CN101495640A - 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法 - Google Patents

具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法 Download PDF

Info

Publication number
CN101495640A
CN101495640A CNA200780028066XA CN200780028066A CN101495640A CN 101495640 A CN101495640 A CN 101495640A CN A200780028066X A CNA200780028066X A CN A200780028066XA CN 200780028066 A CN200780028066 A CN 200780028066A CN 101495640 A CN101495640 A CN 101495640A
Authority
CN
China
Prior art keywords
plant
seq
nucleic acid
seed
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200780028066XA
Other languages
English (en)
Other versions
CN101495640B (zh
Inventor
V·弗兰卡德
V·米隆诺弗
C·勒佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CropDesign NV
Original Assignee
CropDesign NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CropDesign NV filed Critical CropDesign NV
Publication of CN101495640A publication Critical patent/CN101495640A/zh
Application granted granted Critical
Publication of CN101495640B publication Critical patent/CN101495640B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本发明一般地涉及分子生物学领域并涉及用于通过调节编码GRP(生长相关蛋白)的核酸在植物中表达而改进多种植物生长特征的方法。本发明还涉及具有编码GRP的核酸的受调节表达的植物,其中所述植物相对于对应野生型植物或其他对照植物具有改良的生长特征。本发明还提供用于本发明方法中的构建体。GRP可以是如下蛋白之一:伸展蛋白受体样激酶(ERLK)、F-框WD40(FBXW)多肽、RAN-结合蛋白(RANBP)、金色2-样转录因子(GLK)、REVδ同源域亮氨酸拉链结构域多肽、CLE蛋白质和种子产量调节物(SYR)蛋白质。

Description

具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
本发明一般地涉及分子生物学领域并涉及用于通过调节编码GRP(生长相关蛋白)的核酸在植物中表达而改进多种植物生长特征的方法。本发明还涉及具有编码GRP的核酸的受调节表达的植物,其中所述植物相对于对应野生型植物或其他对照植物具有改良的生长特征。本发明还提供用于本发明方法中的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关增加农业效率的研究。常规的作物及园艺学改良手段利用选择育种技术以鉴定具有期望特征的植物。然而,此类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经常含有异源性遗传组分,其可能不总是导致从亲代植物中传递的所希望性状。分子生物学进展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后引入该遗传物质至植物中。此类技术具有给予作物或植物多种经济学、农学或园艺学改良性状的能力。
具有特殊经济意义的性状是增加的产量。产量通常定义为来自作物的经济价值的可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝条的数目)、种子产生、叶衰老等。根发育、养分摄入量、胁迫耐受性和早期萌发势(early vigor)也可以是决定产量的重要因素。优化前述因素因而可以对增加作物产量有贡献。
种子产量是特别重要的性状,因为众多植物的种子对人与动物营养是重要的。作物如玉米、稻、小麦、卡拉诺油菜和大豆占超过一半的人类总热量摄入,无论通过直接消费种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用众多类型代谢物的来源。种子含有胚(新苗和新根的起源)和胚乳(萌发期间及幼苗早期生长期间用于胚生长的营养来源)。种子发育涉及多种基因并且需要代谢物从根、叶和茎转移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成为贮藏大分子以灌满籽粒。
对于众多作物的另一个重要性状是早期萌发势。改进早期萌发势是现代稻育种计划在温带和热带稻品种上的重要目标。长根在水栽稻中对于正确土壤固定是重要的。在将稻直接播种至被淹没田地的情况下,以及在植物必须从水中迅速出苗的情况下,较长的茎与萌发势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对于良好出苗是重要的。将早期萌发势人工改造到植物内的能力将在农业中是极其重要的。例如,不良的早期萌发势已经限制了基于玉米带种质(Corn Belt germplasm)的玉蜀黍(Zea mayes L.)杂种在欧洲大西洋地区的引种。
另一重要性状是改进的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,对于大多数主要作物植物而言降低平均产量超过50%(Wang等、Planta(2003)218:1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性和氧化胁迫引起。提高植物对非生物胁迫耐受性的能力将在世界范围对农民是极大经济优势并且会允许在不利条件期间及在作物栽培否则是不可能的陆地上栽培作物。
作物产量因而可以通过优化前述因素之一而增加。
取决于最终用途,对某些产量性状的改良可能优先于其他产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应用如面粉、淀粉或油生产而言,增加种子参数可能是尤其希望的。即便在种子参数当中,某些参数可以更优先于其他参数,这取决于应用。多种机制可以对增加种子产量有贡献,无论形式为增加的种子大小或是增加的种子数目。
增加植物中产量(种子产量和/或生物量)的一种方法可以是通过调节植物的内在生长机制如细胞周期,或参与植物生长或参与防御机制的多种信号途径。
现已发现可以通过调节编码GRP(目的生长相关蛋白)的核酸在植物中表达而改进植物中的多种生长特征。GRP可以是如下蛋白质之一:伸展蛋白受体样激酶(ERLK)、F-框WD40(FBXW)多肽、RAN-结合蛋白(RANBP)、金色2-样转录因子(Golden2-like Transcription Factor,GLK)、REVδ同源域亮氨酸拉链结构域多肽、CLE蛋白质和种子产量调节物(Seed Yield Regulator,SYR)蛋白质。
背景技术
伸展蛋白受体样激酶
受体样激酶(RLK)参与将胞外信号传递至细胞内。RLK蛋白质具有始于N-末端,带有被加工的分泌信号的模块结构、胞外结构域、单个跨膜结构域和胞质激酶结构域。动物受体样激酶大多具有酪氨酸激酶活性,而植物RLK通常具有Ser/Thr激酶特异性,或者有时候可能具有双重特异性。在动物中,大多数RLK作为生长因子受体起作用,而植物受体样激酶可能在多种过程中发挥功能,所述过程包括发育、激素感知或病原体反应。有关植物受体样激酶的发育功能如分生组织发育、花粉-雌蕊相互作用、激素信号传导、配子体发育、细胞形态发生和分化、器官形态、器官脱落和体细胞胚胎发生等的综述,由Becraft(Annu.Rev.Cell Dev.Biol.,18,163-192,2002)提供。
或者,受体样激酶可以依据其胞外或胞内结构域的结构进行分类(Shiu和Bleecker,Proc.Natl.Acad.Sci.美国98,10763-10768,2001)。图1给出概述。PERK RLK和ERLK具有富含脯氨酸的胞外结构域,该结构域具有一般用于伸展蛋白和富含羟脯氨酸的细胞壁蛋白质的基序。伸展蛋白是一组在植物细胞壁中发现的富含羟脯氨酸的糖蛋白。它们通常富含羟脯氨酸(Hyp)、丝氨酸,以及Val、Tyr、His和Lys的组合。伸展蛋白中典型的基序是SPx基序,其中x代表(羟)脯氨酸重复的数目,一般是2、3、4或更多。伸展蛋白最多可占细胞壁干重的20%。它们是高度糖基化的,可能反映了它们与细胞壁糖类的相互作用。它们的功能中对机械压力的应答是加强细胞壁(例如,在有害物攻击期间、风中植物弯曲期间等)。伸展蛋白基序也可在伸展蛋白受体样激酶的小组(例如拟南芥At5g56890基因)中发现。Shiu和Bleeker(2001)在拟南芥中鉴定了5个家族成员;在稻和其他物种中发现了多个直向同源物(Shiu等,Plant Cell 16,1220-1234,2004)。然而伸展蛋白RLK尚未表征。
F-框WD40多肽(FBXW)
植物必须针对外部和内部的刺激调节它们的新陈代谢,以保证最佳生长。这些细胞过程中涉及的调节蛋白的水平常由蛋白酶解机制控制。在此方面,最重要的选择性蛋白质降解途径是依赖遍在蛋白的蛋白酶解途径。该途径在植物、动物和酵母中是保守的,它控制错折叠的多肽和短寿蛋白质的降解。后者是调控诸如防御反应和胁迫反应、细胞周期进展或信号传导的重要调控蛋白质。将要降解的蛋白质共价标记几个遍在蛋白单元。遍在蛋白化的蛋白质随后被26S的蛋白酶体识别,所述26S的蛋白酶体降解目标蛋白质但是再循环遍在蛋白单体。目标蛋白质的选择和随后的遍在蛋白化发生在不同的步骤中。涉及的三类蛋白质基于它们的连续作用,已被命名为E1至E3。E1酶,也称为遍在蛋白活化酶,其消耗ATP而“活化”游离的遍在蛋白分子,并以硫酯键与遍在蛋白复合。接着,活化的遍在蛋白分子从E1酶转移至遍在蛋白缀合的酶E2的半胱氨酸。该E2酶一般与称为遍在蛋白蛋白连接酶的E3酶连接。遍在蛋白连接酶催化遍在蛋白从遍在蛋白缀合的酶转移至目标蛋白质,所述目标蛋白质最终由聚遍在蛋白链标记。E2酶和E3酶的复合体确定待遍在蛋白化的蛋白质的特异性。而在不同的组织中,存在一个或仅几个E1酶,存在几个可以和几个E3酶结合的E2种类。遍在蛋白蛋白连接酶本身也是不同蛋白质的复合物。迄今,已知5种不同类型的E3酶。其中,SCF复合物在调控过程中起主要作用(Ciechanover(1998)EMBO J.17:7151-7160;Hershko和Ciechanover(1998)Annu.Rev.Biochem.67:425-479)。该复合物由四个亚基组成:cdc53/滞蛋白、Skp1、Rbx1和F-框蛋白质。Skp1蛋白质,以及滞蛋白和Rbx1形成SCF复合物的核心连接酶单元。在该复合物中,Rbx1负责结合负有活化的遍在蛋白的E2酶。F-框蛋白质N-末端包含40-50个氨基酸的简并基序,称为F-框,在人细胞周期蛋白F之后命名。该F-框蛋白质负责和SCF复合物的Skp1亚基连接。在C-末端,不同的蛋白质相互作用结构域确定结合的目标蛋白质。此类蛋白质相互作用结构域之一是WD40重复结构域。
与其他生物相比,在拟南芥中F-框蛋白质代表迄今为止在植物中发现的最大的超家族中的一个(Gagne等,(2002)Proc Natl Acad Science 99:11519-11524;Kuroda等,(2002)Plant Cell Physiol 43(10):1073-85)。但是,仅两个F-框蛋白质含有WD40重复结构域,而在其他生物的F-框蛋白质中发现了多个WD40重复结构域。WD40重复(也称为β-转导素重复)是短的约40个氨基酸的基序,通常以Trp-Asp(W-D)二肽结束。包含WD40重复的蛋白质(或WD40蛋白质)具有4至16个重复单元(其全部为WD40结构域),所有这些被认为形成环化的β-螺旋桨式(propeller)结构。所有WD40蛋白质的基本共同功能是调整多-蛋白质复合物的装配,其中重复单元作为蛋白质相互作用的刚性支架。蛋白质的特异性通过重复自身表面(outside)的序列确定。
公开的欧洲专利申请EP 1033405提供来自拟南芥的编码部分FBXW多肽(N-末端氨基酸序列,长约350个核苷酸)的DNA序列(SEQID NO:39903)。
RAN-结合蛋白质(RANBP)
Ran是小的信号传导GTP酶(GTP结合蛋白质),其参与核质转运。已报导拟南芥中的Ran结合蛋白质、At-RanBP1a、At-RanBP1b、AtRanbp1c与GTP-结合形式的拟南芥Ran1、Ran2和Ran3蛋白质相互作用(Haizel T、Merkle T、Pay A、Fejes E、Nagy F.Characterizationof proteins that interact with the GTP-bound form of the regulatoryGTPase Ran in Arabidopsis.Plant J.1997年1月;11(1):93-103)。所有的RanBP1蛋白质含有大约150个氨基酸残基的Ran结合结构域。RanBP1以高亲和性直接与RanGTP结合。该结构域稳定GTP-结合形式的Ran(Ras-样核小GTP酶)。
国际专利申请WO 02/18538描述了具有破坏的RAN/Ran-结合蛋白质介导的细胞过程的转基因植物;这被报导产生具有增加的产量和生物量的植物。
金色2-样(GLK)转录因子
植物中可发生两种光合循环:最常见的是C3植物的卡尔文循环,其中3-磷酸甘油酸是最稳定的产物,核酮糖二磷酸是CO2的受体。第二种循环是C4植物中的Hatch-Smack途径,其中草酰乙酸盐是最稳定的产物,烯醇丙酮酸磷酸是CO2的受体。在C3草类中,仅叶肉细胞是光合作用的,而在C4植物中,维管束鞘(bundle sheet)和叶肉细胞均是光合作用的。C4植物呈现区室化的光合作用,叶肉细胞通过烯醇丙酮酸磷酸羧激酶、丙酮酸磷酸二激酶和苹果酸脱氢酶进行碳固定,并将苹果酸转移至维管束鞘细胞,在维管束鞘细胞中苹果酸脱羧基为丙酮酸,释放的碳之后在卡尔文循环中进一步加工。因而,在C4植物中存在3类叶绿体:C3植物的典型叶绿体存在于某些组织中,且在某些发育阶段中存在,而在维管束鞘中和叶肉细胞中存在形态迥异的叶绿体。玉米中叶绿体的起源需要两个转录调节物:金色2(G2)和金色-样(GLK)(Rossini等,Plant Cell 13,1231-1244,2001)的参与。
转录因子通常定义为显示序列特异性DNA结合,并能够激活和/或抑制转录的蛋白质。拟南芥基因组编码至少1533个转录调节子,这占其估计的基因总数的约5.9%(Riechmann等,Science 290,2105-2109,2000)。玉米金色(G2)基因是GARP转录因子组的代表,所述GARP转录因子组除金色2外,由拟南芥接受响应调节物(Accepting ResponseRegulator)-B(ARR-B)和来自衣藻(chlamydomonas)的Psr1定义。所有GLK蛋白质分类为GARP家族的成员。GLK基因是单源的,且基因复制独立发生在单子叶植物和双子叶植物中。GLK蛋白质一般包含GARP DNA结合结构域和C-末端金色2框。拟南芥GLK蛋白质在叶绿体的发育中是多余的(Fitter等,Plant J.31,713-727,2002)。另外,该基因的功能在球蒴藓(Physcomitrella patens)和拟南芥中是保守的,这表明GLK-介导的叶绿体发育的调节是植物中古老的调节机制(Yasumura等,Plant Cell 17,1894-1907,2005)。在G2的情况中,大多数转录因子的四个确定的特征中的三个已在异源系统中得到实验证实。G2定位于核(Hall等,1998),能够反式激活报道基因的表达,并可以同源二聚化,以及和ZmGLK1异源二聚化(Rossini等,2001).
REV δ(Δ)同源域亮氨酸拉链结构域(REV ΔHDZip/START)
本发明涉及使用特定类型的转录因子增加植物的产量。转录因子多肽通常定义为显示序列特异性DNA结合亲和性,并能够激活和/或抑制转录的蛋白质。同源域亮氨酸拉链(HDZip)多肽组成转录因子家族,其特征在于存在DNA-结合结构域(同源域,HD)和邻近的亮氨酸拉链(Zip)基序。该同源域通常包含大约60个保守氨基酸残基,所述氨基酸残基形成结合DNA的螺旋1-环-螺旋2-转角-螺旋3。此DNA结合位点通常为假回文结构(pseudopalindromic)。亮氨酸拉链邻近于同源域的C-末端(在一些情况下有几个氨基酸的重叠),包括几个七个氨基酸的重复(至少4个),其中通常每隔6个氨基酸就出现亮氨酸(偶尔为缬氨酸或异亮氨酸)。亮氨酸拉链对于蛋白质二聚化非常重要。二聚化是DNA结合的前提条件(Sessa等(1993)EMBO J 12(9):3507-3517),并且可以发生在两个相同的HDZip多肽之间(同源二聚体),或者两个不同的HDZip多肽之间(异源二聚体)。
同源域编码基因存在于所有真核细胞中,并构成拟南芥中至少89个成员的基因家族。亮氨酸拉链多肽本身也见于来自除植物外的真核细胞的多肽中。不过,在同一个多肽中同源域和亮氨酸拉链两者同时存在却是植物所特有的(在拟南芥89个成员中的至少47个中发现),并且除了维管植物之外,还已经在藓类植物(moss)中遇到(Sakakibara等(2001)Mol Biol Evol 18(4):491-502)。
基于序列相似性标准,已将拟南芥HDZip基因分为四个不同的类别:HDZip I至IV(Sessa等,(1994),在:Puigdomene P、Coruzzi G(编著),Springer,Berlin Heidelberg New York,第411-426页)。在拟南芥中,至少有5个III类HDZip多肽(REVOLUTA(REV/IFL)、PHABULOSA(PHB)、PHAVOLUTA(PHV)、CORONA(CNA/AtHB15)和AtHB8),所有的一般都很大(大于800个氨基酸)。类似地,在稻中已鉴定了至少5个III类HDZip多肽。
除了同源域和亮氨酸拉链,III类HDZip多肽C-末端至亮氨酸拉链还包含用于脂质/sterol结合的START(类固醇生成急性调节(STAR)相关脂质转移)结构域,以及未知功能的突出(extensive)C-末端区(CTR,超过多肽长度的一半)(Schrick等,(2004)Genome Biology 5:R41)另外,在编码III类HDZip多肽的mRNA转录物的START结构域的编码转录物区中发现微小RNA的互补位点(MIR165/166),所述微小RNA用于调控通过miRNA-介导的转录物剪切(Williams等,(2005)Development 132:3657-3668)。
在拟南芥中,REV、PHB和PHV多肽已显示参与茎端分生组织和腋生分生组织的形成和功能,三种双向结构(例如胚或叶)的图式形成(patterning),以及维管发育(木质化输导(lignified conducting)和支持组织的分化)。在拟南芥中,系统发育分析揭示这三种密切相关的III类HDZip多肽形成REV进化枝,剩余的III类HDZip多肽(CAN和AtHB8)属于CNA进化枝(Floyd等,(2006)Genetics 173:373-388)。当在系统发育分析中组合稻和拟南芥时,两种稻III类HDZip多肽(OsHox10和OsREV多肽)聚簇于REV多肽。
拟南芥phb、phv、can和athb8的功能失去突变是显性的(aphenotypic)(Baima等,(2001)Plant Physiol 126:643-655;Prigge等,(2005)Plant Cell 17:61-76),但是rev的功能失去突变形成缺陷侧生分生组织和花分生组织,且发育为异常的茎维管结构和卷曲的(外卷的)叶(Otsuga等,(2001)Plant J.25,223-236;Talbert等,(1995)Development 121:2723-2735)。
由于在跨越MIR165/166结合位点(在START结构域中)的序列中的核苷酸取代,玉米中显性等位基因卷曲的叶1(rld1)(Juarez等,(2004)Nature 428:84-88)、拟南芥中的phb-d和phv-d(McConnell等,(2001)Nature 411:709-713),以及拟南芥中的rev-d(Emery等,(2003)Curr Biol 13:1768-1774)表现相似的突变表型(卷曲的叶)。
在授权的美国专利US7056739(以及相应的国际专利申请WO01/33944)中描述了用包含编码SEQ ID NO:2(该授权的美国专利)所示的REV多肽的拟南芥REV核酸序列的转基因转化的植物和植物细胞。该转基因被报导为还包含与编码多肽SEQ ID NO:2的核酸序列有效连接的异源启动子。通过使用CaMV启动子,转基因拟南芥植物超量表达REV核酸序列,表现出增加的叶、茎和种子大小。提供来自番茄、稻、玉米和大麦的部分III类HDZip基因组序列和cDNA 5’末端序列。描述了设计用于分别在稻和玉米中降低内源拟南芥、稻和玉米III类HDZip多肽表达,以再现rev功能失去表型的载体的实例。
在国际专利申请WO2004/063379中提供了拟南芥REV多肽的两种玉米III类HDZip多肽直向同源物的核酸序列。描述了在植物细胞中通过抑制mRNA转录物的表达来调节III类HDZip多肽的水平的方法。
在Mendel Biotechnology公司存放的许多国际和美国专利申请中,拟南芥REV多肽为内参G438。T-DNA插入REV基因座后降低的REVOLUTA活性导致转基因拟南芥植物具有减少的分枝和降低的木质素含量,而增加的REVOLUTA活性(使用病毒CaMV启动子)导致转基因拟南芥植物在大致中期具有比野生型植物后期稍大而平的叶。
CLE-样多肽
虽然植物中细胞与细胞的通讯主要通过植物激素发生,所述植物激素例如生长素、脱落酸、油菜素类固醇、赤霉酸、乙烯,但是现在认识到肽类激素是信号传导事件的重要介质。肽类激素组例如包含系统素、植物硫酸肽、ENOD40、RALF、CLAVATA3、SCR肽和POLARIS。
CLE-样多肽形成的多肽家族包含拟南芥CLAVATA3和玉米ESR多肽,并共享所述多肽的同源性。假设这些多肽作为配体参与信号传导事件。
植物的根和地上部分分别源自活化的根顶端分生组织(RAM)和茎顶端分生组织(SAM)。这些结构含有允许生长成所有植物细胞类型和组织的多能细胞。在SAM中,虽然中央区(central zone)中的细胞比外周区中的细胞分裂慢,存在中央区中茎细胞的分裂和外周区中细胞分化的平衡。CLAVATA3(CLV3)是CLV3/ESR(CLE)配体基因家族的成员,并由SAM的茎细胞分泌,由此活化CLAVATA1-CLAVATA2受体二聚体并导致WUSCHEL(WUS)基因的受限表达。WUS是同源域转录因子并促进茎细胞的形成;其是茎细胞繁殖所需的。另一方面,CLV3是防止茎细胞不受控制的繁殖所需的。CLV3和WUS因此形成控制茎细胞数目和SAM结构的反馈环。Wus突变体不能发育出茎顶端分生组织,而clv3突变体发育出非常大的茎顶端分生组织。
CLE配体基因家族的另一个成员是CLE2,其功能类似与CLV3,分泌在生长和发育过程的不同途径中活化的信号分子。CLE2和CLE家族成员的其他成员由Cock和McCormick(Plant Physiol.126,939-942,2001)首次表征。所有CLE家族成员均是短的多肽(大约7至9kDa),具有疏水性N-末端序列(假定的信号肽或信号锚)。推定的成熟多肽的主体是高度碱性的(平均pI 9.49±1.57),它们的整条链均是亲水的,在C-末端或其附近有保守区。该保守区可能参与蛋白质-蛋白质的相互作用。假设CLE家族的成员,例如CLV3和CLE2,由蛋白酶处理为分泌的短肽。虽然CLE蛋白质在长度、电荷和亲水性上具有总体相似性,但在氨基酸序列水平上是高度不同的。据报导CLE2通过加入NO3 -诱导(Scheible等,Plant Physiol.136,2483-2499,2004)。其他的功能性特征(Strabala等,Plant Physiol.140,1331-1344,2006)揭示拟南芥中CLE2超量表达导致具有极推迟的开花时间(大约40天,而对照植物为20天)的矮化植物,但其相对于对照具有更长的根。CLE2的超量表达也模拟wus表型。CLE2的类似表型也在CLE3、CLE5、CLE6中CLE7观察到。这些蛋白质也是结构相关的。但是,没有可获得的cle2突变体或CLE2减量调节数据的表型信息。
WO 01/96582描述了配体-样蛋白质(LLP)或其功能片段用于调节植物表型或构造的用途。优选的LLP或片段包含氨基酸基序XRXXXXGXXXXHX(其中X可以是任意氨基酸),更优选的LLP或片段包含氨基酸基序KRXXXXGXXPXHX。该文件还描述多种LLP的异位表达导致不育的转基因植物,或植物最多具有下降的能育性。同样,LLP的反义表达产生具有下降的能育性的转基因植物(每长角果中更少的种子数量)。
WO 03/093450公开了CLAVATA3-样肽在植物中调节细胞分裂、分化和发育的用途,尤其是调节分生组织发育的用途。假设在开花之前CLV3-样肽降低的活性可导致额外的叶的产生,由此提供具有更多能量产生的植物,并因此增加产量,或增加心皮具有的种子数目,或产生更厚的茎,或改变植物的果实。但是就CLV3表达的减量调节仅提供了假设性的实例,未给出真实的实验数据。另外,所公开的CLV3-样肽落入WO 01/96582公开的LLP种类,因为它们包含基序XRXXXXGXXXXHX,因此显示的是减量调节的表达导致植物具有下降的能育性。
类似地,当来自植物寄生线虫大豆孢囊线虫(Heterodera glycines)的CLE-样蛋白质在拟南芥中超量表达时,转基因植物产生花,但这种花不开放或缺少中央雌蕊群,且根系变短。
因此存在的问题是诸如LLP或CLV3-样的CLE-样多肽如何用于增强产量相关性状。
种子产量调节物
SYR是迄今仍未被表征的新蛋白。SYR与名称为ARGOS的拟南芥蛋白质显示一定的同源性(在DNA水平上大约48%的序列同一性,在蛋白质水平上大约45%的序列同一性)(Hu等,Plant Cell 15,1951-1961,2003;US 2005/0108793)。Hu等推定ARGOS是具独特功能的蛋白质且由单个基因编码。拟南芥中ARGOS过表达的主要表型是增加的叶生物量和延迟的开花。相反,稻中SYR过表达主要增加种子产量,而叶生物量和开花时间未明显改变。
发明简述
现已惊奇地发现在植物中调节编码伸展蛋白受体样激酶(ERLK)或其部分的核酸的表达产生了相对于对照植物具有增强的产量相关性状的植物,其中所述部分包含至少激酶结构域和跨膜结构域。
因此,本发明提供相对于对照植物增强植物产量相关性状的方法,其包括在植物中调节编码ERLK蛋白质或其部分的核酸的表达。
现已惊奇地发现在植物中增加编码FBXW多肽的核酸的表达产生了相对于合适的对照植物具有增加的产量的植物。因此,根据本发明的另一实施方案,提供相对于合适的对照植物增加产量的方法,其包括在植物中增加编码FBXW多肽的核酸的表达。
研究了RAN-结合蛋白增强产量相关性状的用途后,本申请的发明人发现启动子的选择是重要的考虑因素。他们发现组成型启动子控制下在植物(稻)中表达RAN-结合蛋白对产量相关表型没有任何影响。然而他们惊讶的发现种子特异性启动子,尤其是胚乳特异性启动子控制下在植物中表达RAN-结合蛋白成功的增加了植物的产量。
因此,本发明也提供相对于对照植物增强植物产量相关性状的方法,其包括优先在植物种子或种子部分中调节编码RANBP的核酸的表达。
现已发现在植物中调节编码金色2样(GLK)蛋白质的核酸的表达产生了相对于对照植物具有增强的产量相关性状的植物。
因此,本发明在另一实施方案中提供相对于对照植物增强植物产量相关性状的方法,其包括在植物中调节编码GLK蛋白质或其部分的核酸的表达。
同样令人惊讶的发现,使用REV δ同源域亮氨酸拉链结构域(HDZip)/类固醇生成急性调节(STAR)相关脂质转化结构域(START)核酸序列降低植物中内源REV基因的表达,产生相对于对照植物具有增加的产量的植物。本发明因此提供另一个实施方案方法,其通过使用REV ΔHDZip/START核酸序列降低植物中内源REV基因的表达,相对于对照植物增加植物产量。
现已发现在植物中调节编码CLE样多肽的核酸的表达产生了相对于对照植物具有增强的产量相关性状的植物。
因此,本发明在另一实施方案中提供相对于对照植物增强植物产量相关性状的方法,其包括在植物中调节编码CLE样多肽或其部分的核酸的表达。
现已惊奇地发现在植物中调节编码种子产量调节物蛋白质(此后称为SYR)的核酸的表达产生了相对于对照植物,当在非生物胁迫条件下生长而具有提高的非生物胁迫耐受性的植物。
因此,本发明提供相对于对照植物,在非生物胁迫条件下增强植物产量相关性状的方法,其包括在植物中调节编码SYR多肽的核酸的表达。
定义
多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可互换使用并且指处于任意长度聚合形式中通过肽键连接的氨基酸。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可互换使用并且指处于任意长度非分支聚合形式中的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者组合。
对照植物
选择合适的对照植物是实验设置的惯用部分并且可以包括对应的野生型植物或无目的基因的对应植物。对照植物一般是与待评估植物相同的植物物种或甚至是相同的变种。对照植物也可以是待评估植物的失效合子。失效合子是由于分离丢失转基因的个体。如本文中所用的“对照植物”不仅指整株植物,还指植物部分,包括种子及种子部分。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质及酶,它们相对于非修饰的上述蛋白质具有氨基酸取代、缺失和/或插入并且与所述肽、寡肽、多肽、蛋白质及酶来源的非修饰蛋白质具有相似生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基在蛋白质中预定位点内的引入。插入可以包含单个或多个氨基酸的氨基端融合和/或羧基端融合以及序列内插入。通常,在氨基酸序列内部的插入会比氨基端融合或羧基端融合更小,约1-10个残基级别。氨基端或羧基端融合蛋白或融合肽的实例包括如酵母双杂交系统中所用转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
取代指以具有相似特性(如相似疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向)的其他氨基酸替换蛋白质的氨基酸。氨基酸取代一般是单个残基的,不过可以是簇集性的,这取决于置于多肽的功能性约束;插入通常会是约1-10个氨基酸残基级别。氨基酸取代优选地是保守性氨基酸取代。保守性取代表是本领域众所周知的(见例如Creighton(1984)Proteins.W.H.Freeman and Company(编著)和下表1)。
表1:保守性氨基酸取代的实例
  残基   保守性取代   残基   保守性取代
  Ala   Ser   Leu   Ile;Val
  Arg   Lys   Lys   Arg;Gln
  Asn   Gln;His   Met   Leu;Ile
  Asp   Glu   Phe   Met;Leu;Tyr
  Gln   Asn   Ser   Thr;Gly
  Cys   Ser   Thr   Ser;Val
  Glu   Asp   Trp   Tyr
  Gly   Pro   Tyr   Trp;Phe
  His   Asn;Gln   Val   Ile;Leu
  Ile   Leu,Val
氨基酸取代、缺失和/或插入可以使用本领域众所周知的肽合成技术如固相肽合成法等或通过重组DNA操作而轻易地进行。用于操作DNA序列以产生蛋白质的取代、插入或缺失变体的方法是本领域众所周知的。例如,用于在DNA中的预定位点处产生取代突变的技术是本领域技术人员众所周知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Clevelaand,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR-介导的位点定向诱变或其他位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然发生形式的蛋白质(如目的蛋白)的氨基酸序列相比,它们包含以非天然发生的氨基酸残基对氨基酸的取代或非天然发生的氨基酸残基的添加。蛋白质的“衍生物”也包含这样的肽、寡肽、多肽,其中与多肽的天然发生形式的氨基酸序列相比,它们包含天然发生的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸盐化等)氨基酸残基或非天然的改变氨基酸残基。与衍生物所来源的氨基酸序列相比,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加(例如报道分子或其他配体),如为促进检测该衍生物而结合的报道分子,和与天然发生的蛋白质的氨基酸序列相对比的非天然发生的氨基酸残基。另外,“衍生物”也包括蛋白质的天然发生形式和诸如FLAG、HIS6或硫氧还蛋白(标签肽的综述参见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)的标签肽的融合物。
直向同源物/旁系同源物
直向同源物和旁系同源物包含用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于先祖基因复制的基因,直向同源物是来自不同生物的起源于物种形成的基因,也源自相同的先祖基因。
结构域
术语”结构域″指沿进化相关蛋白质的序列比对结果而在特定位置处保守的一组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间变动,然而在特定位置处的高度保守的氨基酸指示在蛋白质的结构、稳定性或功能方面可能是必需的氨基酸。结构域因通过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定,它们可以用作鉴定物以确定任意的所讨论多肽是否属于先前已鉴定的多肽家族。
基序/共有序列/标签
术语”基序”或“共有序列”或“标签”指在进化相关蛋白质的序列中的短保守区。基序往往是结构域的高度保守部分,不过也可以仅包括结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
杂交
如本文中所定义的术语”杂交″是其中基本上同源的互补核苷酸序列相互复性的过程。杂交过程可以完全在溶液中进行,即两种互补性核酸均处于溶液中。杂交过程也可以在互补性核酸之一固定到基质如磁珠、琼脂糖(Sepharose)小珠或任何其他树脂的情况下发生。杂交过程也可以在互补性核酸之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅酸玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)上的情况下进行。为使杂交发生,通常将核酸分子热变性或化学变性以使双链解链成为两条单链和/或去除来自单链核酸的发夹或其他二级结构。
术语”严格性”指在其中发生杂交的条件。杂交的严格性受条件如温度、盐浓度、离子强度和杂交缓冲液组成影响。通常,将低严格性条件选择为在确定的离子强度及pH时低于特定序列热解链温度(Tm)约30℃。中等严格性条件是此时温度低于Tm约20℃并且高严格性条件是此时温度低于Tm约10℃。高严格性杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。然而,核酸可以在序列上偏离并且因遗传密码子的简并性而依旧编码基本上相同的多肽。因而有时候可能需要中等严格性杂交条件以鉴定此类核酸分子。
Tm是在确定的离子强度及pH时的温度,在所述温度下50%的靶序列与完全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性地杂交。从低于Tm约16℃直至32℃获得最大杂交速率。一价阳离子在溶液中的存在降低了两条核酸链间的静电排斥,因而促进杂交分子形成;这种作用对于高达0.4M的钠浓度是明显的(对于更高浓度,这种效应可以忽略)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数甲酰胺降低0.6-0.7℃,并且添加50%甲酰胺允许在30-45℃进行杂交,虽然杂交速率会降低。碱基对错配降低了杂交速率及双链体的热稳定性。平均而言并且对于大的探针来说,每%碱基错配Tm下降约1℃。取决于杂交分子的类型,Tm可以使用下列等式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1-0.61x%甲酰胺
2)DNA-RNA或RNA-RNA杂交体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cbb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交体:
对于<20个核苷酸:Tm=2(ln)
对于20-35个核苷酸:Tm=22+1.46(ln)
a或对于其他一价阳离子,但是仅在0.01-0.4M范围内是精确的。
b仅对于%GC在30%-75%范围内是精确的。
cL=双链体的长度(以碱基对计)。
doligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以众多已知技术的任何一种控制非特异性结合,例如用含蛋白质的溶液封闭薄膜、添加异源性RNA、异源性DNA及SDS至杂交缓冲液并且用RNA酶处理。对于非同源性探针,一系列杂交可以通过改变以下条件之一进行:(i)渐进地降低复性温度(例如从68℃至42℃)或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)。技术人员了解杂交期间可以加以改变和将维持或改变严格性条件的多种参数。
除杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异性杂交所致的背景,样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的离子强度及温度:盐浓度越低并且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性上或低于杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交分析法或基因扩增检测方法的合适严格性条件如上所述。也可以选择更严格或更不严格的条件。技术人员了解洗涤期间可以加以改变和将维持或改变严格性条件的多种参数。
例如,用于长度大于50个核苷酸的DNA杂交分子的常见高严格性杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交分子的中等严格性杂交条件的实例包括在55℃于4×SSC中或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交分子的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述的保守区而确定杂交分子长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包含5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平的目的,可以参考Sambrook等(2001)Molecular Cloning:a laboratory manual,第三版,Cold Spring HarborLaboratory Press,CSH,New York或参考Current Protocols inMolecular Biology,John Wiley&Sons,N.Y.(1989和每年更新版本)。
剪接变体
如本文中所用的术语”剪接变体”包含其中已经切除、替换、移位或添加所选内含子和/或外显子或其中内含子已经缩短或加长的核酸序列的变体。此类变体将是其中基本上保留了蛋白质的生物学活性的一种变体;这可以通过选择性保留蛋白质的功能性片段而实现。此类剪接变体可以在自然界中找到或可以人工制造。用于预测和分离此类剪接变体的方法是本领域众所周知的(见例如Foissac和Schiex(2005),BMCBioinformatics.6:25)。
等位变体
等位基因或等位变体是给定基因的替代形式,位于相同染色体位置内。等位变体包含单核苷酸多态性(SNP)和小插入/缺失多态性(INDEL)。INDEL的尺寸通常小于100bp。SNP和INDEL形成在大部分生物的天然发生性多态性株系中序列变体的最大集合。
基因改组/定向进化
基因改组或定向进化的组成为:反复DNA改组,随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸或其部分的变体(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
调节元件/调控序列/启动子
术语“调节元件”、“调控序列”和“启动子”均在本文中可互换使用并且在广义上意指能够实现与之连接的序列表达的调节性核酸序列。术语”启动子”一般指位于基因转录起点上游并参与识别及结合RNA聚合酶和其他蛋白质,因而指导有效连接的核酸转录的核酸调控序列。前述术语包括从典型的真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没有CCAAT盒序列)中衍生的转录调节序列和应答发育刺激和/或外部刺激或以组织特异性方式改变基因表达的额外调节元件(如,上游激活序列、增强子和沉默子)。本术语还包括典型的原核基因的转录调节序列,在此情况下它可以包括-35盒序列和/或一10盒转录调节序列。术语“调节元件”也包含赋予、激活或增强核酸分子在细胞、组织或器官中表达的合成的融合分子或衍生物。
“植物启动子”包含介导编码序列区段在植物细胞中表达的调节元件。因此,植物启动子不需要是植物来源的,而是可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用待于本发明方法中表达及在本文中描述的核酸序列所转化的植物。这也适用于其他“植物”调节性信号,如“植物”终止子。用于本发明方法中的核苷酸序列的启动子上游可以由一个或多个核苷酸取代、插入和/或缺失而受到修饰,但不干扰启动子、可读框(ORF)或3′调节区如终止子或远离ORF的其他3′调节区的功能性或活性。启动子的活性还有可能因修饰该启动子的序列或由更活跃的启动子、甚至来自异源生物的启动子彻底替换该启动子而增加。为在植物中表达,如上所述,核酸分子必须有效连接至或包含合适的启动子,其中所述的启动子在正确时间点上并以所需要的空间表达模式表达基因。
为鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可以通过将该启动子与报道基因有效连接并分析该报道基因在植物多种组织的表达水平和模式而进行分析。合适的公知报道基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如本发明方法中所用的一种启动子)的启动子强度和/或表达模式比较。备选地,启动子强度可以使用本领域已知方法如Northern印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996Genome Methods 6:986-994),通过定量mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如18SrRNA)的mRNA水平比较而分析。通常“弱启动子”意指驱动编码序列在低水平上表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。
有效连接
如本文中所用的术语”有效连接”指启动子序列与目的基因之间功能性地连接,以至于启动子序列能够启动目的基因转录。
组成型启动子
“组成型启动子”指在生长和发育的大部分、但不必全部阶段期间和在大部分环境条件下在至少一个细胞、组织或器官内有转录活性的启动子。下表2a给出组成型启动子的实例。
表2a:组成型启动子的实例
  基因来源   参考文献
  肌动蛋白   McElroy等,Plant Cell,2:163-171,1990
  HMGB   WO 2004/070039
  CAMV 35S   Odell等,Nature,313:810-812,1985
  CaMV 19S   Nilsson等,Physiol.Plant.100:456-462,1997
  GOS2   de Pater等,Plant J Nov;2(6):837-44,1992,WO 2004/065596
  遍在蛋白   Christensen等,Plant Mol.Biol.18:675-689,1992
  稻亲环蛋白   Buchholz等,Plant Mol Biol.25(5):837-43,1994
  玉米H3组蛋白   Lepetit等,Mol.Gen.Genet.231:276-285,1992
  苜蓿H3组蛋白   Wu等Plant Mol.Biol.11:641-649,1988
  肌动蛋白2   An等,Plant J.10(1);107-121,1996
  34S FMV   Sanger等,Plant.Mol.Biol.,14,1990:433-443
  Rubisco小亚基   US 4,962,028
  OCS   Leisner(1988)Proc Natl Acad Sci美国85(5):2553
  SAD1   Jain等,Crop Science,39(6),1999:1696
  SAD2   Jain等,Crop Science,39(6),1999:1696
  nos   Shaw等,(1984)Nucleic Acids Res.12(20):7831-7846
  V-ATP酶   WO 01/14572
  超级启动子   WO 95/14098
  G盒蛋白质   WO 94/12015
遍在启动子
遍在启动子在生物基本上所有组织或细胞内有活性。
发育调节性启动子
发育调节性启动子在某个发育期期间或在经历发育变化的植物部分内有活性。
诱导性启动子
诱导性启动子在应答化学品(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有受诱导或增加的转录启动,或可以是“胁迫诱导性的”,即当植物暴露于多种胁迫条件时受到激活,或是“病原体诱导性的”,即当植物暴露于多种病原体时受到激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够优先在某些器官官或组织如叶、根、种子组织等内启动转录的启动子。例如,“根特异性启动子”是在植物根中优势地具有转录活性的启动子,在植物的任何其他部分内基本上无活性,尽管在植物的这些其他部分内允许任何泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异的”。
种子特异性启动子主要在种子组织中转录激活,但不必仅在种子组织中激活(渗漏表达的情况下)。种子特异性启动子可以在种子发育和/或萌发期间激活。一些种子特异性启动子可以是胚乳、糊粉和/或胚特异性的。种子特异性启动子的实例示于下表2b,胚乳特异性启动子的实例示于下表2c。种子特异性启动子的其他实例由Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)给出,该文献的公开完整引入本文作为参考。
表2b:种子特异性启动子的实例
Figure A20078002806600411
Figure A20078002806600421
表2c:胚乳特异性启动子的实例
  基因来源   参考文献
  谷蛋白(稻)   Takaiwa等,(1986)Mol Gen Genet208:15-22Takaiwa等,(1987)FEBS Letts.221:43-47
  玉米醇溶蛋白   Matzke等,(1990)Plant Mol Biol 14(3):323-32
  小麦LMW和HMW麦谷蛋白-1   Colot等,(1989)Mol Gen Genet216:81-90Anderson等,(1989)NAR 17:461-2
  小麦SPA   Albani等,(1997)Plant Cell 9:171-184
  小麦麦醇溶蛋白   Rafalski等,(1984)EMBO 3:1409-15
  大麦Itr1启动子   Diaz等,(1995)Mol Gen Genet248(5):592-8
  大麦B1,C,D,大麦醇溶蛋白   Cho等,(1999)Theor Appl Genet98:1253-62Muller等,(1993)Plant J 4:343-55Sorenson等,(1996)Mol Gen Genet250:750-60
  大麦DOF   Mena等,(1998)Plant J 116(1):53-62
  blz2   Onate等,(1999)J Biol Chem274(14):9175-82
  合成启动子   Vicente-Carbaj osa等,(1998)Plant J13:629-640
  稻谷醇溶蛋白NRP33   Wu等,(1998)Plant Cell Physiol 39(8)885-889
  稻球蛋白Glb-1   Wu等,(1998)Plant Cell Physiol 39(8)885-889
  稻球蛋白REB/OHP-1   Nakase等,(1997)Plant Molec Biol 33:513-522
  稻ADP-葡萄糖焦磷酸化酶   Russell等,(1997)Trans Res 6:157-68
  玉米ESR基因家族   Opsahl-Ferstad等,(1997)Plant J12:235-46
  高粱醇溶蛋白   DeRose等,(1996)Plant Mol Biol32:1029-35
如本文中所定义的绿色组织特异性启动子是主要在绿色组织中具有转录活性的启动子,在植物的任何其他部分内基本上无活性,尽管在植物的这些其他部分内允许任何泄露表达。
组织特异性启动子的另一个实例是分生组织特异性启动子,其主要在分生性组织中具有转录活性,在植物的任何其他部分内基本上无活性,尽管在植物的这些其他部分内允许任何泄露表达。
终止子
术语”终止子”包括这样的调控序列,其是在转录单位末端的DNA序列,发出对初级转录物进行3’加工并多聚腺苷化以及终止转录的信号。终止子可以衍生自天然基因、来自多种其他植物基因或来自T-DNA。待添加的终止子可以来自例如胭脂碱合酶或章鱼碱合酶基因或备选地来自其他植物基因或较不优选地来自任何其他真核基因。
调节
术语”调节”就表达或基因表达而言意指这样的过程,其中表达水平与对照植物相比因所述基因的表达而改变,优选地,表达水平增加。原先未受调节的表达可以是结构RNA(rRNA、tRNA)或mRNA的任何类型表达,随后是翻译。术语“调节活性”应当意指本发明核酸序列或所编码蛋白质的表达的任何变化,这导致植物增加的产量和/或增加的生长。
表达
术语“表达”或“基因表达”意指因特定一种或多种基因或基因构建体的转录。术语“表达”或“基因表达”尤其意指一种或多种基因或基因构建体转录成结构RNA(rRNA、tRNA)或mRNA,有或没有随后mRNA翻译成蛋白质。此过程包括DNA转录、加工得到的mRNA产物。
增加的表达/过量表达
如本文中所用的术语”增加的表达”或“过量表达”意指对于原有野生型表达水平是额外的任何形式表达。
在本领域内详细记载了用于增加基因或基因产物表达的方法并且它们包括例如,由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。可以在非异源形式的多核苷酸的适宜位置(一般是上游)内引入作为启动子或增强子元件的分离核酸,以便增量调节编码目的多肽的核酸的表达。例如,内源性启动子可以通过突变、缺失和/或取代而在体内改变(见Kmiec,美国5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的正确方向及距离引入植物细胞,以便控制基因表达。
若需要多肽表达,通常希望在多核苷酸编码区的3’末端包括多聚腺苷化区。多聚腺苷化区可以来自天然基因、来自多种其他植物基因或来自T-DNA。待添加的3’末端序列可以来自例如胭脂碱合酶或章鱼碱合酶基因或备选地来自另一植物基因或更不优选来自任何其他真核基因。
内含子序列也可以添加至5′非翻译区(UTR)或部分编码性序列的编码序列上,以增加在胞浆内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。基因表达的此类内含子增强作用一般在位于转录单位5′末端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:The Maize Handbook,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
内源基因
本文中提及的“内源”基因不仅仅指如在植物中以其天然形式(即没有任何人类干预)存在的所讨论基因,还指处于分离形式的随后(再)引入植物(转基因)的相同基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以遭遇转基因表达大幅降低和/或内源基因表达的大幅降低。
分离的基因
分离的基因可分离自生物体,或者是人造的,例如通过化学合成。
降低的表达
本文中提及的“降低的表达”或表达的“降低或基本去除”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的降低。与对照植物相比,降低或基本去除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%,或95%、96%、97%、98%、99%或更多的降低。
为了降低或基本去除内源基因在植物中的表达,需要核酸序列的足够长度的基本上连续的核苷酸。为了开展基因沉默,这个长度可以是少至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以多至整个基因(包括5’和/或3’UTR,在部分或全长中)。基本上连续的核苷酸片段可以来自编码目的蛋白的核酸(靶基因)或来自能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸。优选地,基本上连续的核苷酸片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以递增优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是本文中所讨论用于降低或基本去除内源基因表达的多种方法所需的。
表达的这种降低或基本去除可以使用常规工具和技术完成。用于降低或基本去除内源基因表达的优选方法是在植物中引入并表达这样的遗传构建体,其中核酸(在此情况下是来自目的基因或任何核酸的一段基本上连续的核苷酸序列,其中所述的任何核酸能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物)克隆至所述的遗传构建体内作为由间隔区(非编码性DNA)隔开的(部分或完全的)反向重复序列。
在这种优选的方法中,使用核酸或其部分(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸序列,其中所述的任何核酸能够编码目的蛋白的直向同源物、旁系同源物或同源物)的反向重复序列(优选能够形成发夹结构),通过RNA介导的沉默作用而降低或基本上去除内源基因的表达。反向重复序列在包含调控序列的表达载体中克隆。非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成具有(部分或完全)自身互补结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hpRNA由植物加工成为siRNA,其被掺入RNA诱导性沉默复合物(RISC)中。RISC进一步切开mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。对于其他一般细节,见例如Grierson等(1998)WO98/53083;Waterhouse等(1999)WO 99/53050)。
本发明方法的实施不依赖在植物中引入并表达其中克隆入核酸作为反向重复序列的遗传构建体,而是几种公知“基因沉默”方法的任何一种或多种可以用来实现相同的效果。
一种用于降低内源基因表达的如此方法是RNA介导的基因表达沉默(减量调节)。沉默作用在这种情况下由基本上与内源性靶基因相似的双链RNA序列(dsRNA)在植物中触发。这种dsRNA被植物进一步加工成约20到约26个核苷酸,称作短干扰性RNA(siRNA)。siRNA被掺入RNA诱导性沉默复合物(RISC)内,其中所述的RISC进一步切割内源性靶基因的mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。优选地,双链RNA序列对应于靶基因。
RNA沉默方法的另一个实例包括以有义方向引入核酸序列或其部分(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸,其中所述的任何核酸能够编码目的蛋白的直向同源物、旁系同源物或同源物)至植物内。“有义方向”指与其mRNA转录物同源的DNA序列。因而将向植物中引入该核酸序列的至少一个拷贝。这种额外的核酸序列会降低内源基因表达,产生已知为共抑制作用的现象。当核酸序列的几个额外拷贝引入植物时,基因表达的降低将更明显,因为高转录物水平与共抑制作用的触发之间存在正相关。
RNA沉默方法的另一个实例包括使用反义核酸序列。″反义″核酸序列包含与编码蛋白质的″有义″核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列互补的核苷酸序列。反义核酸序列优选地与待沉默的内源基因互补。互补性可以位于基因的“编码区”和/或”非编码区”内。术语”编码区″指包含被翻译成氨基酸残基的密码子的核苷酸序列区。术语”非编码区″指分布在编码区两侧的被转录但不翻译成氨基酸的5’和3’序列(也称作5′和3′非翻译区)。
反义核酸序列可以根据Watson和Crick碱基配对规则设计。反义核酸序列可以与整个核酸序列互补(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸,其中所述的任何核酸能够编码目的蛋白的直向同源物、旁系同源物或同源物),不过也可以是仅与核酸序列的一部分(包括mRNA 5’和3’UTR)反义的寡核苷酸。例如,反义寡核苷酸序列可以与围绕编码多肽的mRNA转录物的翻译起点周围的区域互补。合适的反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或更少的核苷酸开始。本发明的反义核酸序列可以利用本领域已知方法,使用化学合成和酶连接反应而构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然发生的核苷酸或多种修饰的核苷酸化学地合成,其中所述修饰的核苷酸被设计旨在增加分子的生物学稳定性或增加反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的实例是本领域众所周知的。已知的核苷酸修饰包括甲基化、环化和′加帽′及用类似物(如肌苷)取代一个或多个天然发生的核苷酸。其他的核苷酸修饰是本领域众所周知的。
这种反义核酸序列可以使用其中核酸序列已经以反义方向加以亚克隆(即从插入的核酸中转录的RNA将与目的靶核酸呈反义方向)的表达载体以生物学方式产生。优选地,反义核酸序列在植物中的产生借助稳定整合的核酸构建体进行,其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。
用于本发明方法中沉默作用的核酸分子(无论向植物中引入或在原位产生)与编码多肽的mRNA转录物和/或基因组DNA杂交或结合,以便例如通过抑制转录和/或翻译而抑制蛋白质表达。杂交可以通过形成稳定双链体的常规核苷酸互补性所致,或在结合于DNA双链体的反义核酸序列的情况下,因双螺旋大沟内特异性相互作用所致。反义核酸序列可以通过转化或在特定组织部位直接注射而引入植物。备选地,反义核酸序列可以为了靶向所选择的细胞而受到修饰并且随后系统性施用。例如,对于系统性施用,反义核酸序列可以被修饰以便它们特异结合表达在所选择的细胞表面上的受体或抗原,例如通过连接反义核酸序列至与细胞表面受体或抗原结合的肽或抗体。反义核酸序列也可以使用本文中所述的载体送递至细胞内。
根据另一方面,反义核酸序列是α-异头核酸序列。α异头核酸序列与互补性RNA形成特定双链杂交分子,其中与惯常b-单元相反,所述链相互平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可以包含2′-o-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
内源基因表达的降低或基本去除也可以使用核酶而进行。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸序列,如mRNA。因此,核酶(例如锤头核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可以用来催化性地切割编码多肽的mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列具特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。备选地,对应于核酸序列的mRNA转录物可以用来从RNA分子库中选出具有特异性核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO 94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(AmpliconVIGS WO 98/36083)或Baulcombe(WO 99/15682)及其他人描述的策略而实现。
当在内源基因上存在突变和/或在随后引入植物的分离的基因/核酸上存在突变时,基因沉默也可以发生。降低或基本去除可以由无功能的多肽引起。例如,多肽可以与多种相互作用性蛋白质结合;一个或多个突变和/或截短因而可以提供仍能够结合相互作用性蛋白质(如受体蛋白质)但不能表现其正常功能的多肽(如起信号作用的配体)。
另一种基因沉默的方法是靶定与基因调节区(例如启动子和/或增强子)互补的核酸序列以形成阻止基因在靶细胞中转录的三螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992和Maher,L.J.Bioassays 14,807-15,1992。
其他方法,如使用针对内源性多肽的抗体以抑制此多肽在植物中的功能,或干扰所述多肽参与的信号途径,对于技术人员将是众所周知的。尤其,可以构思的是人造分子可以用于抑制靶多肽的生物学功能,或用于干扰靶多肽参与其中的信号途径。
备选地,可以建立筛选程序以鉴定在植物群体中基因的天然变体,其中所述的变体编码具有降低活性的多肽。此类天然变体也可以用于例如进行同源重组。
人工和/或天然的微小RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常19-24个核苷酸长度的单链小RNA。它们的主要功能是调节基因表达和/或mRNA翻译。大多数的植物微小RNA(miRNA)与其靶序列具有完全的或接近完全的互补性。然而,存在具有多达5个错配的天然靶标。它们由切酶家族的双链特异性RNA酶从具有特征性折回结构的较长的非编码性RNA中加工而来。在加工时,它们通过与RNA诱导性沉默复合物(RISC)的主要成分Argonaute蛋白质结合而掺入该复合体。MiRNA充当RISC的特异性成分,因此它们与细胞质中的靶核酸(大多是mRNA)碱基配对。后续的调节事件包括靶mRNA切割和破坏和/或翻译抑制。miRNA过量表达的作用因此在靶基因降低的mRNA水平上得到反映。
通常21个核苷酸长度的人工微小RNA(amiRNAs)可以遗传改造以特异性地负调节单个或多个目的基因的基因表达。植物微小RNA靶的选择的决定因素是本领域众所周知的。用于靶识别的经验参数已经确定并且可以用来辅助设计特定的amiRNA,(Schwab等,Dev.Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,Plant Cell 18,1121-1133,2006)。
为最佳性能,用于降低内源基因在植物中表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,将来自任何给定植物物种的核酸序列引入同一个物种内。例如,将来自稻的核酸序列转化至稻植物。然而,并非绝对要求待引入的核酸序列起源于与该核酸序列将要引入的植物相同的植物物种。只要内源性靶基因与待引入的核酸之间存在相当大的同源性就足够了。
上文描述的是用于降低或基本去除内源基因在植物中表达的多种方法的实例。本领域技术人员会轻易地能够调整前述用于沉默的方法以至于例如通过利用合适启动子而实现降低内源基因在整株植物或在其部分中的表达。
选择性标记(基因)/报道基因
“选择性标记”、“选择性标记基因”或“报道基因”包括向细胞赋予表型的任何基因,其中在所述的细胞内表达所述基因以促进鉴定和/或选择用本发明的核酸构建体所转染或转化的细胞。这些标记基因能够通过一系列不同原理鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素耐药性或除草剂抗性、引入新代谢性状或允许目视选择的标记。选择性标记基因的实例包括赋予抗生素耐药性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟素的抗性的基因)、赋予除草剂抗性的基因(例如提供
Figure A20078002806600531
抗性的bar;提供草甘膦抗性的aroA或gox或赋予对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA或利用木糖的木糖异构酶或抗营养标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择性标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择性标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择性标记的细胞存活而其他细胞死亡)。
因为一旦已经成功引入了核酸,则转基因宿主细胞中不再需要或不希望有标记基因,尤其抗生素耐药性基因和除草剂抗性基因,因此用于引入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其他更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。另一有利的方法依赖于重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则通过重组酶表达已经成功发生转化时,标记基因被去除。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
转基因的/转基因/重组
为本发明目的,“转基因的”、“转基因”或“重组”就核酸序列而言意指包含此核酸序列的表达盒、基因构建体或载体或用本发明的核酸序列、表达盒或载体转化的生物,这些构建均通过重组方法产生,其中
(a)编码用于本发明方法中的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的遗传调控序列,例如启动子,或
(c)(a)和(b)
不处于其天然遗传环境中或已经通过遗传操作方法修饰,修饰有可能采用例如取代、添加、缺失、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指来源植物中的天然基因组基因座或染色体基因座或在基因组文库中存在。在基因组文库的情况下,核酸序列的天然遗传环境优选地得到保留,至少部分地得以保留。该环境分布在核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp的序列长度。天然发生的表达盒-例如核酸序列的天然启动子与编码本发明方法中所用多肽的对应核酸序列的天然发生的组合,如上文所定义-在这种表达盒通过非天然的合成(“人工”)方法(如诱变处理)而受到修饰时,变成转基因表达盒。合适方法例如在US 5,565,350或WO 00/15815中描述。
为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的核酸不位于所述植物基因组中该核酸的天然基因座内,所述核酸有可能同源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸或在本发明方法中所用核酸处于植物基因组中该核酸的天然位置内,然而其序列相对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到修饰。转基因优选地理解为意指本发明核酸在基因组中的非天然基因座内表达,即发生核酸的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
转化
如本文中所提及的术语“引入”或“转化”包括外源性多核苷酸转移至宿主细胞内,无论用于转化的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚胎发生)的植物组织可以用本发明的遗传构建体转化并且可以从中再生整株植物。选择的具体组织将取决于可用于并且最适于正进行转化的具体物种的克隆性增殖系统。示例性组织靶包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地引入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,多核苷酸可以整合至宿主基因组内。产生的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转化植物。
外来基因转化至植物基因组内称作转化。植物物种的转化现在是相当常规的技术。有利地,几种转化方法中的任一方法可以用来将目的基因引入合适的祖先细胞。用于从植物组织或植物细胞中转化并再生出植物所述的方法可以用于瞬时转化或用于稳定转化。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;Negrutiu I等(1987)Plant MolBiol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的微量注射法(Crossway A等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA涂布的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。转基因植物,包括转基因作物植物,优选地通过农杆菌介导的转化法产生。有利的转化方法是在植物中(in planta)的转化法。为此目的,例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植物的分生组织。根据本发明已经证明使转化的农杆菌混悬液作用于完整植物或至少作用于花原基是特别有利的。植物随后继续培育直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导的稻转化的方法包括用于稻转化的公知方法,如在任一以下文献中描述的那些方法:欧洲专利申请EP 1198985 A1,Aldemita和Hodges(Planta 199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容在本文中引入作为参考,如同完全给出那样。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol 14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容在本文中如充分所述那样引入作为参考。所述方法通过举例方式进一步由B.Jenes等,Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,Academic Press(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacteriumtumefaciens)的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。由这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物,如拟南芥(拟南芥属于本发明的范围,不视为作物植物)或作物植物,例如烟草植物,通过在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随后将它们在合适的培养基内培育。植物通过根癌农杆菌的转化例如由
Figure A20078002806600571
和Willmitzer在Nucl.AcidRes.(1988)16,9877中描述或尤其从F.F.White,Vectors for GeneTransfer in Higher Plants;在Transgenic Plants,第1卷,Engineeringand Utilization,编者S.D.Kung和R.Wu,Academic Press,1993,第15-38页中获知。
除了转化体细胞(其随后必须再生成完整植物)之外,还有可能转化植物分生组织的细胞及特别转化发育成配子的那些细胞。在这种情况下,转化的配子遵循天然的植物发育过程,产生转基因植物。因此,例如拟南芥种子用农杆菌处理并且从发育植物中获得种子,其中一定比例的所述植物受到转化并且因此是转基因的[Feldman,KA和MarksMD(1987)Mol Gen Genet 208:274-289;Feldmann K(1992)。在:编者C Koncz,N-H Chua和J Shell,Methods in Arabidopsis Research.WordScientific,Singapore,第274-289页]。替代性方法基于反复去掉花序并使莲座叶丛中心中的切除部位与转化的农杆菌温育,因而转化的种子同样可以在较晚的时间点获得(Chang(1994)Plant J.5:551-558;Katavic(1994)Mol Gen Genet,245:363-370)。然而,尤其有效的方法是改良的真空渗入法,如“花浸染”法。在拟南芥真空渗入法的情况下,完整植物在减压下用农杆菌混悬液处理[Bechthold,N(1993)。C R AcadSci Paris Life Sci,316:1194-1199],而在“花浸染法”的情况下,正在发育的花组织与表面活性剂处理的农杆菌混悬液短暂温育[Clough,SJ和Bent,AF(1998)The Plant J.16,735-743]。在两种情况下收获了一定比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育而与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母体方式遗传,降低或消除了转基因经花粉流动风险。叶绿体基因组的转化一般通过已在Klaus等,2004[NatureBiotechnology 22(2),225-229]中示例性加以展示的方法实现。简而言之,待转化的序列连同选择性标记基因一起克隆至与叶绿体基因组同源的侧翼序列之间。这些同源的侧翼序列指导位点特异性整合至原质体系内。已经对众多不同植物物种描述了质体转化并且综述可以出自Bock(2001)在基础研究和植物生物技术中的转基因质体(Transgenicplastids in basic research and plant biotechnology).J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progress towards commercialization of plastid transformationtechnology).Trends Biotechnol.21,20-28。进一步生物技术进展最近已经以无标记质体转化体的形式作了报道,所述无标记质体转化体可以通过瞬时共整合的标记基因产生(Klans等,2004,Nature Biotechnology22(2),225-229)。
T-DNA激活标注
T-DNA激活标注(Hayashi等Science(1992)1350-1353)涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子(也可以是翻译增强子或内含子)),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的改良表达。因靠近所引入启动子的基因的改良表达,产生的转基因植物表现显性表型。
TILLING
术语“TILLING”是“基因组内定向诱导的局部损伤”的缩写且意指用于产生和/或鉴定核酸诱变技术,其中所述的核酸编码具有修饰表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以显示在强度方面或在位置方面或在时间方面改良的表达(例如若突变影响启动子)。这些突变变体可以显示比由处于其天然形式的基因所显出活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。一般在TILLING中遵循的步骤是:(a)EMS诱变(RedeiGP和Koncz C(1992)在Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编著,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编著,Arabidopsis.Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,第137-172页;Lightner J和Caspar T(1998)在JMartinez-Zapater,J Salinas编者,Methods on Molecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)PCR扩增目的区;(d)变性和复性以允许形成异源双链体;(e)DHPLC,其中将异源双链体是否在汇集物中的存在检测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)对突变PCR产物测序。用于TILLING的方法是本领域众所周知的(McCallum等,(2000)NatBiotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许选择的核酸在基因组中于确定的所选择位置内引入。同源重组是在生物科学中常规地用于低等生物如酵母或苔藓剑叶藓(Physcomitrella)的标准技术。用于在植物中开展同源重组的方法已经不仅对模式植物(Offringa等(1990)EMBO J 9(10):3077-84)而且对作物植物例如稻(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)进行了描述。
产量
术语”产量”通常意指经济价值的可测量结果,一般与指定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接对产量有贡献,或实际产量是对于某作物和一年的每英亩产量,这通过总产量(包括收获的和评估的产量)除以种植的英亩数而确定。术语植物的“产量”涉及该植物的营养生物量(根和/或茎生物量)、生殖器官和/或繁殖体(例如种子)。
早期萌发势
“早期萌发势”指尤其在植物生长早期期间活跃、健康、良好平衡的生长,且可以因植物适应性增加而产生,其原因在于例如植物更好地适应其环境(即优化能源的使用和苗与根之间的分配)。具有早期萌发势的植物也显示增加的幼苗存活和更好的作物建立,这往往导致高度均匀的田块(作物整齐地生长,即大多数植物在基本上相同的时间上达到发育的各阶段)和往往更好及更高的产量。因而,早期萌发势可以通过多种因子如千粒重、萌发百分数、出苗百分数、幼苗生长、幼苗高度、根长度、根及苗生物量和众多其他因素而确定。
增加/改善/增强
术语“增加”、”改善”或“增强”是可互换的并且应当在本申请含义上指与如本文中定义的对照植物相比至少5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。
种子产量
增加的种子产量本身可以表现为下列一种或多种指标:a)种子生物量(种子总重量)增加,这可以基于单粒种子和/或每株植物和/或每公顷或每英亩;b)每株植物增加的花数;c)增加的(饱满)种子数;d)增加的种子饱满率(其表述为饱满种子数与种子总数之间的比率);e)增加的收获指数,其表述为可收获部分(如种子)产量与总生物量的比率;和f)增加的千粒重(TKW),这从计数的饱满种子数及其总重量外推而来。增加的TKW可以因增加的种子大小和/或种子重量所致,并且也可以因胚和/或胚乳尺寸的增加所致。
种子产量的增加也可以表现为种子大小和/或种子体积的增加。此外,种子产量的增加本身也可以自我表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以产生改良的结构,或可以因改良的结构而出现。
绿度指数
文中所用的“绿度指数”计算自植物的数字图像。对于属于图像上对应的植物目标的每一像素,计算绿度值与红度值的比值(在编码颜色的RGB模式中)。绿度指数表示为绿与红的比值超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下以及在可获得营养物减少的生长条件下,植物的绿度指数在开花前的末次取像时测量。与之相反,在干旱胁迫生长条件下,植物的绿度指数在干旱前的初次取像时测量。
植物
如本文中所用的术语”植物”包含整株植物、植物的祖先及后代和植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花和组织及器官,其中每种所提及对象包含目的基因/核酸。术语”植物”也包含植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种提及的对象包含目的基因/核酸。
特别用于本发明方法中的植物包括属于植物界(Viridiplantae)超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostisstolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachisspp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avena spp.)(例如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avenahybrida)、阳桃(Averrhoa carambola)、箣竹属(Bambusa sp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapa ssp.)[卡诺拉油菜、油菜(oilseed rape)、蔓青(turniprape)])、Cadaba farinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、Carex elata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑橘属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasiaesculenta)、非洲梧桐属物种(Cola spp.)、黄麻属(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegusspp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属(Cynara spp.物种)、胡萝卜(Daucus carota)、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeis guineensis)、美洲油棕Elaeis(oleifera))、穇子(Eleusine coracana)、蔗茅属(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属(Eucalyptus sp.)、红仔果(Eugeniauniflora)、荞麦属物种(Fagopyrum spp.)、水青冈属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属(Glycine spp.)(例如大豆、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属(Helianthus spp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactucasativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotusspp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzula sylvatica、番茄属(Lycopersicon spp.)(例如番茄(Lycopersiconesculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkarazapota)、苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordicaspp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntiaspp.)、鸟足豆属物种(Ornithopus spp.)、稻属物种(Oryza spp.)(例如稻、阔叶稻(Oryza latifolia))、稷(Panicum miliaceum)、柳枝稷(Panicumvirgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Persea spp.)、芹菜(Petroselinumcrispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinusspp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punicagranatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属(Solanum spp.)(例如马铃薯(Solanumtuberosum)、红茄(Solanum  integrifolium)或番茄(Solanumlycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinaciaspp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、Triticosecale rimpaui、小麦属(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野碗豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍、Zizania palustris、枣属物种(Ziziphus spp.)等等。
发明详述
ERLK
现已发现在植物中调节编码伸展蛋白受体样激酶(ERLK)或其部分的核酸的表达产生了相对于对照植物具有增强的产量相关性状的植物,其中所述部分包含至少激酶结构域和跨膜结构域。
因此,本发明的第一实施方案提供相对于对照植物增强植物产量相关性状的方法,其包括在植物中调节编码ERLK蛋白质或其部分的核酸的表达。
用于调节(优选增加)编码伸展蛋白受体样激酶(ERLK)或其部分的核酸表达的优选方法是在植物中引入并表达编码此类ERLK蛋白质的核酸,其中所述部分包含至少激酶结构域和跨膜结构域。
在此之后“用于本发明方法中的蛋白质”的任何引用意指如本文中所定义的ERLK多肽。在此之后“用于本发明方法中的核酸”的任何引用意指能够编码此类ERLK多肽的核酸。待引入植物(并且因而用于实施本发明方法)的核酸是编码现在所述类型蛋白质的任意核酸,下文又称作“ERLK核酸”或“ERLK基因”。
用于本发明方法中的ERLK蛋白质是Shiu和Bleeker(2001)定义的ERLK蛋白质。术语“ERLK蛋白质”或“伸展蛋白受体样激酶”意指包含激酶结构域和跨膜结构域的N-末端的蛋白质(参见用于示意性概述的图1和图2)。ERLK蛋白质优选还包含N-末端分泌信号序列以及任选的胞外结构域。用于本发明的ERLK蛋白质激酶结构域(和/或其他结构域)优选分类为Shiu和Bleeker(2001)定义的伸展蛋白受体样激酶。
术语“结构域”和“基序”在文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation(用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能),(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAI Press,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(瑞士生物信息学研究所(Gasteiger等,ExPASy:the proteomics server for in-depth protein knowledge andanalysis(用于深入认识和分析蛋白质的蛋白组学服务器),Nucleic AcidsRes.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对而鉴定。
用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的全局性(即覆盖完整序列的)比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.2003 Jul 10;4:29.MatGAT:用蛋白质或DNA序列而产生相似性/同一性矩阵的应用)。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构域(如激酶结构域)。使用上文提及的程序,使用默认参数,针对整个核酸序列或氨基酸序列或针对选择的结构域或保守基序测定了序列同一性值。
用于本发明方法中的ERLK蛋白质中的激酶结构域是蛋白质Tyr激酶型结构域(Pfam登录号PF07714、InterPro登录号IPR001245)。活性位点对应PROSITE标签PS00109,具有下列共有模式:[LIVMFYC]-{A}-[HY]-x-D-[LIVMFY]-[RSTAC]-{D}-{PF}-N-[LIVMFYC](3),其中D是活性位点的部分。该模式的体系(syntax)是根据用于Prosite数据库的习惯并在PROSITE手册中解释。
优选地,激酶结构域通过序列基序1(SEQ ID NO:6)的存在进一步表征:
(M/L)L(S/G/R)R(L/M)(H/R/Q)(H/S/C)(R/P)(N/Y)L(L/V)XL(I/L/V)G其中X可以是任意氨基酸,优选是K、N、A、S、G、E中的一个。优选地,基序1具有序列LLSR(L/M)(H/R/Q)(C/S)PYL(L/V)(E/G/A)L(L/I);
最优选基序1具有序列LLSRLQCPYLVELLG。
优选地,激酶结构域也包含序列基序2(SEQ ID NO:7):
L(Y/D/N)(W/F)X(A/V/T)R(L/M)(L/R/G)IA(L/V)
其中X可以是任意氨基酸,优选是D、N、E、K、P、Q或G中的一个,
序列基序3(SEQ ID NO:8):
A(R/K)(A/G)L(A/E)(Y/F)LHE,
序列基序4(SEQ ID NO:9):
(V/I)IHR(D/N)(F/L)K(S/A/G/C)(S/T)N(I/V)LL(E/D)
其中第6位的氨基酸优选不是I、V或M,
序列基序5(SEQ ID NO:10):
(K/R)V(S/A/T)DFG(L/M/S)
中的一个或多个。
优选地,序列基序2具有序列LDW(G/Q/P/E)(A/T)R(L/M)(R/G)IA(L/V),更优选地,序列基序2具有序列LDW(G/Q)(T/A)RL(R/G)IAL,最优选地,序列基序2具有序列LDWGARLRIAL。序列基序3优选具有序列ARALEFLHE。序列基序4优选具有序列VIHR(D/N)(F/L)K(S/C)(S/T)NILLD,最优选地,该序列是VIHRNFKCTNILLD。序列基序5优选具有序列(K/R)VSDFG(L/M),该序列最优选是KVSDFGL。
优选地,用于本发明方法中的ERLK蛋白质的激酶结构域与SEQID NO:2的激酶结构域(如SEQ ID NO:57所给出的)具有一定序列同一性,所述序列同一性按照增加的优选顺序为至少39%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%。激酶结构域可以使用如上列出的用于蛋白质鉴定的数据库和工具,和/或用于待比较的序列比对的方法进行鉴定。在一些情况下,可以调整默认参数以调节搜索的严格性。例如使用BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作“期望”值)以显示严格性较低的匹配。这样,可以鉴定几乎精确的短匹配。
跨膜结构域长约为15至30个氨基酸,并通常包含形成α螺旋的疏水残基。它们一般基于疏水性预测(例如Klein等,Biochim.Biophys.Acta 815,468,1985;或Sonnhammer等,In J.Glasgow、T.Littlejohn、F.Major、R.Lathrop、D.Sankoff和C.Sensen编著,Proceedings of theSixth International Conference on Intelligent Systems for MolecularBiology,第175-182页,Menlo Park,CA,1998,AAAI Press).
ERLK蛋白质的胞外结构域如果存在,具有(但不是必须)一个或多个SPx基序。分泌信号序列的结构及其切割位点的预测是本领域熟知的。
另外,用于本发明方法中的ERLK蛋白质(至少以其天然形式)一般,但不是必须具有激酶活性。因此,具有降低的激酶活性或不具有激酶活性的ERLK蛋白质同样可用于本发明的方法中。本领域的技术人员使用常规工具和技术可容易的确定激酶活性的存在。为了确定受体样激酶的激酶活性,一些测定是可用的(例如Current Protocols inMolecular Biology,1和2卷,Ausubel等(1994),Current Protocols)。简要的,激酶测定通常包括(1)使激酶蛋白质接触含有待磷酸化的靶位点的底物多肽;(2)适当的条件下,在适当激酶缓冲液中进行靶位点的磷酸化;(3)在恰当的反应期后将磷酸化的产物从未磷酸化的底物中分离出来。激酶活性的存在或缺乏是通过磷酸化靶标的存在或缺乏来确定的。另外,可以进行定量测量。纯化的受体样激酶,或者含有或富含受体样激酶的细胞提取物可以用作激酶蛋白质的来源。备选的,可以使用Zhao等(Plant Mol.Biol.26,791-803,1994)的方法,其中稻类受体激酶的胞质结构域在大肠杆菌(Escherichia coli)中表达并测定激酶活性。作为底物,小肽是尤其适合的。肽在磷酸化位点基序中必须含有一个或多个丝氨酸、苏氨酸或酪氨酸残基。可以在Biochimica et Biophysica Acta 1314,191-225,(1996)中找到磷酸化位点的汇编。此外,肽底物可以优选具有净正电荷,以利于结合到磷酸纤维素滤器上(可用于将磷酸化的肽从未磷酸化的肽中分离出来并且检测磷酸化的肽)。如果不知道磷酸化位点基序,可以使用常规酪氨酸激酶底物。例如,“Src相关肽”(RRLIEDAEYAARG)是许多受体和非受体酪氨酸激酶的底物。为了确定合成肽磷酸化的动力参数,需要肽浓度的范围。对于起始反应,可使用0.7-1.5mM的肽浓度。对于每种激酶,重要的是要确定活性的最佳缓冲液、离子强度和pH。标准5×激酶缓冲液通常含有5mg/ml BSA(防止激酶与测定管吸附的牛血清蛋白)、150mM Tris-Cl(pH 7.5)、100mMMgCl2。绝大部分酪氨酸激酶需要二价阳离子,尽管一些酪氨酸激酶(例如胰岛素-、IGF-1-和PDGF受体激酶)需要MnCl2替代MgCl2(或除了MgCl2外还需要MnCl2)。根据经验为每种蛋白激酶确定二价阳离子的最佳浓度。常用的磷酰基(phophoryl)基团供体是放射性标记的[γ-32P]ATP(通常是0.2mM终浓度)。在肽中掺入的32P可以通过在闪烁计数器中的硝化纤维素干垫上测量活性来确定。
本发明通过用由SEQ ID NO:1代表的编码多肽序列SEQ ID NO:2的核酸序列转化的植物加以说明,然而,本发明的实施不限于这些序列。本发明方法可以使用如文中定义的任意ERLK-编码核酸或ERLK多肽有利地进行。
编码ERLK多肽的核酸的实例在文中实施例1的表A中给出。这类核酸可用于实施本发明的方法。实施例1的表A中给出的氨基酸序列是SEQ ID NO:2所示的ERLK多肽的直向同源物和旁系同源物的实例,术语“直向同源物”和“旁系同源物”如文中所定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地鉴定。这通常涉及第一BLAST,其中所述的第一BLAST包括提交查询序列(例如使用实施例1的表A中列出的任一序列)用于针对任一序列数据库(如公众可用的NCBI数据库)的BLAST搜索。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13或SEQ ID NO:14的情况下,第二BLAST因而将针对拟南芥序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地在最高命中的查询序列中产生,则鉴定到旁系同源物;若第一BLAST的中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法。此类核酸变体的实例包括编码实施例1的表A中给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如文中所定义。也可用于本发明方法中的是编码实施例1的表A中给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。用于本发明方法中的同源物和衍生物与它们衍生自的未修饰的蛋白质具有基本相同的生物和功能活性。
用于实施本发明方法的其他核酸变体包括编码ERLK多肽的核酸的部分、与编码ERLK多肽的核酸杂交的核酸、编码ERLK多肽的核酸的剪接变体、编码ERLK多肽的核酸的等位变体,以及通过基因改组获得的编码ERLK多肽的核酸的变体。术语杂交序列、剪接变体、等位变体和基因改组如文中所述。
编码ERLK多肽的核酸不需要是全长核酸,因为本发明方法的实施不依赖使用全长核酸序列的使用。本发明提供在植物中增强产量相关性状的方法,其包括在植物中引入和表达实施例1的表A中给出的核酸序列中任一个的部分,或实施例1的表A中给出的氨基酸序列中任一个的直向同源物、旁系同源物或同源物的编码核酸的部分。优选地,该部分编码的多肽从N-末端到C-末端至少包括(i)跨膜结构域和(ii)伸展蛋白受体样激酶型(ERLK-型)激酶结构域。
核酸的部分可以例如通过对该核酸产生一个或多个缺失而制备。所述的部分可以以分离的形式加以使用或它们可以与其他编码性(或非编码性)序列融合,以便例如产生组合几种活性的蛋白质。当与其他编码序列融合时,翻译时产生的所得多肽可以比对该蛋白质部分所预测的多肽更大。
用于本发明方法中的部分编码文中定义的ERLK多肽,其具有激酶结构域(如上所述)并与实施例1的表A中给出的任意氨基酸序列所示的ERLK蛋白质具有基本相同的生物学活性。优选地,此部分是在实施例1的表A中给出的任何一种核酸的部分,或实施例1的表A中给出的氨基酸序列中任一个的直向同源物或旁系同源物的编码核酸的部分。此部分的长度按照增加的优选顺序为至少800、850、900、950、1000、1050、1100、1150,1200、1250、1300个连续核苷酸,其中所述的连续核苷酸是实施例1的表A中给出的任何一种核酸序列,或是实施例1的表A中给出的氨基酸序列中任一个的直向同源物或旁系同源物的编码核酸。最优选地,此部分是核酸SEQ ID NO:1的部分。
用于本发明方法中的另一核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如文中所定义的ERLK多肽的核酸杂交,或与如文中所定义的部分杂交的核酸。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达能够与实施例1的表A中给出的任何一种核酸杂交的核酸,或包括在植物中引入并表达如此核酸,其能够与实施例1的表A中给出的任意核酸序列的直向同源物、旁系同源物或同源物的编码核酸杂交的核酸。
用于本发明方法中的杂交序列编码文中定义的ERLK多肽,其具有ERLK-型激酶结构域和跨膜结构域(如上所述)并与实施例1的表A中给出的氨基酸序列具有基本相同的生物学活性。杂交序列一般长度为至少800个核苷酸,优选长度为至少1000个核苷酸,进一步优选长度为至少1200个核苷酸,最优选长度为至少1300个核苷酸。优选地,杂交序列能够与实施例1的表A中给出的任一核酸杂交或与任一这些序列的部分杂交,其中所述的部分如上文所定义,或者其中杂交序列能够与实施例1的表A中给出的任一氨基酸序列的直向同源物或旁系同源物的编码核酸杂交,或与探针或衍生自其的探针杂交。最优选地,杂交序列能够与如SEQ ID NO:1所代表的核酸,或与其部分或探针杂交。
设计探针的方法是本领域熟知的。探针长度一般小于1000bp,优选小于500bp。通常,用于诸如Southern印记的DNA-DNA杂交的探针长度在100至500bp之间变化,而用于诸如PCR扩增的DNA-DNA杂交的探针中的杂交区一般短于50个核苷酸但长于10个核苷酸。
用于本发明方法中的另一种核酸变体是编码如上文所定义的ERLK多肽的剪接变体,剪接变体如文中所定义。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例1的表A中给出的任何一种核酸的剪接变体,或实施例1的表A中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:1代表的核酸的剪接变体,或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的剪接变体。
用于实施本发明方法的另一种核酸变体是编码如上文所定义的ERLK多肽的核酸的等位变体,等位变体如文中所定义。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例1的表A中给出的任何一种核酸的等位变体,或包括在植物中引入并表达实施例1的表A中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的等位变体。
用于本发明方法中的等位变体具有与ERLK多肽SEQ ID NO:2和实施例1的表A中所示的任意氨基酸基本相同的生物学活性。等位变体天然存在,且包含在本发明方法中的是这些天然等位基因的用途。优选地,等位变体是SEQ ID NO:1的等位变体,或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位变体。
用于本发明方法中的另一核酸变体是通过基因改组而获得的核酸变体。基因改组或定向进化也可以用来产生编码如上文定义的ERLK多肽的核酸的变体;术语“基因改组”如文中所定义。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例1的表A中给出的任何一种核酸的变体,或包括在植物中引入并表达如此核酸的变体,其中所述的核酸编码实施例1的表A中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物,所述变体核酸通过基因改组获得。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编著)。
编码ERLK多肽的核酸可以来自任何自然来源或人工来源。核酸可以从其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。编码ERLK多肽的核酸优选地来自植物,还优选来自双子叶植物,更优选来自十字花科,该核酸最优选来自拟南芥。
本发明方法的实施产生具有增强的产量相关性状的植物。尤其本发明方法的实施产生相对于对照植物而具有增加的产量、尤其是增加的种子产量的植物。在本文中的“定义”部分中更详细地描述了术语“产量”和“种子产量”。
在本文中对增强的产量相关性状的参考意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。尤其,此类可收获部分是种子和叶生物量,并且本发明方法的实施产生相对于对照植物具有增加的叶生物量和增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩生长的(establish)植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
本发明提供相对于对照植物,增加植物产量,尤其是增加植物叶生物量和增加种子产量的方法,所述方法包括在植物中调节编码如文中所定义的ERLK多肽的核酸的表达,优先增加其表达。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码ERLK多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白质、增量调节抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在相当条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码ERLK多肽的核酸在植物中表达。
本发明方法的实施产生相对于在相当条件下培育的合适对照植物,在营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所述方法包括增加编码ERLK多肽的核酸在植物中的表达。营养缺乏可以因营养物的缺乏或过量所致,所述营养物例如是氮、磷酸盐及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等。
本发明包括可通过本发明方法获得的植物或其部分(包括种子)。该植物或其部分包含编码如上文定义的ERLK多肽的核酸转基因。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达编码ERLK多肽的核酸。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含
(a)编码如上文定义的ERLK多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码ERLK多肽的核酸如上文所定义。术语“调控序列”和“终止序列”如上文所定义。
植物用包含如上所述的任意核酸的载体转化。本领域技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列与一种或多种调控序列(至少与启动子)有效连接。
有利地,任何类型的天然或合成启动子可以用来驱动核酸序列的表达。组成型启动子尤其可用于本方法中。各种启动子类型的定义参见文中的“定义”部分。优选的组成型启动子是也实质上遍在表达的组成型启动子。其他启动子优选来自植物,更优选来自单子叶植物。最优选是使用GOS2启动子,其与来自稻的GOS2启动子基本类似或相同(SEQ ID NO:5或SEQ ID NO:58)。
应当明白本发明的适用性不限于由SEQ ID NO:1代表的ERLK多肽编码核酸,同时本发明的适用性也不限于在组成型启动子驱动时表达ERLK多肽编码核酸。其他组成型启动子的实例参见文中“定义”部分的表2a。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。如定义部分所述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。文中的“定义”部分更加详细的描述了选择性标记。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的“定义”部分。
本发明也提供产生转基因植物的方法,其中所述转基因植物相对于对照植物具有增强的产量相关性状,其包括在植物中引入和表达编码如上文中所定义的ERLK多肽的任意核酸。
更具体地,本发明提供用于产生具有增强的产量相关性状,尤其是增加的叶生物量和种子生物量的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中引入和表达ERLK多肽编码核酸;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
(i)的核酸可以是能够编码文中定义的ERLK多肽的任意核酸。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸优选地通过转化引入植物。文中的“定义”部分更加详细的描述了术语“转化”。
遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R.Wu、Potrykus或
Figure A20078002806600781
和Willmitzer的上述出版物。
通常在转化后,选择一种或多种标记存在的植物细胞或细胞群体,其中所述的标记由与目的基因一起共转移的植物可表达的基因编码,随后将转化的材料再生成整株植物。为了选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。另一种可能性包括在使用合适选择剂的琼脂平板上生长种子(根据需要在消毒之后),使得仅转化的种子可以生长成植物。或者,转化的植物通过上述那些选择性标记的存在筛选。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析进行监测,这两种技术是本领域技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交,选择纯合的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步增殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如被转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过文中所述的任意方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任意前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的一种或多种基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有编码如上文所定义的ERLK多肽的分离的核酸。本发明优选的宿主细胞是植物细胞。宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
本发明方法有利地适用于任何植物。本发明还包括通过本发明的方法获得的植物。本发明因此提供通过本发明的方法获得的植物、其植物部分或植物细胞,所述植物、其部分或细胞包含编码如上文所定义的ERLK蛋白质的核酸转基因。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及来自自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。增加核酸、基因或基因产物的表达的方法在现有技术中充分记载,并且实例在定义给出。
如上文提及,用于调节(优选增加)编码ERLK多肽的核酸表达的优选方法是在植物中引入并表达编码ERLK多肽的核酸;然而实施所述方法的作用即增强产量相关性状也可以使用众所周知的其他技术实现,所述技术包括但不限于T-DNA激活标注、TILLING、同源重组。这些技术的描述在定义给出。
本发明也包括编码文中所述ERLK多肽的核酸的用途和这些ERLK多肽的用途,其用于增强植物中的任意上述产量相关性状。
编码文中所述ERLK多肽的核酸或ERLK多肽本身可以用于育种程序中,其中鉴定到可以遗传地与编码ERLK多肽的基因连接的DNA标记。所述的核酸/基因或ERLK多肽本身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有本发明方法中如上文所定义的增强的产量相关性状的植物。
编码ERLK多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物进行诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其他任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码ERLK多肽的核酸也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。编码ERLK多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码ERLK多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,ALaboratory Manual)可以用ERLK编码核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码ERLK多肽的核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)GenomeRes.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例可见于文中的“定义”部分。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等,(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等,(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等,(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook,(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
本发明方法产生具有如前文所述的具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增加性状,对其他非生物胁迫和生物性胁迫的耐受性,调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
FBW40
现已惊奇地发现增加编码FBXW多肽的核酸在植物中的表达产生了相对于对照植物而具有增强的产量相关性状的植物。因而,本发明提供相对于对照植物增强植物产量相关性状的方法,其包括增加编码FBXW多肽的核酸在植物中的表达。
用于增加编码FBXW多肽的核酸表达的优选方法是在植物中引入并表达编码FBXW多肽的核酸。
在此之后“用于本发明方法中的蛋白质”的任何引用意指如本文中所定义的FBXW多肽。在此之后“用于本发明方法中的核酸”的任何引用意指能够编码此类FBXW多肽的核酸。待引入植物(并且因而用于实施本发明方法)的核酸是编码现在所述类型蛋白质的任意核酸,下文又称作“FBXW核酸”或“FBXW基因”。
文中所定义的术语“FBXW多肽”意指多肽,其包含:(i)F-框;(ii)包含至少一个WD40重复的WD40结构域;(iii)SEQ ID NO:97所示的基序1;和(iv)SEQ ID NO:98所示的基序2。
优选地,基序1的序列是:
WK(E/K)(F/V/L)Y(C/R/G)ERWGXP,X代表任意氨基酸。
基序1中最保守的氨基酸是XLXFGXXXYFXWKXXYXERWGXP,并且基序2中最保守的氨基酸是SLXFEXPWLVSXSXDG(其中X是各位置不同的氨基酸的特定子集,如SEQ ID NO:97和SEQ ID NO:98所示)。其中基序1和基序2允许在任何位置有一个或多个保守性改变,和/或允许在任何位置有一个、两个或三个非保守性改变。
任选地,FBXW多肽可包含下列中的一个或多个:(a)SEQ ID NO:99所示的基序3;(b)SEQ ID NO:100所示的基序4;和(c)SEQ ID NO:101所示的基序5。其中基序3至5允许在任何位置有一个或多个保守性改变,和/或允许在任何位置有一个或两个非保守性改变。
上文定义的FBXW多肽的实例由SEQ ID NO:60所示,其包含:(i)F-框;(ii)包含至少一个WD40重复的WD40结构域;(iii)SEQ ID NO:97所示的基序1;和(iv)SEQ ID NO:98所示的基序2;并且任选包含下列中的一个或多个:(a)SEQ ID NO:99所示的基序3;(b)SEQ ID NO:100所示的基序4;和(c)SEQ ID NO:101所示的基序5(图5是表示SEQ ID NO:60中不同结构域及其相关位置的草图)。其他此类实例由SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68或SEQ ID NO:70,或上述任意SEQ ID NO的直向同源物或旁系同源物中的任一个所示。本发明通过用SEQ ID NO:59所示的编码多肽SEQID NO:60的拟南芥序列转化的植物举例说明。SEQ ID NO:62(由SEQID NO:61编码,来自稻)、SEQ ID NO:64(由SEQ ID NO:63编码,来自蒺藜苜蓿),SEQ ID NO:66(由SEQ ID NO:65编码,来自普通小麦),SEQ ID NO:68(由SEQ ID NO:67编码,来自美洲山杨(Populustremuloides))和SEQ ID NO:70(由SEQ ID NO:69编码,来自玉蜀黍)是多肽SEQ ID NO:60的直向同源物。
直向同源物和旁系同源物(该术语如上文所定义)可以通过开展所谓交互性blast搜索而容易地找到。这一般涉及通过第一BLAST进行,其中所述的第一BLAST包括查询序列(例如SEQ ID NO:59或SEQ IDNO:60)针对任何序列数据库(如公众可用的NCBI数据库)进行BLAST搜索。当从核苷酸序列开始时,可以使用BLASTN或TBLASTX(使用标准默认值),并且当从多肽序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后将筛选结果和非筛选结果的全长序列针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:59或SEQ ID NO:60的情况下,第二BLAST因而将针对拟南芥序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地产生查询序列作为最高命中,则鉴定到旁系同源物;若高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。对直向同源物和旁系同源物鉴定的详述实例在实施例8中给出。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。优选地,用于本发明方法中的FBXW多肽与SEQ IDNO:60具有一定序列同一性,所述序列同一性按照增加的优选顺序为至少45%、50%、55%、65%,70%、75%、80%、85%、90%,95%或98%(计算示于实施例9)。FBXW多肽之间呈现相对低的保守氨基酸序列同一性,虽然它们的多肽结构(包括F-框和WD40结构域)相当保守。SEQ ID NO:102和SEQ ID NO:103(均包含在SEQ ID NO:60中)所示的FBXW多肽的两个较保守区之间的序列保守性按照增加的优选顺序为至少60%、65%、70%、75%、80%、85%、90%、95%或98%同一性(计算示于实施例9)。
SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70中的任一个所代表的多肽或任意前述SEQ ID NO的直向同源物或旁系同源物均包含(i)F-框;(ii)包含至少一个WD40重复的WD40结构域;(iii)SEQ ID NO:97所示的基序1;和(iv)SEQ ID NO:98所示的基序2。
术语″结构域″和“基序”定义如上。存在用于鉴定结构域的专业数据库。在FBXW多肽中的F-框和WD40重复可以使用例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244;由德国海德堡的EMBL拥有)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;由英国的欧洲生物信息研究所(EBI)拥有)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(In)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))、作为一项服务向科学界提供的ExPASy蛋白质组服务器(由瑞士的瑞士生物信息学研究所(SIB)拥有)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002),由英国的Sanger研究所拥有)加以鉴定。F-框包含40至50个残基,其中不变的位置很少。这种严格共有序列的缺乏使用搜索算法要点(essential)鉴定。F-框在InterPro数据库中命名为IPR001810、在Pfam数据库中命名为PF00646并且在PROSITE数据库中命名为PS50181。WD40结构域中包含的WD40重复一般为大约40个氨基酸。正如F-框,除了通常(但不是必须)以Trp-Asp(W-D)二肽结尾的该重复具有很少不变的位置。使用搜索算法的鉴定基本相当。WD40重复在InterPro数据库中命名为IPR001680、在Pfam数据库中命名为PF00400并且在PROSITE数据库中命名为PS50082。根据PFAM算法,WD40结构域通常包含4至16个重复(PF00400重复),优选包含5-10个重复,更优选包含6-8个重复,最优选包含7个重复。WD40结构域在InterPro数据库中命名为IPR0011046。
用于比对序列进行比较的方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J MolBiol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心可获得的。同源物可以使用例如在京都大学生物信息学中心(Kyoto UniversityBioinformatics Center)的GenomeNet服务器上可获得的ClustalW多重序列比对算法(1.83版本),用默认配对比对参数和以百分数计的评分方法而轻易地鉴定。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。在一些情况下,可以调整默认参数以调节搜索法的严格性。例如使用BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作“期望”值)以显示严格性较低的匹配。以这种方式,可以鉴定几乎精确的短匹配。以这种方式可以鉴定如SEQ ID NO:97所代表的基序1和如SEQ ID NO:98所代表的基序2,其中所述的基序均包含于在用于本发明方法中的FBXW多肽内(图6)。允许在基序1和基序2内的任意位置上的一个或多个保守性改变,和/或在任意位置上的一个、两个或三个非保守性改变。基序3至5(分别由SEQ ID NO:99、SEQ ID NO:100和EQ ID NO:101所示)可同样鉴定(图6)。允许在基序3至5内的任意位置上的一个或多个保守性改变,和/或在任意位置上的一个或两个非保守性改变。
编码由SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70的任一种所示多肽或任一前述SEQ ID NO的直向同源物或旁系同源物的核酸不必是全长核酸,因为本发明方法的实施不依赖使用全长核酸序列。另外,在实施本发明方法中适用的核酸的实例包括但不限于由SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67或SEQ ID NO:69的任一种所示的那些核酸。核酸变体也可以在实施本发明的方法中使用。此类变体的实例包括天然存在的或通过DNA操作获得的核酸的部分、杂交序列、剪接变体、等位变体。
部分可以例如通过对编码如上文所定义的FBXW多肽的核酸产生一个或多个缺失而制备。所述的部分可以以分离的形式加以使用或它们可以与其他编码性(或非编码性)序列融合,以便例如产生结合几种活性的蛋白质。当与其他编码序列融合时,翻译时产生的所得多肽可以比对FBXW部分所预测的多肽更大。用于本发明方法中的部分编码(如上文所述的)FBXW多肽,其中所述多肽具有与任一SEQ ID NO:60、SEQID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70所示的FBXW多肽或任一前述SEQ ID NO的直向同源物或旁系同源物基本上相同的生物学活性。部分的实例可以包括这样的核苷酸,其编码的多肽包含(i)F-框;(ii)包含至少一个WD40重复的WD40结构域;(iii)SEQ ID NO:97所示的基序1;和(iv)SEQ ID NO:98所示的基序2。部分可任选包括下列中的一个或多个:(a)SEQ ID NO:99所示的基序3;(b)SEQ ID NO:100所示的基序4;和(c)SEQ ID NO:101所示的基序5。所述的部分一般是至少500个核苷酸长度、优选至少750个核苷酸长度、更优选至少1000个核苷酸长度并且最优选至少1500个核苷酸长度。优选地,所述部分是如SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67或SEQ ID NO:69的任一种所示的核酸的部分。最优选地,该部分是如SEQ ID NO:59所示的核酸的部分。
用于本发明方法中的另一种核酸变体是能够在降低的严格性条件下、优选在严格条件下与编码如本文中所定义的FBXW多肽的核酸杂交,或与如本文中所定义的部分杂交的核酸。
术语“杂交”在上面的定义部分定义。用于本发明方法中的杂交序列编码这样的多肽,其包含:(i)F-框;(ii)包含至少一个WD40重复的WD40结构域;(iii)SEQ ID NO:97所示的基序1;和(iv)SEQ ID NO:98所示的基序2,并且与SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70所示的FBXW多肽,或任一前述SEQ ID NO的直向同源物或旁系同源物具有基本上相同的生物学活性。所述杂交序列一般是至少250个核苷酸长度、优选至少500个核苷酸长度、更优选至少750个核苷酸长度并且最优选至少1000个核苷酸长度。优选地,所述杂交序列是能够与由SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67或SEQ ID NO:69所示的任一核酸杂交或与任一前述序列的部分杂交的序列,其中所述的部分如上文定义。最优选地,所述杂交序列能够与SEQ ID NO:59或与其部分杂交。
编码FBXW多肽的部分缺乏一个或多个以下部分:(i)F-框;(ii)包含至少一个WD40重复的WD40结构域;(iii)SEQ ID NO:97所示的基序1;和(iv)SEQ ID NO:98所示的基序2,例如可用作下述杂交方法中的探针,以获得用于实施本发明方法的部分,所述部分包括(i)F-框;(ii)包含至少一个WD40重复的WD40结构域;(iii)SEQ ID NO:97所示的基序1;和(iv)SEQ ID NO:98所示的基序2的全部。用于杂交方法的实例由以下所示:来自葡萄(Vitis vinifera)的SEQ ID NO:71(NCBI ESTCF210354、CF413646和CF213082的叠连群)、来自Senecio cambrensis的SEQ ID NO:73(NCBI EST DY662683.1)、来自向日葵的SEQ IDNO:75(NCBI EST DY916708)、来自乳浆大戟(Euphorbia esula)的SEQ ID NO:77(NCBI EST DV129599)、来自番茄的SEQ ID NO:79(NCBI EST BI931509)、来自Aquilegia formosa x Aquilegia pubescens的SEQ ID NO:81(NCBI EST DT753991.1)、来自陆地棉的SEQ IDNO:83(NCBI EST DT466472)、来自两色蜀黍的SEQ ID NO:85(NCBI EST CF770159)、来自牵牛(Ipomea nil)的SEQ ID NO:87(NCBI EST BJ574759.1)、来自马铃薯的SEQ ID NO:89(NCBI ESTCX161187)、来自菱叶凤尾蕉(Zamia fischeri)的SEQ ID NO:91(NCBI EST DY032229)、来自鳄梨(Persea americana)的SEQ ID NO:93(NCBI EST CK756534)和来自大豆的SEQ ID NO:95(NCBI ESTCD418593.1)。
用于本发明方法中的另一种核酸变体是编码如上文所定义的FBXW多肽的剪接变体。优选的剪接变体是编码由SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70任一个所示的FBXW多肽的核酸的剪接变体,或是编码任一前述SEQ ID NO的直向同源物或旁系同源物的剪接变体。其他优选的是由SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65、SEQ ID NO:67或SEQ ID NO:69中的任一个所示的核酸的剪接变体。最优选的是由SEQ ID NO:59所示的核酸的剪接变体。
用于实施本发明方法的另一种核酸变体是编码如上文所定义的FBXW多肽的核酸的等位变体。等位变体天然存在,且包含在本发明方法中的是这些天然等位基因的用途。用于本发明方法中的等位变体具有与FBXW多肽SEQ ID NO:60和实施例8的表G中所示的任意氨基酸基本相同的生物学活性。等位变体可以是编码由SEQ ID NO:60、SEQID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ IDNO:70任一个所示的FBXW多肽的核酸的等位变体,或是编码任一前述SEQ ID NO的直向同源物或旁系同源物的核酸的等位变体。其他优选是由SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67或SEQ ID NO:69中的任一个所示的核酸的等位变体。最优选的是由SEQ ID NO:59所示的核酸的等位变体。
用于本发明方法中的另一核酸变体是通过基因改组而获得的核酸变体。基因改组或定向进化也可以用来产生编码如上文定义的FBXW多肽的核酸的变体。
另外,核酸变体也可以例如通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocolsin Molecular Biology.Wiley编著)。
还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70所示的任何一种氨基酸的同源物,或任一前述SEQ IDNO的直向同源物或旁系同源物的同源物。术语“同源物”、“直向同源物”和“旁系同源物”如上文所定义。
还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70所示的任何一种氨基酸的衍生物,或任一前述SEQ IDNO的直向同源物或旁系同源物的衍生物。
编码FBXW多肽的核酸可以来自任何自然来源或人工来源。核酸可以根据就组成和/或基因组环境方面通过人类有意操作而对天然形式加以修饰。优选地,编码FBXW多肽的核酸来自植物,还优选来自双子叶植物,更优选来自十字花科,该核酸最优选地来自拟南芥。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。
因而,提供基因构建体,其包含:
(i)编码如上文所定义的FBXW多肽的核酸;
(ii)与(i)的核酸有效连接的一种或多种调控序列。
本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
植物用包含目的序列的载体(即编码FBXW多肽的核酸)转化。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。
有利地,任何类型的启动子(不论是天然的或合成的)可以用来驱动核酸序列的表达。
根据本发明的一个优选特征,编码FBXW多肽的核酸与组成型启动子(调控序列)有效连接。该组成型启动子优选地是GOS2(也称为SUI1或eIF1(真核起始因子1))启动子,更优选地,该组成型启动子是稻GOS2启动子,该组成型启动子还优选地由基本上与SEQ ID NO:104或SEQ ID NO58相似的核酸序列所示,该组成型启动子最优选地如SEQ ID NO:104或SEQ ID NO58所示。
应当明白本发明的适用性不限于编码由SEQ ID NO:59所示的FBXW多肽的核酸,同时本发明的适用性也不限于由GOS2启动子驱动时编码FBXW多肽的这种核酸的表达。
用于增加核酸或基因或基因产物表达的额外调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。此类调控元件的实例是引入5’非翻译区的内含子。任选地,一种或多种终止子序列(也是调控序列)可以在引入植物的构建体中使用。
其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制序列起点。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的“定义”部分。
本发明也提供用于产生相对于合适的对照植物具有增加产量的转基因植物的方法,其包括在植物中引入并表达编码如上文所定义的FBXW多肽的核酸。
更具体地,本发明提供用于产生相对于合适的对照植物具有增加产量的转基因植物的方法,所述方法包括:
(i)在植物细胞中引入并表达编码FBXW多肽的核酸;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸优选地通过转化引入植物。文中所指的术语“转化”如上所定义。
通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在,其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将转化的材料再生成整株植物。遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R.Wu、Potrykus或
Figure A20078002806600921
和Willmitzer的上述出版物。为选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如。以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择处理。另一种可能性包括在使用合适选择剂的琼脂平板上培育种子(根据需要在消毒之后),以至于仅转化的种子可以生长成植物。备选地,对转化的植物筛选选择性标记(如上文所述的那些选择性标记)的存在。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析,或定量PCR监测,全部技术是本领域内普通技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或经典育种技术。例如,第一代(或T1)的转化植物可以自花传粉产生纯化的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根茎)。
本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有编码如上文所定义的FBXW多肽的分离核酸。本发明优选的宿主细胞是植物细胞。宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及来自自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。增加核酸、基因或基因产物的表达的方法在本领域充分记载,实例在定义部分提供。
如上文提及,用于调节(优选增加)编码FBXW多肽的核酸表达的优选方法是在植物中引入并表达编码FBXW多肽的核酸;然而实施所述方法的作用即增强产量相关性状也可以使用众所周知的其他技术实现,所述技术包括但不限于T-DNA激活标注、TILLING、同源重组。这些技术的描述在定义给出。
本发明方法的实施产生具有增强的产量相关性状的植物。本发明方法的实施尤其产生相对于对照植物,具有增加的产量,尤其是增加的种子产量的植物。术语“产量”和“种子产量”在文中“定义”部分更加详细的描述。
在本文中对增强的产量相关性状的引用意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。具体地,此类可收获部分是种子,本发明方法的实施尤其产生相对于对照植物的种子产量,具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码FBXW多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、增量调节抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在相当条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码FBXW多肽的核酸在植物中表达。
本发明方法的实施产生相对于在相当条件下培育的合适对照植物,在营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所述方法包括增加编码FBXW多肽的核酸在植物中的表达。营养缺乏可以因营养物的缺乏所致,所述营养物例如是氮、磷酸盐及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
本发明还包括通过本发明的方法获得的植物。本发明因此提供通过本发明的方法获得的植物、部分或细胞,所述植物、部分或细胞包含编码如上文所定义的FBXW多肽的核酸转基因。
本发明也包括编码FBXW多肽的核酸的用途,其用于相对于合适的对照植物的产量,增加植物的产量。
一种此类用途涉及增加植物的产量,所述产量如上文所定义。产量可以尤其包括以下中的一种或多种:增加的种子产量、增加的(饱满)种子数、增加的千粒重(TKW)、增加的收获指数和增加的种子饱满率。
编码FBXW多肽的核酸可以用于育种程序中,其中鉴定到可以遗传地与编码FBXW多肽的基因连接的DNA标记。编码FBXW多肽的核酸可以用来定义分子标记。这种标记随后可以在育种程序中用来选择具有增强的种子产量的植物。编码FBXW多肽的核酸例如可以是由SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67或SEQ ID NO:69中任一个所示的核酸。
编码FBXW多肽的核酸的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加种子产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择,所述不同等位变体例如SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67或SEQ ID NO:69中任一个的不同等位变体。可以在温室中或田间监测生长性能。其他任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码FBXW多肽的核酸也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。编码FBXW多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码FBXW多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,ALaboratory Manual)可以用编码FBXW多肽的核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码FBXW多肽的核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(GENETICS 112(4):887-898,1986)中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系(NIL)和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)GenomeRes.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic AcidRes.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有增强的产量的植物,如前文所述。这些性状也可以与经济有利的其他性状组合,如其他的产量增强性状、对其他非生物胁迫和生物性胁迫的耐受性、调节多种构造特征和/或生物化学特征和/或生理学特征的性状。
RANBP
研究了RAN-结合蛋白增强产量相关性状的用途后,本申请的发明人发现启动子的选择是重要的考虑因素。他们发现组成型启动子控制下在植物(稻)中表达RAN-结合蛋白对产量相关表型没有任何影响。然而他们惊讶的发现种子特异性启动子,尤其是胚乳特异性启动子控制下在植物中表达RAN-结合蛋白成功的增加了植物的产量。
因此,本发明提供相对于对照植物增强植物产量相关性状的方法,其包括优先在植物种子或种子部分中调节编码RANBP的核酸的表达。
用于调节(优选增加)编码RANBP的核酸在植物种子或植物部分中的表达的优选方法是在植物中引入并表达在种子特异性启动子控制下的编码RANBP的核酸。
下文中“本发明方法中所用的蛋白质”的任何引用意指文中定义的RANBP多肽。下文中“本发明方法中所用的核酸”的任何引用意指能够编码此类RANBP多肽的核酸。待引入植物(并且因而用于实施本发明方法中)的核酸是编码现在所述类型蛋白质的任意核酸,下文又称作“RANBP核酸”或“RANBP基因”。
待引入植物(并且因而用于实施本发明方法中)的合适的核酸包括编码RANBP的任意核酸,所述RANBP具有基序I:KSC V/L WHAXDFA/S DGELK D/E EXF,其中‘X’是任意氨基酸,允许在任何位置有零个或一个保守性改变,和/或允许在任何位置有零个、一个、两个或三个非保守性改变。
在RANBP来自单子叶植物的情况下,基序I的C-末端通常以‘AIRFG’结尾,而在RANBP来自双子叶植物的情况下,基序I的C-末端通常以‘CIRFA’结尾。
用于本发明方法中的RANBP-编码核酸还可以包括(除了基序I)任意一个或多个下列基序。
1.SEQ ID NO:139或145所示的基序II,或与SEQ ID NO:139或145所示的基序II具有一定序列同一性的基序,所述序列同一性按照增加的优选顺序为至少60%、70%、80%、90%或更高的百分比;
2.SEQ ID NO:140或146所示的基序III,或与SEQ ID NO:140或146所示的基序III具有一定序列同一性的基序,所述序列同一性按照增加的优选顺序为至少70%、80%、90%或更高的百分比;
3.SEQ ID NO:141或147所示的基序IV,允许在任何位置有零个或一个保守性改变,和/或允许在任何位置有零个或一个非保守性改变;
4.SEQ ID NO:142或148所示的基序V,或与SEQ ID NO:142或148所示的基序V具有一定序列同一性的基序,所述序列同一性按照增加的优选顺序为至少70%、80%、90%或更高的百分比;
5.SEQ ID NO:143或149所示的基序VI,允许在任何位置有零个或一个保守性改变,和/或允许在任何位置有零个或一个非保守性改变;
6.SEQ ID NO:144或150所示的基序VII,或与SEQ ID NO:144或150所示的基序VII具有一定序列同一性的基序,所述序列同一性按照增加的优选顺序为至少60%、70%、80%、90%或更高的百分比。
前述基序指沿进化相关蛋白质的序列比对结果而在特定位置处保守的氨基酸。尽管在其他位置处的氨基酸可以在同源物之间变动,然而在特定位置处的高度保守的氨基酸指示在蛋白质的结构、稳定性或活性方面可能是必需的氨基酸。结构域因通过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定,它们可以用作鉴定物以确定任意的所讨论多肽是否属于先前已鉴定的多肽家族(在本情况下,是RNABP家族)。
上述各基序可以使用用于比对序列用于比较的方法容易地进行鉴定。在一些情况下,可以调整默认参数以调节搜索法的严格性。例如使用BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作“期望”值)以显示严格性较低的匹配。以这种方式,可以鉴定几乎精确的短匹配。
用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列(覆盖整个序列的)的全局比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和单位是百分数的评分方法而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMCBioinformatics.2003年7月10日;4:29.MatGAT:用蛋白质或DNA序列而产生相似性/同一性矩阵的应用)。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构域。使用上文提及的程序,使用默认参数,针对整个核酸序列、氨基酸序列、针对选择的结构域,或一个或多个保守基序测定了序列同一性值。
所有RanBP1蛋白质含有大约150个氨基酸残基的Ran结合结构域。存在用于鉴定结构域的专业数据库。RANBP中的结构域可使用如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.AltmanR.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))鉴定。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(Swiss Institute of Bioinformatics(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可使用常规技术,例如通过序列比对鉴定。
本发明通过用SEQ ID NO:113所示的编码多肽SEQ ID NO:114或SEQ ID NO:115的来自玉蜀黍的RANBP转化的植物举例说明(参见实施例部分)。本发明也通过用SEQ ID NO:116所示的编码多肽SEQ IDNO:117或SEQ ID NO:118的来自拟南芥的RANBP转化的植物举例说明。
当然本发明的实施不限于使用前述序列,本发明方法可以使用如上文中定义的编码包含基序I的RANBP的任意核酸实施。编码包含基序I的RANBP的此类核酸的实例包括编码SEQ ID NO:114、SEQ ID NO:115、SEQ ID NO:117和SEQ ID NO:118的同源物、直向同源物和旁系同源物的核酸。此类同源物、直向同源物和旁系同源物的实例包括实施例14的表P中列出的序列。
直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。这一般涉及第一BLAST,其中所述的第一BLAST包括查询序列(例如SEQ ID NO:113、SEQ ID NO:114、SEQ ID NO:115、SEQID NO:116、SEQ ID NO:117或SEQ ID NO:118)针对任一序列数据库(如公众可用的NCBI数据库)进行BLAST搜索。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后将筛选结果和非筛选结果的全长序列针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:113、SEQ ID NO:114或SEQ ID NO:115的情况下,第二BLAST将针对玉蜀黍序列;其中在查询序列是SEQ ID NO:116、SEQ ID NO:117或SEQ ID NO:118的情况下,第二BLAST将针对拟南芥序列)。随后比较第一和第二次BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,那么反向BLAST随后理想地产生查询序列作为最高命中,则鉴定到旁系同源物;若第一次BLAST中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法。此类核酸变体的实例包括编码实施例14的表P中给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如文中所定义。也可用于本发明方法中的是编码实施例14的表P中给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。用于本发明方法中的同源物和衍生物与它们衍生自的未修饰的蛋白质具有基本相同的生物和功能活性。
一般的,编码包含至少基序I的RANBP的核酸与SEQ ID NO:113或116所示的核酸序列具有一定序列同一性,所述序列同一性按照增加的优选顺序为至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的百分比。
也可用于本发明方法中的是编码SEQ ID NO 114、SEQ ID NO:115、SEQ ID NO:117或SEQ ID NO 118所示氨基酸的衍生物的核酸,或编码SEQ ID NO 114、SEQ ID NO:115、SEQ ID NO:117或SEQ IDNO 118的直向同源物或旁系同源物的衍生物的核酸。
编码表P中序列所代表的多肽的核酸,或编码任意这些SEQ ID NO的直向同源物或旁系同源物的核酸不需要是全长核酸,因为本发明方法的实施不依赖使用全长核酸序列的使用。适用于实施本发明方法的核酸的实例包括但不限于实施例14的表P中所示的那些。核酸变体也可用于实施本发明的方法。此类核酸变体的实例包括编码RANBP的核酸的部分、编码RANBP的核酸的剪接变体、与编码RANBP的核酸杂交的序列、编码RANBP的核酸的等位变体和通过基因改组设计的编码RANBP的核酸的变体。术语剪接变体和等位变体如上所述。
编码RANBP的核酸的部分可以例如通过对该核酸产生一个或多个缺失而制备。所述的部分可以以分离的形式加以使用或它们可以与其他编码性(或非编码性)序列融合,以便例如产生组合几种活性的蛋白质。当与其他编码序列融合时,翻译时产生的所得多肽可以比对RANBP部分所预测的多肽更大。
用于本发明方法中的部分编码这样的多肽,其包含如上文所述的基序I并且与表P中列出的序列所代表的RANBP,或前述任意SEQ IDNO的直向同源物或旁系同源物具有基本上相同的生物学活性。该部分一般具有至少200个连续核苷酸长度、优选至少300个连续核苷酸长度、更优选至少400个连续核苷酸长度。优选地,该部分是表P中列出的任一序列所代表的核酸的部分。最优选地,该部分是如SEQ ID NO:113或SEQ ID NO:116所代表的核酸的部分。
本发明提供用于增强植物中产量相关性状的方法,其包括优先在植物种子或种子部分中引入并表达表P中列出的任一序列所代表的核酸的部分。
用于本发明方法中的另一种核酸变体是能够在降低的严格性条件下、优选在严格条件下与编码如本文中所定义的RANBP的核酸杂交,或与如本文中所定义的部分杂交的核酸。
用于本发明方法中的杂交序列编码这样的多肽,其包含基序I并且与表P中列出的任意序列所代表的RANBP具有基本上相同的生物学活性,或与前述任意SEQ ID NO的直向同源物或旁系同源物具有基本上相同的生物学活性。该杂交序列一般具有至少200个连续核苷酸长度、优选至少300个连续核苷酸长度、更优选至少400个连续核苷酸长度。优选地,该杂交序列是能够与表P中列出的序列所代表的任意核酸杂交或与任意前述序列的部分杂交的序列,其中所述的部分如上文定义。最优选地,杂交序列能够与如SEQ ID NO:113或SEQ ID NO:116所代表的核酸杂交或与其部分杂交。
本发明提供用于在植物中增强产量相关性状的方法,其包括优先在植物种子或种子部分中引入并表达能够与编码表P中列出的任意序列所代表的RANBP的核酸杂交的核酸,或包括优先在植物种子或种子部分中引入并表达能够与如此核酸的杂交的核酸,其中所述的核酸编码前述任意SEQ ID NO的直向同源物、旁系同源物或同源物。
用于本发明方法中的另一种核酸变体是编码本文上述所定义的RANBP的剪接变体。本发明提供用于在植物中增强产量相关性状的方法,其包括优先在植物种子或种子部分中引入并表达编码表P中列出的任意序列所代表的RANBP的核酸的剪接变体,或编码前述任意SEQ IDNO的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是编码由SEQ ID NO:114、SEQ ID NO 115、SEQID NO:117或SEQ ID NO:118任一个所示的RANBP的核酸的剪接变体。其他优选的是由表P中列出的序列的任一个所示的核酸的剪接变体。最优选的是由SEQ ID NO:113或SEQ ID NO:116所示的核酸的剪接变体。
用于实施本发明方法的另一种核酸变体是编码如上文所定义的RANBP的核酸的等位变体。等位变体天然存在,且包含在本发明方法中的是这些天然等位基因的用途。
本发明提供用于在植物中增强产量相关性状的方法,其包括优先在植物种子或种子部分中引入并表达编码表P中列出的任意序列所代表的RANBP的核酸的等位变体,或包括在植物中引入并表达编码前述任意SEQ ID NO的直向同源物、旁系同源物或同源物的核酸的等位变体。
等位变体可以是编码由SEQ ID NO:114、SEQ ID NO 115、SEQ IDNO:117或SEQ ID NO:118任一个所示的RANBP的核酸的等位变体,或编码前述任意SEQ ID NO的直向同源物或旁系同源物的核酸的等位变体。其他优选的是由表P中列出的序列的任一个所示的核酸的等位变体。最优选的是由SEQ ID NO:113或SEQ ID NO:116所示的核酸的等位变体。
用于本发明方法中的另一核酸变体是通过基因改组而设计和/或获得的核酸变体。基因改组或定向进化也可以用来产生编码如上文定义的RANBP的核酸的变体。
本发明提供用于在植物中增强产量相关性状的方法,其包括优先在植物种子或种子部分中引入并表达表P中列出的任意序列的变体,所述变体核酸通过基因改组而设计和/或获得。
另外,核酸变体也可以例如通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocolsin Molecular Biology.Wiley编著)。
编码RANBP的核酸可以来自任何自然来源或人工来源。核酸可以根据就组成和/或基因组环境方面通过人类有意操作而对天然形式加以修饰。根据一个优选的实施方案,编码RANBP的核酸来自植物,优选来自单子叶植物,更优选来自禾本科(Poaceae),更优选来自玉蜀黍属(Zea),最优选地来自玉蜀黍。
根据另一个优选的实施方案,编码RANBP的核酸来自植物,优选来自双子叶植物,更优选来自十字花科,该核酸更优选地来自拟南芥。
本发明也包括通过本发明的方法获得的植物或其部分。该植物或其部分包括与种子特异性启动子有效连接的编码RANBP的核酸转基因。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。
因而,提供基因构建体,其包含:
(i)编码如上文所定义的包含基序I的RANBP的核酸;
(ii)与(i)的核酸有效连接的种子特异性启动子。
本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的载体,其中所述载体可以通过商业途径获得。本发明因而提供如上文所定义的基因构建体在本发明方法中的用途。
植物用包含目的序列的载体(即编码RANBP的核酸)转化。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。术语“调控序列”、“控制序列”和“启动子”在本文中均可以互换使用,并定义如上。
编码的RANBP的核酸与种子特异性启动子有效连接,即主要在种子组织表达的启动子,但是由于启动子渗漏表达在植物中的其他部分有残留表达。进一步优选的,种子特异性启动子分离自编码种子储存蛋白质的基因,尤其是分离自编码胚乳特异性启动子的基因。胚乳特异性启动子意指任意能够优先驱动目的基因在胚乳组织中表达的启动子。文中“优先”驱动在胚乳组织中的表达的引用意指,相对于由于启动子渗漏表达在植物中的其他部分的任意残留表达,驱动任意与其相连的序列主要在胚乳组织表达的启动子。例如,谷醇溶蛋白在胚乳中显示强表达,在分生组织有渗漏(表达),尤其在茎分生组织和/或分生组织中的辨别中心(discrimination centre)中有渗漏(表达)。胚乳特异性启动子最优选分离自谷醇溶蛋白基因,例如SEQ ID NO:155所示的稻谷醇溶蛋白RP6(Wen等,(1993)Plant Physiol 101(3):1115-6)启动子,或是与稻谷醇溶蛋白启动子具有相似的强度的启动子和/或,与稻谷醇溶蛋白启动子具有相似的表达模式的启动子。也可用于实施本发明方法的其他胚乳特异性启动子的实例示于上面的表2c。
应当明白本发明的适用性不限于由SEQ ID NO:113或SEQ ID NO:116所示的编码RANBP的核酸,同时本发明的适用性也不限于由谷醇溶蛋白启动子驱动时编码RANBP的核酸的表达。也可以用来执行本发明方法的其他种子特异性启动子的实例示于上面的表2b。
任选地,一种或多种终止子序列(也是调控序列)可以在引入植物的构建体中使用。额外的调节元件可以包括转录增强予以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。其他调控序列可以是蛋白质和/或RNA稳定化元件,除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的“定义”部分。
本发明也提供相对于对照植物产生具有增强的产量相关性状的转基因植物的方法,其包括优先在植物种子或种子部分中引入并优先表达编码如上文所定义的包含基序I的RANBP的核酸。
更具体地,本发明提供用于产生具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(i)在植物细胞中引入并表达与种子特异性启动子有效连接的编码包含基序I的RANBP(如文中所定义)的核酸;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸优选地通过转化而引入植物。
文中所用的术语“转化”如上文所述。
遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R.Wu、Potrykus或
Figure A20078002806601101
和Willmitzer的上述出版物。
通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在,其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将转化的材料再生成整株植物。为了选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。另一种可能性包括在使用合适选择剂的琼脂平板上生长种子(根据需要在消毒之后),使得仅转化的种子可以生长成植物。或者,转化的植物通过上述那些选择性标记的存在筛选。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析或定量PCR进行监测,全部技术是本领域内普通技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交以产生纯合的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步增殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代显示出与通过本发明方法中的亲代所产生的那些后代相同的基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有分离的包含基序I的RANBP的核酸。本发明优选的宿主细胞是植物细胞。宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
本发明也扩展至植物的可收获部分,如不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。增加核酸、基因或基因产物的表达的方法在现有技术中充分记载,并且实例在定义给出。
如上文提及,用于优先在植物种子或种子部分调节(优选增加)编码RANBP的核酸表达的优选方法是在植物中引入并表达编码RANBP的核酸;然而实施所述方法的作用即增强产量相关性状也可以使用众所周知的其他技术实现,所述技术包括但不限于T-DNA激活标注、TILLING、同源重组。这些技术的描述在定义给出。
本发明的作用也可以使用同源重组法再现。靶标核酸优选是在植物中控制编码RANBP的核酸的天然表达的区域。种子特异性启动子引入该区域,基本代替其部分或全部。
本发明方法的实施产生具有增强的产量性状的植物。本发明方法的实施尤其产生相对于对照植物,具有增加的产量,特别是增加的生物量和种子产量的植物。术语“产量”和“种子产量”在文中的“定义”部分详细描述。
在本文中对增强的产量相关性状的引用意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。具体地,此类可收获部分是地上部分生物量和种子,并且本发明方法的实施导致植物具有增加的生物量和,相对于对照植物的种子产量的增加的种子产量。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩植物数的增加,每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
本发明提供产生相对于对照植物,具有增加的产量,特别是增加的种子产量的植物的方法,所述方法包括在植物中调节编码文中定义的RANBP多肽的核酸的表达,优选增加表达。
由于本发明的转基因植物具有增加的产量,因而相对于对比植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在整个植物生活周期期间发生。增加的生长速率在植物生活周期中的早期期间可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码RANBP多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、增量调节抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在相当条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于增加在非胁迫条件下或在轻微干旱条件下培育的植物中产量的方法,所述方法包括增加编码RANBP多肽的核酸在植物中的表达。
本发明方法的实施产生在营养缺乏条件下、尤其在氮缺乏条件下培育的相对于在相当条件下培育的合适对照植物具有增加产量的植物。因而根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所述方法包括增加编码RANBP多肽的核酸在植物中的表达。营养缺乏可以因营养物的缺乏所致,如氮、磷酸盐及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
本发明也包括编码RANBP的核酸的用途和RANBP本身的用途,用于增强植物中产量相关性状。
编码RANBP的核酸或RANBP本身可以用于育种程序中,其中鉴定到可以遗传地与编码RANBP的基因连接的DNA标记。所述的核酸/基因或RANBP本身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有本发明方法中如上文所定义的增加产量的植物。
编码RANBP的核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变性处理而引入等位基因变异;备选地,该程序可以从非人为造成的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其他任选步骤包括使其中优异等位变体被鉴定的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码RANBP的核酸也可以用作为探针以便对基因进行遗传作图或物理作图,它们作为所述基因的一部分的基因及用作与那些基因连锁的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。RANBP编码核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。RANBP编码核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹(Sambrook J,FritschEF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用RANBP编码核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切酶核酸处理的一组个体的基因组DNA的DNA印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算RANBP编码核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bematzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)GenomeRes.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic AcidRes.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有增强的产量相关性状的植物,如前文所述。这些性状也可以与经济有利的其他性状组合,所述性状如如其他的产量增强性状、对其他非生物胁迫和生物性胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
GLK
现已发现调节编码金色2-样(GLK)蛋白质的核酸在植物中表达产生了相对于对照植物而具有增强的产量相关性状的植物。
因此,本发明提供相对于对照植物增强植物产量相关性状的方法,其包括在植物中调节编码GLK蛋白质或其部分的核酸的表达。
用于调节(优选增加)编码金色2-样蛋白质(GLK)的核酸表达的优选方法是在植物中引入并表达编码此类GLK蛋白质的核酸。
在此之后“用于本发明方法中的蛋白质”的任何引用意指如本文中所定义的GLK多肽。在此之后“用于本发明方法中的核酸”的任何引用意指能够编码此类GLK多肽的核酸。待引入植物(并且因而用于实施本发明方法)的核酸是编码现在所述类型蛋白质的任意核酸,下文又称作“GLK核酸”或“GLK基因”。
待引入植物(并且因而用于实施本发明方法中)的核酸是编码GLK蛋白质(图11)的任意核酸。术语“GLK蛋白质”或“金色2-样蛋白质”意指转录调节物蛋白质,其包括GARP DNA-结合结构域(Tamai等,Plant Cell Physiol.43,99-107,2002)。假定GARP结构域是负责核定位和DNA结合的多功能结构域(Hosoda等,Plant Cell 14,2015-2021,2002).GLK蛋白质优选还包括富含酸性氨基酸的N-末端区、大约100个氨基酸的富含碱性氨基酸的中央部分,以及富含Pro残基的C-末端结构域。该C-末端区优选还包含GARPC-末端(GCT)结构域(Rossini等,2001)。
术语“结构域”和“基序”如定义部分所定义。存在用于鉴定结构域的专业数据库。金色2-样转录调节物中的GARP结构域可使用如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.AltmanR.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))鉴定。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(在Swiss Institute ofBioinformatics上驻留(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可使用常规技术,例如通过序列比对鉴定。
GARP DNA结合结构域(Tamai等,2002)优选具有三个或更多个下列共有序列:
GARP共有序列1(SEQ ID NO:161):
(K/R)(P/M/V/A)(R/K/M)(V/L)(V/D)W(S/T/I/N)(V/AP/S/T/C/H/Q/D)(E/Q/T/D/S)L(H/D)(R/K/Q/A/H/D/E/L/I)(K/R/Q/S/C/V/A/H)F(V/L/I)(A/K/Q/E/H/D/N/R/S)(A/V/C)(V/G/L/I)(N/E/A/Q/D/G/T/I/K/H)(Q/E/H/L/I/M/K/R/S)L
GARP共有序列2(SEQ ID NO:162):
G(I/V/L/P/S/H/Q/A/G)(D/E/K/H/Q/N/A)
GARP共有序列3(SEQ ID NO:163):
(A/T)(V/I/Y/F/T)P(K/S)(K/R/T/Q/L/S/G/A)(I/V/L)(L/M/R/K)(D/E/Q/K/R/S)(L/I/F/H/V/M/T/R/A)(M/I/L)(N/K/G/S/D/Q/E)
GARP共有序列4(SEQ ID NO:164):
(V/I/M/T/E/L/S/N)(E/D/G/N/Y/K/H/Q/P)(N/G/K/T/S/C/R/D)(I/L)(T/D/A/S)(R/N/I/L/V)(E/H/D/S/A/Y/F)(N/E/H)
GARP共有序列5(SEQ ID NO:165):
(V/I/L)(A/K)SHLQ(K/M/I)(Y/F)(R/V)
更优选地,GARP共有序列分别具有以下序列:
1:(K/R)(P/M/V/A)(R/K/M)(V/L)(V/D)W(S/T/I)(V/A/P)(E/Q)LH(R/K/Q)(K/R/Q)FV(A/K/Q/E/H/D)A(V/G)(N/E/A)(Q/E/H)L
2:G(I/V/L)(D/E/K)
3:A(V/I/Y/F)P(K/S)(K/R/T)I(L/M)(D/E/Q)(L/I)M(N/K/G/S)
4:(V/I/M/T/E)(E/D/G/N/Y/K/H/Q/P)(N/G/K/T/S/C/R)(I/L)(T/D)R(E/H)N
5:(V/I)ASHLQK(Y/F)R
更优选地,GARP共有序列分别具有以下序列:
1:K(P/V/A)KVDWTPELHR(K/R)FV(Q/E/H)A(V/G)E(Q/E)L
2:G(I/V/L)(D/E)
3:A(V/Y/F)PSRILE(L/I)M(N/G)
4:(V/I/M/T/E)(E/D/N/Y/K/H/Q)(S/C/R)LTRHN
5:(V/I)ASHLQKYR
更优选地,GARP共有序列分别具有以下序列:
1:K(V/A)KVDWTPELHRRFVQA(V/G)E(Q/E)L
2:G(I/V/L)D
3:AVPSRILE(L/I)MG
4:(I/M/T/E)(E/D/N/Y)(S/C/R)LTRHN
5:IASHLQKYR
最优选地,GARP共有序列分别具有以下序列:
1:KAKVDWTPELHRRFVQAVEQL
2:GID
3:AVPSRILEIMG
4:IDSLTRHN
5:IASHLQKYR
任选地,GARP共有序列5后面是另一个保守基序(共有序列6,SEQ ID NO:166):
SHR(K/R)H(L/M)(L/A/M/I)ARE(A/G/V)EA(A/G)(S/N/T)W
优选该共有序列6具有序列:
SHRKH(L/M)(L/M/I)ARE(A/G/V)EA(A/G)(S/N)W
更优选共有序列6具有序列:
SHRKHMIAREAEAASW。
MYB结构域基序可以,但不需出现在GARP结构域(图12)中。该MYB结构域对应Pfam登录号PF00249和InterPro登录号IPR001005,并含有Prosite模式PS00037(W-[ST]-{W}-{PTLN}-E-[DE]-{GIYS}-{GYPH}-[LIV].)或Prosite模式PS00334(W-x(2)-[LI]-[SAG]-x(4,5)-R-{RE}-x(3)-{AG}-x(3)-[YW]-x(3)-[LIVM].)或Prosite模式PS50090。
用于本发明中的GLK优选(但不是必须)还包含GCT结构域(Rossini等,2001)。该GCT结构域的共有序列在SEQ ID NO:167中给出:
(H/Q)(P/L)S(N/K/S)E(S/V)(I/V/L)DAAIG(D/E)(V/A)(I/L)(S/T/A/V)(N/K/R)PW(L/T)P(L/P)PLGL(K/N)PP(S/A)(V/M/L)(D/E/G)(G/S)V(M/I)(T/A/S/G)EL(Q/H/E)(R/K)(Q/H)G(V/I)(S/N/P/A)(N/E/T/K)(V/I)P(P/Q)
优选地,该GCT共有结构域具有序列:
(H/Q)PS(N/K/S)ESIDAAIGD(V/A)L(S/T/V)KPW(L/T)PLPLGLKPPS(V/L)(D/G)SV(M/I)(S/G)EL(Q/H/E)RQG(V/I)(P/A)(N/K)(V/I)P(P/Q)
更优选地,该GCT共有结构域具有序列:
QPSSESIDAAIGDVLSKPWLPLPLGLKPPSVDSVMGELQRQGVANVPP
已知GLK蛋白质在N-末端区(从N-末端到GARP结构域的起点,图11,图12)具有高于平均酸性氨基酸(D和E)含量的酸性氨基酸含量,该含量按照增加的优选顺序为高于12%、15%、20%,但低于30%。N-末端区中D和E的含量一般为大约23%,而蛋白质中D和E的平均含量为大约11.9%(表3)。相似的,始于GARP结构域末端,包含GCT结构的C-末端区富含Pro残基。然而蛋白质的平均Pro含量为4.8%,在SEQ ID NO:157的该C-末端区中Pro含量是25.4%。该区域中P的含量在10至30%之间变化。(范围:PpGLK1:11.23、PpGLK2:11.17、ZmG2:20.73、ZmGLK1:23.30、AtGLK2:17.6%、AtGLK1:20.13)
表3:SWISS PROT中蛋白质的平均蛋白质组成(2004年7月)
  残基   摩尔%   残基   摩尔%
  A=Ala   7.80   M=Met   2.37
  C=Cys   1.57   N=Asn   4.22
  D=Asp   5.30   P=Pro   4.85
  E=Glu   6.59   Q=Gln   3.93
  F=Phe   4.02   R=Arg   5.29
  G=Gly   6.93   S=Ser   6.89
  H=His   2.27   T=Thr   5.46
  I=Ile   5.91   V=Val   6.69
  K=Lys   5.93   W=Trp   1.16
  L=Leu   9.62   Y=Tyr   3.09
文中定义的GLK蛋白质的实例包括SEQ ID NO 157所示的蛋白质,但是术语“GLK蛋白质”也包括前述SEQ ID NO:157的直向同源物或旁系同源物。本发明通过用SEQ ID NO:156所示的编码多肽SEQ ID NO:157的稻序列转化的植物举例说明。SEQ ID NO:169(来自稻,由SEQ ID NO:168编码)是多肽SEQ ID NO:157的旁系同源物,而来自拟南芥的SEQ ID NO:171和173(由SEQ ID NO:170和172编码)、来自球蒴藓的SEQ ID NO:175和177(由SEQ ID NO:174和176编码)、来自玉蜀黍的SEQ ID NO:179和181(由SEQ IDNO:178和180编码)、来自普通小麦的部分序列SEQ ID NO:183,和来自两色蜀黍的部分序列SEQ ID NO:189是蛋白质SEQ ID NO:157的直向同源物的实例。SEQ ID NO:193代表蛋白质SEQ ID NO:157的变体。
直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。这可通过第一BLAST进行,其中所述的第一BLAST包括查询序列(例如SEQ ID NO:156或SEQ ID NO:157)针对任一序列数据库(如公众可用的NCBI数据库)进行BLAST搜索。当从核苷酸序列开始时,可以使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后将筛选结果和非筛选结果的全长序列针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:156或SEQ IDNO:157的情况下,第二BLAST将因此针对稻序列)。随后比较第一和第二次BLAST搜索的结果。若来自第二BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,则鉴定到旁系同源物;若高阶位命中不源自与查询序列从其中衍生的物种相同的物种,则鉴定到直向同源物。优选的直向同源物是SEQ ID NO:156或SEQ ID NO:157的直向同源物。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。该值优选大于50,更优选大于100,并优选E-值小于e-5,更优选小于e-6。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法的结果以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
同源物(或同源蛋白质、包括直向同源物和旁系同源物)使用本领域熟知的常规技术可以容易地鉴定,例如通过序列比对鉴定。用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的比对。BLAST算法(Altschul等(1990)JMol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.4,29)。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构域(如GARP结构域或GCT结构域)。
优选地,用于本发明方法中的GLK蛋白质与蛋白质SEQ ID NO:157具有一定序列同一性,所述序列同一性按照增加的优选顺序为至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%。或者,同源物中的序列同一性可以使用特定结构域(如GARP结构域或GCT结构域)确定。使用上面列出的蛋白质鉴定数据库和工具,和/或比较的序列比对的方法可以鉴定和绘出GARP或GCT结构域。在一些情况下,可以调整默认参数以调节搜索的严格性。例如使用BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作“期望”值)以显示严格性较低的匹配。这样,可以鉴定几乎精确的短匹配。
详述同源物鉴定的实例在实施例21中给出。实施例22中显示的矩阵显示GARP或GCT结构域上的相似性和同一性(黑体),其中的值自然高于考虑全长蛋白质时的值。
编码SEQ ID NO 157、SEQ ID NO:193中任一个所示的多肽,或前述任意SEQ ID NO的直向同源物或旁系同源物的核酸不需要是全长核酸,因为本发明方法的实施不依赖使用全长核酸序列的使用。另外,适用于实施本发明方法的核酸的实例不限于实施例21的表Q中列出的那些。核酸变体也可以用于实施本发明的方法。此类变体的实例包括天然存在的或通过DNA操作获得的核酸的部分、杂交序列、剪接变体、等位变体。
文中所用术语“部分”意指编码多肽的DNA的一段,所述多肽包含至少上文所述的GARP结构域,并且优选从N-末端到C-末端包含(i)在GARP结构域前面有富含酸性核酸(D或E)的区域,(ii)GARP结构域的C-末端区,其富含Pro残基并优选包含GCT结构域。
部分可以例如通过对编码如上文所定义的GLK蛋白质的核酸产生一个或多个缺失而制备。所述的部分可以以分离的形式加以使用或它们可以与其他编码性(或非编码性)序列融合,以便例如产生结合几种活性的蛋白质。当与其他编码序列融合时,翻译时产生的所得多肽可以比对GLK部分所预测的多肽更大。用于本发明方法中的部分编码(如上文所述的)GARP结构域,其中所述多肽具有与任一SEQ ID NO:157、SEQID NO:193所示的GLK蛋白质或任一前述SEQ ID NO的直向同源物或旁系同源物基本上相同的生物学活性。所述的部分一般是至少800个核苷酸长度、优选至少900个核苷酸长度、更优选至少1000个核苷酸长度并且最优选至少1100个核苷酸长度。优选地,所述部分是如实施例21的表Q中列出的任一核酸的部分。最优选地,该部分是如SEQ IDNO:156所示的核酸的部分。
本发明提供用于增强植物中产量相关性状的方法,其包括在植物中引入并表达实施例21的表Q中给出的任一核酸序列的部分,或编码实施例21的表Q中给出的任意氨基酸序列的直向同源物、旁系同源物、同源物的核酸的部分。
用于本发明方法中的另一种核酸变体是能够在降低的严格性条件下、优选在严格条件下与编码如上文中所定义的GLK蛋白质的核酸杂交,或与如上文中所定义的部分杂交的核酸。
用于本发明方法中的杂交序列编码这样的多肽,其包含富含酸性核酸(D或E)的N-末端区、GARP结构域和GARP结构域的C-末端区,其富含Pro残基并优选包含GCT结构域(如上所述),并与任意SEQID NO:157、SEQ ID NO:193所示GLK蛋白质具有基本上相同的生物学活性,或与前述任意SEQ ID NO的直向同源物或旁系同源物具有基本上相同的生物学活性。该杂交序列一般具有至少800个连续核苷酸长度、优选至少900个连续核苷酸长度、更优选至少1000个连续核苷酸长度,最优选至少1100个连续核苷酸长度。优选地,该杂交序列是能够与实施例21的表Q中列出的序列所代表的任意核酸(或衍生的探针)杂交或与任意前述序列的部分杂交的序列,其中所述的部分如上文定义。最优选地,杂交序列能够与如SEQ ID NO:156与其部分(或探针)杂交。设计探针的方法是本领域熟知的。探针长度一般小于1000bp,优选小于500bp。通常,用于诸如Southern印记的DNA-DNA杂交的探针长度在100至500bp之间变化,而用于诸如PCR扩增的DNA-DNA杂交的探针中的杂交区一般短于50个核苷酸但长于10个核苷酸。本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达能够与编码实施例21的表Q中给出的任一核酸杂交的核酸,或包括在植物中引入并表达能够与如此核酸的杂交的核酸,其中所述的核酸编码实施例21的表Q中给出的任意核酸序列的直向同源物、旁系同源物或同源物。
用于本发明方法中的另一种核酸变体是编码如上文所定义的GLK蛋白质的剪接变体。
优选的剪接变体是编码由SEQ ID NO:157、SEQ ID NO:193中任一个所示的GLK蛋白质的核酸的剪接变体,或是编码任一前述SEQ IDNO的直向同源物或旁系同源物的剪接变体。其他优选的剪接变体的核酸由实施例21的表Q中列出的序列中任一个所示。最优选的剪接变体的核酸由SEQ ID NO:156所示。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例21的表Q中给出的任一核酸序列的剪接变体,或编码实施例21的表Q中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
用于实施本发明方法的另一种核酸变体是编码如上文所定义的GLK蛋白质的核酸的等位变体。等位变体天然存在,且包含在本发明方法中的是这些天然等位基因的用途。等位变体可以是编码由SEQ IDNO:157、SEQ ID NO:193任一个所示的GLK蛋白质的核酸的等位变体,或是编码任一前述SEQ ID NO的直向同源物或旁系同源物的核酸的等位变体。其他优选的等位变体的核酸由实施例21的表Q中列出的任一个序列所示。最优选的等位变体的核酸由SEQ ID NO:156所示,例如SEQ ID NO:192。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例21的表Q中给出的任一核酸序列的等位变体,或包括在植物中引入并表达编码实施例21的表Q中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
用于本发明方法中的另一核酸变体是通过基因改组而获得的核酸变体。基因改组或定向进化也可以用来产生编码如上文定义的GLK蛋白质的核酸的变体。本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例21的表Q中给出的任一核酸序列的变体,或包括在植物中引入并表达编码实施例21的表Q中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,所述变体通过基因改组获得。
另外,核酸变体也可以例如通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(CurrentProtocols in Molecular Biology.Wiley编著)。优选的突变体是导致组织身份(tissue identity)从C3组织结构转变为C4植物的克兰茨解剖(结构)的那些突变体。
还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:157、SEQ ID NO:193所示的任何一种氨基酸的同源物,或任一前述SEQ IDNO的直向同源物或旁系同源物的同源物。
还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:157、SEQ ID NO:193所示的任何一种氨基酸的衍生物,或任一前述SEQ IDNO的直向同源物或旁系同源物的衍生物。
另外,用于本发明方法中的GLK蛋白质(至少以其天然形式)一般,但不是必须具有转录调节活性。因此,具有降低的转录调节活性或不具有转录调节活性的GLK蛋白质同样可用于本发明的方法中。本领域的技术人员使用常规工具和技术可容易的确定DNA结合活性或转录活性的存在。为了确定GLK蛋白质的DNA结合活性,一些测定是可用的(例如Current Protocols in Molecular Biology,第1和2卷,Ausubel等,(1994),Current Protocols),具体地,包含GARP结构域的转录因子的DNA结合测定由Hosoda等,(2002)描述,其包括PCR-辅助的DNA结合位点选择和DNA凝胶移位结合试验。或者可以使用Tamai等,(2002)的方法,其中在试验中使用拟南芥GPRI1来驱动lacZ报道基因的转录;Rossini等,2001还描述了酵母GAL4反式激活试验。
编码GLK蛋白质的核酸可以来自任何自然来源或人工来源。核酸可以从其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。GLK蛋白质编码核酸优选地来自植物,还优选来自单子叶植物,更优选来自禾本科,该核酸最优选来自稻。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。
因而,提供基因构建体,其包含:
(i)编码如上文所定义的GLK蛋白质的核酸;
(ii)与(i)的核酸有效连接的一种或多种调控序列。
本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。优选地,该基因构建体用于在植物中驱动GLK的表达。
植物用包含目的序列的载体(即编码GLK蛋白质的核酸)转化。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。
有利地,任何类型的启动子可以用来驱动核酸序列的表达。优选地,GLK编码核酸或其变体与组成型启动子有效连接。组成型启动子在生长及发育的大部分、但非全部阶段期间并且在大部分环境条件下至少在一个细胞、组织或器官中有转录活性。优选的组成型启动子是遍在表达的组成型启动子。更优选地,启动子来自植物、还优选来自单子叶植物。最优选的是使用GOS2启动子(来自稻)(SEQ ID NO:160或SEQ IDNO:58)。应当明白本发明的适用性不限于由SEQ ID NO:156或SEQ IDNO:192代表的GLK编码核酸,同时本发明的适用性也不限于由GOS2启动子驱动时编码GLK蛋白质的核酸的表达。也可以用来驱动编码GLK蛋白质的核酸表达的其他组成型启动子的实例在上面的定义部分中显示。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。其他调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。如定义部分所述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制序列起点。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。选择性标记在文中的“定义”部分中详细描述。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的定义部分。
本发明也提供用于产生相对于对照植物具有改变的产量相关形状的转基因植物的方法,其包括在植物中引入并表达编码如上文所定义的GLK多肽的核酸。
更具体地,本发明提供用于产生具有改变的产量相关形状的转基因植物的方法,所述方法包括:
(i)在植物细胞中引入并表达编码GLK蛋白质的核酸;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸优选地通过转化引入植物。术语“转化”在文中的定义部分中详细描述。
通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在,其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将转化的材料再生成整株植物。为选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如。以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择处理。另一种可能性包括在使用合适选择剂的琼脂平板上培育种子(根据需要在消毒之后),以至于仅转化的种子可以生长成植物。备选地,对转化的植物筛选选择性标记(如上文所述的那些选择性标记)的存在。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析,或定量PCR监测,全部技术是本领域内普通技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或经典育种技术。例如,第一代(或T1)的转化植物可以自身产生纯合的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根茎)。
本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有编码如上文所定义的GLK蛋白质的分离核酸。本发明优选的宿主细胞是植物细胞。宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、根、块茎和球茎。本发明进一步涉及来自自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。增加核酸、基因或基因产物的表达的方法在本领域充分记载,实例在定义部分提供。
如上文提及,用于调节(优选增加)编码GLK蛋白质的核酸表达的优选方法是在植物中引入并表达编码GLK蛋白质的核酸;然而实施所述方法的作用即改变产量相关性状也可以使用众所周知的其他技术实现,所述技术包括但不限于T-DNA激活标注、TILLING、同源重组。这些技术中的一些的描述在定义给出。
本发明方法的实施产生具有增强的产量相关性状的植物。本发明方法的实施尤其产生相对于对照植物,具有增加的产量,尤其是增加的种子产量的植物。术语“产量”和“种子产量”在文中“定义”部分更加详细的描述。
在本文中对增强的产量相关性状的引用意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。具体地,此类可收获部分是地上部分生物量和/或种子,本发明方法的实施尤其产生相对于对照植物的种子产量和/或生物量,具有增加的种子产量和/或增加的地上部分生物量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩生长的植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
本发明提供相对于对照植物,增加植物的产量,尤其是地上部分生物量和/或种子产量的方法,所述方法包括调节编码文中定义的GLK多肽的核酸在植物中的表达,优选增加表达。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码GLK多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、增量调节抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在相当条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码GLK多肽的核酸在植物中表达。
本发明方法的实施产生相对于在相当条件下培育的合适对照植物,在营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所述方法包括增加编码GLK多肽的核酸在植物中的表达。营养缺乏可以因营养物的缺乏所致,所述营养物例如是氮、磷酸盐及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
本发明还包括通过本发明的方法获得的植物。本发明因此提供通过本发明的方法获得的植物、其植物部分或植物细胞,所述植物、其部分或细胞包含编码如上文所定义的GLK蛋白质的核酸转基因。
本发明也包括编码GLK蛋白质的核酸的用途和GLK多肽的用途,其用于改变产量相关性状。
发现编码GLK多肽的核酸,或GLK蛋白质自身可以用于育种程序中,其中鉴定到可以遗传地与GLK蛋白质编码基因连接的DNA标记。核酸和/或基因,或GLK蛋白质自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明方法中选择具有增加的产量的植物,所述增加的产量如上文所定义。
GLK蛋白质编码核酸和/或基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其他任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码GLK蛋白质的核酸也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。GLK编码核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。GLK编码核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用GLK编码核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算GLK编码核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(Plant Mol.Biol.Reporter 4:37-41,1986))中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)GenomeRes.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic AcidRes.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有改变的产量相关性状的植物,如前文所述。这些性状也可以与经济有利的其他性状组合,如其他的产量增强性状、对其他非生物胁迫和生物性胁迫的耐受性、调节多种构造特征和/或生物化学特征和/或生理学特征的性状。
REV DHDZip/START
现已惊讶地发现使用REVδ同源域亮氨酸拉链结构域(HDZip)/类固醇生成急性调节(STAR)相关脂质转化结构域(START)核酸序列降低植物中内源REV基因的表达产生了相对于对照植物而具有增加的产量的植物。因此,本发明提供相对于对照植物增加植物产量的方法,其通过使用REV ΔHDZip/START核酸序列降低植物中内源REV基因的表达。
有利地,本发明方法的实施产生相对于对照植物具有增强的产量相关性状的植物,具体地是增加的产量,更具体地是是增加的种子产量和/或增加的生物量。术语“产量”和“种子产量”在文中“定义”部分更加详细的描述。增加的生物量通过增加的根生物量证明其自身。增加的根生物量可由于增加的根的数量、增加的根粗(root thickness)和/或增加的根长度。
术语“增加的产量”也指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。此类可收获部分包括营养生物量和/或种子,本发明方法的实施产生相对于对照植物的产量,具有增加的种子产量(营养生物量和/或种子)的植物。
因此,本发明提供增加种子产量和/或植物生物量的方法,所述方法包括使用REV ΔHDZip/START核酸序列降低植物中内源REV基因的表达。
具体地,增加的种子产量选自下列一种或多种:(i)增加的种子重量;(ii)增加的饱满种子数;(iii)增加的种子饱满率;(iv)增加的收获指数;和(v)增加的各种子长度。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩生长的植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
本发明提供相对于对照植物增加植物的产量,尤其是种子产量的方法,所述方法调节编码如文中定义的REV ΔHDZip/START多肽在植物中的表达,优选增加表达。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码REVΔHDZip/START多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、增量调节抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在相当条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码REV ΔHDZip/START多肽的核酸在植物中表达。
本发明方法的实施产生相对于在相当条件下培育的合适对照植物,在营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所述方法包括增加编码REV ΔHDZip/START多肽的核酸在植物中的表达。营养缺乏可以因营养物的缺乏所致,所述营养物例如是氮、磷酸盐及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等。
本文中提及的“内源”REV基因不仅仅指如在植物中以其天然形式(即没有任何人类干预)发现的REV基因,还指随后引入植物的分离的REV核酸序列。例如,根据本发明的方法,含有REV转基因的转基因植物可以遭遇转基因表达大幅降低和/或内源REV基因表达的大幅降低。
术语“表达”或“基因表达”意指因特定一种或多种特定基因,或特定基因构建体的转录。术语“表达”或“基因表达”尤其意指一种或多种基因,或基因构建体转录成结构RNA(rRNA、tRNA)或mRNA,有或没有随后mRNA翻译成蛋白质。此过程包括DNA转录和加工得到的mRNA产物。
表达的“减少”或“降低”在文中可互换使用,对于本发明的方法,意指分别相对于对照植物中发现的REV基因的表达和/或REV多肽的水平和/或REV多肽的活性,使用REV ΔHDZip/START核酸序列减少但不是消除内源REV基因的表达和/或REV多肽的水平和/或REV多肽的活性。REV基因的表达和/或REV多肽的水平和/或REV多肽的活性的减少在本申请中意指相对于文中定义的对照植物,小于至少10%、20%、30%、40%或50%,优选至少60%、70或80%,更优选85%、90%或95%的REV基因的表达和/或REV多肽的水平和/或REV多肽的活性。优选地,使用REV ΔHDZip/START核酸序列减少内源REV基因的表达导致一种或多种表型性状的出现。
这种内源REV基因表达的减少可通过使用一种或多种熟知的“基因沉默”方法(更多细节参见定义部分)实现。文中所用的术语基因的“沉默”意指内源REV基因表达的减少但不是消除。
用于通过RNA介导的沉默来减少植物中内源REV基因表达的一个优选方法是使用REV ΔHDZip/START核酸序列的反向重复,优选是能够形成发夹结构的反向重复。该反向重复克隆进入包含控制序列的表达载体。非编码DNA核酸序列(间隔臂,例如基质粘附区片段(MAR)、内含子、多聚接头等)位于形成反向重复的两个反向REV ΔHDZip/START核酸序列之间。在反向重复转录之后,形成具有自身互补结构的嵌合RNA(部分或全部)。此双链RNA结构称为发夹RNA(hpRNA)。HpRNA被植物加工为siRNA,其被掺入到RISC中。RISC还切割编码REV多肽的mRNA转录物,由此减少待翻译为REV多肽的mRNA转录物的数目。例如参见Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO 99/53050。
内源REV基因表达的降低也可以通过在REV基因的基因座内或基因组的其他位置引入遗传修饰。如本文中所定义的基因的基因座意指这样的基因组区域,其包括目的基因和编码区上游或下游10kb。
此遗传修饰可以例如通过下列方法中的任一个(或多个)引入:T-DNA标注、TILLING、位点定向诱变、定向进化、同源重组法。在引入遗传修饰后是对内源REV基因降低的表达进行选择的步骤,其中降低的表达产生相对于对照植物具有增加的产量的植物。
T-DNA标注涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA,使得T-DNA降低(但不是消除)靶定基因的表达。
同源重组允许选择的核酸在基因组中于确定的所选择位置内引入。备选地,可以建立筛选程序以鉴定在植物群体中REV基因的天然变体,其中所述的变体编码具有降低活性的REV多肽。此类天然变体也可以用于例如进行同源重组。
T-DNA标注、TILLING、位点定向诱变法和定向进化是能够产生REV核酸序列的新等位基因和变体的技术的实例,所述变体编码具有降低的活性的REV多肽。
其他方法,如使用针对内源REV多肽的抗体以抑制此多肽在植物中的功能,或干扰所述REV多肽参与的信号途径,对于技术人员将是众所周知的。
为最佳性能,使用REV ΔHDZip/START核酸序列降低内源REV基因在植物中表达的RNA介导的沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,将来自任何给定植物物种的REV ΔHDZip/START核酸序列引入同一个物种内。例如,将来自稻的REV ΔHDZip/START核酸序列转化至稻植物。REV ΔHDZip/START核酸序列不需要引入相同的植物物种。
在本文中对“核酸序列”的引用意指聚合形式的任一长度的双链或单链的脱氧核糖核苷酸聚合物或核糖核苷酸聚合物,或其类似物,它们具有天然核糖核苷酸的本质特征,因为它们可以以以类似于天然存在的多核苷酸的方式与核酸杂交。
文中“REV ΔHDZip/START”核酸序列的引用意指从REV核酸序列基本排除编码HDZip和START结构域的部分之外的足够长度的基本上连续的核苷酸。为了实施基因沉默,这可以小如20个或更少的核苷酸,或者可以大如REV ΔHDZip/START核酸序列(包括5’和/或3’UTR,在部分或全长中)。本领域的技术人员将会意识到在实施本发明的方法中,来自REV核酸序列,编码HDZip和START结构域的足够长度的基本上连续的核苷酸基本被排除。这可以是小如10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。这可以大如编码HDZip和START结构域的完整核酸序列。文中核酸序列“编码HDZip和START结构域”意指包含密码子的核酸序列的区域,所述密码子翻译成HDZip和START结构域的氨基酸残基(所述结构域不是完整性和功能性需要的)。本领域的技术人员将会意识到来自REV核酸序列的基本上连续的核苷酸可通过几个核苷酸(一般不超过20个核苷酸)覆盖(overlap)HDZip和START结构域的边界。实施本发明的方法还将排除的是将同时降低至少一个其他内源基因表达的核酸序列,无论该其他内源基因编码的多肽是否包含HDZip和START结构域。编码(功能性)多肽的核酸序列对于上述讨论的实质性降低内源REV基因表达的各种方法是不需要的。
REV是本领域已知的(最近描述于Floyd等,((2006)Genetics 173:373-388),并且可用于本发明方法中的是REV ΔHDZip/START核酸序列。
其他REV ΔHDZip/START核酸序列也可用于本发明的方法中,并且其可由本领域的技术人员容易地鉴定。REV多肽可通过一些已知特征(见下)中地一个或多个地存在鉴定。鉴定REV多肽后,本领域的技术人员使用常规技术可容易地得到对应的编码REVΔHDZip/START核酸序列,并使用其足够长度的连续核苷酸来实施上述一个或多个基因沉默方法。
文中定义的术语“REV多肽”意指落入Sessa等,((1994)In:Puigdomene P,Coruzzi G(ed),Springer,Berlin Heidelberg New York,第411-426页)描述的III类HDZip多肽的多肽。REV多肽从N-末端到C-末端包含:(i)用于DNA结合的同源域(HD)结构域;(ii)用于蛋白质-蛋白质相互作用的亮氨酸拉链;(iii)用于脂质/sterol结合的START结构域,和(iv)未定义功能的C-末端区(CTR)。
REV多肽使用本领域熟知的常规技术可以容易地鉴定,例如通过序列比对鉴定。用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心可获得的。包含同源域、亮氨酸拉链、START结构域和CTR的REV多肽可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和单位是百分数的评分方法而轻易地鉴定。可以进行细微手工编著以优化比对,如本领域技术人员显而易见。估计种系发生(或共同祖先)的系统树可使用邻接树构建算法(Neighbour-Joining tree building algorithm,在EBI)构建,以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。文中定义的REV多肽意指任意多肽,当其用于构建III类HDZip多肽系统树(例如图15和16描述的系统树)时,落入REV进化枝(包含REV、PHB和PHV)而不是CORONA进化枝(包含ATHb8和CNA),更具体地,其落入REV分支(而不是PHB/PHV分支)。鉴定REV多肽(落入REV分支)后,本领域技术人员使用常规技术将容易地得到对应的编码REVΔHDZip/START的核酸序列,并使用其足够长度的连续核苷酸来实施上述一个或多个基因沉默方法。
直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。这可通过第一BLAST进行,其中所述的第一BLAST包括查询序列(例如SEQ ID NO:198或SEQ ID NO:199)针对任一序列数据库(如公众可用的NCBI数据库)进行BLAST搜索。当从核苷酸序列开始时,可以使用BLASTN或TBLASTX(使用标准默认值),并且当从多肽序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后将筛选结果和非筛选结果的全长序列针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:1198或SEQ IDNO:199的情况下,第二BLAST将因此针对稻序列)。高阶位命中是具有低E-值的那些命中。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。详述直向同源物和旁系同源物的鉴定的实例在实施例27中给出。所有REV多肽包含CTR,所述CTR与SEQ IDNO:197所示的REV多肽的CTR具有一定序列同一性,所述序列同一性按照增加的优选顺序为至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或98%。优选地,REV多肽的CTR由SEQID NO:197所示。更优选地,SEQ ID NO:194编码的REV多肽的CTR的部分用于实施本发明的方法。在图16中,REV多肽的直向同源物和旁系同源物聚簇在一起。
术语″结构域″和“基序”定义如上。文中定义的术语“区域”意指始于START结构域末端,终于REV多肽终止密码子的氨基酸序列。
存在用于鉴定结构域的专业数据库,REV多肽中的HD和START结构域可以使用例如SMART、InterPro、Prosite或Pfam鉴定。HD包含大约60个残基,START结构域包含大约210个残基。在InterPro数据库中,HD数据库中命名为IPR001356、在Pfam数据库中命名为PF00046并且在PROSITE数据库中命名为PS50071。在InterPro数据库中,START结构域命名为IPR002913,在Pfam数据库中命名为PF01852且在PROSITE数据库中命名为PS50848。例如在SEQ ID NO:199中,HD Pfam entry跨越第27位至第87位氨基酸,START结构域Pfam entry跨越第163位至第376位氨基酸。因此CTR始于第377位氨基酸并终于终止密码子(在第840位)。亮氨酸拉链预测和heptad鉴定可使用诸如2ZIP的特定软件,其结合标准的卷曲螺旋预测算法和特征亮氨酸重复的大致搜索(Bornberg-Bauer等,(1998)ComputationalApproaches to Identify Leucine Zippers,Nucleic Acids Res.,26(11):2740-2746)其驻留在柏林的Max Planck Institute for MolecularGenetics的服务器上)进行。例如,亮氨酸拉链SEQ ID NO:199包含五个亮氨酸重复,且跨越第91位至第127位氨基酸。
另外,REV多肽也可以因能够结合DNA及与其他蛋白质相互作用而是可鉴定的。DNA结合活性及蛋白质-蛋白质相互作用可以使用本领域众所周知的技术而轻易地在体外或在体内确定。用于DNA结合活性的体外测定法的实例包括:使用HD DNA结合结构域的凝胶阻滞分析(West等,(1998)Nucl Acid Res 26(23):5277-87),或酵母单杂交分析。用于蛋白质-蛋白质相互作用的体外测定法的实例是酵母双杂交分析(Fields和Song(1989)Nature 340:245-6)。
因而一旦利用一种或几种如上所述特征而鉴定REV多肽,本领域技术人员可以容易地得到对应的REV ΔHDZip/START核酸序列,并使用该核酸的足够长度的基本连续核苷酸来实施任何一种或多种上文所述的基因沉默方法(用于基本降低内源性REV基因表达)。
优选用于本发明方法中的是SEQ ID:194所示的编码稻REV多肽的部分的核酸序列,或SEQ ID:196所示的编码相同稻REV多肽的CTR的核酸序列。REV ΔHDZip/START核酸序列包含编码REV多肽直向同源物或旁系同源物的核酸序列。SEQ ID NO:199的REV多肽旁系同源物的实例由SEQ ID NO:201,稻Orysa_HOX10(由SEQ ID NO:200编码,NCBI登录号AY425991.1)所示。REV多肽直向同源物的实例由以下序列所示:SEQ ID NO:203,拟南芥Arath_REV(由SEQ IDNO:202编码,NCBI登录号AF188994)、SEQ ID NO:205玉蜀黍Zeama_HDIII RLD1(卷曲的叶1;由SEQ ID NO:204编码,NCBI登录号AY501430.1)、SEQ ID NO:207毛果杨(Populus trichocarpa)Poptr_HDIII(由SEQ ID NO:206编码,NCBI登录号AY919617)、SEQID NO:209蒺藜苜蓿Medtr_HDIII(由SEQ ID NO:208编码,NCBI登录号AC138171.17)、SEQ ID NO:211甘蔗Sacof_HDIII部分(由SEQID NO:210编码,NCBI登录号CA125167.1CA217027.1CA241276.1CA124509.1的叠连群)、SEQ ID NO:213普通小麦Triae_HDIII(部分;由SEQ ID NO:212编码,NCBI登录号CD905903 BM135681.1BQ578798.1 CJ565259.1的叠连群)、SEQ ID NO:215大麦Horvu_HDIII(部分,由SEQ ID NO:214编码,NCBI登录号BU996988.1BJ452342.1BJ459891.1的叠连群),和SEQ ID NO:217黄条早竹(Phyllostachys praecox)Phypr_HDIII(部分;由SEQ ID NO:216编码,NCBI登录号DQ013803)。本申请实施例27(和表Z)中描述了鉴定可用于实施本发明方法的核酸序列的方法。
用于实施本发明方法的REV ΔHDZip/START核酸序列的来源可以是任意植物来源或人工来源。为最佳性能,用于降低内源REV基因表达的基因沉默技术需要使用来自单子叶植物的REV ΔHDZip/START核酸序列以转化至单子叶植物内,使用来自双子叶植物的REVΔHDZip/START核酸序列以转化至双子叶植物内。优选地,将来自禾本科植物的REV ΔHDZip/START核酸序列转化入禾本科植物。还优选地,来自稻的REV ΔHDZip/START核酸序列转化进入稻植物。REVΔHDZip/START核酸序列不需要引入相同的植物品种。最优选地,来自稻的REV ΔHDZip/START核酸序列是SEQ ID NO:194或SEQ IDNO:196的足够长度的基本上连续的核苷酸,或来自如此核酸序列的REV ΔHDZip/START核酸序列的足够长度的基本上连续的核苷酸,其中所述的核酸序列编码REV多肽的直向同源物或旁系同源物。如上文提及,本领域技术人员会充分了解什么将构成旨在开展上文所定义任一基因沉默方法的基本上连续的核苷酸的足够长度,这种长度可以在一些情况下是20个或更少的基本上连续的核苷酸。
本发明还提供遗传构建体和载体以促进引入和/或表达用于本发明方法中的核苷酸序列。
因而,提供降低内源REV基因在植物中的表达的基因构建体,其包含能够一种或多种调控序列、REV ΔHDZip/START核酸序列,和任选的转录终止序列。优选地,调控序列是组成型启动子。
用于降低内源REV基因在植物中的表达的优选构建体是包含REVΔHDZip/START核酸序列反向重复序列(其优选能够形成发夹结构)的构建体,其中所述的反向重复序列处在组成型启动子控制下。
本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明因此也提供如上文中所定义的基因构建体的用途。
目的序列有效地与一种或多种能够增加植物中的表达的调控序列(至少与启动子)连接。有利地,任何类型的启动子可以用来驱动核酸序列的表达。
在一个实施方案中,REV ΔHDZip/START核酸序列与组成型启动子有效连接。优选的组成型启动子是遍在启动子并主要在全部植物中表达。优选地,组成型启动子主要由SEQ ID NO:218或SEQ ID NO:58所示,更优选地,能够优先在全部植物中表达核酸序列的启动子是GOS2启动子,最优选的GOS2启动子来自稻(SEQ ID NO:218或SEQ ID NO:58)。应当明白本发明的适用性不限于由SEQ ID NO:194代表的REVΔHDZip/START核酸,同时本发明的适用性也不限于由GOS2启动子驱动时REV ΔHDZip/START核酸的表达。可用于本发明方法中的另一种组成型启动子是高速泳动族蛋白启动子(SEQ ID NO:293,PRO0170)。也可以用来驱动编码REV ΔHDZip/START核酸序列表达的其他组成型启动子的实例在定义部分中显示。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制序列起点。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。选择性标记在文中的“定义”部分中详细描述。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的定义部分。
本发明也包含相对于对照植物具有增加的产量的植物,其含有通过本发明的方法获得的植物部分和植物细胞,所述植物部分和植物细胞使用REV ΔHDZip/START核酸序列而具有降低内源REV基因的表达。
本发明也提供用于产生相对于对照植物具有增加的产量的转基因植物的方法,所述转基因植物使用REV ΔHDZip/START核酸序列而具有降低内源REV基因的表达。
更具体地,本发明提供相对于对照植物产生具有增加的产量的转基因植物的方法,所述方法包括:
(i)在植物、植物部分和植物细胞中引入并表达遗传构建体,所述构建体包含一个或多个调控序列,其用于使用REV ΔHDZip/START核酸序列而在植物中降低内源REV基因的表达;和
(ii)在促进植物生长和发育的条件下培育植物、植物部分和植物细胞。
优选地,引入植物中的构建体是包含REV ΔHDZip/START核酸序列反向重复序列(其优选能够形成发夹结构)的构建体,其中所述的反向重复序列处在组成型启动子控制下。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸通过转化引入植物。
遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R.Wu、Potrykus或
Figure A20078002806601491
和Willmitzer的上述出版物。
通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在,其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将转化的材料再生成整株植物。为选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如。以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择处理。另一种可能性包括在使用合适选择剂的琼脂平板上培育种子(根据需要在消毒之后),以至于仅转化的种子可以生长成植物。备选地,对转化的植物筛选选择性标记(如上文所述的那些选择性标记)的存在。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析,或定量PCR监测,全部技术是本领域内普通技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或经典育种技术。例如,第一代(或T1)的转化植物可以自身产生纯化的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根茎)。
上述生长特征有利地在任何植物中修饰。本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
其他有利的植物选自菊科(Asteraceae)如向日葵属(Helianthus)、万寿菊属例如物种向日葵[向日葵(sunflower)]、香叶万寿菊(Tageteslucida)、万寿菊(Tagetes erecta)或细叶万寿菊(Tagetestenuifolia)[Marigold]、十字花科(Brassieaeeae)如芸苔属(Brassiea)、拟南芥属(Arabadopsis)例如物种欧洲油菜、芜芜青[卡诺拉油菜、油菜、蔓青]或拟南芥;豆科(Fabaeeae)如大豆属例如物种大豆、大豆(Sojahispida)或大豆(Soja max)[大豆];亚麻科(Linaceae)如亚麻属(Linum)例如物种亚麻[亚麻(flax、linseed)];禾本科如大麦属(Hordeum)、黑麦属(Secale)、燕麦属(Avena)、高粱属(Sorghum)、稻属(Oryza)、玉蜀黍属(Zea)、小麦属(Tritieum)例如物种大麦[大麦];黑麦[rye]、燕麦、野燕麦、比赞燕麦、Avena fatua var.sativa、杂种燕麦[oat]、两色蜀黍[高粱、粟]、稻、阔叶稻[稻]、玉蜀黍[玉米、玉米]、普通小麦、硬粒小麦、圆柱小麦、Triticum hybernum、马卡小麦、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare)[小麦、面包小麦、普通小麦];茄科(Solanaceae)如茄属(Solanum)、番茄属(Lycopersicon)例如马铃薯[马铃薯]、番茄(Lycopersicon esculentum、Lycopersieon lycopersicum、Lycopersieon pyriforme、Solanum integrifolium或Solanumlycopersicum)[西红柿(tomato)]。
本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任意前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的基因型特征和/或表型特征。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及来自自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
本发明也包括REV ΔHDZip/START核酸序列的用途,用途降低植物、植物部分或植物细胞中内源REV基因的表达,以增加如上文所定义的植物产量。
CLE
现已发现调节编码CLE-样多肽的核酸在植物中表达产生了相对于对照植物而具有增强的产量相关性状的植物。
因此,本发明提供相对于对照植物增强植物产量相关性状的方法,其包括在植物中调节编码CLE-样多肽的核酸或其部分的表达。
“参考”、“参考植物”、“对照”、“对照植物”、“野生型”或“野生型植物”尤其是这样的细胞、组织、器官、植物或其部分,其不是根据本发明方法产生的。因此,术语“野生型”、”对照”或“参考”是可相互交换的并且可以是未根据本文中所述的本发明方法加以修饰或处理的植物的细胞或一部分,如细胞器或组织、或植物。因此,用作野生型、对照或参考的植物的细胞或部分如细胞器或者植物尽可能地对应于细胞、植物或其部分,并且在除本发明方法的结果以外的其他任何特性上与本发明的主题尽可能相同。因此,将野生型、对照或参考相同地或尽可能相同地处理,也即仅如此条件或特性可以不同,其中所述的条件或特性不影响所测试特性的品质。换句话说,这意味野生型指这样的植物(1)其携带基因或等位基因的未改变或未调整形式,或指(2)用于得到本发明方法所产生植物的起始材料/植物。
优选地,在野生型植物与由本发明方法产生的植物之间的任何比较在相似的条件下进行。术语”相似的条件”意指全部条件,例如培养条件或生长条件、分析条件(如缓冲液组成、温度、底物、病原体株系、浓度等)在待比较的实验之间保持相同。
“参考”、“对照”或“野生型”优选是这样的对象,例如细胞器、细胞、组织、植物,其未根据本文中所述的本发明方法加以调整、修饰或处理并且在任何其他特性上尽可能与本发明的主题相似。参考、对照或野生型在其基因组、转录物组、蛋白质组或代谢物组上尽可能与本发明的主题相似。优选地,术语“参考-”、“对照-”或“野生型-”的细胞器、细胞、组织或植物涉及这样的细胞器、细胞、组织或植物,其与本发明细胞器、细胞、组织或植物或其部分遗传上几乎相同,优选95%,更优选98%、甚至更优选99.00%、尤其99.10%、99.30%、99.50%、99.70%、99.90%、99.99%、99.999%或更高,最优选地,“参考”、“对照”或“野生型”优选地是这样的对象,例如细胞器、细胞、组织或植物,其与根据本发明方法使用的植物、细胞、细胞器在遗传上相同,除核酸分子或由所述核酸分子编码的基因产物根据本发明方法受到改变、调整或修饰之外。
术语”调节”就表达或基因表达而言意指这样的过程,其中表达水平与对照植物相比因所述基因的表达而改变,优选地,表达水平增加。原先未受调节的表达可以是结构RNA(rRNA、tRNA)或mRNA的任何类型表达,随后是翻译。术语“调节活性”应当意指本发明核酸序列或所编码蛋白质的表达的任何变化,这导致植物增加的产量和/或增加的生长。
用于调节(优选降低)编码CLE-样多肽的核酸表达的优选方法是在植物中引入并表达编码遗传构建体,其中克隆了作为反向重复(部分或全部)的编码此类CLE-样多肽的核酸,其通过间隔臂(非编码DNA)分隔。
在此之后“用于本发明方法中的蛋白质”的任何引用意指如本文中所定义的POI多肽。在此之后“用于本发明方法中的核酸”的任何引用意指能够编码此类POI多肽的核酸。待引入植物(并且因而用于实施本发明方法)的核酸是编码现在所述类型蛋白质的任意核酸,下文又称作“POI核酸”或“POI基因”。
CLE-样多肽编码基因是本领域已知的(参见例如Cock和McCormick(Plant Physiol.126,939-942,2001),并且可用于本发明方法中的是编码CLE-样多肽或其部分的核酸。
文中定义的术语“CLE-样多肽”意指与SEQ ID NO:233同源的多肽。CLE-样多肽包含N-末端信号序列和保守基序(Cock和McCormick,2001:Figure 21),也称为CLE结构域(Strabala等,2006),其位于该多肽的C-末端或在C-末端附近。未处理的多肽长度一般在60至140个氨基酸,并具有高等电点,优选高于pI 7.0,更优选高于pI 8.0,最优选高于pI 9.0(例如,SEQ ID NO:233所示的蛋白质具有的pI为10.46)。切除信号肽后,CLE-样多肽可在C-末端部分通过蛋白酶解进一步加工,优选在CLE结构域的N-末端的保守Arg残基上切割,由此产生主要包含CLE结构域的生物活性短肽(Ni和Clark,Plant Physiol.140,726-733,2006)。
术语“结构域”和“基序”如定义部分所定义。存在用于鉴定结构域的专业数据库。CLE-样多肽中的CLE结构域可使用如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,KarpP.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucleic Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))鉴定。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(由Swiss Institute of Bioinformatics拥有(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res.31:3784-3788(2003))。然而,CLE结构域也可使用推定的CLE-样多肽和本领域已知的CLE-样多肽(例如Cock和McCormick(2001),或Strabala等(2006)公开的那些)的序列比对容易地鉴定。
CLE结构域优选具有以下共有序列(SEQ ID NO:237):
(S/E/R/M/P/L)(K/E/D/R/S)R(K/I/L/R/F/Q/V/M)(V/I/S/L)(P/L/R)(R/T/Q/C/N/G/K/S)(N/G)(S/P)(D/N/Y)P(I/L/Q/R/Y/H)(H/L/I)(H/N).
更优选地,CLE结构域具有以下共有序列(SEQ ID NO:238):
(S/P)(R/E/K)R(M/L/I)(V/S/I)P(Q/G/C/T/S)GP(N/D)P(L/Q/H)H(H/N).
最优选地,CLE结构域具有序列:
SRRMVPQGPN PLHN.
CLE结构域包含多个高度保守的氨基酸,包括蛋白酶解处理需要的Arg残基(SEQ ID NO:233中的Arg73,参见图21和22),和两个或三个Pro残基。
优选用于本发明中的是如SEQ ID:233所示的编码至少部分CLE-样多肽的核酸,或编码SEQ ID:233的同源物的至少部分的核酸。CLE-样多肽的实例包括SEQ ID NO:233,并且还包括SEQ ID:233的同源物(含直向同源物和旁系同源物)。本发明通过用SEQ ID NO:232所示的编码多肽SEQ ID NO:233的甘蔗序列转化的稻植物举例说明。来自Populus的SEQ ID NO:240、来自稻SEQ ID NO:242、来自拟南芥的SEQ ID NO:246和来自欧洲油菜的SEQ ID NO:248代表SEQ ID NO:233的直向同源物。SEQ ID NO:246和SEQ ID NO:250互为旁系同源物。
直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。这可通过第一BLAST进行,其中所述的第一BLAST包括查询序列(例如SEQ ID NO:241或SEQ ID NO:242)针对任一序列数据库(如公众可用的NCBI数据库)进行BLAST搜索。当从核苷酸序列开始时,可以使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后将筛选结果和非筛选结果的全长序列针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是241或SEQ ID NO:242的情况下,第二BLAST将因此针对稻序列)。随后比较第一和第二次BLAST搜索的结果。若来自第二BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,则鉴定到旁系同源物;若高阶位命中不源自与查询序列从其中衍生的物种相同的物种,则鉴定到直向同源物。优选的直向同源物是SEQ ID NO:232或SEQ ID NO:233的直向同源物。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。该值优选大于50,更优选大于100,并优选E-值小于e-5,更优选小于e-6。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法的结果以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
同源物(或同源蛋白质、包括直向同源物和旁系同源物)使用本领域熟知的常规技术可以容易地鉴定,例如通过序列比对鉴定。用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的比对。BLAST算法(Altschul等(1990)JMol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.4,29)。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构域(如CLE结构域)。在下面以百分比描述的序列同一性值使用上述程序,利用默认参数,在完整核酸或氨基酸序列上确定。
优选地,用于本发明方法中的CLE-样多肽与多肽SEQ ID NO:233具有一定序列同一性,所述序列同一性按照增加的优选顺序为至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%。或者,同源物中的序列同一性可以使用特定结构域(如CLE结构域)确定。使用上面列出的蛋白质鉴定数据库和工具,和/或比较的序列比对的方法可以鉴定和绘出CLE结构域。在一些情况下,可以调整默认参数以调节搜索的严格性。例如使用BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作“期望”值)以显示严格性较低的匹配。这样,可以鉴定几乎精确的短匹配。
文中所用的术语CLE-样核酸意指编码如上所定义的CLE-样多肽的任意核酸,或其互补物。CLE-样核酸不需要是全长核酸,因为本发明方法的实施不依赖使用全长核酸序列的使用。另外,适用于实施本发明方法的核酸的实例包括但不限于SEQ ID NO:232、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245或SEQ ID NO:247中任一个所代表的那些。核酸变体也可以在实施本发明的方法中使用。此类变体的实例包括天然存在的或通过DNA操作获得的核酸的部分、杂交序列、剪接变体、等位变体。
对“CLE-样”核酸序列引用意指来自CLE-样核酸序列的足够长度的基本连续核苷酸。为了实施基因沉默,这可以小如20、19、18、17、16、15、14、13、12,11、10个或更少的核苷酸,或者可以大如CLE-样核酸序列(包括5’和/或3’UTR,在部分或全长中)。编码(功能性)多肽的核酸序列对于上述讨论的实质性降低内源CLE-样基因表达的各种方法是不需要的。
文中所用术语CLE-样核酸的“部分”意指编码至少部分CLE-样多肽的DNA的一段,或其互补物;但也可以是CLE多肽编码cDNA的5’或3’非翻译区(UTR)的部分,或其互补物;或可以是完整5’或3’UTR,或其互补物。文中所用术语cDNA意指不但包括编码序列,还包括对应mRNA的5’和3’UTR的非编码序列。
术语“片段”、“序列的片段”或“序列的部分”、“部分”或“其部分”意指所提及的原始序列的截短序列。截短序列(核酸序列或蛋白质序列)可以在长度上大幅地变化;最小尺寸是具有足够尺寸的序列以对序列提供所提及的原始序列的至少相当功能和/或活性或与本发明的或本发明方法中所用的核酸分子在严格条件下杂交,而最大尺寸并非关键的。在一些应用中,最大尺寸通常基本上不大于对原始序列提供想要的活性和/或功能而需要的尺寸。相当的功能意指原始序列至少40%、45%或50%、优选至少60%、70%、80%或90%或更高的功能。
部分可以例如通过对编码如上文所定义的CLE-样多肽的核酸产生一个或多个缺失而制备。所述的部分可以以分离的形式加以使用或它们可以与其他编码性(或非编码性)序列融合。所述的部分一般是至少100个核苷酸长度、优选至少200、250个核苷酸长度、更优选至少300、350个核苷酸长度并且最优选至少400或450个核苷酸长度。优选地,所述部分是如SEQ ID NO:232、SEQ ID NO:239、SEQ ID NO:241、SEQID NO:243、SEQ ID NO:245或SEQ ID NO:247中任一个所示核酸的部分。最优选地,该部分是如SEQ ID NO:232所示的核酸的部分。用于本发明方法中的CLE-样核酸的优选部分是与内源目的CLE-样基因的转录序列或其互补物具有高同源性,而与内源非目的CLE-样基因的转录序列(或其互补序列)具有低同源性或没有同源性的部分。
用于本发明方法中的另一种核酸变体是能够在降低的严格性条件下、优选在严格条件下与编码如上文中所定义的GLK蛋白质的核酸杂交,或与如上文中所定义的部分杂交的核酸。
用于本发明方法中的杂交序列编码这样的多肽,其包含富含酸性核酸(D或E)的N-末端区、GARP结构域和GARP结构域的C-末端区,其富含Pro残基并优选包含GCT结构域(如上所述),并与任一SEQID NO:157、SEQ ID NO:193所示GLK蛋白质具有基本上相同的生物学活性,或与前述任意SEQ ID NO的直向同源物或旁系同源物具有基本上相同的生物学活性。该杂交序列一般具有至少800个连续核苷酸长度、优选至少900个连续核苷酸长度、更优选至少1000个连续核苷酸长度,最优选至少1100个连续核苷酸长度。优选地,该杂交序列是能够与实施例21的表Q中列出的序列所代表的任意核酸(或衍生的探针)杂交或与任意前述序列的部分杂交的序列,其中所述的部分如上文定义。最优选地,杂交序列能够与如SEQ ID NO:156所代表的核酸杂交或与其部分杂交。设计探针的方法是本领域熟知的。探针长度一般小于1000bp,优选小于500bp。通常,用于诸如Southern印记的DNA-DNA杂交的探针长度在100至500bp之间变化,而用于诸如PCR扩增的DNA-DNA杂交的探针中的杂交区一般短于50个核苷酸但长于10个核苷酸。本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达能够与编码实施例21的表Q中给出的任一核酸杂交的核酸,或包括在植物中引入并表达能够与如此核酸的杂交的核酸,其中所述的核酸编码实施例21的表Q中给出的任意核酸序列的直向同源物、旁系同源物或同源物。
用于本发明方法中的另一种核酸变体是编码如上文所定义的GLK蛋白质的剪接变体。
优选的剪接变体是编码由SEQ ID NO:157、SEQ ID NO:193中任一个所示的GLK蛋白质的核酸的剪接变体,或是编码任一前述SEQ IDNO的直向同源物或旁系同源物的剪接变体。其他优选的剪接变体的核酸由实施例21的表Q中列出的序列中任一个所示。最优选的剪接变体的核酸由SEQ ID NO:156所示。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例21的表Q中给出的任一核酸序列的剪接变体,或编码实施例21的表Q中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
用于实施本发明方法的另一种核酸变体是编码如上文所定义的GLK蛋白质的核酸的等位变体。等位变体天然存在,且包含在本发明方法中的是这些天然等位基因的用途。等位变体可以是编码由SEQ IDNO:157、SEQ ID NO:193任一个所示的GLK蛋白质的核酸的等位变体,或是编码任一前述SEQ ID NO的直向同源物或旁系同源物的核酸的等位变体。其他优选的等位变体的核酸由实施例21的表Q中列出的任一个序列所示。最优选的等位变体的核酸由SEQ ID NO:156所示,例如SEQ ID NO:192。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例21的表Q中给出的任一核酸序列的等位变体,或包括在植物中引入并表达编码实施例21的表Q中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
用于本发明方法中的另一核酸变体是通过基因改组而获得的核酸变体。基因改组或定向进化也可以用来产生编码如上文定义的GLK蛋白质的核酸的变体。本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例21的表Q中给出的任一核酸序列的变体,或包括在植物中引入并表达编码实施例21的表Q中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,所述变体通过基因改组获得。
另外,核酸变体也可以例如通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(CurrentProtocols in Molecular Biology.Wiley编著)。优选的突变体是导致组织身份(tissue identity)从C3组织结构转变为C4植物的克兰茨解剖(结构)的那些突变体。
还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:157、SEQ ID NO:193所示的任何一种氨基酸的同源物,或任一前述SEQ IDNO的直向同源物或旁系同源物的同源物。
还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:157、SEQ ID NO:193所示的任何一种氨基酸的衍生物,或任一前述SEQ IDNO的直向同源物或旁系同源物的衍生物。
另外,用于本发明方法中的GLK蛋白质(至少以其天然形式)一般,但不是必须具有转录调节活性。因此,具有降低的转录调节活性或不具有转录调节活性的GLK蛋白质同样可用于本发明的方法中。本领域的技术人员使用常规工具和技术可容易的确定DNA结合活性或转录活性的存在。为了确定GLK蛋白质的DNA结合活性,一些测定是可用的(例如Current Protocols in Molecular Biology,第1和2卷,Ausubel等,(1994),Current Protocols),具体地,包含GARP结构域的转录因子的DNA结合测定由Hosoda等,(2002)描述,其包括PCR-辅助的DNA结合位点选择和DNA凝胶移位结合试验。或者可以使用Tamai等,(2002)的方法,其中在试验中使用拟南芥GPRI1来驱动lacZ报道基因的转录;Rossini等,2001还描述了酵母GAL4反式激活试验。
编码GLK蛋白质的核酸可以来自任何自然来源或人工来源。核酸可以从其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。GLK蛋白质编码核酸优选地来自植物,还优选来自单子叶植物,更优选来自禾本科,该核酸最优选来自稻。
用于本发明方法中的另一种核酸变体是能够在降低的严格性条件下、优选在严格条件下与编码如本文中所定义的CLE-样多肽的核酸杂交,或与如本文中所定义的部分杂交的核酸。
用于本发明方法中的杂交序列编码至少部分如上文所定义的CLE-样多肽,或能够与CLE-样多肽编码的mRNA或cDNA的5’或3’UTR杂交。所述杂交序列一般是至少100个核苷酸长度、优选至少200个核苷酸长度、更优选至少300个核苷酸长度并且最优选至少400个核苷酸长度。优选地,所述杂交序列是能够与由SEQ ID NO:232、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245或SEQ IDNO:247所示的任一核酸(或衍生的探针)杂交或与任一前述序列的部分杂交的序列,其中所述的部分如上文定义。最优选地,所述杂交序列能够与SEQ ID NO:232或与其部分(或探针)杂交。设计探针的方法是本领域熟知的。探针长度一般小于500、400、300、200bp,优选小于100bp。通常,用于诸如Southern印记的DNA-DNA杂交的探针长度在100至500bp之间变化,而用于诸如PCR扩增的DNA-DNA杂交的探针中的杂交区一般短于50个核苷酸但长于10个核苷酸。优选长度为15、20、25、30、35、40、45或50bp.
用于本发明方法中的另一种核酸变体是编码如上文所定义的CLE-样多肽的剪接变体。优选的剪接变体是编码由SEQ ID NO:223所示的CLE-样多肽的核酸的剪接变体,或是编码SEQ ID NO:223的直向同源物或旁系同源物的剪接变体。其他优选的剪接变体的核酸由SEQ ID NO:232、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245或SEQ ID NO:247中任一个所示。最优选的剪接变体的核酸由SEQID NO:232所示。
用于实施本发明方法的另一种核酸变体是编码如上文所定义的CLE-样蛋白质的核酸的等位变体。等位变体天然存在,且包含在本发明方法中的是这些天然等位基因的用途。等位变体可以是编码由SEQID NO:223所示的CLE-样多肽的核酸的等位变体,或是编码任一前述SEQ ID NO的直向同源物或旁系同源物的核酸的等位变体。其他优选的等位变体的核酸由SEQ ID NO:232、SEQ ID NO:239、SEQ IDNO:241、SEQ ID NO:243、SEQ ID NO:245或SEQ ID NO:247中任一个所示。最优选的等位变体的核酸由SEQ ID NO:232所示。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物部分中引入并表达实施例33的表HH中给出的任一核酸序列的杂交序列、剪接变体或等位变体,或包括在植物部分中引入并表达编码实施例33的表HH中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的杂交序列、剪接变体或等位变体。
用于本发明方法中的另一核酸变体是通过基因改组而获得的核酸变体。基因改组或定向进化也可以用来产生编码如上文定义的CLE-样多肽的核酸的变体。另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology.Wiley编著)。
还用于本发明方法中的是这样的核酸,其编码由SEQ ID NO:223所示的任何一种氨基酸的同源物,或其直向同源物或旁系同源物的同源物;以及这样的核酸,其编码由SEQ ID NO:223所示的多肽,或其直向同源物或旁系同源物的衍生物。
另外,用于本发明方法中的CLE-样核酸(至少以其天然形式)一般,但不是必须编码具有信号活性(signalling activity)的多肽。
优选地,当CLE-样核酸编码的多肽在植物中超量表达时导致wus-样表型。更优选地,当CLE-样多肽在拟南芥中超量表达时导致如Strabala等(2006)所定义的Aii表型。更优选地,当CLE-样核酸作为反向重复在SEQ ID NO:236所示的启动子控制下在稻中表达时导致增加的种子产量,例如增加的种子总重量。
编码CLE-样多肽的核酸可以来自任何自然来源或人工来源。核酸可以从其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。CLE-样多肽编码核酸优选地来自植物,还优选来自单子叶植物,更优选来自禾本科,该核酸最优选来自甘蔗。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。
因而,提供基因构建体,其包含:
(i)如上文所定义的CLE-样核酸或其部分;
(ii)与(i)的核酸有效连接的一种或多种调控序列。
优选的构建体是包含CLE-样核酸反向重复(优选能够形成发夹结构)的构建体,所述反向重复在种子特异性启动子的控制下。
本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中转录目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
植物用包含目的序列的载体转化。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。
有利地,任何类型的启动子可用于本发明的方法中。优选的启动子尤其是在组织及器官中、在种子细胞如胚乳细胞及发育胚的细胞中引起基因表达的那些启动子。合适的启动子是油菜的油菜籽蛋白基因启动子(US 5,608,152)、蚕豆(Vicia faba)USP启动子(Baeumlein等,Mol GenGenet,1991,225(3):459-67)、拟南芥油质蛋白启动子(WO 98/45461)、菜豆(Phaseolus vulgaris)菜豆蛋白启动子(US 5,504,200)、芸苔属植物(Brassica)Bce4启动子(WO 91/13980)、豆类arc5启动子、胡萝卜DcG3启动子或豆科植物(Legumin)B4启动子(LeB4;Baeumlein等,1992,Plant Journal,2(2):233-9)和导致在单子叶植物如玉米、大麦、小麦、黑麦、稻等内的种子特异性表达的启动子。有利的种子特异性启动子是蔗糖结合蛋白启动子(WO 00/26388)、菜豆蛋白启动子和油菜籽蛋白启动子。必须加以考虑的合适启动子是大麦lpt2或lpt1基因启动子(WO 95/15389和WO 95/23230)和在WO 99/16890中描述的启动子(来自大麦的大麦醇溶蛋白基因、稻的谷蛋白基因、稻的水稻素基因、稻的谷醇溶蛋白基因、小麦的麦醇溶蛋白基因、小麦的谷蛋白基因、玉米的玉米醇溶蛋白基因、燕麦的谷蛋白基因、高粱kasirin基因和黑麦的裸麦醇溶蛋白基因的启动子)。其他合适的启动子是Amy32b、Amy 6-6和Aleurain[US 5,677,474]、Bce4(油菜)[US 5,530,149]、大豆球蛋白(大豆)[EP 571 741]、磷酸烯醇式丙酮酸羧化酶(大豆)[JP 06/62870]、ADR12-2(大豆)[WO 98/08962]、异柠檬酸裂合酶(油菜)[US 5,689,040]或α-淀粉酶(大麦)[EP 781 849]。可用于在植物中表达基因的其他启动子是叶特异性启动子,如在DE-A 19644478中描述的那些启动子或光调节启动子如,例如豌豆petE启动子。
优选地,CLE-样核酸或其变体有效连接于种子特异性启动子。种子特异性启动子主要在种子组织中转录激活,但不必仅在种子组织中激活(渗漏表达的情况下)。种子特异性启动可以在种子发育和/或萌发期间激活。种子特异性启动在本领域众所周知。优选地,种子特异性启动是胚乳特异性启动子。更优选地,该启动子是稻谷醇溶蛋白RP6或功能等同的启动子.最优选地,该启动子序列由SEQ ID NO:236所示。应当清楚,本发明的实用性不局限于SEQ ID NO:236所示的CLE-样核酸,本发明的实用性也不局限于受种子特异性启动子驱动的CLE-样核酸的转录。其他种子特异性启动子(包括胚乳特异性启动子)如上文所列出的。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制序列起点。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测和/或选择如在序列方案中描述及在本发明方法中使用的核酸序列的成功转移,使用标记基因(=报道基因)是有利的。因此遗传构建体可任选包括可选择性标记基因。这些标记基因能够通过一系列不同原理而鉴定核酸分子的成功转移,例如借助荧光、发光或在人眼睛可觉察的光的波长范围内通过目测鉴定、通过除草剂抗性或抗生素耐药性、通过所谓营养标记(营养缺陷标记)或抗营养性标记、通过酶分析法或通过植物激素。可以提及的此类标记的实例是GFP(=绿色荧光蛋白);萤光素/萤光素酶系统、β-半乳糖苷酶与其有色底物例如X-Gal、对例如咪唑啉酮、草甘膦、膦丝菌素或磺脲类的除草剂抗性、对例如博来霉素、潮霉素、链霉素、卡那霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(G418)、壮观霉素或杀稻瘟素等的抗生素耐药性、营养标记如对甘露糖或木糖的利用或抗营养性标记,如对2-脱氧葡萄糖的抗性。植物中优选的可选择性标记包括那些赋予除草剂如草甘膦或草丁膦抗性的标记。其他合适的标记为例如编码参与例如糖或氨基酸生物合成通路基因的标记,如β-半乳糖苷酶、ura3或ilv2。编码基因如荧光素酶、gfp或其他荧光基因的标记同样适用。这些标记和前述标记可在突变体中使用,所述突变体中原有的这些基因没有功能,例如由于常规方法而缺失。这个名单仅代表少数的可能标记。技术人员非常熟悉此类标记。取决于生物和选择方法,优选不同的标记。
在本发明优选的实施方案中,CLE-样蛋白质调节的表达是CLE-样蛋白质降低的表达,优选是内源CLE-样蛋白质降低的表达。
本文中提及的“内源”CLE-样基因不仅仅指如在植物中以其天然形式(即没有任何人类干预)发现的CLE-样基因,还指随后引入植物的分离的CLE-样核酸序列。例如,根据本发明的方法,含有CLE-样转基因的转基因植物可以遭遇转基因表达大幅降低和/或内源CLE-样基因表达的大幅降低。
用于降低内源CLE-样蛋白质表达的优选方法是使用表达载体,其中编码CLE-样多肽的CLE-样核酸序列作为由间隔区(非编码性DNA)隔开的(部分或完全的)反向重复序列加以克隆。
表达的“减少”或“降低”或“减量调节”在文中可互换使用,并定义如上。优选地,降低的表达不是表达的完全消除。优选地,使用CLE-样核酸序列减少内源CLE-样基因的表达导致一种或多种表型性状的出现。
这种内源CLE-样基因表达的减少可通过使用一种或多种熟知的如上所述的“基因沉默”方法实现。
用于通过RNA介导的沉默来减少植物中内源CLE-样基因表达的一个优选方法是使用CLE-样核酸序列或其部分的反向重复,优选是能够形成发夹结构的反向重复。该反向重复克隆进入包含控制序列的表达载体。非编码DNA核酸序列(间隔臂,例如基质粘附区片段(MAR)、内含子、多聚接头等)位于形成反向重复的两个反向CLE-样核酸之间。在反向重复转录之后,形成具有自身互补结构的嵌合RNA(部分或全部)。此双链RNA结构称为发夹RNA(hpRNA)。HpRNA被植物加工为siRNA,其被掺入到RISC中。RISC还切割编码CLE-样多肽的mRNA转录物,由此减少待翻译为CLE-样多肽的mRNA转录物的数目。例如参见Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO 99/53050。
优选地,将来自任何给定植物物种的CLE-样核酸序列引入同一个物种内。例如,将来自稻的CLE-样核酸序列转化至稻植物。然而,并非绝对要求待引入的CLE-样核酸序列起源于与该核酸序列将要引入的植物相同的植物物种,如实施例部分所示,其中甘蔗序列被引入稻中以获得期望的效果。只要内源CLE-样靶基因与待引入的CLE-样核酸之间存在相当大的同源性就足够了。
内源CLE-样基因表达的降低也可以通过在CLE-样基因的基因座内或基因组的其他位置引入遗传修饰。如本文中所定义的基因的基因座意指这样的基因组区域,其包括目的基因和编码区上游或下游10kb。
此遗传修饰可以例如通过下列方法中的任一个(或多个)引入:T-DNA标注、TILLING、位点定向诱变、定向进化、同源重组法。在引入遗传修饰后是对内源CLE-样基因降低的表达进行选择的步骤,其中降低的表达产生相对于对照植物具有增加的产量的植物。
位点定向诱变和随机诱变可用于产生CLE-样核酸序列的变体,所述变体编码具有降低的活性的CLE-样多肽。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols in MolecularBiology.Wiley编著)。
定向进化也可用于产生CLE-样核酸序列的变体,所述变体编码具有降低的活性的CLE-样多肽。
T-DNA标注、TILLING、位点定向诱变和定向进化是能够产生CLE-样核酸序列的新等位基因和变体的技术的实例,所述变体编码具有降低的活性的CLE-样多肽。
同源重组法允许在所选核酸基因组的明确选择的位置引入。待靶定的核酸可以是编码具有降低的活性的CLE-样多肽的等位基因,以用于取代内源基因,且需要靶定CLE-样基因的基因座。
备选地,可以建立筛选程序以鉴定在植物群体中CLE-样基因的天然变体,其中所述变体编码具有降低活性的CLE-样多肽。此类天然变体也可以用于例如进行同源重组。
上述生长特征有利地在任何植物中修饰。本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
其他有利的植物选自菊科(Asteraceae)如向日葵属(Helianthus)、万寿菊属例如物种向日葵[向日葵(sunflower)]、香叶万寿菊(Tageteslucida)、万寿菊(Tagetes erecta)或细叶万寿菊(Tagetestenuifolia)[Marigold]、十字花科(Brassicaceae)如芸苔属(Brassica)、拟南芥属(Arabadopsis)例如物种欧洲油菜、芜芜青[卡诺拉油菜、油菜、蔓青]或拟南芥。豆科(Fabaceae)如大豆属例如物种大豆、大豆(Sojahispida)或大豆(Soja max)[大豆]。亚麻科(Linaceae)如亚麻属(Linum)例如物种亚麻[亚麻(flax、linseed)];禾本科如大麦属(Hordeum)、黑麦属(Secale)、燕麦属(Avena)、高粱属(Sorghum)、稻属(Oryza)、玉蜀黍属(Zea)、小麦属(Triticum)例如物种大麦[大麦];黑麦[rye]、燕麦、野燕麦、比赞燕麦、Avena fatua var.sativa、杂种燕麦[oat]、两色蜀黍[高粱、粟]、稻、阔叶稻[稻]、玉蜀黍[玉米、玉米]、普通小麦、硬粒小麦、圆柱小麦、Triticum hybernum、马卡小麦、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare)[小麦、面包小麦、普通小麦];茄科(Solanaceae)如茄属(Solanum)、番茄属(Lycopersicon)例如马铃薯[马铃薯]、番茄(Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme、Solanum integrifolium或Solanumlycopersicum)[西红柿(tomato)]。
本发明还包括通过本发明的方法获得的植物。本发明因此提供通过本发明的方法获得的植物、部分或细胞,所述植物、部分或细胞包含编码如上文所定义的CLE-样蛋白质的核酸转基因。
本发明还提供产生相对于对照植物具有改变的产量相关性状的植物的方法,其包括在植物中引入和表达如上文中所定义的CLE-样核酸,所述核酸可用于如上所讨论的减量调节方法中。
宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
更具体地,本发明提供用于产生具有改变的产量相关性状的转基因植物的方法,所述方法包括:
(i)在植物细胞中引入并表达编码CLE-样核酸,所述CLE-样核酸在用于减量调节CLE-样基因表达的构建体中;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸优选地通过转化而引入植物。用于减量调节CLE-样基因表达,并引入植物细胞或植物中的构建体进一步优选包含CLE-样核酸或其部分的反向重复。
外来基因转移进入植物基因组中称为转化。为实施转化,利用转化方法以及由植物组织或植物细胞再生植物的方法来进行瞬时或稳定转化。有利的转化法是植物原位(in planta)转化。为此,有可能例如使农杆菌作用于植物种子,或用农杆菌接种植物分生组织。根据本发明,证明使转化农杆菌悬液作用于完整植株或至少花原基尤为有利。随后培养植物,直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件中,从而可将转化植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长周期之后,通过喷雾对其进行选择。另一可能性包括使用合适的选择剂,将种子,适用的情况下是在授粉之后,种植在琼脂板上,从而仅转化的种子能够长成植物。其他有利的转化方法、特别是植物转化方法,为技术人员所公知,并在下文描述。
通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在,其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将转化的材料再生成整株植物。
如所提到的那样,用本发明表达载体转化的农杆菌也可以以其自身已知的方法来转化植物,如实验植物,像拟南芥或作物植物,例如像谷类、玉米、燕麦、黑麦、大麦、小麦、大豆、稻、棉花、甜菜、芸苔、向日葵、亚麻、大麻、马铃薯、烟草、番茄、胡萝卜、甜椒、油菜籽油菜、木薯淀粉、木薯、竹芋、万寿菊、苜蓿、生菜和多种树木、坚果和葡萄藤物种,特别是含油作物植物,如大豆、花生、蓖麻油植物、向日葵、玉米、棉花、亚麻、油菜籽油菜、椰子、油椰、红花(Carthamustinctorius)、可可豆,例如通过在农杆菌溶液中水浴划破的叶子或叶节,随后在合适的培养基中培养之。
遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R.Wu、Potrykus或
Figure A20078002806601701
和Willmitzer的上述出版物。为选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如。以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择处理。另一种可能性包括在使用合适选择剂的琼脂平板上培育种子(根据需要在消毒之后),以至于仅转化的种子可以生长成植物。备选地,对转化的植物筛选选择性标记(如上文所述的那些选择性标记)的存在。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,目标CLE-样基因的表达水平的减量调节可以使用Northern和/或Western分析或定量PCR进行监测,全部技术是本领域内普通技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交以产生纯合的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步增殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代显示出与通过本发明方法中的亲代所产生的那些后代相同的基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有分离的CLE-样核酸。本发明优选的宿主细胞是植物细胞。宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
本发明也扩展至植物的可收获部分,如不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
有利地,本发明方法的实施产生相对于对照植物具有增强的产量相关性状的植物,具体地是增加的产量,更具体地是是增加的种子产量和/或增加的生物量。
本发明方法的实施产生具有增强的产量相关性状的植物。本发明方法的实施尤其产生相对于对照植物,具有增加的产量,尤其是增加的种子产量的植物。术语“产量”和“种子产量”在文中“定义”部分更加详细的描述。
在本文中对增强的产量相关性状的引用意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。具体地,此类可收获部分是种子和/或生物量,本发明方法的实施尤其产生相对于对照植物的种子产量,具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩生长的植物数的增加,每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
本发明提供相对于对照植物增加植物的产量,尤其是种子产量的方法,所述方法调节编码如文中定义的CLE-样多肽在植物中的表达,优选增加表达。
由于本发明的转基因植物具有增加的产量,因而相对于对比植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植。因而根据本发明,提供用于增加植物生长速率的方法,所述方法包括调节、优选增加编码CLE-样多肽的核酸在植物中的表达,如本文所述。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、增量调节抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在相当条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于增加在非胁迫条件下或在轻微干旱条件下培育的植物中产量的方法,所述方法包括增加编码CLE-样多肽的核酸在植物中的表达。
本发明也包括CLE-样核酸在改变产量相关形状中的用途。
编码CLE-样多肽的核酸可以用于育种程序中,其中鉴定到可以遗传地与CLE-样基因连接的DNA标记。该核酸/基因可以用来定义分子标记。这种DNA标记随后可以在育种程序中用来选择如上文所定义的在本发明方法中具有增加的产量的植物。
CLE-样核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变性处理而引入等位基因变异;备选地,该程序可以从非人为造成的所谓“自然”起源性的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论的及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其他任选步骤包括使其中优异等位变体被鉴定的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
CLE-样核酸也可以用作为探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及用作与那些基因连锁的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。CLE-样核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。CLE-样核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹(Sambrook J,Fritsch EF和ManiatisT(1989)Molecular Cloning,A Laboratory Manual)可以用CLE-样核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的DNA印迹,其中所述的一组个体代表具有确定遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算CLE-样核酸在先前使用这个群体获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(Plant Mol.Biol.Reporter 4:37-41,1986)中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)GenomeRes.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic AcidRes.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有如前文所述的改变的产量相关形状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状,对其他非生物胁迫和生物性胁迫的耐受性,调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
SYR
令人惊讶的是,现已发现在植物中调节编码SYR多肽的核酸的表达产生了在生物胁迫条件下生长时,相对于对照植物具有增强的产量相关性状的植物。本发明的第一实施方案提供在生物胁迫条件下生长时,相对于对照植物增强植物产量相关性状的方法,其包括在植物中调节编码SYR多肽的核酸的表达。
用于调节(优选增加)编码SYR多肽的核酸表达的优选方法是在植物中引入并表达编码SYR多肽的核酸。
在此之后“用于本发明方法中的蛋白质”的任何引用意指如本文中所定义的SYR多肽。在此之后“用于本发明方法中的核酸”的任何引用意指能够编码此类SYR多肽的核酸。待引入植物(并且因而用于实施本发明方法)的核酸是编码现在所述类型蛋白质的任意核酸,下文又称作“SYR核酸”或“SYR基因”。
文中所定义的术语“SYR蛋白质或其同源物”意指约65至约200个氨基酸的多肽,其包含(i)富含亮氨酸结构域,其类似蛋白质C-末端中间的亮氨酸拉链,所述富含亮氨酸结构域是(ii)在前为三肽,其序列为YFS(保守基序1a,SEQ ID NO:256),或YFT(保守基序1b,SEQ IDNO:257),或YFG(保守基序1c,SEQ ID NO:258)或YLG(保守基序1d,SEQ ID NO:259),和(iii)之后为保守基序2((V/A/I)LAFMP(T/S),SEQ ID NO:260)。优选地,保守基序2是(A/V)LAFMP(T/S),最优选地,该保守基序是VLAFMPT。“SYR蛋白质或其同源物”还优选具有以保守基序3(SYL或PYL,SEQ ID NO:261)结尾的保守C-末端肽。SYR蛋白质或其同源物的富含亮氨酸结构域长度约为38至48个氨基酸,紧接起始于保守基序1并紧接终止于保守基序2,且包含至少30%的亮氨酸。富含亮氨酸结构域优选具有类似亮氨酸拉链基序(L-X6-L-X6-L-X6-L,其中X6是6个连续氨基酸的序列)的基序。Apreferred example of a SYR蛋白质的优选实例由SEQ ID NO:252所示,其结构域的概述在图24中给出。应当注意的是术语“SYR蛋白质或其同源物”不包含来自拟南芥的ARGOS蛋白质(SEQ ID NO:276)。
进一步优选地,SYR蛋白质具有两个跨膜结构域,该蛋白质的N-末端部分和C-末端部分位于内部,跨膜结构域之间的部分位于外部。
备选的,SYR蛋白质的同源物与SEQ ID NO:252所示的氨基酸具有一定整体序列同一性(overall sequence identity),所述整体序列同一性按照增加的优选顺序为至少27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,前提是同源蛋白质包含保守基序1(a、b、c或d)、2和3,且富含亮氨酸结构域如上所述。整体序列同一性使用全局性比对算法确定,所述全局性比对算法例如GAP程序(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数。
术语“结构域”和“基序”在文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAI Press,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic AcidsResearch 30(1):276-280(2002))。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(瑞士生物信息学研究所(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对而鉴定。
用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的全局性(即覆盖完整序列的)比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.2003 Jul 10;4:29.MatGAT:用蛋白质或DNA序列而产生相似性/同一性矩阵的应用)。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构域。使用上文提及的程序,使用默认参数,针对整个核酸序列或氨基酸序列或针对选择的结构域或保守基序测定了序列同一性值。
跨膜结构与长为约15至30个氨基酸,并通常包含形成α螺旋的疏水性残基。它们一般基于疏水性推测(例如Klein等,Biochim.Biophys.Acta 815,468,1985;或Sonnhammer等,In J.Glasgow,T.Littlejohn、F.Major、R.Lathrop、D.Sankoff和C.Sensen编著,Proceedings of theSixth International Conference on Intelligent Systems for MolecularBiology,第175-182页,Menlo Park,CA,1998.AAAI Press.).
落入定义“SYR蛋白质或其同源物”定义内的蛋白质的实例在实施例部分的表II中给出,包括来自多种单子叶植物的序列,例如稻(SEQID NO:252、SEQ ID NO:262和SEQ ID NO:263)、玉米(SEQ ID NO:264)、小麦(SEQ ID NO:265)、大麦(SEQ ID NO:266)、甘蔗(SEQ ID NO:267和SEQ ID NO:268)、高粱(SEQ ID NO:269);和来自双子叶植物的序列。例如拟南芥(SEQ ID NO:270和SEQ ID NO:271)、葡萄(SEQID NO:272)、柑橘(SEQ ID NO:273)或西红柿(SEQ ID NO:274和SEQID NO:275)。预计富含亮氨酸结构域对于蛋白质的功能是重要的,因此具有富含亮氨酸结构域,但没有保守基序1或2的蛋白质也可用于本发明的方法中;此类蛋白质的实例由SEQ ID NO:284和285给出。
应当理解术语“SYR蛋白质或其同源物”不限于SEQ ID NO:252所示的序列,或SEQ ID NO:262或SEQ ID NO:275所列的同源物,也不限于满足以下标准的任何约65至约200个氨基酸的多肽,所述标准为包含如上定义的富含亮氨酸结构域,前面为保守三肽基序1(a、b、c或d),后面为保守基序2,优选后面为保守基序3;或与序列SEQ IDNO:252具有至少38%序列同一性的序列也适用于本发明的方法中。
SYR蛋白质或其同源物的活性可通过在稻中,在GOS2启动子控制下表达SYR蛋白质或其同源物而测定,相对于对应的野生型植物,所述SYR蛋白质或其同源物在生长在氮不足条件下的植物中产生增加的生物量和/或种子产量,而不延迟开花时间。这种种子产量的增加可通过多种方式测定,例如作为增加的种子总重量、饱满种子数或千粒重来测定。
本发明通过用由SEQ ID NO:251代表的编码多肽序列SEQ IDNO:252的核酸序列转化的植物加以说明,然而,本发明的实施不限于这些序列;本发明方法可以使用如文中定义的任意SYR-编码核酸或SYR多肽有利地进行。
编码SYR多肽的核酸的实例在文中实施例38的表II中给出。这类核酸可用于实施本发明的方法。实施例38的表II中给出的氨基酸序列是SEQ ID NO:252所示的SYR多肽的直向同源物和旁系同源物的实例,术语“直向同源物”和“旁系同源物”如文中所定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。这通常涉及第一BLAST,其中所述的第一BLAST包括提交查询序列(例如使用实施例38的表II中列出的任一序列)用于针对任一序列数据库(如公众可用的NCBI数据库)的BLAST搜索。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:251或SEQ ID NO:252的情况下,第二BLAST因而将针对稻序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地在最高命中的查询序列中产生,则鉴定到旁系同源物;若第一BLAST的中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法。此类核酸变体的实例包括编码实施例38的表II中给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如文中所定义。也可用于本发明方法中的是编码实施例38的表II中给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。用于本发明方法中的同源物和衍生物与它们衍生自的未修饰的蛋白质具有基本相同的生物和功能活性。
用于实施本发明方法的其他核酸变体包括编码SYR多肽的核酸的部分、与编码SYR多肽的核酸杂交的核酸、编码SYR多肽的核酸的剪接变体、编码SYR多肽的核酸的等位变体,以及通过基因改组获得的编码SYR多肽的核酸的变体。术语杂交序列、剪接变体、等位变体和基因改组如文中所述。
编码SYR多肽的核酸不需要是全长核酸,因为本发明方法的实施不依赖使用全长核酸序列的使用。本发明提供在植物中增强产量相关性状的方法,其包括在植物中引入和表达实施例38的表II中给出的核酸序列中任一个的部分,或实施例38的表II中给出的氨基酸序列中任一个的直向同源物、旁系同源物或同源物的编码核酸的部分。
核酸的部分可以例如通过对该核酸产生一个或多个缺失而制备。所述的部分可以以分离的形式加以使用或它们可以与其他编码性(或非编码性)序列融合,以便例如产生组合几种活性的蛋白质。当与其他编码序列融合时,翻译时产生的所得多肽可以比对该蛋白质部分所预测的多肽更大。
用于本发明方法中的部分编码文中定义的SYR多肽,其与实施例38的表II中给出的意氨基酸序列具有基本相同的生物学活性。优选地,此部分是在实施例38的表II中给出的任何一种核酸的部分,或实施例38的表II中给出的氨基酸序列中任一个的直向同源物或旁系同源物的编码核酸的部分。此部分的长度按照增加的优选顺序为至少150、200、250、300、350、400、450、500、550、600个连续核苷酸,其中所述的连续核苷酸是实施例38的表II中给出的任何一种核酸序列,或是实施例38的表II中给出的氨基酸序列中任一个的直向同源物或旁系同源物的编码核酸。最优选地,此部分是核酸SEQ ID NO:251的部分。优选地,该部分编码约65至约200个氨基酸的多肽,包含如上定义的富含亮氨酸结构域,前面为保守三肽基序1(a、b、c或d),后面为保守基序2,优选后面为保守基序3;或与序列SEQ ID NO:252具有至少38%序列同一性。
用于本发明方法中的另一核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如文中所定义的SYR多肽的核酸杂交,或与如文中所定义的部分杂交的核酸。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达能够与实施例38的表II中给出的任何一种核酸杂交的核酸,或包括在植物中引入并表达如此核酸,其能够与实施例38的表II中给出的任意核酸序列的直向同源物、旁系同源物或同源物的编码核酸杂交的核酸。
用于本发明方法中的杂交序列编码文中定义的SYR多肽,其与实施例38的表II中给出的任意氨基酸序列具有基本相同的生物学活性。优选地,杂交序列能够与实施例38的表II中给出的任一核酸杂交或与任一这些序列的部分杂交,其中所述的部分如上文所定义,或者其中杂交序列能够与实施例38的表II中给出的任意氨基酸序列的直向同源物或旁系同源物的编码核酸杂交。最优选地,杂交序列能够与如SEQ IDNO:251所代表的核酸,或与其部分杂交。
优选地,杂交序列编码约65至约200个氨基酸的多肽,包含如上定义的富含亮氨酸结构域,前面为保守三肽基序1(a、b、c或d),后面为保守基序2,优选后面为保守基序3;或与序列SEQ ID NO:252具有至少38%序列同一性。
用于本发明方法中的另一种核酸变体是编码如上文所定义的SYR多肽的剪接变体,剪接变体如文中所定义。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例38的表II中给出的任何一种核酸的剪接变体,或实施例38的表II中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:251代表的核酸的剪接变体,或编码SEQ ID NO:252的直向同源物或旁系同源物的核酸的剪接变体。优选地,剪接变体编码的氨基酸序列是约65至约200个氨基酸的多肽,包含如上定义的富含亮氨酸结构域,前面为保守三肽基序1(a、b、c或d),后面为保守基序2,优选后面为保守基序3;或与序列SEQ ID NO:252具有至少38%序列同一性。
用于实施本发明方法的另一种核酸变体是编码如上文所定义的SYR多肽的核酸的等位变体,等位变体如文中所定义。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例38的表II中给出的任何一种核酸的等位变体,或包括在植物中引入并表达实施例38的表II中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的等位变体。
用于本发明方法中的等位变体具有与SYR多肽SEQ ID NO:252和实施例38的表II中所示的任意氨基酸基本相同的生物学活性。等位变体天然存在,且包含在本发明方法中的是这些天然等位基因的用途。优选地,等位变体是等位变体SEQ ID NO:251或编码SEQ ID NO:252的直向同源物或旁系同源物的核酸的等位变体。优选地,等位变体编码的氨基酸序列是约65至约200个氨基酸的多肽,包含如上定义的富含亮氨酸结构域,前面为保守三肽基序1(a、b、c或d),后面为保守基序2,优选后面为保守基序3;或与序列SEQ ID NO:252具有至少38%序列同一性。
基因改组或定向进化也可以用来产生编码如上文定义的SYR多肽的核酸的变体;术语“基因改组”如文中所定义。
本发明提供用于在植物中增强产量相关性状的方法,其包括在植物中引入并表达实施例38的表II中给出的任何一种核酸的变体,或包括在植物中引入并表达如此核酸的变体,其中所述的核酸编码实施例38的表II中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物,所述变体核酸通过基因改组获得。
优选地,通过基因改组获得的变体编码的氨基酸序列是约65至约200个氨基酸的多肽,包含如上定义的富含亮氨酸结构域,前面为保守三肽基序1(a、b、c或d),后面为保守基序2,优选后面为保守基序3;或与序列SEQ ID NO:252具有至少38%序列同一性。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology;Wiley编著)。
编码SYR多肽的核酸可以来自任何自然来源或人工来源。核酸可以从其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。编码SYR多肽的核酸优选地来自植物,还优选来自单子叶植物,更优选来自禾本科,该核酸最优选来自稻。
本发明方法的实施产生在非生物胁迫下生长,相对于对照植物具有增强的非生物胁迫抗性(或非生物胁迫耐受性,该术语可互换使用)的植物,所述增强的非生物胁迫抗性导致增强的产量相关性状。尤其本发明方法的实施产生相对于对照植物而具有增加的产量、尤其增加的种子产量和增加的生物量的植物。在本文中的“定义”部分中更详细地描述了术语“产量”和“种子产量”。
在本文中对增强的产量相关性状的参考意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生相对于对照植物的种子产量,具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩生长的植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
本发明提供在非生物胁迫条件下生长,相对于对照植物,导致植物产量增加的增强的非生物胁迫抗性,尤其是增加植物种子产量和/或增加的生物量的方法,所述方法包括在植物中调节编码如文中所定义的SYR多肽的核酸的表达,优先增加其表达。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。除了增加产量的能力,增加的营养摄取效率也有助于产量增加。据观察本发明的植物显示更高的营养摄取效率。当植物处于胁迫条件下时,增加的营养摄取效率使得植物生长更好。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于当生长在非生物胁迫条件下的对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加非生物胁迫条件下的植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码SYR多肽的核酸在植物中的表达。
与对照植物相比,当植物暴露于多种非生物胁迫下,发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。在特定实施方案中,非生物性胁迫是一种或多种营养物的可用性降低,所述营养物是植物生长和发育需要吸收的营养物。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在胁迫条件下(优选在一种或多种营养物的可用性降低的条件下)或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、增量调节抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在相当条件下培育的合适对照植物,赋予在非生物胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非生物胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码SYR多肽的核酸在植物中表达。
本发明方法的实施产生相对于在相当条件下培育的合适对照植物,在营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所述方法包括增加编码SYR多肽的核酸在植物中的表达。营养缺乏可以因营养物的缺乏所致,所述营养物例如是氮、磷酸盐及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等。
本发明包括可通过本发明方法获得的植物或其部分(包括种子)。该植物或其部分包含编码如上文定义的SYR多肽的核酸转基因。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达编码SYR多肽的核酸。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含
(a)编码如上文定义的SYR多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码SYR多肽的核酸如上文所定义。术语“调控序列”和“终止序列”如上文所定义。
植物用包含如上所述的任意核酸的载体转化。本领域技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列与一种或多种调控序列(至少与启动子)有效连接。
有利地,任何类型的天然或合成启动子可以用来驱动核酸序列的表达。组成型启动子尤其可用于本方法中。各种启动子类型的定义参见文中的“定义”部分。
应当明白本发明的适用性不限于由SEQ ID NO:251代表的SYR多肽编码核酸,同时本发明的适用性也不限于在组成型启动子驱动时表达SYR多肽编码核酸。
组成型启动子优选是GOS2启动子,GOS2启动子优选来自稻。更优选地,该组成型启动子由基本上与SEQ ID NO:255或SEQ ID NO:58相似的核酸序列所示,该组成型启动子最优选地如255或SEQ IDNO:58所示。有用的组成型启动子的其他实例参见文中“定义”部分的表2a。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。如定义部分所述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。文中的“定义”部分更加详细的描述了选择性标记。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择性标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择性标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择性标记的细胞存活而其他细胞死亡)。标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的定义部分。
本发明也提供产生转基因植物的方法,其中在非生物胁迫条件下,所述转基因植物相对于对照植物具有增强的产量相关性状,其包括在植物中引入和表达任意编码如上文中所定义的SYR多肽的核酸。
更具体地,本发明提供用于产生具有增强的产量相关性状,尤其是增加的(种子)产量和/或增加的生物量的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中引入和表达SYR多肽编码核酸;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
(i)的核酸可以是能够编码文中定义的SYR多肽的任意核酸。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸优选地通过转化引入植物。文中的“定义”部分更加详细的描述了术语“转化”。
遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R.Wu、Potrykus或
Figure A20078002806601911
和Willmitzer的上述出版物。
通常在转化后,选择一种或多种标记存在的植物细胞或细胞群体,其中所述的标记由与目的基因一起共转移的植物可表达的基因编码,随后将转化的材料再生成整株植物。为了选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。另一种可能性包括在使用合适选择剂的琼脂平板上生长种子(根据需要在消毒之后),使得仅转化的种子可以生长成植物。或者,转化的植物通过上述那些选择性标记的存在筛选。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析进行监测,这两种技术是本领域技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交,选择纯合的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步增殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如被转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过文中所述的任意方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任意前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的一种或多种基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有编码SYR多肽的分离的核酸。本发明优选的宿主细胞是植物细胞。宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及来自自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。增加核酸、基因或基因产物的表达的方法在现有技术中充分记载,并且实例在定义给出。
如上文提及,用于调节(优选增加)编码SYR多肽的核酸表达的优选方法是在植物中引入并表达编码SYR多肽的核酸;然而实施所述方法的作用即增强产量相关性状也可以使用众所周知的其他技术实现,所述技术包括但不限于T-DNA激活标签、TILLING、同源重组。这些技术的描述在定义给出。
本发明也包括编码文中所述SYR多肽的核酸的用途和这些SYR多肽的用途,其用于增强生长在非生物胁迫条件下的植物中的任意上述产量相关性状。
编码文中所述SYR多肽的核酸或SYR多肽本身可以用于育种程序中,其中鉴定到可以遗传地与编码SYR多肽的基因连接的DNA标记。所述的核酸/基因或SYR多肽本身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有本发明方法中如上文所定义的增强的产量相关性状的植物。
编码SYR多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物进行诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其他任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码SYR多肽的核酸也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。编码SYR多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码SYR多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A LaboratoryManual)可以用SYR编码核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码SYR多肽的核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)GenomeRes.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例可见于文中的“定义”部分。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等,(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等,(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等,(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook,(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
本发明方法产生具有如前文所述的具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增加性状,对其他非生物胁迫和生物性胁迫的耐受性,调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
附图描述
ERLK
图1给出受体激酶蛋白组的概述,所述受体激酶蛋白根据它们的胞外区分类(Shiu和Bleecker,2001)。标记为TM的竖线指示跨膜结构域。在左边,给出各个蛋白质的基因座名称或MAtDB名称。RLCK代表受体-样胞质激酶,RLK代表受体-样激酶。根据SMART和Pfam数据库给予结构域名称。
图2显示用于本发明中的ERLK蛋白质(SEQ ID NO:2)的结构域结构:黑体示出低复杂性结构域、下划线示出跨膜结构域、斜线示出激酶结构域。该分析由SMART作出。
图3给出SEQ ID NO:2、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:34、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54andSEQ ID NO:56所示蛋白质的多重比对。该比对用CLUSTAL W(1.83)作出,权重距阵:BLOSUM、空位开放罚分:11、空位延伸罚分:1。
图4显示双元载体p030的图,其用于在稻中增加GOS2启动子(SEQ ID NO:58)控制下的拟南芥ERLK-编码核酸的表达。
FBXW
图5是植物中FBXW多肽结构的示意图。显示不同特征的相关位置:F-框(PFAM PF00646)、WD40结构域(如在PFAM PF00400中,具有7个单独的WD40重复)和如SEQ ID NO:97至101分别表示的基序1至5。
图6显示植物FBXW多肽的序列多重比对,其使用CLUSTAL W(1.83)(在Kyoto University Bioinformatics Center的GenomeNet服务器上)和默认值(Blosum 62为权重距阵、空位开放罚分为10、空位延伸罚分为0.05)。框出F-框和WD40重复。基序1和基序2由波形括号标出。基序3、4和5由黑框示出。
图7显示双元载体p1017,其用于在稻中增加GOS2启动子(SEQID NO:58)控制下的编码FBXW多肽的拟南芥核酸的表达。RANBP
图8显示上文所定义的RANBP多肽的比对。该序列使用VectorNTI软件包中的AlignX程序(InforMax,Bethesda,MD)进行比对。多重比对使用空位开放罚分10和空位延伸罚分0.01进行。需要时,实施细微手工编著以便更好地定位一些保守区。示出基序II、III、IV、V、VI和VII。
图9显示双元载体p072,其用于在稻中增加谷醇溶蛋白启动子(内参PRO0090)控制下的玉蜀黍RANBP-编码核酸的表达。
图10显示双元载体p074,其用于在稻中增加谷醇溶蛋白启动子(内参PRO0090)控制下的拟南芥RANBP-编码核酸的表达。
GLK
图11给出玉米和稻GLK基因的图形概述(Rossini等,2001)。水平线代表未翻译的转率区(UTRs)。框代表示出的编码区的不同结构域。NLS是预测的核定位信号、DBD是预测的DNA结合结构域,其包含GARP结构域。白色三角形指出所有四个基因中存在的内含子的位置;黑色三角形指出未在G2基因中发现的内含子的位置。注意虽然预测OsGLK1具有核定位(信号),但不可能很准确的预测NLS序列的存在。
图12显示用于本发明中的GLK蛋白质(SEQ ID NO:157)的结构域结构。GARP结构域(黑体)与MYB结构域(斜体表示,由SMART鉴定)具有一些相似性;GCT结构域具有下划线。
图13给出SEQ ID NO:157(OsGLK1)、SEQ ID NO:169(OsGLK2)、SEQ ID NO:171(AtGLK1)、SEQ ID NO:173(AtGLK2)、SEQ ID NO:175(PpGLK1)、SEQ ID NO:177(PpGLK2)、SEQ ID NO:179(ZmGLK1)、SEQ ID NO:181(ZmG2)、SEQ IDNO:183(TaGLK1)、SEQ ID NO:185(AcGLK1)、SEQ ID NO:189(SbGLK1)、SEQ ID NO:193(OsGLK1var)所示蛋白质的多重比对。该比对用CLUSTAL W(1.83)作出,权重距阵:BLOSUM、空位开放罚分:10、空位延伸罚分:0.05。
图14显示双元载体p045的图,其用于在稻中增加GOS2启动子(SEQ ID NO:58)控制下的稻GLK-编码核酸的表达。
REV ΔHDZip/START
图15显示III类HDZip多肽的系统发生图。有两个单子叶REV多肽(稻),它们和一个双子叶REV多肽(拟南芥)聚簇在一起。圆形指示可用于实施本发明方法的REV核酸序列ΔHDZip/START的REV多肽的进化枝。在Floyd等,(2006)Genetics 173(1):373-88之后。
图16.使用CLUSTAL W(1.83)(在Kyoto UniversityBioinformatics Center的GenomeNet服务器上)和默认值(Blosum 62为权重距阵、空位开放罚分为10、空位延伸罚分为0.05)对来自拟南芥(共5个)和稻(共5个)的所有III类HDZip多肽(包括REV多肽直向同源物和旁系同源物的实例,参见实施例27)的序列多重比对后的邻近连接树(Neighbour-joining tree)结果。REV分支的多肽以波形括号示出,并以黑线从其他4个III类HDZip多肽中分开。圆形指示REV分支进入点(out point)。
图17图示全长REV多肽。REV多肽从N-末端到C-末端包括:(i)用于DNA结合的同源域(HD)结构域;(ii)用于蛋白质-蛋白质相互作用的亮氨酸拉链(Zip);(iii)用于脂质/sterol结合的START结构域(包含miRNA互补结合位点,mir165/166),和(iv)未定义功能的C-末端区(CTR)。例如,在SEQ ID NO:199所示的来自稻的一个REV多肽中,HD跨越第27位至第87位氨基酸,亮氨酸拉链跨越第91位至第127位氨基酸,START结构域跨越第166位至第376位氨基酸,且CTR跨越第377位至第840位氨基酸。
图18是可用于实施本发明方法的REV ΔHDZip/START核酸序列的全长REV多肽的序列多重比对,其使用CLUSTAL W(1.83)(在Kyoto University Bioinformatics Center的GenomeNet服务器上)和默认值(Blosum 62为权重距阵、空位开放罚分为10、空位延伸罚分为0.05)。黑框框出同源域、亮氨酸拉链、START结构域和CTR。
图19是可用于实施本发明方法的REV ΔHDZip/START核酸序列的REV多肽(全长或部分多肽,如实施例27中列出的)的CTR的序列多重比对,其使用CLUSTAL W(1.83)(在Kyoto UniversityBioinformatics Center的GenomeNet服务器上)和默认值(Blosum 62为权重距阵、空位开放罚分为10、空位延伸罚分为0.05)。
图20代表双元载体p0443和p0448,它们用于分别使用SEQ IDNO:194所示的REV ΔHDZip/START核酸序列(编码来自REV多肽的部分CTR),以及SEQ ID NO:198所示的REV核酸序列(编码完整REV多肽),以降低稻中内源REV基因的表达。核酸序列作为反向重复克隆,其通过非编码区(此处为来自烟草的基质附着区(MAR))分开,目标为获得具有发夹构象的mRNA。在两个不同的质粒中,组成型启动子(PRO0129)均控制在两个不同的质粒中的核酸序列SEQ ID NO:194和SEQ ID NO:198的表达。
CLE
图21显示CLE-样多肽SEQ ID NO:233的结构域结构:斜体是信号序列,蛋白酶解加工所需的保守Arg残基以黑体示出(此处为Arg73),CLE结构域有下划线。
图22给出CLE-样多肽的多重比对:序列排列(alignment)下面的单点表示保守性较低的取代,冒号表示高度保守性取代,星号表示所有序列中的保守残基相同的氨基酸。
图23代表双元载体p068,其用于稻中的内源基因沉默,优选使用在胚乳特异性启动子(PRO90)控制下的具有发夹结构的编码CLE-样多肽的核酸序列或其部分。
SYR NUE
图24给出SEQ ID NO:252中存在的保守基序的概述。富含亮氨酸的结构域有下划线,保守基序1、2和3以黑体示出,呈斜体的序列代表推定的N-糖基化位点和推定的蛋白激酶C磷酸化位点。
图25显示多个SYR蛋白质的多重比对。星号表示相同的氨基酸残基,冒号代表高度保守性取代,点代表保守性较低的取代。根据来自图1的信息,SEQ ID NO:252中的各个结构域和保守基序可容易的在其他SYR蛋白质中鉴定。
图26显示双元载体pGOS2::SYR,其用于在稻中转录和表达稻GOS2启动子控制下的稻SYR核酸。
图27详述了用于实施本发明方法的序列的实例,或用于分离此类序列的序列的实例。序列可来自低质量测序的公共EST集合。作为结果,可期望几个核酸取代。5’和3’UTR均可用于实施本发明的方法。SEQ ID NO:1至SEQ ID NO:58涉及ERLK;SEQ ID NO:58至SEQID NO:112涉及FBXWD40;SEQ ID NO:113至SEQ ID NO:155涉及RANBP;SEQ ID NO:156至SEQ ID NO:193和SEQ ID NO:58涉及GLK;SEQ ID NO:194至SEQ ID NO:231和SEQ ID NO:58涉及REV ΔHDZip/START;SEQ ID NO:232至SEQ ID NO:250涉及CLE;SEQ ID NO:58和SEQ ID NO:251至SEQ ID NO:292涉及SYR。SEQ ID NO:276代表ARGOS蛋白序列(GenBank登录号AY305869)。
实施例
本发明现在将参考仅作为说明的下列实施例加以描述。下列实施例不意图彻底定义或限制本发明范围。
DNA操作:除非另外声明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York)中或Ausubel等(1994),CurrentProtocols in Molecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOSScientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
实施例1:鉴定ERLK蛋白质SEQ ID NO:2在拟南芥、稻和其他植物物种中的同源物
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic AcidsRes.25:3389-3402)在国家生物技术信息中心的Entrez核苷酸数据库中所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。该程序一般用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对本发明核酸所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。
来自多种植物物种的稻序列和EST序列也可从其他数据库获得,例如KOME(Knowledge-based Oryza Molecular biologicalEncyclopedia;Kikuchi等,Science 301,376-379,2003)、Sputnik(Rudd,S.,Nucleic Acids Res.,33:D622-D627,2005)或Eukaryotic Gene直向同源物数据库(EGO,基因组研究所(The Institute for GenomicResearch)拥有)。这些数据库可用BLAST工具搜索。SEQ ID NO:11至SEQ ID NO:56是SEQ ID NO:2同源物的核酸和蛋白质序列,它们使用SEQ ID NO:2作为查询序列从上述数据库获得。
表A:与本发明方法中所用核酸序列(SEQ ID NO:1)相关的核酸序列,和相应的推导多肽
  植物来源  核酸SEQ ID NO:  蛋白质SEQ ID NO:
  拟南芥ERLK   1   2
  拟南芥AAC64891   11   12
  拟南芥NM_104355.2   13   14
  拟南芥At3g58690   15   16
  拟南芥At3g58690   17   18
  拟南芥At4g02010   19   20
  拟南芥At5g56890   21   22
  拟南芥AT2G20300   23   24
  稻Osi093820.1   25   26
  稻Osi015947.1   27   28
  稻Osi003977.2   29   30
  稻Osi003977   31   32
  稻Osi000040.5   33   34
  稻Ozsa8316   35   36
  稻Osi001397.3   37   38
  稻Osi000142.1   39   40
  稻Osi009054.1   41   42
  稻Osi001078.4   43   44
  甘蔗(Saccharumofficinarum)TC15181   45   46
  大豆TC196912   47   48
  马铃薯TC81885   49   50
  烟草coi2   51   52
  蒺藜苜蓿ABE82646.1   53   54
  杨属物种TC25047   55   56
实施例2:确定ERLK蛋白质的激酶结构域之间的全局相似性和同一性
ERLK蛋白质的激酶结构域之间的相似性百分数和同一性百分数使用MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的应用.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka所有)加以确定。MatGAT软件产生针对DNA序列或蛋白质序列的相似性/同一性矩阵,无需数据的预比对。使用Myers和Miller全局比对算法(空位开口罚分12和空位延伸罚分2),该程序执行一系列配对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。SEQ ID NO:2的序列在矩阵中显示为第1号。
在表C中显示针对ERLK多肽的激酶结构域的全局相似性和同一性的软件分析结果。激酶结构域使用SMART工具绘出,获得的序列在表B中列出。同一性百分数在对角线之上给出(黑体)并且相似性百分数在对角线之下给出(正常字体)。在CDS845(SEQ ID NO:2)ERLK旁系同源物和直向同源物的激酶结构域间的同一性百分数范围是30-68.8%。
表B:用SMART分析获得的和用于MATGAT分析中的激酶结构域序列
  CDS0845   FSEEKKIGNGDVYKGVLSDGTVAAIKKLHMFNDNASNQKHEERSFRLVQRSTSRLQCPYLVELLGYCADQNHRILIYEFMPNGTVEHHLHDHNFKNLKDRPQPLDWGARLRIALDCARALEFLHENTISTVIHRNFKCTNILLDQNNRAKVSDFGLAKTGSDKLNGEISTRVIGTTGYLAPEYASTGKLTTKSDVYSYGIVLLQLLTGRTPIDSRRPRGQDVLVSWALPRLTNREKISEMVDPTMKGQYSQKDLIQVAAIAAVCVQPEASYRPLMTDVVHSL
  NP_175879   FSEEKKIGNGDVYKGVLSDGTVAAIKKLHMFNDNASNQKHEERSFRLEVDLLSRLQCPYLVELLGYCADQNHRILIYEFMPNGTVEHHLHDHNFKNLKDRPQPLDWGARLRIALDCARALEFLHENTISTVIHRNFKCTNILLDQNNRAKVSDFGLAKTGSDKLNGEISTRVIGTTGYLAPEYASTGKLTTKSDVYSYGIVLLQLLTGRTPIDSRRPRGQDVLVSWALPRLTNREKISEMVDPTMKGQYSQKDLIQVAAIAAVCVQPEASYRPLMTDVVHSL
  AT3G58690   FSKSNVVGNGGFGLVYRGVLNDGRKVAIKLMDHAGKQGEEEFKMEVELLSRLRSPYLLALLGYCSDNSHKLLVYEFMANGGLQEHLYLPNRSGSVPPRLDWETRMRIAVEAAKGLEYLHEQVSPPVIHRDFKSSNILLDRNFNAKVSDFGLAKVGSDKAGGHVSTRVLGTQGYVAPEYALTGHLTTKSDVYSYGVVLLELLTGRVPVDMKRATGEGVLVSWALPQLADRDKVVDIMDPTLEGQYSTKEVVQVAAIAAMCVQAEADYRPLMADVVQSL
  At3g58690s   FSKSNVVGNGGFGLVYRGVLNDGRKVAIKLMDHAGKQGEEEFKMEVELLSRLRSPYLLALLGYCSDNSHKLLVYEFMANGGLQEHLYLPNRSGSVPPRLDWETRMRIAVEAAKGLEYLHEQVSPPVIHRDFKSSNILLDRNFNAKVSDFGLAKVGSDKAGGHVSTRVLGTQGYVAPEYALTGHLTTKSDVYSYGVVLLELLTGRVPVDMKRATGEGVLVSWALPQLADRDKVVDIMDPTLEGQYSTKEVVQVAAIAAMCVQAEADYRPLMADVVQSL
  AT4G02010   FESASILGEGGFGKVYRGILADGTAVAIKKLTSGGPQGDKEFQVEIDMLSRLHHRNLVKLVGYYSSRDSSQHLLCYELVPNGSLEAWLHGPLGLNCPLDWDTRMKIALDAARGLAYLHEDSQPSVIHRDFKASNILLENNFNAKVADFGLAKQAPEGRGNHLSTRVMGTFGYVAPEYAMTGHLLVKSDVYSYGVVLLELLTGRKPVDMSQPSGQENLVTWTRPVLRDKDRLEELVDSRLEGKYPKEDFIRVCTIAAACVAPEASQRPTMGEVVQSL
  At5g56890   FDESRVLGEGGFGRVYEGVFDDGTKVAVKVLKRDDQQGSREFLAEVEMLSRLHHRNLVNLIGICIEDRNRSLVYELIPNGSVESHLHGIDKASSPLDWDARLKIALGAARGLAYLHEDSSPRVIHRDFKSSNILLENDFTPKVSDFGLARNALDDEDNRHISTRVMGTFGYVAPEYAMTGHLLVKSDVYSYGVVLLELLTGRKPVDMSQPPGQENLVSWTRPFLTSAEGLAAIIDQSLGPEISFDSIAKVAAIASMCVQPEVSHRPFMGEVVQAL
  AT2G20300   FSAKRVLGEGGFGRVYQGSMEDGTEVAVKLLTRDNQNRDREFIAEVEMLSRLHHRNLVKLIGICIEGRTRCLIYELVHNGSVESHLHEGTLDWDARLKIALGAARGLAYLHEDSNPRVIHRDFKASNVLLEDDFTPKVSDFGLAREATEGSQHISTRVMGTFGYVAPEYAMTGHLLVKSDVYSYGVVLLELLTGRRPVDMSQPSGEENLVTWARPLLANREGLEQLVDPALAGTYNFDDMAKVAAIASMCVHQEVSHRPFMGEVVQAL
  Osi015947   FSECNVVGRGAYGVVFRGRLGDGTTAAIKRLKMDGRREGEREFRIEMGVAITAQVDLLSRMHSPYLVGLLGYCADQSHRLLVFEFMPNGSLKSHLHRRALAPAEQPPPLDWQTRLGIALDCARALEFLHEHSSPAVIHRDFKCSNILLDHNYRARVSDFGMAKLGSNKANGQVAAITAMCIQTKADYRPLMTDVVQSL
  Osi003977   FGRAHVVGQGSFGAVYRGVLPDGRKVAVKLMDRPGKQGEEEFEMEVELLSRLRSPYLLGLIGHCSEGGHRLLVYEFMANGGLQEHLYPNGAFEKIETFSIYLVKQRPIFDKNIGHPICRRAHFSRQLISHKADIVGSCGGISKLDWPTRMRIALEAAKGLEYLHERVNPPVIHRDFKSSNILLDKDFRARVSDFGLAKLGSDRAGGHVSTRVLGTQGYVAPDYGVVLLELLTGRVPVDMKRPPGEGVLVNWALPMLTDREKVVQILDPALEGQYSLKDAVQVAAIAAMCVQQEADYRPLMADVVQSL
  Osi000040a   FDPSSMLGEGGFGRVFKGVLTDGTAVAIKKLTSGGHQGDKEFLVEVEMLSRLHHRNLVKLIGYYSNRTLGASRPLDWDTRMRIALDAARGLAYLHEDSQPCVIHRDFKASNILLEDDFHAKVSDFGLAKQAPEGRTNYLSTRVMGTFGYVAPEYAMTGHLLVKSDVYSYGVVLLELLTGRRPVDMSQPSGQENLVTWLTQMFPDLSTKSLVSHQPLLAKLSGVEILICSILTTQARPILRDKDTLEELADPKLGGQYPKDDFVRVCTIAAACVSPEASQRPTMGEVVQSL
  Osi000040b   FSNDLAIGVGGFGVVYRGVVDGDVKVAVKRSNPSSEQGITEFQTEVEMLSKLRHRHLVSLIGFCEEDGEMVLVYDYMEHGTLREHLYHNGGKPTLSWRHRLDICIGAARGLHYLHTGESHVSTVVKGSFGYLDPEYYRRQQLTDKSDVYSFGVVLFEVLMARPALDPALPRDQVSLADYALACKRGGALPDVVDPAIRDQIAPECLAKFADTAEKCLSENGTERPTMGDVLWNL
  Osi001397   FDNSRIIGEGGFGRVYEGILEDGERVAVKILKRDDQQGTREFLAEVEMLSRLHHRNLVKLIGICTEEHIRCLVYELVPNGSVESHLHGSDKGTAPLYWDARLKIALGAARALAYLHEDSSPRVIHRDFKSSNILLEHDFTPKVSDFGLARTAIGEGNEHISTRVMGTFGYVAPEYAMTGHLLVKSDVYSYGVVLLELLTGRKPVDILRPPGQENLVAWACPFLTSRDGLETIIDPSLGNSILFDSIAKVAAIASMCVQPEVDQRPFMGEVVQAL
  Osi000142   FDDSTVLGEGGFGCVYQGTLEDGTRVAVKVLKRYDGQGEREFLAEVEMLGRLHHRNLVKLLGICVEENARCLVYELIPNGSVESHLHGVDLETAPLDWNARMKIALGAARALAYLHEDSSPCVIHRDFKSSNILLEHDFTPKVSDFGLARTARGEGNQHISTRVMGTFGYVAPEYAMTGHLLVKSDVYSYGVVLLELLTGRKPVDMSRPGGQENLVSWARPLLTNVVSLRQAVDPLLGPNVPLDNVAKAAAIASMCVQPEVAHRPSMGEVVQAL
  Osi009054   FDSKRVLGQGGFGRVYHGTMDGGDEIAVKLLTREDRSGDREFIAEVEMLSRLHHRNLVKLIGICIEHNKRCLVYELIRNGSVESHLHGADKAKGMLNWDVRMKIALGAARGLAYLHEDSNPHVIHRDFKGSNILLEEDFTPKVTDFGLAREATNGIQPISTRVMGTFGYVAPEYAMTGHLLVKSDVYSYGVVLLELLSGRKPVCMSDTNGPQNLVTWARPLLCHKEGLERLIDPSLNGNFNFDDVAKVASIASMCVHNDPSQRPFMGEVVQAL
  Osi001078   FSFNKIIGEGGYGRVYRGTIDDEVDVAVKLLTRKHQNRDREFIAEVEMLSRLHHRNLVKLIGICIERSTRCLVFELVPNGSVESHLHGSDKIYGPLDFDTRMKIALGAARGLAYLHEDANPHVIHRDFKASNVLLENDFTPKVADFGLAKEASEGMDHISTQVMGTFGYVAPEYAMTGHLLVKSDVYSYGVVLLELLSGRKPVDMTQPPGSENLVTWARPLLTDRDGLQQLVDPSMPAASYGFEKLAKAAAIASMCVHVEASHRPFMGEVVQAL
  TC15181   FGRAHMVGQGSFGAVYRGVLPDGRKVAVKLMDRPGKQGEEEFEMEVELLSRLRSPYLLGLIGHCSEGGHRLLVYEFMANGGLQEHLYPNRGSCGGISKLDWDTRMRIALEAAKGLEYLHERVNPPVIHRDFKSSNILLDKDFHARVSDFGLTKLGSDRAGGHVSTRVLGTQGYVAPEYALTGHLTTKSDVYSYGVVLLELLTGRVPVDMKRPPGEGVLVNWALPMLTDREKVVRILDPALEGQYSLKDAVQVAAIAAMCVQPEADYRPLMADVVQSL
  TC196912   SKSNVIGHGGFGLVYRGVLNDGRKVAIKFMDQAGKQGEEEFKVEVELLSRLHSPYLLALLGYCSDSNHKLLVYEFMANGGLQEHLYPVSNSIITPVKLDWETRLRIALEAAKGLEYLHEHVSPPVIHR
  DFKSSNILLDKKFHAKVSDFGLAKLGPDRAGGHVSTRVLGTQGYVAPEYALTGHLTTKSDVYSYGVVLLELLTGRVPVDMKRPPGEGVLVSWALPLLTDREKVVKIMDPSLEGQYSMKEVVQVAAIAAMCVQPEADYRPLMADVVQSL
  TC81885   EEEFKVEVELLCRLRSPYLLSLIGYCSESSHKLLVYEFMANGGLQEHLYPIKGSNNCCPKLDWKTRLRIALEAAKGLEYLHEHVNPPIIHRDLKSSNILLDKNFHAKVSDFGLAKLGSDKAGGHVSTRVLGTQGYVAPEYALTGHLTTKSDVYSYGVVLLELLTGRVPVDMKRSPGEGVLVSWALPRLTDREKVVEIMDPALEGQYSMKEVIQVAAIAAMCVQPEADYRPLMADVVQSL
  ABB36644   FSLKRVLGEGGFGRVYHGILEDRTEVAVKVLTRDNQNGDREFIAEVEMLSRLHHRNLVKLIGICSEERTRSLVYELVRNGSVESHLHGRDGRKEPLDWDVRLKIALGAARGLAYLHEDSNPRVIHRDFKASNVLLEDDFTPKVADFGLAREATEGSHHISTRVMGTFGYVAPEYAMTGHLLVKSDVYSYGVVLLELLSGRKPVDMSQPPGEENLVTWARPLLTTREGLEQLVDPSLAGSYDFDDMAKVAAIASMCVHPEVTQRPFMGEVVQAL
  ABE82646   MLSRLHHRNLVKLIGICIEGRRRCLVYELVPNGSVESHLHGDDKNRGPLDWEARMKIALGAARGLAYLHEDSNPRVIHRDFKASNVLLEDDFTPKVSDFGLAREATEGSNHISTRVMGTFGYVAPEYAMTGHLLVKSDVYSYGVVLLELLTGRKPVDMSQPQGQENLVTWARALLTSREGLEQLVDPSLAGGYNFDDMAKVAAIASMCVHSEVTQRPFMGEVVQAL
  Popsp   VTWNEGYGVVYGGTLSDGTVAAIKMLHRAGKQGERAFRIEVDLLSRLHSPYLVELLGYCADQNHRLLVFEFMPNGTLQHHLHHKQYRPLDWGTRLRIALDCARALEFLHELTIPAVIHRDFKCSNILLDQNFRAKVSDFGSAKMGSERINARNSMCLPSTTGYLAPEHASTGKLTTKSDVYSYGVVLLQLLTGRKPVDTKQPSGEHVLVSWALPRLTNRDKVVEMVDPAMQDQYSKKDLIQVAAIAAVCVQPEADYRPLMTDVVQSL
表C:
Figure A20078002806602071
实施例3:克隆本发明方法中所用核酸序列
DNA操作:除非另外声明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York)中或Ausubel等(1994),CurrentProtocols in Molecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOSScientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥幼苗cDNA文库(在PCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μlPCR混合物中的200ng模板进行PCR。所用的引物是prm2500(SEQ IDNO:3;有义,起始密码子为粗体字:
5′ggggacaagtttgtacaaaaaagcaggcttcacaatggaaaacaaaagccatagc 3′)
和prm2501(SEQ ID NO:4;反义,互补:
5′ggggaccactttgtacaagaaagctgggtaaacaaaagagtgtcatggca 3′),
其中所述引物包括用于Gateway重组的AttB位点。扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”p031。质粒pDONR201作为
Figure A20078002806602081
技术的部分从Invitrogen购买。
实施例4:表达载体构建
进入克隆p031随后在LR反应中与p05050(一种用于稻转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择性标记;筛选标记表达盒和意图与已经克隆于所述进入克隆中的目的核酸序列发生LR体内重组的Gateway盒。稻非病毒组成型启动子,GOS2启动子(SEQ ID NO:58)位于这种Gateway盒的上游。
在LR重组步骤后,将产生的表达载体p030(图4)转化至农杆菌菌株LBA4044并随后转化至稻植物内。
实施例5:植物转化
稻转化
含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中温育4周后,将来自小盾片的愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃温育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温室中培育。
对于一个构建体,产生大约35个独立T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3-5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
玉米转化
玉米的转化根据对Ishida等(1996.Nature Biotech 14(6):745-50)描述方法的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其他基因型也可以成功地使用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择性标记)。培养板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
小麦转化
小麦的转化用Ishida等Ishida等(1996)Nature Biotech14(6):745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择性标记)。培养平板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切下并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其他品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植体的切口端浸入细菌混悬液而接种。外植体随后在含有3mg/lBAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗切下并转移至苗伸长培养基(含0.5mg/l BAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
苜蓿转化
苜蓿的再生性克隆使用(McKersie等,1999 Plant Physiol119:839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其他商业苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中(Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/LK2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不合生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
实施例6:评价方法
6.1评价准备
产生大约30个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下7个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评估,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048x1536像素,1600万颜色)。
6.2统计学分析:t-检验和F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
实施例7:评价结果
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表达的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点。
将成熟的主圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内在37℃干燥3日。随后将圆锥花序脱粒并且收集及计数全部种子。使用吹气装置分开饱满粒与空粒。弃去空粒并再次对剩余部分计数。饱满粒在分析天平上称重。饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产量通过称量从植物中收获的全部饱满粒而测量。
如在表D至表F中所示,与合适的对照植物相比,地上部分生物量、种子产量、饱满种子数在编码ERLK蛋白质的核酸的表达增加的转基因植物中增加。显示了来自T1和T2世代的结果。
表D显示在编码ERLK蛋白质的核酸的表达增加的转基因稻的T1和T2世代中,地上部分生物量增加的百分数以及这种增加根据F-检验的统计关联性。
表D:
Figure A20078002806602141
表E显示在编码ERLK蛋白质的核酸的表达增加的转基因稻的T1和T2世代中,种子总产量(种子总重量)增加的百分数以及这种增加根据F-检验的统计关联性。
表E:
表F显示在编码ERLK蛋白质的核酸的表达增加的转基因稻的T1和T2世代中,饱满种子数增加的百分数以及这种增加根据F-检验的统计关联性。
表F:
Figure A20078002806602143
FBXW
实施例8:鉴定与本发明方法中所用核酸序列相关的序列
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic AcidsRes.25:3389-3402)在国家生物技术信息中心的Entrez核苷酸数据库中所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对本发明核酸所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。
下表提供与执行本发明方法中所用核酸序列相关的核酸序列列表。
表G:与本发明方法中所用核酸序列(SEQ ID NO:59)相关的核酸序列,和对应的推导多肽
名称 核酸SEQID NO   多肽SEQ IDNO 序列长度 NCBI登录号 来源生物
 Arath_FBXW(At5g21040) 59 60 全长 NM_122112.2 拟南芥
 Orysa_FBXW 61 62 全长 AK111585
 Medtr_FBXW 63 64 全长   CR931734剪接自(spliced out)   蒺藜苜蓿(Medicagotrunculata)
Triae_FB XW 65 66 全长   CJ661176.1CB307121.1CJ553648.1 普通小麦
  Poptr_FBXW 67 68 全长 Proprietary 美洲山杨
  Zeama_FBXW 69 70 全长   AC183938.1剪接自 玉蜀黍
Vitvi_FBXW 71 72 部分(3’)   CF210354CF413646CF213082 葡萄
  Senca_FBXW 73 74 部分(5’) DY662683.1   Seneciocambrensis
  Helan_FBXW 75 76   部分(中间) DY916708 向日葵
  Eupes_FBXW 77 78   部分(中间) DV129599 乳浆大戟
  Lyces_FBXW 79 80   部分(中间) BI931509 番茄
Aqufo_FBXW 81 82 部分(中间) DT753991.1   Aquilegiaformosa xAquilegiapubescens
  Goshi_FBXW 83 84 部分(3’) DT466472 陆地棉
  Sorbi_FBXW 85 86   部分(中间) CF770159 两色蜀黍
  Iponi_FBXW 87 88 部分(3’) BJ574759.1 牵牛
  Soltu_FBXW   89   90   部分(3’)   CX161187   马铃薯
  Zamfi_FBXW 91 92   部分(中间) DY032229 菱叶凤尾蕉
  Peram_FBXW 93 94 部分(3’) CK756534 鳄梨
  Glyma_FBXW 95 96 部分(3’) CD418593.1 大豆
  Brara_FBXW 107 108 全长 AC189583 芜青
Sorbi_FBXW 109 110 全长   BI075893CW484775CF770159CF770238的叠连群 两色蜀黍
  Vitvi_FBXW   111   112  全长   AM440865   葡萄
实施例9:确定FBXW多肽及其如SEQ ID NO:102和SEQ ID NO:103所示的保守区(均包含在SEQ ID NO:60中)之间的全局相似性和同一性
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的应用.Campanella JJ,Bitincka L,SmalleyJ;软件由Ledion Bitincka所有)确定全长FBXW多肽序列之间的全局相似性百分数和同一性百分数。MatGAT软件产生针对DNA序列或蛋白质序列的相似性/同一性矩阵,无需数据的预比对。使用Myers和Miller全局比对算法(空位开口罚分12和空位延伸罚分2),该程序执行一系列配对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。SEQ ID NO:60的序列来自拟南芥(code Arath_FBXW)。
比较中所用的参数是:
记分矩阵:Blosum62
第一空位:12
延伸性空位:2
在表H中显示针对FBXW多肽全长的全局相似性和同一性的软件分析结果。同一性百分数在对角线之上给出并且相似性百分数在对角线之下给出。在FBXW旁系同源物和直向同源物间的同一性百分数范围是45-80%,反映所述旁系同源物和直向同源物间相对低的序列同一性保守。
表H:用于FBXW多肽全长上的全局相似性和同一性的MatGAT结果
Figure A20078002806602181
在表I和J中显示针对FBXW多肽的保守区1(如SEQ ID NO:102所示,包含在SEQ ID NO:60中)和2(SEQ ID NO:103,包含在SEQ ID NO:60中)的全局相似性和同一性的软件分析结果。同一性百分数在对角线之上给出并且相似性百分数在对角线之下给出。在FBXW旁系同源物和直向同源物的保守区1(如SEQ ID NO:102)和保守区2(如SEQ ID NO:103)间的同一性百分数范围是65-100%(相似性百分数范围是85-100%)。
表I:用于在FBXW多肽的保守区1(如SEQ ID NO:102)上的全局相似性和同一性的MatGAT结果
Figure A20078002806602182
Figure A20078002806602191
表J:用于在FBXW多肽的保守区2(如SEQ ID NO:103)上的全局相似性和同一性的MatGAT结果
实施例10:克隆本发明方法中所用的核酸序列
DNA操作:除非另外声明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York)中或Ausubel等(1994),CurrentProtocols in Molecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOSScientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥混合组织cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μlPCR混合物中的200ng模板进行PCR。所用的引物是prm06999(SEQID NO:105;有义,AttB1位点是小写字体:
5′-ggggacaagtttgtacaaaaaagcaggcttaaacaATGAATCGTTTTTCTCGTTT  3′)
和prm07000(SEQ ID NO:106;反义,互补,AttB2位点是小写字体:
5′ggggaccactttgtacaagaaagctgggtATCCAATCTTATCGCTTAGG3′),
其中所述引物包括用于Gateway重组的AttB位点。扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”p08433。质粒pDONR201作为
Figure A20078002806602201
技术的部分从Invitrogen购买。
实施例11:表达载体构建
进入克隆p08433随后在LR反应中与p00640(一种用于稻转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择性标记;筛选标记表达盒和意图与已经克隆于所述进入克隆中的目的核酸序列发生LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ ID NO:58)(PRO0129)位于这种Gateway盒的上游。
在LR重组步骤后,将产生的表达载体p15973(图7)转化至农杆菌菌株LBA4044并随后转化至稻植物内。允许转化的稻植物生长并随后对下文所述参数进行检验。
实施例12:评价方法
12.1评价准备
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下7个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评估,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
12.2统计分析:F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
实施例13:评价结果
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表达的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点。
将成熟的主圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内在37℃干燥3日。随后将圆锥花序脱粒并且收集及计数全部种子。使用吹气装置分开饱满粒与空粒。弃去空粒并再次对剩余部分计数。饱满粒在分析天平上称重。饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产量通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的壳粒数目而测量。从计数的饱满种子数及其总重量外推出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比,乘以系数106。如本发明中定义的每圆锥花序的总花数是种子总数与成熟主圆锥花序的数目之间的比率。如本发明中定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。
如在表K至表O中所示,与合适的对照植物相比,地上部分生物量、每个圆锥花序的花数、种子产量、种子总数、饱满种子数、千粒重(TKW)和收获指数在编码FBXW多肽的核酸的表达增加的转基因植物中增加。显示了来自T1和T2世代的结果。
表K显示具有种子总产量(种子总重量)增加的转基因事件的数目、这种增加的百分数以及这种增加根据F-检验的统计关联性。
表K:在编码FBXW多肽的核酸表达增加的转基因稻的T1和T2世代中具有种子总产量增加的转基因事件的数目、这种增加的百分数和F-检验的P值。
Figure A20078002806602221
表L显示具有饱满种子数增加的转基因事件的数目、这种增加的百分数以及这种增加根据F-检验的统计关联性。
表L:在编码FBXW多肽的核酸表达增加的转基因稻的T1和T2世代中具有饱满种子数增加的转基因事件的数目、这种增加的百分数和F-检验的P值。
表M显示具有收获指数增加的转基因事件的数目、这种增加的百分数以及这种增加根据F-检验的统计关联性。
表M:在编码FBXW多肽的核酸表达增加的转基因稻的T1和T2世代中具有收获指数增加的转基因事件的数目、这种增加的百分数和F-检验的P值。
Figure A20078002806602232
表N显示具有千粒重(TKW)增加的转基因事件的数目、这种增加的百分数以及这种增加根据F-检验的统计关联性。
表N:在编码FBXW多肽的核酸表达增加的转基因稻的T1和T2世代中具有千粒重(TKW)增加的转基因事件的数目、这种增加的百分数和F-检验的P值。
Figure A20078002806602233
表O显示具有种子饱满率增加的转基因事件的数目、这种增加的百分数以及这种增加根据F-检验的统计关联性。
表O:在编码FBXW多肽的核酸表达增加的转基因稻的T1和T2世代中具有种子饱满率增加的转基因事件的数目、这种增加的百分数和F-检验的P值。
Figure A20078002806602241
RANBP
实施例14:鉴定与本发明方法中所用核酸序列相关的序列
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic AcidsRes.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。例如,本发明所用核酸编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。例如可以增加E-值以显示严格性较小的匹配。以这种方式,可以鉴定短的几乎精确的匹配。
表P提供与本发明方法中所用核酸序列相关的核酸序列列表。
表P:与本发明方法中所用核酸序列(SEQ ID NO:113)相关的核酸序列,和对应的推导多肽
植物来源 核酸SEQ ID NO   蛋白质SEQ ID NO
    玉蜀黍     113     114
    玉蜀黍     113     115
    拟南芥     116     117
    拟南芥     116     118
    拟南芥     119     120
    拟南芥     121     122
    番茄     123     124
    稻     125     126
    玉蜀黍     127     128
    稻     129     130
    杨属物种     131     132
    甘蔗     133     134
    甘蔗     135     136
    苜蓿     137     138
在一些情况下,相关序列已经由研究所如基因组研究所(TIGR)试验性汇编并向公众公开。真核生物基因直向同源物(EGO)数据库可以用来此类的相关序列,这可通过关键词搜索通过使用BLAST算法利用目的核酸或多肽序列进行。
实施例15:克隆本发明方法中所用玉蜀黍RANBP编码核酸序列
本发明方法中所用的核酸序列通过PCR,使用玉米胚乳cDNA文库作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μlPCR混合物中的200ng模板进行PCR。所用的引物是prm06703(SEQ ID NO:151;有义,起始密码子为粗体字,AttB1位点是斜体:5′-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcggacaaggagc-3′)和prm06704(SEQ ID NO:152;反义,互补,AttB2位点是斜体:5′ggggaccactttgtacaagaaagctgggtagtgcaacc acaccaactact 3′),
其中所述引物包括用于Gateway重组的AttB位点。扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为
Figure A20078002806602261
技术的部分从Invitrogen购买。
实施例16:表达载体构建
进入克隆随后在LR反应中与用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择性标记;筛选标记表达盒和意图与已经克隆于所述进入克隆中的目的核酸序列发生LR体内重组的Gateway盒。用于胚特异性表达的谷醇溶蛋白启动子(SEQ ID NO:155)(内参PRO90)位于这种Gateway盒的上游。
在LR重组步骤后,将产生的表达载体p072(图9)转化至农杆菌菌株LBA4044并随后转化至稻植物内。允许转化的稻植物生长并随后对下文所述参数进行检验。
实施例17:克隆本发明方法中所用拟南芥RANBP编码核酸序列
本发明方法中所用的核酸序列通过PCR,使用拟南芥cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μlPCR混合物中的200ng模板进行PCR。所用的引物是6491(SEQ ID NO:153;有义,起始密码子为粗体字,AttB1位点是斜体:5′-ggggacaagtttgtacaaaaaagcaggcttcacaatggcgagcattagcaac 3′)和6492(SEQ ID NO:154;反义,互补,AttB2位点是斜体:5′ggggaccactttgtacaagaaagctgggtgcatcttaagctgagggaac 3′),
其中所述引物包括用于Gateway重组的AttB位点。扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为
Figure A20078002806602271
技术的部分从Invitrogen购买。
实施例18:表达载体构建
进入克隆随后在LR反应中与用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择性标记;筛选标记表达盒和意图与已经克隆于所述进入克隆中的目的核酸序列发生LR体内重组的Gateway盒。用于胚特异性表达的谷醇溶蛋白启动子(SEQ ID NO:155)(内参PRO90)位于这种Gateway盒的上游。
在LR重组步骤后,将产生的表达载体p074(图10)转化至农杆菌菌株LBA4044并随后转化至稻植物内。允许转化的稻植物生长并随后对下文所述参数进行检验。
实施例19:评价方法
19.1评价准备
产生大约30个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下7个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评估,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
19.2统计分析:t检验和F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
为检查基因在事件中的作用,即株系特异性作用,使用来自转基因植物和对应的无效植物的数据集在每个事件内进行t检验。”无效植物”或“无效分离子”或“失效合子”是以与转基因植物相同的方式受到处理,但是转基因已经从中发生分离的植物。无效植物也可以描述为纯合阴性转化植物。用于t检验的显著性的阈值设置在10%概率水平上。一些事件的结果可以高于或低于这个阈值。这基于如此假设,即基因可能仅在基因组中某些位置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用在本文中又称作“基因的株系作用”。p-值通过t-值与t-分布比较或备选地通过F-值与F-分布比较而获得。该p-值随后给出无效假设(即转基因的作用不存在)是正确的概率。
实施例20:评价结果
相对于对照植物中的各项,表达在谷醇溶蛋白启动子控制下的玉米RANBP的转基因稻植物产生增加的平均种子重量、饱满种子数、收获指数、生物量、饱满率、千粒重(TKW)、种子平均面积、种子平均长度和种子平均宽度。具体而言,在T1世代中TKW增加,并该增加在T2植物世代中得到确认。发现具有来自F-检验的p-值>0.00001的该增加是统计学显著的。同样值得注意的是,相对于对照植物饱满率增加,在T1世代中的该增加在T2植物世代中得到确认。同样发现具有来自F-检验的p-值为0.001的该增加是统计学显著的。
相对数据
相对于对照植物,表达在组成型GOS2启动子控制下的玉米RANBP的转基因稻植物未产生产量的实质性不同。相对于对照植物,转基因植物的平均种子重量、饱满种子数、收获指数、生物量、饱满率或千粒重(TKW)没有增加。
相对于对照植物中的各项,表达在谷醇溶蛋白启动子控制下的拟南芥RANBP的转基因稻植物产生增加的生物量、平均种子重量、饱满种子数、每个圆锥花序的花数、收获指数、饱满率和千粒重。
GLK
实施例21:在拟南芥、稻和其他植物物种中鉴定GLK蛋白质SEQ ID NO:157的同源物
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic AcidsRes.25:3389-3402)在国家生物技术信息中心的Entrez核苷酸数据库中所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。该程序一般用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对本发明核酸所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。
来自多种植物物种的稻序列和EST序列也可从其他数据库获得,例如KOME(Knowledge-based Oryza Molecular biologicalEncyclopedia;Kikuchi等,Science 301,376-379,2003)、Sputnik(Rudd,S.,Nucleic Acids Res.,33:D622-D627,2005)或Eukaryotic Gene直向同源物数据库(EGO,基因组研究所(The Institute for GenomicResearch)拥有)。这些数据库可用BLAST工具搜索。SEQ ID NO:168至SEQ ID NO:193是SEQ ID NO:157同源物的核酸和蛋白质序列,它们使用SEQ ID NO:157作为查询序列从上述数据库获得。
表Q:与用于本发明方法中的核酸序列(SEQ ID NO:156)相关的核酸序列及对应的推导多肽。
  植物来源   核酸SEQ ID NO   蛋白质SEQ ID NO
  OsGLK   156   157
  OSJNBa0086P08.18   168   169
  拟南芥GLK1   170   171
  拟南芥GLK2   172   173
  小立碗藓Glk1   174   175
  小立碗藓Glk2   176   177
  玉蜀黍ZmGLK1   178   179
  玉蜀黍ZmGLK2   180   181
  普通小麦TaGLK1   182   183
  洋葱AcGLK1   184   185
  大麦HvGLK2   186   187
  两色蜀黍SbGLK1   188   189
  甘蔗oGLK2   190   191
  稻OsGLK1   192   193
实施例22:确定GLK蛋白质之间的全局相似性和同一性
全长GLK蛋白质序列和GLK蛋白质GARP或GCT结构域之间的相似性百分数和同一性百分数使用MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的应用.Campanella JJ,Bitincka L,SmalleyJ;软件由Ledion Bitincka所有)加以确定。MatGAT软件产生针对DNA序列或蛋白质序列的相似性/同一性矩阵,无需数据的预比对。使用Myers和Miller全局比对算法(空位开口罚分12和空位延伸罚分2),该程序执行一系列配对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
GARP和GCT结构域使用多重比对示出,且获得的序列在表R和S中列出。在表T至V中显示针对全长蛋白质序列和GLK蛋白质GARP或GCT结构域的相似性和同一性的软件分析结果。序列SEQ IDNO:157在距阵中以数字6(OsGLK1)示出。同一性百分数在对角线之上给出(黑体)并且相似性百分数在对角线之下给出(正常字体)。SEQID NO:157的GLK旁系同源物和直向同源物的全长序列的同一性百分数范围是30-98.7%。当使用GARP结构域的序列代替全长序列时,这些百分比要高很多。
表R:用蛋白质序列比对获得的和用于MATGAT分析中的GARP结构域序列:
  ZmG2   KVKVDWTPELHRRFVQAVEQLGIDKAVPSRILEIMGTDCLTRHNIASHLQKYRSHR
  ZmGLK1   KAKVDWTPELHRRFVQAVEELGIDKAVPSRILEIMGIDSLTRHNIASHLQKYRSHR
  OsGLK2   KVKVDWTPELHRRFVQAVEQLGIDKAVPSRILELMGIECLTRHNIASHLQKYRSHR
  PpGLK2   KAKVDWTPELHRRFVHAVEQLGVEKAYPSRILELMGVQCLTRHNIASHLQKYRSHR
  PpGlk1   KAKVDWTPELHRRFVHAVEQLGVEKAFPSRILELMGVQCLTRHNIASHLQKYRSHR
  OsGLK1   KAKVDWTPELHRRFVQAVEQLGIDKAVPSRILEIMGIDSLTRHNIASHLQKYRSHR
  AtGLK2   KPKVDWTPELHRKFVQAVEQLGVDKAVPSRILEIMNVKSLTRHNVASHLQKYRSHR
  AtGLK1   KVKVDWTPELHRRFVEAVEQLGVDKAVPSRILELMGVHCLTRHNVASHLQKYRSHR
  AcGLK1   KAKVDWTPELHRRFVQAVEQLGVDKAVPSRILELMGIDCLTRHNIASHLQKYRSHR
表S:用蛋白质序列比对获得的和用于MATGAT分析中的GCT结构域序列:
  ZmG2   KHLMAREAEAATWAQKRHMYAPPAPRTTTTTDAARPPWVVPTTIGFPPPRFCRPLHVWGHPPPHAAAAEAAAATPMLPVWPRHLAPPRHLAPWAHPTPVDPAFWHQQYSAARKWGPQAAAVTQGTPCVPLPRFPVPHPIYSRPAMVPPPPSTTKLAQLHLELQAHPSKESIDAAIGDVLVKPWLPLPLGLKPPSLDSVMSELHKQGVPKIPPAAATTTGATG
  ZmGLK1   KHMLAREVEAATWTTHRRPMYAAPSGAVKRPDSNAWTVPTIGFPPPAGTPPRPVQHFGRPLHVWGHPSPTPAVESPRVPMWPRHLAPRAPPPPPWAPPPPADPASFWHHAYMRGPAAHMPDQVAVTPCVAVPMAAARFPAPHVRGSLPWPPPMYRPLVPPALAGKSQQDALFQLQIQPSSESIDAAIGDVLTKPWLPLPLGLKPPSVDSVMGELQRQGVANVPQACG
  OsGLK2   KHLMAREAEAASWTQKRQMYTAAAAAAAVAAGGGPRKDAAAATAAVAPWVMPTIGFPPPHAAAMVPPPPHPPPFCRPPLHVWGHPTAGVEPTTAAAPPPPSPHAQPPLLPVWPRHLAPPPPPLPAAWAHGHQPAPVDPAAYWQQQYNLQRFPVPPVPGMVPHPMYRPIPPPSPPQGNKLAALQLQLDAHPSKESIDAAIGDVLVKPWLPLPLGLKPPSLDSVMSELHKQGIPKVPPAASGAAG
  PpGLK2   RHLAAREAEAASWTHRRTYTQAPWPRSSRRDGLPYLVPIHTPHIQPRPSMAMAMQPQLQTPH
  HPISTPLKVWGYPTVDHSNVHMWQQPAVATPSYWQAADGSYWQHPATGYDAFSARACYSHPMQRVPVTTTHAGLPIVAPGFPDESCYYGDDMLAGSMYLCNQSYDSEIGRAAGVAACSKPIETHLSKEVLDAAIGEALANPWTPPPLGLKPPSMEGVIAELQRQGINTVPPSTC
  PpGlk1   RHLAAREAEAASWTHRRAYTQMPWSRSSRRDGLPYLVPLHTPHIQPRPSMVMAMQPQLQTQHTPVSTPLKVWGYPTVDHSSVHMWQQPAVATPSYWQAPDGSYWQHPATNYDAYSARACYPHPMRVSLGTTHAGSPMMAPGFPDESYYGEDVLAATMYLCNQSYDSELGRAAGVAACSKPPETHLSKEVLDAAIGEALANPWTPPPLGLKPPSMEGVIAELQRQGINTVPPSTC
  OsGLK1   KHMIAREAEAASWTQRRQIYAAGGGAVAKRPESNAWTVPTIGFPPPPPPPPSPAPMQHFARPLHVWGHPTMDPSRVPVWPPRHLVPRGPAPPWVPPPPPSDPAFWHHPYMRGPAHVPTQGTPCMAMPMPAARFPAPPVPGVVPCPMYRPLTPPALTSKNQQDAQLQLQVQPSSESIDAAIGDVLSKPWLPLPLGLKPPSVDSVMGELQRQGVANVPPACG
  AtGLK2   KHLLAREAEAASWNLRRHATVAVPGVGGGGKKPWTAPALGYPPHVAPMHHGHFRPLHVWGHPTWPKHKPNTPASAHRTYPMPAIAAAPASWPGHPPYWHQQPLYPQGYGMASSNHSSIGVPTRQLGPTNPPIDIHPSNESIDAAIGDVISKPWLPLPLGLKPPSVDGVMTELQRQGVSNVPPLP
  AtGLK1   KHLLAREAEAANWTRKRHIYGVDTGANLNGRTKNGWLAPAPTLGFPPPPPVAVAPPPVHHHHFRPLHVWGHPTVDQSIMPHVWPKHLPPPSTAMPNPPFWVSDSPYWHPMHNGTTPYLPTVATRFRAPPVAGIPHALPPHHTMYKPNLGFGGARPPVDLHPSKESVDAAIGDVLTRPWLPLPLGLNPPAVDGVMTELHRHGVSEVPPTASCA
表T:全长序列的MATGAT距阵
  1   2   3   4   5   6   7   8   9
  1.ZmG2   43.9   53.6   29.4   29.7   45.0   38.8   40.0   44.8
  2.ZmGLK1   54.3   42.1   32.0   33.2   68.3   39.5   40.9   68.5
  3.OsGLK2   63.2   54.8   32.9   31.3   46.9   37.6   40.5   46.9
  4.PpGLK2   43.5   45.1   46.8   78.7   33.3   31.3   34.3   33.5
  5.PpGlk1   42.9   44.4   43.5   85.1   33.6   30.9   32.9   34.2
  6.OsGLK1   57.7   75.6   56.5   45.5   46.4   40.7   45.1   98.7
  7.AtGLK2   49.5   49.9   47.0   42.2   41.9   50.8   46.1   40.3
  8.AtGLK1   51.8   52.2   52.0   45.8   43.6   58.7   58.6   45.1
  9.OsGLK1var   57.9   75.6   56.7   44.5   46.8   99.3   50.5   58.7
表U:GARP结构域的MATGAT距阵
  1   2   3   4   5   6   7   8   9
  1.ZmG2   92.9   94.6   85.7   85.7   94.6   85.7   89.3   92.9
  2.ZmGLK1   94.6   91.1   83.9   83.9   98.2   85.7   83.9   92.9
  3.OsGLK2   98.2   96.4   87.5   87.5   92.9   83.9   91.1   94.6
  4.PpGLK2   91.1   92.9   94.6   98.2   85.7   82.1   89.3   91.1
  5.PpGlk1   91.1   92.9   94.6   100.0   85.7   82.1   89.3   91.1
  6.OsGLK1   94.6   100.0   96.4   92.9   92.9   87.5   85.7   94.6
  7.AtGLK2   91.1   94.6   94.6   91.1   91.1   94.6   87.5   85.7
  8.AtGLK1   96.4   94.6   98.2   92.9   92.9   94.6   92.9   91.1
  9.AcGLK1   96.4   98.2   98.2   94.6   94.6   98.2   92.9   96.4
表V:GCT结构域的MATGAT距阵
  1   2   3   4   5   6   7   8
  1.ZmG2   48.2   56.3   26.7   28.5   47.6   38.0   37.0
  2.ZmGLK1   58.6   44.0   32.4   33.9   72.7   41.0   44.3
  3.OsGLK2   65.0   57.6   33.6   32.0   51.6   40.6   42.5
  4.PpGLK2   41.9   47.0   44.0   88.6   32.4   33.8   35.0
  5.PpGlk1   42.3   45.7   42.4   93.2   35.2   32.6   34.5
  6.OsGLK1   61.3   81.1   60.5   44.1   49.6   44.2   48.9
  7.AtGLK2   48.6   48.5   48.6   43.2   43.2   52.3   47.3
  8.AtGLK1   50.9   55.5   54.7   49.2   46.6   61.8   57.1
实施例23:克隆本发明方法中所用核酸序列
DNA操作:除非另外声明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York)中或Ausubel等(1994),CurrentProtocols in Molecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOSScientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
本发明方法中所用的核酸序列通过PCR,使用定制的稻幼苗cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板而扩增。在标准条件下使用Hifi Taq DNA聚合酶,利用在50μl PCR混合物中的200ng模板进行PCR。所用引物是prm2251(SEQ ID NO:158;有义,起始密码子为粗体字:
5′ggggacaagtttgtacaaaaaagcaggcttcaca
Figure A20078002806602341
cttgccgtgtcgc  3′)和prm2252(SEQ ID NO:159;反义,互补:
5′ggggaccactttgtacaagaaagctgggtaatatcatccacacgctgga  3′),其包括用于Gateway重组的AttB位点。扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,p034。质粒pDONR201作为技术的构成部分从Invitrogen购买。
实施例24:表达载体构建
进入克隆p031随后在LR反应中与p00640(一种用于稻转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择性标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。稻非病毒组成型启动子,GOS2启动子(SEQ ID NO:58)(PRO0129)位于这种Gateway盒的上游。
在LR重组步骤后,将产生的表达载体p045(图14)转化至农杆菌菌株LBA4044并且随后转化至稻植物。允许转化的稻植物生长并随后对下文所述参数进行检验。
实施例25:评价方法
25.1评价准备
产生大约30个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下4个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评估,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
25.2统计学分析:t-检验和F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
实施例26:评价结果
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表达的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点。
将成熟的主圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内在37℃干燥3日。随后将圆锥花序脱粒并且收集及计数全部种子。使用吹气装置分开饱满粒与空粒。弃去空粒并再次对剩余部分计数。饱满粒在分析天平上称重。饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产量通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的壳粒数目而测量。
如在表W至表Y中所示,与合适的对照植物相比,地上部分生物量、种子产量和饱满种子数在编码GLK蛋白质的核酸的表达增加的转基因植物中增加。显示了来自T1和T2世代的结果。
表W显示在编码GLK蛋白质的核酸的表达增加的转基因稻的T1和T2世代中,地上部分生物量的增加百分比,以及这种增加根据F-检验的统计关联性。
表W:
表X显示在编码GLK蛋白质的核酸的表达增加的转基因稻的T1和T2世代中,种子总产量(种子总重量)增加的百分数以及这种增加根据F-检验的统计关联性。
表X:
Figure A20078002806602371
表Y显示在编码GLK蛋白质的核酸的表达增加的转基因稻的T1和T2世代中,饱满种子数增加的百分数以及这种增加根据F-检验的统计关联性。
表Y:
Figure A20078002806602372
REV ΔHDZip/START
实施例27:鉴定与本发明方法中所用核酸序列相关的序列
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic AcidsRes.25:3389-3402)在国家生物技术信息中心的Entrez核苷酸数据库中所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对本发明核酸序列所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。
表Z提供与本发明方法中所用核酸序列相关的核酸序列列表。
表Z:与本发明方法中所用核酸序列(SEQ ID NO:194)相关的核酸序列,和对应的推导多肽
名称 来源生物  核酸SEQ ID NO   多肽SEQ ID NO 数据库登录号
 Orysa_REV部分CTR   稻   194   195   AK102830(Os10g33960)的部分
 Orysa_REV CTR   稻   196   197   AK102830(Os10g33960)的部分
 Orysa_Rev   稻   198   199   AK102830(Os10g33960)
 Orysa_HOX10   稻   200   201   AY425991.1
 Arath_REV   拟南芥   202   203   AF188994
 Zeama_HDIII RLD1(卷曲的叶1) 玉蜀黍 204 205 AY501430.1
 Poptr_HDIII   毛果杨   206   207   AY919617
 Medtr_HDIII   蒺藜苜蓿   208   209   剪接自AC138171.17
 Sacof_HDIII部分 甘蔗 210 211   CA125167.1CA217027.1CA241276.1CA124509.1的叠连群
 Triae_HDIII部分 普通小麦 212 213   CD905903BM135681.1BQ578798.1CJ565259.1的叠连群
 Horvu_HDIII部分 大麦 214 215 编著自BU996988.1BJ452342.1BJ459891.1
 Phypr_HDIII部分 黄条早竹 216 217 DQ013803
 Orysa_REV   稻   223   SEQ ID NO:196的变体
名称 来源生物 核酸SEQ ID NO   多肽SEQ ID NO 数据库登录号
 Brara Revoluta   芜青     224     225     AC189324.1
 Ginbi Revoluta   银杏     226     227     DQ385525
 Gosba Revoluta   海岛棉     228     229     AY966446.1
 Lyces Revoluta   番茄     230     231     BT013577
实施例28:确定REV多肽的CTR之间的全局相似性和同一性
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的应用.Campanella JJ,Bitincka L,SmalleyJ;软件由Ledion Bitincka所有)确定REV多肽的CTR之间的全局相似性百分数和同一性百分数。MatGAT软件产生针对DNA序列或蛋白质序列的相似性/同一性矩阵,无需数据的预比对。使用Myers和Miller全局比对算法(空位开口罚分12和空位延伸罚分2),该程序执行一系列配对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
记分矩阵:Blosum62
第一空位:12
延伸性空位:2
在表AA中显示针对REV多肽的CTR之间的全局相似性和同一性的软件分析结果。同一性百分数在对角线之上给出并且相似性百分数在对角线之下给出。在REV多肽旁系同源物和直向同源物的CTR间的同一性百分数范围是30-70%,反映所述旁系同源物和直向同源物在HDZip和START结构域之外相对低的序列同一性保守。
表AA:用于REV多肽直向同源物和旁系同源物的CTR之间的全局相似性和同一性的MatGAT结果
 REV多肽直向同源物和旁系同源物的CTR上的全局相似性和同一性 1 2 3 4 5 6 7 8 9 10
  1.CTR_Horvu_HDIII   61.1   57.2   81.1   88.2   89.7   60   79.6   96.5   79.8
  2.CTR_Arath_REV   76.9   70   61.8   63   63.2   73.3   62.5   62.9   63.4
  3.CTR_Medtr_REV   73.2   86.5   59.2   60.3   60.8   70.2   59.4   58.6   60.3
  4.CTR_Orysa_HOX10   89   80.7   76.6   83.9   84.8   59.8   88.2   83   89.7
  5.CTR_Orysa_REV   93.5   79.6   76.2   92.5   92.7   61.9   83.2   90.7   83.9
  6.CTR_Phypr_HDIII   93.3   79.8   76.2   92.7   96.3   61.9   84.5   91.8   84.2
  7.CTR_Poptr_HDIII   75.1   86.4   82.8   76.1   76.1   76.5   60.4   61.6   61.3
  8.CTR_Sacof_HDIII   88.6   80.3   75.9   94.2   91.8   91.8   77.4   81.9   94.8
  9.CTR_Triae_HDIII   97.4   79   74.9   90.8   95.7   95.1   76.3   90.5   81.8
  10.CTR_Zeama_HDIII_LRD1   88.8   81.3   77.8   95.7   92.5   92.3   77.8   97   90.6
所有REV多肽包含CTR,所述CTR与SEQ ID NO:197所示的REV多肽的CTR具有一定序列同一性,所述序列同一性按照增加的优选顺序为至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或98%。
实施例29:基因克隆
DNA操作:除非另外声明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York)中或Ausubel等(1994),CurrentProtocols in Molecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOSScientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
稻Orysa_REV全长基因SEQ ID NO:198通过PCR,使用定制的稻cDNA文库(Invitrogen,Paisley,UK)作为模板进行扩增。将提取自幼苗的RNA逆转录后,将cDNA克隆至pCMV Sport 6.0。在质粒提取后,将200ng模板用于50μlPCR混合物中。PCR扩增所用的引物是prm01983(SEQ ID NO:221;有义,起始密码子是黑体,AttB1位点是斜体:5′-
Figure A20078002806602411
gcggcggcggtgg-3′)
和prm01984(SEQ ID NO:222;反义,互补,AttB2位点是斜体:5′-ggattttgggtcacacgaaggacca-3′),其中所述引物包括用于Gateway重组的AttB位点。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生重组以产生根据Gateway命名的“进入克隆”p04562。质粒pDONR201作为
Figure A20078002806602413
技术的部分从Invitrogen购买。
Orysa_REV基因SEQ ID NO:194的稻部分CTR(REVΔHDZip/START)使用如上的PCR扩增,引物为prm03263(SEQ ID NO:219:5′ggggacaagtttgtacaaaaaagcaggcttgtgctaaggcatccatgctac3′)
和prm03264(SEQ ID NO:220:5′ggggaccactttgtacaagaaagctgggtgcaccttccatgctacagcttg3′)。
克隆后得到的进入克隆号是p04436。
实施例30:载体构建
进入克隆p04562和p04436随后在LR反应中与p01519(一种用于发夹构建体稻转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择性标记;筛选标记表达盒,和意图发生LR体内重组(因此来自进入克隆的目的序列以有义和反义方向整合,以形成发夹二级结构)的两个Gateway盒,所述两个Gateway盒克隆为反向重复并被MAR(烟草的基质附着区约300bp的片段)分开。用于该遗传构建体组成型表达的稻GOS2启动子(SEQ ID NO:58)(PRO0129)位于这种Gateway盒的上游。
在LR重组步骤后,将产生的表达载体p0443(具有Orysa_REV的部分CTR;SEQ ID NO:194)和p0448(具有全长Orysa_REV;包含在SEQ ID NO:198中)(见图20)分别转化至农杆菌菌株LBA4044并随后转化至稻植物内。允许转化的稻植物生长并随后对实施例31所述参数进行检验。
实施例31:评价方法
31.1评价准备
产生大约15-20个独立T0稻转化体。将原代转化体从组织培养箱转移至温室用于生长并收获T1种子。留下包含全长Orysa_REV的发夹构建体的5个事件,包含Orysa_REV的部分CTR的发夹构建体的6个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择到含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。将选择的T1植物转移至温室。每个植物接受唯一的条形码标签以明确地将表型分型数据与对应的植物联系起来。选择的T1植物在10cm直径花钵中的土壤上于下列环境设置下培育:光周期=11.5小时,日光密度=30,000lux或更高,昼间温度=28℃或更高,夜间温度=22℃,相对湿度=60-70%。转基因植物和对应的失效合子(对照植物)在随机位置上并排培育。
5个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评估(如果在第一次评估中获得了阳性结果),但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
31.2统计分析:F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
实施例32:评价结果
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表达的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点。
通过将植物生长在特别设计的具有透明底以允许观察根的花盆中,来测定植物的地下部分(在本实施例中主要是根)。在植物生长过程中通过花盆的底部用数码相机记录图像。使用从适宜的软件产生的图像推导出根的特征,例如总投影面积(其可与总的根体积相关)、平均直径和高于某个粗度阈值的根的长度(粗根的长度)。
将成熟的主圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内在37℃干燥3日。随后将圆锥花序脱粒并且收集及计数全部种子。使用吹气装置分开饱满粒与空粒。弃去空粒并再次对剩余部分计数。饱满粒在分析天平上称重。饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产量通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的壳粒数目而测量。从计数的饱满种子数及其总重量外推出千粒重(TKW)。使用与图像分析软件偶联的定制装置(由两个主要组件,称重和成像装置,组成)测量单个种子的参数(包括宽度、长度、面积、重量)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比,乘以系数106。如本发明中定义的每圆锥花序的总花数是种子总数与成熟主圆锥花序的数目之间的比率。如本发明中定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。
32.1测量使用SEQ ID NO:194所示的REV ΔHDZip/START核酸序列而具有内源REV基因降低的表达的转化体的产量相关参数
如在表BB至表EE中所示,与对照植物相比,种子产量、饱满种子数、种子饱满率和收获指数在使用REV ΔHDZip/START核酸序列而具有内源REV基因降低的表达的转基因植物中增加。显示了来自T1和T2世代的结果。
表BB显示具有种子总产量(种子总重量)增加的转基因事件的数目、这种增加的百分数以及这种增加根据F-检验的统计关联性。
表BB:在使用REV ΔHDZip/START核酸序列而具有内源REV基因降低的表达的转基因稻的T1和T2世代中,具有种子产量增加的转基因事件的数目、这种增加的百分数和F-检验的P值。
Figure A20078002806602441
表CC显示具有饱满种子数增加的转基因事件的数目、这种增加的百分数以及这种增加根据F-检验的统计关联性。
表CC:在使用REV ΔHDZip/START核酸序列而具有内源REV基因降低的表达的转基因稻的T1和T2世代中,具有饱满种子数增加的转基因事件的数目、这种增加的百分数和F-检验的P值。
表DD显示具有种子饱满率增加的转基因事件的数目、这种增加的百分数以及这种增加根据F-检验的统计关联性。
表DD:在使用REV ΔHDZip/START核酸序列而具有内源REV基因降低的表达的转基因稻的T1和T2世代中,具有种子饱满率增加的转基因事件的数目、这种增加的百分数和F-检验的P值。
Figure A20078002806602451
表EE显示具有收获指数增加的转基因事件的数目、这种增加的百分数以及这种增加根据F-检验的统计关联性。
表EE:在使用REV ΔHDZip/START核酸序列而具有内源REV基因降低的表达的转基因稻的T1和T2世代中,具有收获指数增加的转基因事件的数目、这种增加的百分数和F-检验的P值。
Figure A20078002806602452
仅在一个评估中测定另外两个参数:
1)平均各种子长度
2)平均根粗
如表FF所示,与对照植物相比,在使用REV ΔHDZip/START核酸序列而具有内源REV基因降低的表达的转基因稻中,平均各种子长度和平均根粗均显著增加。
表FF:在使用REV ΔHDZip/START核酸序列而具有内源REV基因降低的表达的转基因稻的单一世代中,具有收获指数增加的转基因事件的数目和F-检验的P值。
  显示增加的事件数   F检验的P值
  平均各种子长度(T2种子) 6个中有5个   0.009
  平均根粗(T2植物)   4个中有4个   <0.0001
32.2测量使用如SEQ ID NO:198所示的编码全长Orysa_REV多肽的核酸序列而具有内源REV多肽降低的表达的转化体的产量相关参数:
对于使用编码全长Orysa_REV多肽的核酸序列而具有内源REV多肽降低的表达的转化稻,进行如上所述的相同评估方法。如表GG所示,测定的所有参数均是强烈而显著的阴性。
表GG:在使用编码全长Orysa_REV多肽的核酸序列而具有内源REV基因降低的表达的转基因稻的T1世代中,具有地上部分生物量、种子总产量、饱满种子数、每个圆锥花序的花数、收获指数、第一个圆锥花序数和植物高度降低的转基因事件的数目、这种降低的百分数和F-检验的P值。
  参数   显示增加的事件数   %差异   F检验的P值
  地上部分生物量   5个中有5个   -40   <0.0001
  种子总产量   5个中有5个   -65   <0.0001
  饱满种子数   5个中有5个   -64   <0.0001
  每个圆锥花序的花数   5个中有5个   -39   <0.0001
  收获指数   5个中有5个   -53   <0.0001
  第一个圆锥花序数   5个中有5个   -39   <0.0001
  植物高度   5个中有5个   -13   0.0006
通过包含用于降低内源REV基因表达的发夹构建体的保守区(例如HDZip和START结构域),其他的III类HDZip基因的表达也降低。
CLE
实施例33:鉴定与本发明方法中所用核酸序列相关的序列
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic AcidsRes.25:3389-3402)在国家生物技术信息中心的Entrez核苷酸数据库中所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对本发明核酸序列所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。
表HH提供与本发明方法中所用核酸序列相关的核酸序列列表。
表HH:与本发明方法中所用核酸序列(SEQ ID NO:232)相关的核酸序列,和对应的推导多肽
 植物来源  核酸SEQ ID NO:  蛋白质SEQ ID NO:
 甘蔗CLE-样   232   233
 毛果杨x美洲黑杨CLE-样   239   240
 稻CLE-样   241   242
 甘蔗CLE-样   243   244
 拟南芥CLE2-样   245   246
 欧洲油菜CLE-样   247   248
 拟南芥CLAVATA3   249   250
实施例34:基因克隆
甘蔗CLE-样基因使用引物prm05843(SEQ ID NO:234;有义,起始密码子是黑体,AttB1位点是斜体:5′-
Figure A20078002806602481
aggatgttcttccgg-3′)和prm05844(SEQ ID NO:235;反义,互补,AttB2位点是斜体:5′-
Figure A20078002806602482
tcctctcatctgttgtggag-3′),其中所述引物包括用于Gateway重组的AttB位点,通过PCR扩增。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”p066。质粒pDONR201作为
Figure A20078002806602483
技术的部分从Invitrogen购买。
实施例35:载体构建
进入克隆p066随后在LR反应中与p01519(一种用于反义构建体稻转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择性标记;筛选标记表达盒,和意图发生LR体内重组(因此来自进入克隆的目的序列以有义和反义方向整合)的Gateway盒。用于这种特异性表达的稻谷醇溶蛋白启动子(SEQ ID NO:236)(PRO090)位于这种Gateway盒的上游。
在LR重组步骤后,将产生的表达载体p068(图23)转化至农杆菌菌株LBA4044并且随后转化至稻植物。允许转化的稻植物生长并随后对实施例36所述参数进行检验。
实施例36:对CLE-样以反义方向转化的植物的评价方法
产生大约15-20个独立T0稻转化体。将原代转化体从组织培养箱转移至温室用于生长并收获T1种子。留下6个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择到含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。将选择的T1植物转移至温室。每个植物接受唯一的条形码标签以明确地将表型分型数据与对应的植物联系起来。选择的T1植物在10cm直径花钵中的土壤上于下列环境设置下培育:光周期=11.5小时,日光密度=30,000lux或更高,昼间温度=28℃,夜间温度=22℃,相对湿度=60-70%。转基因植物和对应的失效合子在随机位置上并排培育。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均并且通过校正转化成由平方mm表示的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。Areamax是在植物已经达到其最大叶生物量的时间点上地方部分面积。
将成熟的主要圆锥花序收获、装袋、加条形码标记并且随后在干燥箱内在37℃干燥3日。随后将圆锥花序脱粒并且收集全部种子。使用吹气装置分开饱满粒与空粒。在分离后,随后使用市售计数机对两个种子批次计数。弃去空粒。饱满粒在分析天平上称重并且种子的横截面积使用数字成像法测量。这种方法产生以下的种子相关参数集合:
每个圆锥花序的花数是估计植物上每个圆锥花序小花的平均数目的参数,该参数来自种子总数除以第一个圆锥花序数。最高圆锥花序以及垂直排列时与最高圆锥花序重叠的全部圆锥花序被视为第一圆锥花序并以手工方式计数。饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产量(种子总重量)通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的壳粒数目而测量并且对应于每株植物的小花数目。使用图像分析软件,这些参数以自动化方式来自数字图像并通过统计学分析。使用由两个主要部分(称量装置和成像装置及与之连接的用于图像分析的软件)构成的定制仪器测量各个种子参数(包括宽度、长度、面积、重量)。收获指数在本发明中定义为种子总产量(g)与地上部分面积(mm2)之间的比,乘以系数106
使用对非平衡设计作出校正的双因子ANOVA(方差分析)作为统计模型用于植物表型特征的总体评价。对用所述基因转化的全部事件的全部植物的全部测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作“基因全局作用”)。若F检验的值显示该数据是显著的,则可以得出存在“基因”作用的结论,意味着不仅仅基因的存在或位置才造成所述作用。对于F检验,用于真实全局基因作用的显著性的阈值设置在5%概率水平。
为检查基因在事件中的作用,即株系特异性作用,使用来自转基因植物和对应的无效植物的数据集在每个事件内进行t检验。“无效植物”或“无效分离子”或“失效合子”是以与转基因植物相同的方式受到处理,但是转基因已经从中发生分离的植物。无效植物也可以描述为纯合阴性转化植物。用于t检验的显著性的阈值设置在10%概率水平上。一些事件的结果可以高于或低于这个阈值。这基于如此假设,即基因可能仅在基因组中某些位置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用在本文中又称作“基因的株系作用”。p-值通过t-值与t-分布比较或备选地通过F-值与F-分布比较而获得。该p-值随后给出无效假设(即转基因的作用不存在)是正确的概率。
实施例37:测量反义构建体转化体的产量相关参数:
在如上所述对种子分析时,本发明人发现与缺少CLE-样转基因的植物相比,用反义CLE-样基因构建体转化的植物具有更高种子产量,其表达为饱满种子数、种子总重量、种子总数和收获指数。尤其是种子总重量和种子总数在T1和T2世代植物中均显著增加。
SYR NUE
实施例38:鉴定SEQ ID NO:251和SEQ ID NO:252相关的序列
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic AcidsRes.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与SEQ ID NO:251和/或蛋白质序列SEQ ID NO:252相关的(全长cDNA、EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。SEQ ID NO:251编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。
除了可在NCBI获得的公众可用核酸序列之外,还按照如上文所述的相同方法搜索专用序列数据库。
表II提供与SEQ ID NO:251所示的核酸序列和SEQ ID NO:252所示的蛋白质序列相关的核酸和蛋白质序列列表。
表II:与本发明方法中所用核酸序列(SEQ ID NO:251)相关的核酸序列,和对应的推导多肽
 名称   来源生物   多肽SEQID NO:   核酸SEQ IDNO:   数据库登录号   状态
 OsSYR   稻   252   251   /   全长或部分
 稻SYR同源物1   稻   262   277   XP_472637   全长
 稻SYR同源物2   稻   263   AP008218   全长
 玉米SYR同源物   玉蜀黍   264   278   AY110705   部分
小麦SYR同源物 普通小麦 265 / 全长
  大麦SYR同源物   大麦  266   286   CB871444   全长
  甘蔗SYR同源物1   甘蔗  267   287   CA165713   部分
  甘蔗SYR同源物2   甘蔗  268   288   CA242805   全长
  高粱SYR同源物   两色蜀黍  269   289   CX611532   全长
  AtSYR同源物1   拟南芥  270   290   NM 115853   全长
  AtSYR同源物2   拟南芥  271   291   NM 180078   全长
  葡萄SYR同源物   葡萄  272   279   CF404276   全长
  柑橘SYR同源物   橘  273   280   CF830612   部分
  番茄SYR同源物1   番茄  274   282   AI774560   全长
  番茄SYR同源物2   番茄  275   281   BG125370   全长
实施例39:相关多肽序列的比对
来自Vector NTI(Invitrogen)的AlignX基于进行性比对的流行Clustal算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003),Nucleic Acids Res 31:3497-3500)。可以使用邻接聚类算法构建系统发生树。默认值是空位开口罚分10,空位延伸罚分0.1并且选择的权重矩阵是Blosum 62(若比对多肽)。
在图25中显示使用在鉴定实施本发明方法中所用多肽中相关的多肽的多重序列比对结果。富含亮氨酸的重复和保守基序可在各序列中容易的鉴定。
实施例40:用于实施本发明方法的多肽序列之间全局同一性百分数的计算
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的应用.Campanella JJ,Bitincka L,SmalleyJ;软件由Ledion Bitincka所有)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开口罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
记分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列(排除部分多肽序列)全长上的全局相似性和同一性软件分析结果在表JJ中显示。同一性百分数在对角线之上给出并且相似性百分数在对角线之下给出。
与SEQ ID NO:252相比,用于实施本发明方法的多肽序列之间的同一性百分数可以低到27%氨基酸同一性。
表JJ:多肽序列全长上的全局相似性和同一性的MatGAT结果
实施例41:用于实施本发明方法的多肽序列的拓扑学预测(亚细胞定位,跨膜...)
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于任何氨基端前序列的预测的存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的记分并不实际是概率,并且它们未必合为一体。然而,具有最高记分的位置根据TargetP是最有可能的,并且记分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有氨基端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物组(非植物或植物)、临界设置(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO:252所代表的多肽序列的TargetP 1.1分析的结果在表KK中显示。已经选择“植物”生物组,未定义临界值并且需要转运肽的预测长度。如SEQ ID NO:252所代表的多肽序列的亚细胞定位可以是线粒体,但应当注意到的是可靠性(reliability)级别是5(即,最低的可靠性类别)。
表KK:如SEQ ID NO:252所代表的多肽序列的TargetP 1.1分析
长度(AA) 105
叶绿体转运肽 0.025
线粒体转运肽 0.552
分泌途径信号肽 0.009
其他亚细胞靶向 0.416
预测的位置 线粒体
可靠性类别 5
通过驻留在丹麦技术大学生物序列分析中心的服务器上的TMHMM程序鉴定到两个跨膜结构域。N-末端位于内部的可能性是0.997。定位(orientation)的更多细节在表LL中给出:
表LL:TMHMM 2.0的结果
定位 起始-终止残基
内部     1    42
跨膜螺旋(TMhelix)     43    65
外部     66    74
跨膜螺旋(TMhelix)     75    92
内部     93    105
众多其他算法可以用来执行此类分析,包括:
●在丹麦技术大学(Technical University of Denmar)服务器上驻留的ChloroP 1.1;
●在澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute forMolecular Bioscience,University of Queensland,Brisbane,Australia)的服务器上驻留的蛋白质Prowler亚细胞定位预测程序(Protein Prowler Subcellular Localisation Predictor)第1.2版;
●在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学(University ofAlberta,Edmonton,Alberta,Canada)的服务器上驻留的PENCEProteme Analyst PA-GOSUB 2.5;
实施例42:基因克隆
DNA操作:除非另外声明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York)中或Ausubel等(1994),CProtocols in Molecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOS ScientificPublications Ltd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
稻SYR基因通过PCR,使用稻幼苗cDNA文库(Invitrogen,Paisley,UK)作为模板而扩增。将提取自幼苗的RNA逆转录后,将cDNA克隆至pCMV Sport 6.0。库的插入序列平均大小是1.5kb并且克隆的最初数目是1.59×107cfu量级。在6×1011cfu/ml的第一轮扩增后测定原始滴度是9.6×105cfu/ml。在质粒提取后,将200ng模板用于50μlPCR混合物中。将引物prm08170(SEQ ID NO:253;有义,起始密码子为粗体字,AttB1位点为斜体:5′-gaaggtgtaggtgctagg-3′)
和prm08171(SEQ ID NO:254;反义,互补,AttB2位点为斜体字:5′-
Figure A20078002806602572
aaaaacaaaaataaattcccc-3′),用于PCR扩增,其中所述引物包括用于Gateway重组的AttB位点。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。还使用标准方法扩增并纯化正确大小的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pSYR。质粒pDONR201作为
Figure A20078002806602573
技术的部分从Invitrogen购买。
实施例43:载体构建
进入克隆pSYR随后在LR反应中与用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择性标记;筛选标记表达盒和意图与已经克隆于所述进入克隆中的目的序列发生LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ IDNO:58)位于这种Gateway盒的上游。制备相似的载体构建体,但具有的是高迁移率族蛋白启动子(HMGP,SEQ ID NO:283或SEQ ID NO:293),代替GOS2启动子。
在LR重组步骤后,将产生的表达载体pGOS2::SYR(具有GOS2启动子)和pHMGP::SYR(具有HMGP启动子)(图25)转化至农杆菌菌株LBA4044并随后转化至稻植物内,所述两种启动子均用于组成型SYR表达。
实施例44:对以稻GOS2启动子或HMGP启动子控制下的SYR所转化植物的评价方法
44.1评价准备
产生大约15-20个独立T0稻转化体。将原代转化体从组织培养箱转移至温室用于生长并收获T1种子。留下8个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择到含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。将选择的T1植物转移至温室。每个植物接受唯一的条形码标签以明确地将表型分型数据与对应的植物联系起来。选择的T1植物在10cm直径花钵中的土壤上于下列环境设置下培育:光周期=11.5小时,日光密度=30,000lux或更高,昼间温度=28℃或更高,夜间温度=22℃,相对湿度=60-70%。转基因植物和对应的失效合子在随机位置上并排培育。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
氮利用效率筛选
在除营养液以外正常的条件下在花盆土中培养来自T2种子的稻植物。从植物移植到成熟一直用特定的营养液对花盆浇水,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量参数,作为生长在正常条件下的细节。
44.2统计分析:F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
由于进行的两种实验具有重叠事件,因此进行组合分析。这可用于检查两种实验中效应的一致性,并且如果情况果真如此,其可用于从两种实验中收集证据从而增加结论的可信性。使用的方法是考虑到数据的多级结构(即实验-事件-分离子)的混合模型方法。通过比较卡方分布的似然比测试来获得p值。
44.3测量的参数
生物量相关参数的测量
植物地上面积(或者说叶生物量)通过计数区别于背景的地上植物部分数码图像的像素总数而确定。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值(physicalsurface value)。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。地上面积是在植物达到其最大叶生物量的时间点测定的面积。根生物量的增加表达为根总生物量(测量为植物生命周期中观察到的最大根生物量)的增加。
种子相关参数的测量
收获成熟的初级圆锥花序、计数、装袋、贴上条形码标记,然后在烤箱中于37℃干燥三天。随后将圆锥花序脱粒,收集并计数所有的种子。使用鼓风装置将饱满谷壳和空壳分开。弃去空壳,再次计数剩下的部分。在分析天平上称重饱满的谷壳。通过计数在分离步骤之后剩下的饱满谷壳数确定饱满种子的数目。通过称量所有从植物中收获的饱满谷壳来测量种子总产率。从计数的饱满种子数目和它们的总重推断得出千粒重(TKW)。
实施例45:测量在营养缺乏条件下生长的pGOS2::SYR转化体的产量相关参数:
在如上所述对种子分析时,本发明人发现与缺少SYR转基因的植物相比,用pGOS2::SYR基因构建体转化,并生长在营养缺乏胁迫下的植物具有更高种子产量,其表达为饱满种子数(增加大于5%)、种子总重量(增加大于5%)和TKW(增加大于2.5%)。还观察到茎生物量(大于5%)和根生物量(几个株系大于5%)的增加。
序列表
<110>克罗普迪塞恩股份有限公司
<120>具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
<130>PF58342
<160>293
<170>PatentIn版本3.3
<210>1
<211>1397
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>1
atggaaaaca aaagccatag caaccaccac cggtaccatc atctatcatc ccggagccac    60
gagcaaaacc agcgtggcct aatttcgata aatgccataa tcatcattgg catctccatt    120
atctccatat tcataatcct tgcaattctc ctaataatca ttttacttca tcgacttaaa    180
tccgcaagag tcaaagcaca agaattatct tgcaaagaaa gcttcaacaa catgaacaat    240
ggtggagctt ccaccaacta cagctacact tctagccctg atgacatcaa gagagattgt    300
ctatactcaa gaaacccaac atcgttcaga caattacccc cacagacaaa aagttgtagg    360
agaagccgag ccgaaggagt agaagtgtac acatacaagg aattagagat tgcaacaaat    420
aatttcagcg aggagaagaa aatcggaaat ggagatgtgt acaaaggagt actaagtgat    480
ggaactgttg cggccattaa aaagcttcat atgtttaatg ataatgctag taaccaaaag    540
catgaagaac ggtcctttag gcttgaggtt gatcttctta gtcgattaca atgcccatat    600
ttggtggaat tacttggata ttgtgcagat caaaaccata ggatcytgat atatgaattt    660
atgcctaatg gtactgtgga acatcatctc cacgatcata attttaagaa tctaaaggat    720
cgacctcaac cattagattg gggagctcgg cttaggatcg cccttgattg cgccagagcc    780
ctaragtttc ttcatgagaa tacaatctct actgttatcc accggaactt caagtgtacc    840
aacattttgt tggatcaaaa taatcgagct aaagtttcag atttcggatt agccaaaacc    900
ggatccgata aactaaacgg tgagatttca acaagggtta ttggcaccac aggatatctt    960
gctccagagt atgcctctac tggaaagctt actacaaaat cagatgttta tagttatggt    1020
attgtgttac tacaactctt aacgggtcgc acaccgatcg attcaagacg tccacgggga    1080
caagatgtcc ttgtctcttg ggctcttcca agactaacca atagagagaa aattagtgaa    1140
atggtggatc caaccatgaa aggtcaatac tcacaaaaag atcttattca ggtagcagcc    1200
atagcagcag tgtgtgtgca accagaagca agttatagac cgttgatgac ggatgttgtt    1260
cactcgctca ttccccttgt taaagctttc aacaaaagta ctgattcttc tcggtttcct    1320
agccgtagag aaagcttgtc atttgatgat attatgccat gacactcttt tgtttaccca    1380
gctttcttgt acaaagt                                                   1397
<210>2
<211>453
<212>PRT
<213>拟南芥
<220>
<221>不确定
<222>(216)..(216)
<223>Xaa可以是任意天然产生的氨基酸
<220>
<221>不确定
<222>(262)..(262)
<223>Xaa可以是任意天然产生的氨基酸
<400>2
Met Glu Asn Lys Ser His Ser Asn His His Arg Tyr His His Leu Ser
1               5                   10                  15
Ser Arg Ser His Glu Gln Asn Gln Arg Gly Leu Ile Ser Ile Asn Ala
            20                  25                  30
Ile Ile Ile Ile Gly Ile Ser Ile Ile Ser Ile Phe Ile Ile Leu Ala
        35                  40                  45
Ile Leu Leu Ile Ile Ile Leu Leu His Arg Leu Lys Ser Ala Arg Val
    50                  55                  60
Lys Ala Gln Glu Leu Ser Cys Lys Glu Ser Phe Asn Asn Met Asn Asn
65                  70                  75                  80
Gly Gly Ala Ser Thr Asn Tyr Ser Tyr Thr Ser Ser Pro Asp Asp Ile
                85                  90                  95
Lys Arg Asp Cys Leu Tyr Ser Arg Asn Pro Thr Ser Phe Arg Gln Leu
            100                 105                 110
Pro Pro Gln Thr Lys Ser Cys Arg Arg Ser Arg Ala Glu Gly Val Glu
        115                 120                 125
Val Tyr Thr Tyr Lys Glu Leu Glu Ile Ala Thr Asn Asn Phe Ser Glu
    130                 135                 140
Glu Lys Lys Ile Gly Asn Gly Asp Val Tyr Lys Gly Val Leu Ser Asp
145                 150                 155                 160
Gly Thr Val Ala Ala Ile Lys Lys Leu His Met Phe Asn Asp Asn Ala
                165                 170                 175
Ser Asn Gln Lys His Glu Glu Arg Ser Phe Arg Leu Glu Val Asp Leu
            180                 185                 190
Leu Ser Arg Leu Gln Cys Pro Tyr Leu Val Glu Leu Leu Gly Tyr Cys
        195                 200                 205
Ala Asp Gln Asn His Arg Ile Xaa Ile Tyr Glu Phe Met Pro Asn Gly
    210                 215                 220
Thr Val Glu His His Leu His Asp His Asn Phe Lys Asn Leu Lys Asp
225                 230                 235                 240
Arg Pro Gln Pro Leu Asp Trp Gly Ala Arg Leu Arg Ile Ala Leu Asp
                245                 250                 255
Cys Ala Arg Ala Leu Xaa Phe Leu His Glu Asn Thr Ile Ser Thr Val
            260                 265                 270
Ile His Arg Asn Phe Lys Cys Thr Asn Ile Leu Leu Asp Gln Asn Asn
        275                 280                 285
Arg Ala Lys Val Ser Asp Phe Gly Leu Ala Lys Thr Gly Ser Asp Lys
    290                 295                 300
Leu Asn Gly Glu Ile Ser Thr Arg Val Ile Gly Thr Thr Gly Tyr Leu
305                 310                 315                 320
Ala Pro Glu Tyr Ala Ser Thr Gly Lys Leu Thr Thr Lys Ser Asp Val
                325                 330                 335
Tyr Ser Tyr Gly Ile Val Leu Leu Gln Leu Leu Thr Gly Arg Thr Pro
            340                 345                 350
Ile Asp Ser Arg Arg Pro Arg Gly Gln Asp Val Leu Val Ser Trp Ala
        355                 360                 365
Leu Pro Arg Leu Thr Asn Arg Glu Lys Ile Ser Glu Met Val Asp Pro
    370                 375                 380
Thr Met Lys Gly Gln Tyr Ser Gln Lys Asp Leu Ile Gln Val Ala Ala
385                 390                 395                 400
Ile Ala Ala Val Cys Val Gln Pro Glu Ala Ser Tyr Arg Pro Leu Met
                405                 410                 415
Thr Asp Val Val His Ser Leu Ile Pro Leu Val Lys Ala Phe Asn Lys
            420                 425                 430
Ser Thr Asp Ser Ser Arg Phe Pro Ser Arg Arg Glu Ser Leu Ser Phe
        435                 440                 445
Asp Asp Ile Met Pro
    450
<210>3
<211>55
<212>DNA
<213>人工序列
<220>
<223>引物:prm2500
<400>3
ggggacaagt ttgtacaaaa aagcaggctt cacaatggaa aacaaaagcc atagc      55
<210>4
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm2501
<400>4
ggggaccact ttgtacaaga aagctgggta aacaaaagag tgtcatggca              50
<210>5
<211>2193
<212>DNA
<213>稻(Oryza sativa)
<400>5
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct    60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact    120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt    180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc    240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata    300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga    360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt    420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat    480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag    540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt    600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc    660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat    720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa    780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca    840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag    900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa  960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata  1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag  1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc  1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg  1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg  1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat  1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc  1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt  1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag  1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg  1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat  1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc  1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca  1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta  1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga  1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg  1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac  1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta  2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga  2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct  2160
tggtgtagct tgccactttc accagcaaag ttc                               2193
<210>6
<211>15
<212>PRT
<213>人工序列
<220>
<223>基序1
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Leu″
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Gly″/取代=″Arg″
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Met″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Arg″/取代=″Gln″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Ser″/取代=″Cys″
<220>
<221>变体
<222>(8)..(8)
<223>/取代=″Pro″
<220>
<221>变体
<222>(9)..(9)
<223>/取代=″Tyr″
<220>
<221>变体
<222>(11)..(11)
<223>/取代=″Val″
<220>
<221>不确定
<222>(12)..(12)
<223>Xaa可以是任意天然产生的氨基酸,优选是Lys、Asn、Ala、Ser、Gly或Glu中的一个
<220>
<221>变体
<222>(14)..(14)
<223>/取代=″Leu″/取代=″Val″
<400>6
Met Leu Ser Arg Leu His His Arg Asn Leu Leu Xaa Leu Ile Gly
1               5                   10                  15
<210>7
<211>11
<212>PRT
<213>人工序列
<220>
<223>基序2
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Tyr″/取代=″Asn″
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Phe″
<220>
<221>不确定
<222>(4)..(4)
<223>Xaa可以是任意天然产生的氨基酸,优选是Asp、Asn、Glu、Lys、Pro、Gln或Gly中的一个
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Val″/取代=″Thr″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Met″
<220>
<221>变体
<222>(8)..(8)
<223>/取代=″Arg″/取代=″Gly″
<220>
<221>变体
<222>(11)..(11)
<223>/取代=″Val″
<400>7
Leu Tyr Trp Xaa Ala Arg Leu Leu Ile Ala Leu
1               5                   10
<210>8
<211>9
<212>PRT
<213>人工序列
<220>
<223>基序3
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Lys″
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Gly″
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Glu″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Phe″
<400>8
Ala Arg Ala Leu Ala Tyr Leu His Glu
1               5
<210>9
<211>14
<212>PRT
<213>人工序列
<220>
<223>基序4
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Ile″
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Asn″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Leu″
<220>
<221>变体
<222>(6)..(6)
<223>氨基酸优选不是Ile、Val或Met
<220>
<221>变体
<222>(8)..(8)
<223>/取代=″Ala″/取代=″Gly″/取代=″Cys″
<220>
<221>变体
<222>(9)..(9)
<223>/取代=″Thr″
<220>
<221>变体
<222>(11)..(11)
<223>/取代=″Val″
<220>
<221>变体
<222>(14)..(14)
<223>/取代=″Asp″
<400>9
Val Ile His Arg Asp Phe Lys Ser Ser Asn Ile Leu Leu Glu
1               5                   10
<210>10
<211>7
<212>PRT
<213>人工序列
<220>
<223>基序5
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Arg″
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Ala″/取代=″Thr″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Met″/取代=″Ser″
<400>10
Lys Val Ser Asp Phe Gly Leu
1               5
<210>11
<211>1524
<212>DNA
<213>拟南芥
<400>11
atggaaaaca aaagccatag caaccaccac cggtaccatc atctatcatc ccggagccac  60
gagcaaaacc agcgtggcct aatttcgata aatgccataa tcatcattgg catctccatt  120
atctccatat tcataatcct tgcaattctc ctaataatca ttttacttca tcgacttaaa  180
tccgcaagag tcaaagcaca agaattatct tgcaaagaaa gcttcaacaa catgaacaat  240
ggtggagctt ccaccaacta cagctacact tctagccctg gtaaaacacc taaacattca  300
ttccataatt ttgtaaagaa tcataagttt ttaattcaaa atcaatcagc aatgagtgga  360
gattctcata tctttatatc agtattgaat tacttccaca tccaatgtgt atttcttatt  420
cgaactttaa tgttcttgtt agatgacatc aagagagatt gtctatactc aagaaaccca  480
acatcgttca gacaattacc cccacagaca aaaagttgta ggagaagccg agccgaagga  540
gtagaagtgt acacatacaa ggaattagag attgcaacaa ataatttcag cgaggagaag  600
aaaatcggaa atggagatgt gtacaaagga gtactaagtg atggaactgt tgcggccatt  660
aaaaagcttc atatgtttaa tgataatgct agtaaccaaa agcatgaaga acggtccttt  720
aggcttgagg ttgatcttct tagtcgatta caatgcccat atttggtgga attacttgga  780
tattgtgcag atcaaaacca taggatcctg atatatgaat ttatgcctaa tggtactgtg  840
gaacatcatc tccacgatca taattttaag aatctaaagg atcgacctca accattagat  900
tggggagctc ggcttaggat cgcccttgat tgcgccagag ccctagagtt tcttcatgag  960
aatacaatct ctactgttat ccaccggaac ttcaagtgta ccaacatttt gttggatcaa  1020
aataatcgag ctaaagtttc agatttcgga ttagccaaaa ccggatccga taaactaaac  1080
ggtgagattt caacaagggt tattggcacc acaggatatc ttgctccaga gtatgcctct  1140
actggaaagc ttactacaaa atcagatgtt tatagttatg gtattgtgtt actacaactc  1200
ttaacgggtc gcacaccgat cgattcaaga cgtccacggg gacaagatgt ccttgtctct  1260
tgggctcttc caagactaac caatagagag aaaattagtg aaatggtgga tccaaccatg  1320
aaaggtcaat actcacaaaa agatcttatt caggtagcag ccatagcagc agtgtgtgtg  1380
caaccagaag caagttatag accgttgatg acggatgttg ttcactcgct cattcccctt  1440
gttaaagctt tcaacaaaag tactgattct tctcggtttc ctagccgtag agaaagcttg  1500
tcatttgatg atattatgcc atga                                         1524
<210>12
<211>507
<212>PRT
<213>拟南芥
<400>12
Met Glu Asn Lys Ser His Ser Asn His His Arg Tyr His His Leu Ser
1               5                   10                  15
Ser Arg Ser His Glu Gln Asn Gln Arg Gly Leu Ile Ser Ile Asn Ala
            20                  25                  30
Ile Ile Ile Ile Gly Ile Ser Ile Ile Ser Ile Phe Ile Ile Leu Ala
        35                  40                  45
Ile Leu Leu Ile Ile Ile Leu Leu His Arg Leu Lys Ser Ala Arg Val
    50                  55                  60
Lys Ala Gln Glu Leu Ser Cys Lys Glu Ser Phe Asn Asn Met Asn Asn
65                  70                  75                  80
Gly Gly Ala Ser Thr Asn Tyr Ser Tyr Thr Ser Ser Pro Gly Lys Thr
                85                  90                  95
Pro Lys His Ser Phe His Asn Phe Val Lys Asn His Lys Phe Leu Ile
            100                 105                 110
Gln Asn Gln Ser Ala Met Ser Gly Asp Ser His Ile Phe Ile Ser Val
        115                 120                 125
Leu Asn Tyr Phe His Ile Gln Cys Val Phe Leu Ile Arg Thr Leu Met
    130                 135                 140
Phe Leu Leu Asp Asp Ile Lys Arg Asp Cys Leu Tyr Ser Arg Asn Pro
145                 150                 155                 160
Thr Ser Phe Arg Gln Leu Pro Pro Gln Thr Lys Ser Cys Arg Arg Ser
                165                 170                 175
Arg Ala Glu Gly Val Glu Val Tyr Thr Tyr Lys Glu Leu Glu Ile Ala
            180                 185                 190
Thr Asn Asn Phe Ser Glu Glu Lys Lys Ile Gly Asn Gly Asp Val Tyr
        195                 200                 205
Lys Gly Val Leu Ser Asp Gly Thr Val Ala Ala Ile Lys Lys Leu His
    210                 215                 220
Met Phe Asn Asp Asn Ala Ser Asn Gln Lys His Glu Glu Arg Ser Phe
225                 230                 235                 240
Arg Leu Glu Val Asp Leu Leu Ser Arg Leu Gln Cys Pro Tyr Leu Val
                245                 250                 255
Glu Leu Leu Gly Tyr Cys Ala Asp Gln Asn His Arg Ile Leu Ile Tyr
            260                 265                 270
Glu Phe Met Pro Asn Gly Thr Val Glu His His Leu His Asp His Asn
        275                 280                 285
Phe Lys Asn Leu Lys Asp Arg Pro Gln Pro Leu Asp Trp Gly Ala Arg
    290                 295                 300
Leu Arg Ile Ala Leu Asp Cys Ala Arg Ala Leu Glu Phe Leu His Glu
305                 310                 315                 320
Asn Thr Ile Ser Thr Val Ile His Arg Asn Phe Lys Cys Thr Asn Ile
                325                 330                 335
Leu Leu Asp Gln Asn Asn Arg Ala Lys Val Ser Asp Phe Gly Leu Ala
            340                 345                 350
Lys Thr Gly Ser Asp Lys Leu Asn Gly Glu Ile Ser Thr Arg Val Ile
        355                 360                 365
Gly Thr Thr Gly Tyr Leu Ala Pro Glu Tyr Ala Ser Thr Gly Lys Leu
    370                 375                 380
Thr Thr Lys Ser Asp Val Tyr Ser Tyr Gly Ile Val Leu Leu Gln Leu
385                 390                 395                 400
Leu Thr Gly Arg Thr Pro Ile Asp Ser Arg Arg Pro Arg Gly Gln Asp
                405                 410                 415
Val Leu Val Ser Trp Ala Leu Pro Arg Leu Thr Asn Arg Glu Lys Ile
            420                 425                 430
Ser Glu Met Val Asp Pro Thr Met Lys Gly Gln Tyr Ser Gln Lys Asp
        435                 440                 445
Leu Ile Gln Val Ala Ala Ile Ala Ala Val Cys Val Gln Pro Glu Ala
    450                 455                 460
Ser Tyr Arg Pro Leu Met Thr Asp Val Val His Ser Leu Ile Pro Leu
465                 470                 475                 480
Val Lys Ala Phe Asn Lys Ser Thr Asp Ser Ser Arg Phe Pro Ser Arg
                485                 490                 495
Arg Glu Ser Leu Ser Phe Asp Asp Ile Met Pro
            500                 505
<210>13
<211>1482
<212>DNA
<213>拟南芥
<400>13
caaaaatgaa caacaccaaa atggaaaaca aaagccatag caaccaccac cggtaccatc    60
atctatcatc ccggagccac gagcaaaacc agcgtggcct aatttcgata aatgccataa    120
tcatcattgg catctccatt atctccatat tcataatcct tgcaattctc ctaataatca    180
ttttacttca tcgacttaaa tccgcaagag tcaaagcaca agaattatct tgcaaagaaa    240
gcttcaacaa catgaacaat ggtggagctt ccaccaacta cagctacact tctagccctg    300
atgacatcaa gagagattgt ctatactcaa gaaacccaac atcgttcaga caattacccc    360
cacagacaaa aagttgtagg agaagccgag ccgaaggagt agaagtgtac acatacaagg    420
aattagagat tgcaacaaat aatttcagcg aggagaagaa aatcggaaat ggagatgtgt    480
acaaaggagt actaagtgat ggaactgttg cggccattaa aaagcttcat atgtttaatg    540
ataatgctag taaccaaaag catgaagaac ggtcctttag gcttgaggtt gatcttctta    600
gtcgattaca atgcccatat ttggtggaat tacttggata ttgtgcagat caaaaccata    660
ggatcctgat atatgaattt atgcctaatg gtactgtgga acatcatctc cacgatcata    720
attttaagaa tctaaaggat cgacctcaac cattagattg gggagctcgg cttaggatcg    780
cccttgattg cgccagagcc ctagagtttc ttcatgagaa tacaatctct actgttatcc    840
accggaactt caagtgtacc aacattttgt tggatcaaaa taatcgagct aaagtttcag    900
atttcggatt agccaaaacc ggatccgata aactaaacgg tgagatttca acaagggtta    960
ttggcaccac aggatatctt gctccagagt atgcctctac tggaaagctt actacaaaat    1020
cagatgttta tagttatggt attgtgttac tacaactctt aacgggtcgc acaccgatcg    1080
attcaagacg tccacgggga caagatgtcc ttgtctcttg ggctcttcca agactaacca    1140
atagagagaa aattagtgaa atggtggatc caaccatgaa aggtcaatac tcacaaaaag    1200
atcttattca ggtagcagcc atagcagcag tgtgtgtgca accagaagca agttatagac    1260
cgttgatgac ggatgttgtt cactcgctca ttccccttgt taaagctttc aacaaaagta    1320
ctgattcttc tcggtttcct agccgtagag aaagcttgtc atttgatgat attatgccat    1380
gacactcttt tgtttaatat gtattaattt ctctctttta agttgagatt ctcgttgtta    1440
ttgtatattt gtataggtaa atgaatccat ttatcttgta ct                       1482
<210>14
<211>458
<212>PRT
<213>拟南芥
<400>14
Met Asn Asn Thr Lys Met Glu Asn Lys Ser His Ser Asn His His Arg
1               5                   10                  15
Tyr His His Leu Ser Ser Arg Ser His Glu Gln Asn Gln Arg Gly Leu
            20                  25                  30
Ile Ser Ile Asn Ala Ile Ile Ile Ile Gly Ile Ser Ile Ile Ser Ile
        35                  40                  45
Phe Ile Ile Leu Ala Ile Leu Leu Ile Ile Ile Leu Leu His Arg Leu
    50                  55                  60
Lys Ser Ala Arg Val Lys Ala Gln Glu Leu Ser Cys Lys Glu Ser Phe
65                  70                  75                  80
Asn Asn Met Asn Asn Gly Gly Ala Ser Thr Asn Tyr Ser Tyr Thr Ser
                85                  90                  95
Ser Pro Asp Asp Ile Lys Arg Asp Cys Leu Tyr Ser Arg Asn Pro Thr
            100                 105                 110
Ser Phe Arg Gln Leu Pro Pro Gln Thr Lys Ser Cys Arg Arg Ser Arg
        115                 120                 125
Ala Glu Gly Val Glu Val Tyr Thr Tyr Lys Glu Leu Glu Ile Ala Thr
    130                 135                 140
Asn Asn Phe Ser Glu Glu Lys Lys Ile Gly Asn Gly Asp Val Tyr Lys
145                 150                 155                 160
Gly Val Leu Ser Asp Gly Thr Val Ala Ala Ile Lys Lys Leu His Met
                165                 170                 175
Phe Asn Asp Asn Ala Ser Asn Gln Lys His Glu Glu Arg Ser Phe Arg
            180                 185                 190
Leu Glu Val Asp Leu Leu Ser Arg Leu Gln Cys Pro Tyr Leu Val Glu
        195                 200                 205
Leu Leu Gly Tyr Cys Ala Asp Gln Asn His Arg Ile Leu Ile Tyr Glu
    210                 215                 220
Phe Met Pro Asn Gly Thr Val Glu His His Leu His Asp His Asn Phe
225                 230                 235                 240
Lys Asn Leu Lys Asp Arg Pro Gln Pro Leu Asp Trp Gly Ala Arg Leu
                245                 250                 255
Arg Ile Ala Leu Asp Cys Ala Arg Ala Leu Glu Phe Leu His Glu Asn
            260                 265                 270
Thr Ile Ser Thr Val Ile His Arg Asn Phe Lys Cys Thr Asn Ile Leu
        275                 280                 285
Leu Asp Gln Asn Asn Arg Ala Lys Val Ser Asp Phe Gly Leu Ala Lys
    290                 295                 300
Thr Gly Ser Asp Lys Leu Asn Gly Glu Ile Ser Thr Arg ValIle Gly
305                 310                 315                 320
Thr Thr Gly Tyr Leu Ala Pro Glu Tyr Ala Ser Thr Gly Lys Leu Thr
                325                 330                 335
Thr Lys Ser Asp Val Tyr Ser Tyr Gly Ile Val Leu Leu Gln Leu Leu
            340                 345                 350
Thr Gly Arg Thr Pro Ile Asp Ser Arg Arg Pro Arg Gly Gln Asp Val
        355                 360                 365
Leu Val Ser Trp Ala Leu Pro Arg Leu Thr Asn Arg Glu Lys Ile Ser
    370                 375                 380
Glu Met Val Asp Pro Thr Met Lys Gly Gln Tyr Ser Gln Lys Asp Leu
385                 390                 395                 400
Ile Gln Val Ala Ala Ile Ala Ala Val Cys Val Gln Pro Glu Ala Ser
                405                 410                 415
Tyr Arg Pro Leu Met Thr Asp Val Val His Ser Leu Ile Pro Leu Val
            420                 425                 430
Lys Ala Phe Asn Lys Ser Thr Asp Ser Ser Arg Phe Pro Ser Arg Arg
        435                 440                 445
Glu Ser Leu Ser Phe Asp Asp Ile Met Pro
    450                 455
<210>15
<211>1516
<212>DNA
<213>拟南芥
<400>15
caaaaaccaa aaactaattt tcacgaaatc cgaagcttaa aaattattcc tctactgttt    60
caatttcatc tcttcttcct cttgagttgg caatttctag ggttttctca ttttcctttt    120
tttccatttc tggaaactgg taaaaggctt tttctttgtc tgtgggggag aaacaaaaat    180
ggagacagac gaagcatacc aaaagaaaga gcgagctgca ttagtagcca tcgttgtcct    240
tgcttgtctt gctttatctt ctttgttcgt cgcctttagc tactactgct atattcgtaa    300
caaggtttct aagcgtcaca gaattagcaa gaggtttgat tgtgaggaaa aaggcgattg    360
tcagaaagta caagatgtta ctgaaaatgg gttgcaaatt ttcaccttta agcaattgca    420
ttcagcaact ggtggattta gcaagtctaa tgtggttggg aatggtgggt ttggcttggt    480
ttatcgtggt gtgcttaacg atggcagaaa agttgctatc aagctcatgg atcatgcagg    540
aaagcaaggg gaagaagaat tcaagatgga ggttgagtta ctgagccgtc tgcgttcacc    600
atacttgttg gcacttcttg gttattgctc agacaatagt cataagctgc ttgtgtatga    660
gttcatggca aatggtggtc tgcaggaaca cctgtatctt cccaacaggt ctggttctgt    720
cccaccaaga ttagattggg aaactaggat gagaatagct gtggaagctg caaaaggctt    780
ggaatatctc catgaacaag tatcaccccc ggtgattcat agagacttta agagcagcaa    840
tattctgctg gacagaaact tcaatgccaa agtttcagat tttggattgg ctaaagtcgg    900
atcagataaa gctggtggac acgtttctac ccgtgtatta ggcacacaag gatatgtagc    960
tcctgagtac gctttaactg gtcacttgac aacaaagtcg gatgtctata gctacggtgt    1020
tgtcctgtta gagttactaa ccggtagagt tccagtagat atgaagagag ctacaggaga    1080
aggtgttctt gtctcttggg ctttgcctca attggctgat agagacaaag tagtagacat    1140
aatggatcca acactcgaag gacaatactc tacgaaagaa gttgttcaag ttgcagcaat    1200
agcagcaatg tgtgttcaag cagaagctga ctacagaccc ttaatggcag atgtggtgca    1260
gtcactggtt ccattagtga gaaaccgtag gtcagcttca aagcttagtg gctgctctag    1320
tagctttagc ttggctcggt ctcctaactc tccgggtaaa gcaagcatag gttctcaatg    1380
aataaatcaa tcagagaaga cgaaatgtga ggcttttatt atgtaacggt atttactaaa    1440
acagacaatg atgtaaacac ttgagtgatc aaacatggag tcatagagat aatcatcaaa    1500
taaacttttt cgaatc                                                    1516
<210>16
<211>400
<212>PRT
<213>拟南芥
<400>16
Met Glu Thr Asp Glu Ala Tyr Gln Lys Lys Glu Arg Ala Ala Leu Val
1               5                   10                  15
Ala Ile Val Val Leu Ala Cys Leu Ala Leu Ser Ser Leu Phe Val Ala
            20                  25                  30
Phe Ser Tyr Tyr Cys Tyr Ile Arg Asn Lys Val Ser Lys Arg His Arg
        35                  40                  45
Ile Ser Lys Arg Phe Asp Cys Glu Glu Lys Gly Asp Cys Gln Lys Val
    50                  55                  60
Gln Asp Val Thr Glu Asn Gly Leu Gln Ile Phe Thr Phe Lys Gln Leu
65                  70                  75                  80
His Ser Ala Thr Gly Gly Phe Ser Lys Ser Asn Val Val Gly Asn Gly
                85                  90                  95
Gly Phe Gly Leu Val Tyr Arg Gly Val Leu Asn Asp Gly Arg Lys Val
            100                 105                 110
Ala Ile Lys Leu Met Asp His Ala Gly Lys Gln Gly Glu Glu Glu Phe
        115                 120                 125
Lys Met Glu Val Glu Leu Leu Ser Arg Leu Arg Ser Pro Tyr Leu Leu
    130                 135                 140
Ala Leu Leu Gly Tyr Cys Ser Asp Asn Ser His Lys Leu Leu Val Tyr
145                 150                 155                 160
Glu Phe Met Ala Asn Gly Gly Leu Gln Glu His Leu Tyr Leu Pro Asn
                165                 170                 175
Arg Ser Gly Ser Val Pro Pro Arg Leu Asp Trp Glu Thr Arg Met Arg
            180                 185                 190
Ile Ala Val Glu Ala Ala Lys Gly Leu Glu Tyr Leu His Glu Gln Val
        195                 200                 205
Ser Pro Pro Val Ile His Arg Asp Phe Lys Ser Ser Asn Ile Leu Leu
    210                 215                 220
Asp Arg Asn Phe Asn Ala Lys Val Ser Asp Phe Gly Leu Ala Lys Val
225                 230                 235                 240
Gly Ser Asp Lys Ala Gly Gly His Val Ser Thr Arg Val Leu Gly Thr
                245                 250                 255
Gln Gly Tyr Val Ala Pro Glu Tyr Ala Leu Thr Gly His Leu Thr Thr
            260                 265                 270
Lys Ser Asp Val Tyr Ser Tyr Gly Val Val Leu Leu Glu Leu Leu Thr
        275                 280                 285
Gly Arg Val Pro Val Asp Met Lys Arg Ala Thr Gly Glu Gly Val Leu
    290                 295                 300
Val Ser Trp Ala Leu Pro Gln Leu Ala Asp Arg Asp Lys Val Val Asp
305                 310                 315                 320
Ile Met Asp Pro Thr Leu Glu Gly Gln Tyr Ser Thr Lys Glu Val Val
                325                 330                 335
Gln Val Ala Ala Ile Ala Ala Met Cys Val Gln Ala Glu Ala Asp Tyr
            340                 345                 350
Arg Pro Leu Met Ala Asp Val Val Gln Ser Leu Val Pro Leu Val Arg
        355                 360                 365
Asn Arg Arg Ser Ala Ser Lys Leu Ser Gly Cys Ser Ser Ser Phe Ser
    370                 375                 380
Leu Ala Arg Ser Pro Asn Ser Pro Gly Lys Ala Ser Ile Gly Ser Gln
385                 390                 395                 400
<210>17
<211>1161
<212>DNA
<213>拟南芥
<400>17
atggagacag acgaagcata ccaaaagaaa gagcgagctg cattagtagc catcgttgtc    60
cttgcttgtc ttgctttatc ttctttgttc gtcgccttta gctactactg ctatattcgt    120
aacaaggaaa aaggcgattg tcagaaagta caagatgtta ctgaaaatgg gttgcaaatt    180
ttcaccttta agcaattgca ttcagcaact ggtggattta gcaagtctaa tgtggttggg    240
aatggtgggt ttggcttggt ttatcgtggt gtgcttaacg atggcagaaa agttgctatc    300
aagctcatgg atcatgcagg aaagcaaggg gaagaagaat tcaagatgga ggttgagtta    360
ctgagccgtc tgcgttcacc atacttgttg gcacttcttg gttattgctc agacaatagt    420
cataagctgc ttgtgtatga gttcatggca aatggtggtc tgcaggaaca cctgtatctt    480
cccaacaggt ctggttctgt cccaccaaga ttagattggg aaactaggat gagaatagct    540
gtggaagctg caaaaggctt ggaatatctc catgaacaag tatcaccccc ggtgattcat  600
agagacttta agagcagcaa tattctgctg gacagaaact tcaatgccaa agtttcagat  660
tttggattgg ctaaagtcgg atcagataaa gctggtggac acgtttctac ccgtgtatta  720
ggcacacaag gatatgtagc tcctgagtac gctttaactg gtcacttgac aacaaagtcg  780
gatgtctata gctacggtgt tgtcctgtta gagttactaa ccggtagagt tccagtagat  840
atgaagagag ctacaggaga aggtgttctt gtctcttggg ctttgcctca attggctgat  900
agagacaaag tagtagacat aatggatcca acactcgaag gacaatactc tacgaaagaa  960
gttgttcaag ttgcagcaat agcagcaatg tgtgttcaag cagaagctga ctacagaccc  1020
ttaatggcag atgtggtgca gtcactggtt ccattagtga gaaaccgtag gtcagcttca  1080
aagcttagtg gctgctctag tagctttagc ttggctcggt ctcctaactc tccgggtaaa  1140
gcaagcatag gttctcaatg a                                            1161
<210>18
<211>386
<212>PRT
<213>拟南芥
<400>18
Met Glu Thr Asp Glu Ala Tyr Gln Lys Lys Glu Arg Ala Ala Leu Val
1               5                   10                  15
Ala Ile Val Val Leu Ala Cys Leu Ala Leu Ser Ser Leu Phe Val Ala
            20                  25                  30
Phe Ser Tyr Tyr Cys Tyr Ile Arg Asn Lys Glu Lys Gly Asp Cys Gln
        35                  40                  45
Lys Val Gln Asp Val Thr Glu Asn Gly Leu Gln Ile Phe Thr Phe Lys
    50                  55                  60
Gln Leu His Ser Ala Thr Gly Gly Phe Ser Lys Ser Asn Val Val Gly
65                  70                  75                  80
Asn Gly Gly Phe Gly Leu Val Tyr Arg Gly Val Leu Asn Asp Gly Arg
                85                  90                  95
Lys Val Ala Ile Lys Leu Met Asp His Ala Gly Lys Gln Gly Glu Glu
            100                 105                 110
Glu Phe Lys Met Glu Val Glu Leu Leu Ser Arg Leu Arg Ser Pro Tyr
        115                 120                 125
Leu Leu Ala Leu Leu Gly Tyr Cys Ser Asp Asn Ser His Lys Leu Leu
    130                 135                 140
Val Tyr Glu Phe Met Ala Asn Gly Gly Leu Gln Glu His Leu Tyr Leu
145                 150                 155                 160
Pro Asn Arg Ser Gly Ser Val Pro Pro Arg Leu Asp Trp Glu Thr Arg
                165                 170                 175
Met Arg Ile Ala Val Glu Ala Ala Lys Gly Leu Glu Tyr Leu His Glu
            180                 185                 190
Gln Val Ser Pro Pro Val Ile His Arg Asp Phe Lys Ser Ser Asn Ile
        195                 200                 205
Leu Leu Asp Arg Asn Phe Asn Ala Lys Val Ser Asp Phe Gly Leu Ala
    210                 215                 220
Lys Val Gly Ser Asp Lys Ala Gly Gly His Val Ser Thr Arg Val Leu
225                 230                 235                 240
Gly Thr Gln Gly Tyr Val Ala Pro Glu Tyr Ala Leu Thr Gly His Leu
                245                 250                 255
Thr Thr Lys Ser Asp Val Tyr Ser Tyr Gly Val Val Leu Leu Glu Leu
            260                 265                 270
Leu Thr Gly Arg Val Pro Val Asp Met Lys Arg Ala Thr Gly Glu Gly
        275                 280                 285
Val Leu Val Ser Trp Ala Leu Pro Gln Leu Ala Asp Arg Asp Lys Val
    290                 295                 300
Val Asp Ile Met Asp Pro Thr Leu Glu Gly Gln Tyr Ser Thr Lys Glu
305                 310                 315                 320
Val Val Gln Val Ala Ala Ile Ala Ala Met Cys Val Gln Ala Glu Ala
                325                 330                 335
Asp Tyr Arg Pro Leu Met Ala Asp Val Val Gln Ser Leu Val Pro Leu
            340                 345                 350
Val Arg Asn Arg Arg Ser Ala Ser Lys Leu Ser Gly Cys Ser Ser Ser
        355                 360                 365
Phe Ser Leu Ala Arg Ser Pro Asn Ser Pro Gly Lys Ala Ser Ile Gly
    370                 375                 380
Ser Gln
385
<210>19
<211>2627
<212>DNA
<213>拟南芥
<400>19
aacggaatat tttttttctg ggagctgaaa atcgttggtg acgatggcgg attctctttc    60
tagggtttac ggaactctgt ttagtggtgt taatatatct ctcttctcgg atccaccgtt    120
gaaaaccccc tgaagagtgt ttttttttcc gggtttaagg tcttttacgt ttcgtttttt    180
cttgagattt cgtcttccgc tgtgagtttc tgttctcgcg gcgagttttt gtgtagatct    240
gagggttttc aaggcaagag aaagtgtcgg tgatgtcgat tttctcactc gcgagctctt    300
ctgattcaca aagagatgac ctaataatgg cgttgaaggc ggtggttatt gtatattgtg    360
tggtttctct cgtcagtgtt caattagctg atgctcaaca tgaaggactg ccagtttcac    420
caacgttatc accttcaact tcaccagtta tcactgatct gcccctacca gctgaatttc    480
cgcggtttca cagaaagtat ttcgcaccac aacaagcaga agcacctcag cattctcccc    540
cttatagtcg tttggtcgct tctgatcatc cccctaccag ctcacatttc tccaaacctt    600
ccatgaaaag gaatgctcag tctcctggag ccggcttggc tgatattgct ccagcacaat    660
ctagcaatgg tgttcttcct gatgccttaa ctcagccacc tttgtcgccc tccatttcaa    720
attgttgcaa atcagatatg gtgcttaaac gaagaagtat tggttgccac tgcgtgtatc    780
ctataaaact ggacatcctt ctcttgaatg tttcagaaac tcctagttgg aacatgttct    840
tgaacgaatt tgctacccag cttggtctcc tacctcacca aatcgagctg attaacttct    900
atgtgctaag cttatcaagg atgaacatat cgatggatat cacccctcat tctggaatta    960
gtttctcagc tagtcaggca tccgcaataa actcttccct tatcagccac aagattcaat    1020
ttagccctac tttggtggga gattacaaac ttctaaacct tacttggttt gaggcccctg    1080
caccttcgca agcacctcta gtggcttctt cacctcataa agcaccatca caaggatcct    1140
cagcaactac gtcagtaaga tctccaggga aaaagaggca tcccaatctt attcttatct    1200
tttctatagc cgctggtgtg cttatacttg ccataatcac tgtacttgtt atttgttccc    1260
gcgcactccg agaagagaaa gctccagatc ctcacaaaga agctgtaaaa ccaaggaacc    1320
tggacgctgg ttcatttggg ggatctcttc ctcacccagc aagtacacgg tttctgtcat    1380
atgaagaact caaagaggca actagcaatt ttgaatctgc tagcattcta ggagaaggtg    1440
ggtttggcaa ggtttacaga ggcatcttag ccgatggtac tgctgtagcg attaagaagc    1500
tcacaagtgg tgggccacaa ggtgataaag aattccaggt ggagattgat atgcttagcc    1560
gtcttcatca tcgtaatctt gtgaaacttg tgggttacta tagtagtcga gattcttctc    1620
agcacctact ttgttatgag cttgttccaa atggcagcct cgaggcttgg ctccatgggc  1680
ctctcgggtt gaactgtcct cttgattggg acaccagaat gaagattgca cttgatgctg  1740
caagaggact tgcatacctt catgaagact cgcaaccctc cgttatacac agagatttta  1800
aagcctctaa tatactcctt gaaaacaact tcaacgccaa agttgcagat tttggcctag  1860
ccaaacaagc tcctgaaggc aggggtaatc acttatctac tcgtgttatg ggcacatttg  1920
gatatgttgc gcctgaatat gcaatgacgg gacacctact cgtcaagagt gatgtttata  1980
gttacggtgt ggtccttctc gaattgttaa ctggtagaaa acctgtggat atgtcacaac  2040
cttcaggcca agaaaatctc gtcacttgga caaggccagt tttaagagac aaagaccggt  2100
tagaagaact agtcgattca agacttgaag gaaaataccc gaaagaagat ttcataagag  2160
tatgcacaat cgctgcagct tgtgttgcac ctgaagctag ccagagacca acgatgggcg  2220
aagtggttca gtcacttaaa atggttcaac gggtggttga gtatcaagac ccggttttaa  2280
acacttcaaa taaagctcgt cctaaccgga gacaatcatc agctacgttc gagtcagaag  2340
taacctcttc tatgttctct tctggtcctt attctggtct aagcgctttt gatcatgaaa  2400
atattacacg aacaactgtt ttctcagaag atcttcacga aggccgatga tagaagccag  2460
ggttttcttc tttttatttg tttttctccc acttacggtg agaaaatttc caccagagaa  2520
gcttttgagt ttgggacatt attacagctc tttggatttt ggattctcct ttattggagg  2580
atagaatttt gtatatattt ttgcgttaat taattaatat ttgccac                2627
<210>20
<211>725
<212>PRT
<213>拟南芥
<400>20
Met Ser Ile Phe Ser Leu Ala Ser Ser Ser Asp Ser Gln Arg Asp Asp
1               5                   10                  15
Leu Ile Met Ala Leu Lys Ala Val Val Ile Val Tyr Cys Val Val Ser
            20                  25                  30
Leu Val Ser Val Gln Leu Ala Asp Ala Gln His Glu Gly Leu Pro Val
        35                  40                  45
Ser Pro Thr Leu Ser Pro Ser Thr Ser Pro Val Ile Thr Asp Leu Pro
    50                  55                  60
Leu Pro Ala Glu Phe Pro Arg Phe His Arg Lys Tyr Phe Ala Pro Gln
65                  70                  75                  80
Gln Ala Glu Ala Pro Gln His Ser Pro Pro Tyr Ser Arg Leu Val Ala
                85                  90                  95
Ser Asp His Pro Pro Thr Ser Ser His Phe Ser Lys Pro Ser Met Lys
            100                 105                 110
Arg Asn Ala Gln Ser Pro Gly Ala Gly Leu Ala Asp Ile Ala Pro Ala
        115                 120                 125
Gln Ser Ser Asn Gly Val Leu Pro Asp Ala Leu Thr Gln Pro Pro Leu
    130                 135                 140
Ser Pro Ser Ile Ser Asn Cys Cys Lys Ser Asp Met Val Leu Lys Arg
145                 150                 155                 160
Arg Ser Ile Gly Cys His Cys Val Tyr Pro Ile Lys Leu Asp Ile Leu
                165                 170                 175
Leu Leu Asn Val Ser Glu Thr Pro Ser Trp Asn Met Phe Leu Asn Glu
            180                 185                 190
Phe Ala Thr Gln Leu Gly Leu Leu Pro His Gln Ile Glu Leu Ile Asn
        195                 200                 205
Phe Tyr Val Leu Ser Leu Ser Arg Met Asn Ile Ser Met Asp Ile Thr
    210                 215                 220
Pro His Ser Gly Ile Ser Phe Ser Ala Ser Gln Ala Ser Ala Ile Asn
225                 230                 235                 240
Ser Ser Leu Ile Ser His Lys Ile Gln Phe Ser Pro Thr Leu Val Gly
                245                 250                 255
Asp Tyr Lys Leu Leu Asn Leu Thr Trp Phe Glu Ala Pro Ala Pro Ser
            260                 265                 270
Gln Ala Pro Leu Val Ala Ser Ser Pro His Lys Ala Pro Ser Gln Gly
        275                 280                 285
Ser Ser Ala Thr Thr Ser Val Arg Ser Pro Gly Lys Lys Arg His Pro
    290                 295                 300
Asn Leu Ile Leu Ile Phe Ser Ile Ala Ala Gly Val Leu Ile Leu Ala
305                 310                 315                 320
Ile Ile Thr Val Leu Val Ile Cys Ser Arg Ala Leu Arg Glu Glu Lys
                325                 330                 335
Ala Pro Asp Pro His Lys Glu Ala Val Lys Pro Arg Asn Leu Asp Ala
            340                 345                 350
Gly Ser Phe Gly Gly Ser Leu Pro His Pro Ala Ser Thr Arg Phe Leu
        355                 360                 365
Ser Tyr Glu Glu Leu Lys Glu Ala Thr Ser Asn Phe Glu Ser Ala Ser
    370                 375                 380
Ile Leu Gly Glu Gly Gly Phe Gly Lys Val Tyr Arg Gly Ile Leu Ala
385                 390                 395                 400
Asp Gly Thr Ala Val Ala Ile Lys Lys Leu Thr Ser Gly Gly Pro Gln
                405                 410                 415
Gly Asp Lys Glu Phe Gln Val Glu Ile Asp Met Leu Ser Arg Leu His
            420                 425                 430
His Arg Asn Leu Val Lys Leu Val Gly Tyr Tyr Ser Ser Arg Asp Ser
        435                 440                 445
Ser Gln His Leu Leu Cys Tyr Glu Leu Val Pro Asn Gly Ser Leu Glu
    450                 455                 460
Ala Trp Leu His Gly Pro Leu Gly Leu Asn Cys Pro Leu Asp Trp Asp
465                 470                 475                 480
Thr Arg Met Lys Ile Ala Leu Asp Ala Ala Arg Gly Leu Ala Tyr Leu
                485                 490                 495
His Glu Asp Ser Gln Pro Ser Val Ile His Arg Asp Phe Lys Ala Ser
            500                 505                 510
Asn Ile Leu Leu Glu Asn Asn Phe Asn Ala Lys Val Ala Asp Phe Gly
        515                 520                 525
Leu Ala Lys Gln Ala Pro Glu Gly Arg Gly Asn His Leu Ser Thr Arg
    530                 535                 540
Val Met Gly Thr Phe Gly Tyr Val Ala Pro Glu Tyr Ala Met Thr Gly
545                 550                 555                 560
His Leu Leu Val Lys Ser Asp Val Tyr Ser Tyr Gly Val Val Leu Leu
                565                 570                 575
Glu Leu Leu Thr Gly Arg Lys Pro Val Asp Met Ser Gln Pro Ser Gly
            580                 585                 590
Gln Glu Asn Leu Val Thr Trp Thr Arg Pro Val Leu Arg Asp Lys Asp
        595                 600                 605
Arg Leu Glu Glu Leu Val Asp Ser Arg Leu Glu Gly Lys Tyr Pro Lys
    610                 615                 620
Glu Asp Phe Ile Arg Val Cys Thr Ile Ala Ala Ala Cys Val Ala Pro
625                 630                 635                 640
Glu Ala Ser Gln Arg Pro Thr Met Gly Glu Val Val Gln Ser Leu Lys
                645                 650                 655
Met Val Gln Arg Val Val Glu Tyr Gln Asp Pro Val Leu Asn Thr Ser
            660                 665                 670
Asn Lys Ala Arg Pro Asn Arg Arg Gln Ser Ser Ala Thr Phe Glu Ser
        675                 680                 685
Glu Val Thr Ser Ser Met Phe Ser Ser Gly Pro Tyr Ser Gly Leu Ser
    690                 695                 700
Ala Phe Asp His Glu Asn Ile Thr Arg Thr Thr Val Phe Ser Glu Asp
705                 710                 715                 720
Leu His Glu Gly Arg
                725
<210>21
<211>3732
<212>DNA
<213>拟南芥
<400>21
cttcttcttc tgccacttcg attgctttaa acttggagat taagattaca catcaaataa  60
ttcttctttg tcttcctcgt gatcatcgag gaagcttgat ctcttctatg gaatggagaa  120
tttgactctc ctccttagga tctgtcttgt ttcgtcggtt ttagttgctg cttcttcctc  180
aggatcggaa ttgttatctc cgttatcatc accaccgtct ccattacccg aaacttcaaa  240
agggtttggt caagcaccga gtaattcacc tgaatctcac aaatccgaca atgtgccacc  300
gtctaaagct tcttctcaac cgtctcttcc tcctttagct gatttggcag ctccaccacc  360
gtcagattcc gtcggaggta aagcaccggc cggtgtgcct gttgtctttg ttcctaatgc  420
tccagctcca gctacaatac ccgttaagga tttgcccgta gcttcgcctc cggttcttca  480
acccattaca ccgattgctt caccacctcg attcattcca ggagatgcac caaaggagcc  540
tcctttctca ggaagagtta ctccagcccc ggtttcatca cctgtttcgg atattcctcc  600
aattccatca gtggctctgc ctccgcctac accgagcaat gtacctccta gaaatgcttc  660
taacaatcac aagcctcctc ctatcgaaaa gtctattgct cctgttgcat caccaccaac  720
aatatcaatt gacattgcac caccagtaca tcccgtcata cctaagttaa caccctcgag  780
ctcacctgta cctacctcga ctccaactaa gggatctccg agaagaaatc cgccaactac  840
ccacccagtt ttccccatag aatctcctgc tgtctcacca gatcatgctg caaatccagt  900
aaaacatccg ccccccagcg ataacggaga tgatagtaaa agtccgggtg ctgcaccggc  960
aaatgaaact gctaaaccct tacctgtctt cccacataaa gcttctcctc cttcgattgc  1020
tccctcagcc ccaaaattta acagacactc tcatcataca tctccatcta ctactccacc  1080
gccagattct actcctagta atgtacacca ccatccttca tcaccatctc ctcctcctct  1140
atcttcacac catcaacatc atcaagaacg aaagaaaatc gcagatagtc cagctccttc  1200
accactgcca ccgcatctca tatctccaaa gaagtcaaac cgtaaaggtt caatgactcc  1260
tcctccacaa tcgcaccatg ctccttctcc tcccattcct gattctttga tttctcctgc  1320
tcacgctcca gtctctttct ctatgaaacg catctccccg gctctagcac cttctccaac  1380
ccaagtgttt cctctcaggt cctcttcaag accttcaaaa tctcggaaat tccctctagg  1440
tccacctctt caagcatttc ctcctcctcc ccctaattca gattgttctt caactatttg  1500
tttggaaccg tacacaaaca cacctccggg atctccatgt ggctgtgtct ggccaattca  1560
agttgagcta cgccttagca tggcgctcta cgacttcttc ccaatggttt cagaatttgc  1620
tcgggaaatc agcgccggag ttttcatgaa acagagccaa gtccgtataa tgggagctaa  1680
cgcggccagc gaacaacctg agaaatccat tgttctaatc gatttagtac cgcttggaga  1740
taaattcgat aacatgactg caatgctgac ttaccagaga ttctggagta aaaaagtcta  1800
tatagatgaa ccaatctttg gcggatacga cgtgatttac gtgcgttatc ctggtttacc  1860
cgcttccccg ccaacttctg gtatgaccat tatagatcaa ggaccgtact ctggtaataa  1920
taacggaagg gcggtcaaac cgctcggagt tgatgttcca aggaagccgc gcaagaaaga  1980
gctcaatggt ggaagtattg ctgtgattgt tttatccgca gctgctttta tcggtttatg  2040
tttcgttatc gtttggttct tggttttccg gcgacaaaga gatcgacgac gtctttcgaa  2100
aagaacacca cttgctcgcc cttcactgcc ttccctctcg aaaccatcag gctcggcgag  2160
atctttaact ggaagccgat ttagctcaac ttcattgtca tttgaatcca gcattgctcc  2220
gtttactctc tctgcaaaga ctttcaccgc aagtgaaata atgaaagcta caaataactt  2280
tgatgaatcg agggttcttg gtgaaggcgg atttggacga gtttacgaag gtgttttcga  2340
tgacggaact aaagtagcag ttaaggtatt gaagagagat gaccagcaag gtagcaggga  2400
gttcttagcc gaagtggaaa tgcttagtcg tcttcatcac agaaacctcg tgaatttaat  2460
tggtatttgt atcgaagatc gtaaccgttc cctggtttat gaactcatac caaatggcag  2520
cgttgaatct cacctccacg ggattgataa agcatcttcg cctttagatt gggatgctcg  2580
gttgaagata gctcttggtg cggcccgtgg tttagcgtat ttacacgaag actcgagccc  2640
gcgagttata cacagagact tcaagtccag caacatcttg ctggaaaacg atttcacacc  2700
taaagtatct gactttggat tggctcgtaa cgcccttgat gatgaagata acagacatat  2760
atcgacacgc gttatgggaa cgtttgggta tgtggcaccg gaatacgcaa tgacagggca  2820
tcttttggtg aagagtgatg tgtatagtta cggagttgtg cttctcgagc tacttacagg  2880
gcggaaacca gtggatatgt ctcaaccgcc cggacaagag aacttagttt catggactcg  2940
gccttttctt acgagtgcag aagggcttgc agctattata gatcagtctt taggacccga  3000
gatctcattc gatagcatag ctaaagtcgc ggcaatagct tctatgtgcg ttcaaccaga  3060
agtatcacac cgtcctttca tgggagaagt agtgcaagct ttgaaacttg tcagcaacga  3120
atgtgatgaa gctaaagaac tcaattcttt aacttctatc tctaaagacg attttagaga  3180
tgacactcaa gctgagagct cttgtggtga cagctcagca aggatggctc ggtatccatt  3240
gctaccaaat tacgactctg agcctgatac agagagagga ttatctacat cggaaatgta  3300
cacggggtca gggaggttcg agagacagtc taactcgggt cccttgacct cgggtcgagg  3360
caagagtttc tggcaaaaga tgaggagatt atcgaccgga agcttgagtg agcatggaac  3420
accaacggtc atgttacgat ccggttctcg ctaaacaatc ttttgcctac agaacactga  3480
agagtttttg attgcccgtt taagttaaga gactgaaagg aaagaaggtg ccttctccta  3540
caagcaaaac tctttgcctc atggaaaccg gttaagataa aaccaggagt gatcatttcc  3600
cggttcaaaa tttttagttg aatagatctg tttatctgag aagaagaaac aagagattct  3660
gttaaatcta atttgaatgt acatatcacg ttttaaagta acaggcttaa gcattaagta  3720
tcatcatcct tc    3732
<210>22
<211>1113
<212>PRT
<213>拟南芥
<400>22
Met Glu Asn Leu Thr Leu Leu Leu Arg Ile Cys Leu Val Ser Ser Val
1               5                   10                  15
Leu Val Ala Ala Ser Ser Ser Gly Ser Glu Leu Leu Ser Pro Leu Ser
            20                  25                  30
Ser Pro Pro Ser Pro Leu Pro Glu Thr Ser Lys Gly Phe Gly Gln Ala
        35                  40                  45
Pro Ser Asn Ser Pro Glu Ser His Lys Ser Asp Asn Val Pro Pro Ser
    50                  55                  60
Lys Ala Ser Ser Gln Pro Ser Leu Pro Pro Leu Ala Asp Leu Ala Ala
65                  70                  75                  80
Pro Pro Pro Ser Asp Ser Val Gly Gly Lys Ala Pro Ala Gly Val Pro
                85                  90                  95
Val Val Phe Val Pro Asn Ala Pro Ala Pro Ala Thr Ile Pro Val Lys
            100                 105                 110
Asp Leu Pro Val Ala Ser Pro Pro Val Leu Gln Pro Ile Thr Pro Ile
        115                 120                 125
Ala Ser Pro Pro Arg Phe Ile Pro Gly Asp Ala Pro Lys Glu Pro Pro
    130                 135                 140
Phe Ser Gly Arg Val Thr Pro Ala Pro Val Ser Ser Pro Val Ser Asp
145                 150                 155                 160
Ile Pro Pro Ile Pro Ser Val Ala Leu Pro Pro Pro Thr Pro Ser Asn
                165                 170                 175
Val Pro Pro Arg Asn Ala Ser Asn Asn His Lys Pro Pro Pro Ile Glu
            180                 185                 190
Lys Ser Ile Ala Pro Val Ala Ser Pro Pro Thr Ile Ser Ile Asp Ile
        195                 200                 205
Ala Pro Pro Val His Pro Val Ile Pro Lys Leu Thr Pro Ser Ser Ser
    210                 215                 220
Pro Val Pro Thr Ser Thr Pro Thr Lys Gly Ser Pro Arg Arg Asn Pro
225                 230                 235                 240
Pro Thr Thr His Pro Val Phe Pro Ile Glu Ser Pro Ala Val Ser Pro
                245                 250                 255
Asp His Ala Ala Asn Pro Val Lys His Pro Pro Pro Ser Asp Asn Gly
            260                 265                 270
Asp Asp Ser Lys Ser Pro Gly Ala Ala Pro Ala Asn Glu Thr Ala Lys
        275                 280                 285
Pro Leu Pro Val Phe Pro His Lys Ala Ser Pro Pro Ser Ile Ala Pro
    290                 295                 300
Ser Ala Pro Lys Phe Asn Arg His Ser His His Thr Ser Pro Ser Thr
305                 310                 315                 320
Thr Pro Pro Pro Asp Ser Thr Pro Ser Asn Val His His His Pro Ser
                325                 330                 335
Ser Pro Ser Pro Pro Pro Leu Ser Ser His His Gln His His Gln Glu
            340                 345                 350
Arg Lys Lys Ile Ala Asp Ser Pro Ala Pro Ser Pro Leu Pro Pro His
        355                 360                 365
Leu Ile Ser Pro Lys Lys Ser Asn Arg Lys Gly Ser Met Thr Pro Pro
    370                 375                 380
Pro Gln Ser His His Ala Pro Ser Pro Pro Ile Pro Asp Ser Leu Ile
385                 390                 395                 400
Ser Pro Ala His Ala Pro Val Ser Phe Ser Met Lys Arg Ile Ser Pro
                405                 410                 415
Ala Leu Ala Pro Ser Pro Thr Gln Val Phe Pro Leu Arg Ser Ser Ser
            420                 425                 430
Arg Pro Ser Lys Ser Arg Lys Phe Pro Leu Gly Pro Pro Leu Gln Ala
        435                 440                 445
Phe Pro Pro Pro Pro Pro Asn Ser Asp Cys Ser Ser Thr Ile Cys Leu
    450                 455                 460
Glu Pro Tyr Thr Asn Thr Pro Pro Gly Ser Pro Cys Gly Cys Val Trp
465                 470                 475                 480
Pro Ile Gln Val Glu Leu Arg Leu Ser Met Ala Leu Tyr Asp Phe Phe
                485                 490                 495
Pro Met Val Ser Glu Phe Ala Arg Glu Ile Ser Ala Gly Val Phe Met
            500                 505                 510
Lys Gln Ser Gln Val Arg Ile Met Gly Ala Asn Ala Ala Ser Glu Gln
        515                 520                 525
Pro Glu Lys Ser Ile Val Leu Ile Asp Leu Val Pro Leu Gly Asp Lys
    530                 535                 540
Phe Asp Asn Met Thr Ala Met Leu Thr Tyr Gln Arg Phe Trp Ser Lys
545                 550                 555                 560
Lys Val Tyr Ile Asp Glu Pro Ile Phe Gly Gly Tyr Asp Val Ile Tyr
                565                 570                 575
Val Arg Tyr Pro Gly Leu Pro Ala Ser Pro Pro Thr Ser Gly Met Thr
            580                 585                 590
Ile Ile Asp Gln Gly Pro Tyr Ser Gly Asn Asn Asn Gly Arg Ala Val
        595                 600                 605
Lys Pro Leu Gly Val Asp Val Pro Arg Lys Pro Arg Lys Lys Glu Leu
    610                 615                 620
Asn Gly Gly Ser Ile Ala Val Ile Val Leu Ser Ala Ala Ala Phe Ile
625                 630                 635                 640
Gly Leu Cys Phe Val Ile Val Trp Phe Leu Val Phe Arg Arg Gln Arg
                645                 650                 655
Asp Arg Arg Arg Leu Ser Lys Arg Thr Pro Leu Ala Arg Pro Ser Leu
            660                 665                 670
Pro Ser Leu Ser Lys Pro Ser Gly Ser Ala Arg Ser Leu Thr Gly Ser
        675                 680                 685
Arg Phe Ser Ser Thr Ser Leu Ser Phe Glu Ser Ser Ile Ala Pro Phe
    690                 695                 700
Thr Leu Ser Ala Lys Thr Phe Thr Ala Ser Glu Ile Met Lys Ala Thr
705                 710                 715                 720
Asn Asn Phe Asp Glu Ser Arg Val Leu Gly Glu Gly Gly Phe Gly Arg
                725                 730                 735
Val Tyr Glu Gly Val Phe Asp Asp Gly Thr Lys Val Ala Val Lys Val
            740                 745                 750
Leu Lys Arg Asp Asp Gln Gln Gly Ser Arg Glu Phe Leu Ala Glu Val
        755                 760                 765
Glu Met Leu Ser Arg Leu His His Arg Asn Leu Val Asn Leu Ile Gly
    770                 775                 780
Ile Cys Ile Glu Asp Arg Asn Arg Ser Leu Val Tyr Glu Leu Ile Pro
785                 790                 795                 800
Asn Gly Ser Val Glu Ser His Leu His Gly Ile Asp Lys Ala Ser Ser
                805                 810                 815
ProLeu Asp Trp Asp Ala Arg Leu Lys Ile Ala Leu Gly Ala Ala Arg
           820                 825                 830
Gly Leu Ala Tyr Leu His Glu Asp Ser Ser Pro Arg Val Ile His Arg
        835                 840                 845
Asp Phe Lys Ser Ser Asn Ile Leu Leu Glu Asn Asp Phe Thr Pro Lys
    850                 855                 860
Val Ser Asp Phe Gly Leu Ala Arg Asn Ala Leu Asp Asp Glu Asp Asn
865                 870                 875                 880
Arg His Ile Ser Thr Arg Val Met Gly Thr Phe Gly Tyr Val Ala Pro
                885                 890                 895
Glu Tyr Ala Met Thr Gly His Leu Leu Val Lys Ser Asp Val Tyr Ser
            900                 905                 910
Tyr Gly Val Val Leu Leu Glu Leu Leu Thr Gly Arg Lys Pro Val Asp
        915                 920                 925
Met Ser Gln Pro Pro Gly Gln Glu Asn Leu Val Ser Trp Thr Arg Pro
    930                 935                 940
Phe Leu Thr Ser Ala Glu Gly Leu Ala Ala Ile Ile Asp Gln Ser Leu
945                 950                 955                 960
Gly Pro Glu Ile Ser Phe Asp Ser Ile Ala Lys Val Ala Ala Ile Ala
                965                 970                 975
Ser Met Cys Val Gln Pro Glu Val Ser His Arg Pro Phe Met Gly Glu
            980                 985                 990
Val Val Gln Ala Leu Lys Leu Val Ser Asn Glu Cys Asp Glu Ala Lys
        995                 1000                1005
Glu Leu Asn Ser Leu Thr Ser Ile Ser Lys Asp Asp Phe Arg Asp
    1010                1015                1020
Asp Thr Gln Ala Glu Ser Ser Cys Gly Asp Ser Ser Ala Arg Met
    1025                1030                1035
Ala Arg Tyr Pro Leu Leu Pro Asn Tyr Asp Ser Glu Pro Asp Thr
    1040                1045                1050
Glu Arg Gly Leu Ser Thr Ser Glu Met Tyr Thr Gly Ser Gly Arg
    1055                1060                1065
Phe Glu Arg Gln Ser Asn Ser Gly Pro Leu Thr Ser Gly Arg Gly
    1070                1075                1080
Lys Ser Phe Trp Gln Lys Met Arg Arg Leu Ser Thr Gly Ser Leu
    1085                1090                1095
Ser Glu His Gly Thr Pro Thr Val Met Leu Arg Ser Gly Ser Arg
    1100                1105                1110
<210>23
<211>3162
<212>DNA
<213>拟南芥
<400>23
ttctggtttc gaattcactt tactctcttc gcttccaatc tctctctacc actctgatac    60
cttcgccgga gaagaagctc tcgttctctc tatcgtcgga gaagctctcg ttctctgctt    120
ccctgctctg tacagatctc gagccgcatt tcgtggatct gtcaaaatcg cgttaaaacc    180
tactcgcttc tctctaaccc tagggttttt gaattttttt cgggacgagg gagaaatcaa    240
tgtctgtgaa gctttgagga agctatatgg ttacaccttt ggttctggtt agtcttcgtt    300
ttgatcggcg gagagtgttc gccgaggctt ggtgtctccg ttattgacta atggtggttt    360
ttgatttgag ataagagatg cggaactttg cgatgcttct gctgttaatt cttcttcttc    420
actctctcgc ctcgtttcct atatgctttg ctcggttatt tccgatgagt ttgccattta    480
cccgatcaaa ggcgcatcaa atgcatttct ttcatcctta tcttaatcca tcagttgctc    540
ctacaccttc accagctttt tcccccaacc caagtcgcat tccaccacta aggcacaagg    600
gtcatcaccg tcatcgtcgc tggcatttaa gacgcaatgc cactgcagtg tcaccttcgt    660
cacatgactg tcagcagaca tgtgtggagc ctctcacttc aactcccttt ggttcacctt    720
gtggttgtgt cttccccatg aaagttcagc ttctactaag tgtcgcacct ttttctattt    780
tccccgtgac caacgagtta gaaattgagg ttgctgctgg aacatacttg gaacaaagcc    840
aagtgaaaat aatgggtgcc agtgccgaca gtgaaaatca agggaaaaca gtggtggata    900
ttaaccttgt tccacttggg gaaaagttcg acaacactac agcaacactt atttatcaga    960
gattccggca caagaaagta cctctaaatg agactgtttt tggtgattat gaggttacgc    1020
acataagtta tccaggaatt ccttcttctt cgccaaatgg agatgttact ggagatgctc    1080
caggaggcct  tccaattccg atcaatgcaa caacttttgc caacaaaagc  cagggaatag  1140
gttttagaac gattgcaatt attgcgttgt caggttttgt cctcattctg gttttggttg    1200
gagctatttc tataatcgtg aaatggaaga aaattgggaa gtcatctaat gctgttggtc    1260
cggctttggc tccatcgatt aacaaaaggc ctggtgctgg atctatgttt tccagtagcg    1320
ccagaagctc aggctcagat tctttgatgt cttccatggc tacatgtgct ttatcagtta    1380
agaccttcac actctccgag cttgagaagg ctactgatag attcagtgcc aagagggttt    1440
tgggcgaggg cggatttggt cgtgtttatc aggggagtat ggaagatgga actgaggttg    1500
cagtgaaact gctaactagg gacaatcaga atcgagaccg tgaatttatt gccgaagtcg    1560
agatgctaag ccgtttgcac caccgcaatc ttgtgaaact gattggaata tgcattgaag    1620
gtcgtacacg ttgcttgatt tatgagctcg tccacaatgg gagtgttgag tcccacttac    1680
acgaaggaac gcttgattgg gatgcgcggt tgaagattgc acttggagca gcgagaggac    1740
tggcttatct ccatgaagat tcaaatcccc gagtaatcca ccgtgatttc aaggctagca    1800
atgttctcct agaagatgac tttaccccaa aagtctcaga ctttggactg gcaagagaag    1860
caaccgaagg aagtcaacat atttcaactc gagtcatggg gacctttggg tacgtggctc    1920
ctgagtatgc aatgacgggg catctccttg ttaaaagcga tgtctatagt tatggtgtag    1980
ttctactaga gcttctaacc ggtagaagac cagtagacat gtctcaacct tcgggagagg    2040
aaaaccttgt gacatgggcg agacccttac tagccaacag agagggcctg gagcaactgg    2100
tggaccctgc attggctgga acctacaact ttgatgacat ggcgaaagtg gctgcgattg    2160
cctccatgtg cgtccaccaa gaggtctcac acagaccatt catgggtgaa gttgtgcagg    2220
cactaaaact tatatacaac gatgcagatg agacctgtgg tgattattgc agccaaaagg    2280
actcatcagt accagactct gctgacttca aaggcgatct  ggctccttcg gatagcagct    2340
ggtggaattt gacacctcgg ttaaggtatg gtcaagcttc gtcgttcata acaatggatt    2400
atagctcagg accactagag gacatggaga accggcctca ctctgcctct agcattccaa    2460
gagtaggagg tcttattcta ccaaacagat caggtccgtt  aagacccatg cgtagtagaa   2520
gaaacttctt tagactgaga ggaagcatga gcgaacacgg tggaccgtcg tcgtctagac    2580
atctctggtc cggcaatggt gactggctct gagaaaccag aaaatgtaca gtgaagaaaa    2640
gggaaaagga ggctcacaaa ctcttgagct gcatggttag gttctggtta atccggccag    2700
gttcggttca tctgggtaaa gatttccggt ttgatttctt ttaggagctg tttgttgtta    2760
tgattatcct caatagagat ttaattgttt gtttttgcga ggatgcaaaa gcacagggag    2820
ggttgtattt tgaaggacgc ctgtatttag ttctctcctt ttctctctca cccacaaaaa    2880
aacattttta tatattttat tttagtgaag ttagtaatta cctaattttt tttagttttt    2940
caagttccta agaaatttgg cttttggtca tcgttgttaa gtttccggtt ttctgaattt    3000
acatccgaaa tattttttgg ttaaataaaa ttctggcttg agagtaattg gctggtgaat    3060
ggtaacaagt cacttggtca aagctgttgt aattcttttc taatttctag tatcttctgt    3120
agattggaca caatgacatg gattgttgat ctttaaagtc gt                       3162
<210>24
<211>744
<212>PRT
<213>拟南芥
<400>24
Met Arg Asn Phe Ala Met Leu Leu Leu Leu Ile Leu Leu Leu His Ser
1               5                   10                  15
Leu Ala Ser Phe Pro Ile Cys Phe Ala Arg Leu Phe Pro Met Ser Leu
            20                  25                  30
Pro Phe Thr Arg Ser Lys Ala His Gln Met His Phe Phe His Pro Tyr
        35                  40                  45
Leu Asn Pro Ser Val Ala Pro Thr Pro Ser Pro Ala Phe Ser Pro Asn
    50                  55                  60
Pro Ser Arg Ile Pro Pro Leu Arg His Lys Gly His His Arg His Arg
65                  70                  75                  80
Arg Trp His Leu Arg Arg Asn Ala Thr Ala Val Ser Pro Ser Ser His
                85                  90                  95
Asp Cys Gln Gln Thr Cys Val Glu Pro Leu Thr Ser Thr Pro Phe Gly
            100                 105                 110
Ser Pro Cys Gly Cys ValPhe Pro Met Lys Val Gln Leu Leu Leu Ser
        115                 120                 125
Val Ala Pro Phe Ser Ile Phe Pro Val Thr Asn Glu Leu Glu Ile Glu
    130                 135                 140
Val Ala Ala Gly Thr Tyr Leu Glu Gln Ser Gln Val Lys Ile Met Gly
145                 150                 155                 160
Ala Ser Ala Asp Ser Glu Asn Gln Gly Lys Thr Val Val Asp Ile Asn
                165                 170                 175
Leu Val Pro Leu Gly Glu Lys Phe Asp Asn Thr Thr Ala Thr Leu Ile
            180                 185                 190
Tyr Gln Arg Phe Arg His Lys Lys Val Pro Leu Asn Glu Thr Val Phe
        195                 200                 205
Gly Asp Tyr Glu Val Thr His Ile Ser Tyr Pro Gly Ile Pro Ser Ser
    210                 215                 220
Ser Pro Asn Gly Asp Val Thr Gly Asp Ala Pro Gly Gly Leu Pro Ile
225                 230                 235                 240
Pro Ile Asn Ala Thr Thr Phe Ala Asn Lys Ser Gln Gly Ile Gly Phe
                245                 250                 255
Arg Thr Ile Ala Ile Ile Ala Leu Ser Gly Phe Val Leu Ile Leu Val
            260                 265                 270
Leu Val Gly Ala Ile Ser Ile Ile Val Lys Trp Lys Lys Ile Gly Lys
        275                 280                 285
Ser Ser Asn Ala Val Gly Pro Ala Leu Ala Pro Ser Ile Asn Lys Arg
    290                 295                 300
Pro Gly Ala Gly Ser Met Phe Ser Ser Ser Ala Arg Ser Ser Gly Ser
305                 310                 315                 320
Asp Ser Leu Met Ser Ser Met Ala Thr Cys Ala Leu Ser Val Lys Thr
                325                 330                 335
Phe Thr Leu Ser Glu Leu Glu Lys Ala Thr Asp Arg Phe Ser Ala Lys
            340                 345                 350
Arg Val Leu Gly Glu Gly Gly Phe Gly Arg Val Tyr Gln Gly Ser Met
        355                 360                 365
Glu Asp Gly Thr Glu Val Ala Val Lys Leu Leu Thr Arg Asp Asn Gln
    370                 375                 380
Asn Arg Asp Arg Glu Phe Ile Ala Glu Val Glu Met Leu Ser Arg Leu
385                 390                 395                 400
His His Arg Asn Leu Val Lys Leu Ile Gly Ile Cys Ile Glu Gly Arg
                405                 410                 415
Thr Arg Cys Leu Ile Tyr Glu Leu Val His Asn Gly Ser Val Glu Ser
            420                 425                 430
His Leu His Glu Gly Thr Leu Asp Trp Asp Ala Arg Leu Lys Ile Ala
        435                 440                 445
Leu Gly Ala Ala Arg Gly Leu Ala Tyr Leu His Glu Asp Ser Asn Pro
    450                 455                 460
Arg Val Ile His Arg Asp Phe Lys Ala Ser Asn Val Leu Leu Glu Asp
465                 470                 475                 480
Asp Phe Thr Pro Lys Val Ser Asp Phe Gly Leu Ala Arg Glu Ala Thr
                485                 490                 495
Glu Gly Ser Gln His Ile Ser Thr Arg Val Met Gly Thr Phe Gly Tyr
            500                 505                 510
Val Ala Pro Glu Tyr Ala Met Thr Gly His Leu Leu Val Lys Ser Asp
        515                 520                 525
Val Tyr Ser Tyr Gly Val Val Leu Leu Glu Leu Leu Thr Gly Arg Arg
    530                 535                 540
Pro Val Asp Met Ser Gln Pro Ser Gly Glu Glu Asn Leu Val Thr Trp
545                 550                 555                 560
Ala Arg Pro Leu Leu Ala Asn Arg Glu Gly Leu Glu Gln Leu Val Asp
                565                 570                 575
Pro Ala Leu Ala Gly Thr Tyr Asn Phe Asp Asp Met Ala Lys Val Ala
            580                 585                 590
Ala Ile Ala Ser Met Cys Val His Gln Glu Val Ser His Arg Pro Phe
        595                 600                 605
Met Gly Glu Val Val Gln Ala Leu Lys Leu Ile Tyr Asn Asp Ala Asp
    610                 615                 620
Glu Thr Cys Gly Asp Tyr Cys Ser Gln Lys Asp Ser Ser Val Pro Asp
625                 630                 635                 640
Ser Ala Asp Phe Lys Gly Asp Leu Ala Pro Ser Asp Ser Ser Trp Trp
                645                 650                 655
Asn Leu Thr Pro Arg Leu Arg Tyr Gly Gln Ala Ser Ser Phe Ile Thr
            660                 665                 670
Met Asp Tyr Ser Ser Gly Pro Leu Glu Asp Met Glu Asn Arg Pro His
        675                 680                 685
Ser Ala Ser Ser Ile Pro Arg Val Gly Gly Leu Ile Leu Pro Asn Arg
    690                 695                 700
Ser Gly Pro Leu Arg Pro Met Arg Ser Arg Arg Asn Phe Phe Arg Leu
705                 710                 715                 720
Arg Gly Ser Met Ser Glu His Gly Gly Pro Ser Ser Ser Arg His Leu
                725                 730                 735
Trp Ser Gly Asn Gly Asp Trp Leu
            740
<210>25
<211>369
<212>DNA
<213>稻
<400>25
atgccaacta gtagagtcga cctgctgagc cggatgcact cgccgtacct ggtggggttg    60
ctgggctact gcgccgacca gagccaccgt ctgctggtgt tcgagttcat gcccaacggc    120
agcctcaaga gccacctcca ccggcgcgcg ctggcgccgg cggagcagcc gccgccgctg    180
gactggcaga cgcggctggg catcgcgctg gactgcgccc gcgcgctgga gttcctccac    240
gagcacagct cccccgccgt gatccaccgc gacttcaagt gcagcaacat cctcctcgac    300
cacaactacc gcgcccgcgt ctccgacttc ggcatgggca agctcggctc caacaaggcc    360
aatggccag                                                            369
<210>26
<211>123
<212>PRT
<213>稻
<400>26
Met Pro Thr Ser Arg Val Asp Leu Leu Ser Arg Met His Ser Pro Tyr
1               5                   10                  15
Leu Val Gly Leu Leu Gly Tyr Cys Ala Asp Gln Ser His Arg Leu Leu
            20                  25                  30
Val Phe Glu Phe Met Pro Asn Gly Ser Leu Lys Ser His Leu His Arg
        35                  40                  45
Arg Ala Leu Ala Pro Ala Glu Gln Pro Pro Pro Leu Asp Trp Gln Thr
    50                  55                  60
Arg Leu Gly Ile Ala Leu Asp Cys Ala Arg Ala Leu Glu Phe Leu His
65                  70                  75                  80
Glu His Ser Ser Pro Ala Val Ile His Arg Asp Phe Lys Cys Ser Asn
                85                  90                  95
Ile Leu Leu Asp His Asn Tyr Arg Ala Arg Val Ser Asp Phe Gly Met
            100                 105                 110
Gly Lys Leu Gly Sar Asn Lys Ala Asn Gly Gln
        115                 120
<210>27
<211>1233
<212>DNA
<213>稻
<400>27
atggcggatg cttgggcggc gtcccctcca tctcctacgg ctccttcgcc tttcgccgcg    60
gacgacctcg tcgacgcgcg gctcgcgccg tggccgccgt tcgccccgtg gccggcgccc    120
gggcagctcc accacaaccg ccgcggcggc gggcacccga acccgctctt caccatcctg    180
ccggcctcgg cgctggcaat aggggtcgtg ctgcttgtcg ccgtggtcgt catcctggtg    240
atgacgcgtc ggtggaagcc cggggcggtg gacggcgccg gcggcgccag ctgcaacggc    300
gacaagcctg gcggcgcccc cgcgtccagc tgcggcagca gcgtccgcgg ctacaacaac    360
tccaggtact acgccgccgc cgccgccggg tgcatatatg gcggaaggct gggtttctcg    420
gtgcagccgc ggaaccgcgg cgcgcaagtg ttcacgtacc gggagctgga gagcgcgacg    480
gacgggttca gcgagtgcaa cgtggtgggc cgcggcgcgt acggcgtggt cttccgcggc    540
cggctcggcg acggcaccac ggccgccatc aagcggctca agatggacgg ccggcgcgag    600
ggcgagcgcg agttccgcat cgagatgggc gttgctatta ctgctcaggt cgacctgctg    660
agccggatgc actcgccgta cctggtgggg ttgctgggct actgcgccga ccagagccac    720
cgtctgctgg ttttcgagtt catgcccaac ggcagcctca agagccacct ccaccggcgc    780
gcgctggcgc cggcggagca gccgccgccg ctggactggc agacgcggct gggcatcgcg    840
ctggactgcg cccgcgcgct ggagttcctc cacgagcaca gctcccccgc cgtgatccac    900
cgcgacttca agtgcagcaa catcctcctc gaccacaact accgcgcccg cgtctccgac    960
ttcggcatgg ccaagctcgg ctccaacaag gccaatggcc aggtggccgc  catcacggcg   1020
atgtgcatac agacgaaggc ggactaccgg ccgctgatga cggacgtggt gcagtcgctg    1080
atccccatcg tgaagagccc actcatgtcc tgcacctcca cgccgctgag gcccgcgcac    1140
gggcaccacc acgtcgtcta catgagcccg agcaggggct cttccaacgg cggtgccctg    1200
gaaacgcgat gcgtcatgca cggcttggat tga                                 1233
<210>28
<211>410
<212>PRT
<213>稻
<400>28
Met Ala Asp Ala Trp Ala Ala Ser Pro Pro Ser Pro Thr Ala Pro Ser
1               5                   10                  15
Pro Phe Ala Ala Asp Asp Leu Val Asp Ala Arg Leu Ala Pro Trp Pro
            20                  25                  30
Pro Phe Ala Pro Trp Pro Ala Pro Gly Gln Leu His His Asn Arg Arg
        35                  40                  45
Gly Gly Gly His Pro Asn Pro Leu Phe Thr Ile Leu Pro Ala Ser Ala
    50                  55                  60
Leu Ala Ile Gly Val Val Leu Leu Val Ala Val Val Val Ile Leu Val
65                  70                  75                  80
Met Thr Arg Arg Trp Lys Pro Gly Ala Val Asp Gly Ala Gly Gly Ala
                85                  90                  95
Ser Cys Asn Gly Asp Lys Pro Gly Gly Ala Pro Ala Ser Ser Cys Gly
            100                 105                 110
Ser Ser Val Arg Gly Tyr Asn Asn Ser Arg Tyr Tyr Ala Ala Ala Ala
        115                 120                 125
Ala Gly Cys Ile Tyr Gly Gly Arg Leu Gly Phe Ser Val Gln Pro Arg
    130                 135                 140
Asn Arg Gly Ala Gln Val Phe Thr Tyr Arg Glu Leu Glu Ser Ala Thr
145                 150                 155                 160
Asp Gly Phe Ser Glu Cys Asn Val Val Gly Arg Gly Ala Tyr Gly Val
                165                 170                 175
Val Phe Arg Gly Arg Leu Gly Asp Gly Thr Thr Ala Ala Ile Lys Arg
            180                 185                 190
Leu Lys Met Asp Gly Arg Arg Glu Gly Glu Arg Glu Phe Arg Ile Glu
        195                 200                 205
Met Gly Val Ala Ile Thr Ala Gln Val Asp Leu Leu Ser Arg Met His
    210                 215                 220
Ser Pro Tyr Leu Val Gly Leu Leu Gly Tyr Cys Ala Asp Gln Ser His
225                 230                 235                 240
ArgLeu Leu Val Phe Glu Phe Met Pro Asn Gly Ser Leu Lys Ser His
               245                 250                 255
Leu His Arg Arg Ala Leu Ala Pro Ala Glu Gln Pro Pro Pro Leu Asp
            260                 265                 270
Trp Gln Thr Arg Leu Gly Ile Ala Leu Asp Cys Ala Arg Ala Leu Glu
        275                 280                 285
Phe Leu His Glu His Ser Ser Pro Ala Val Ile His Arg Asp Phe Lys
    290                 295                 300
Cys Ser Asn Ile Leu Leu Asp His Asn Tyr Arg Ala Arg Val Ser Asp
305                 310                 315                 320
Phe Gly Met Ala Lys Leu Gly Ser Asn Lys Ala Asn Gly Gln Val Ala
                325                 330                 335
Ala Ile Thr Ala Met Cys Ile Gln Thr Lys Ala Asp Tyr Arg Pro Leu
            340                 345                 350
Met Thr Asp Val Val Gln Ser Leu Ile Pro Ile Val Lys Ser Pro Leu
        355                 360                 365
Met Ser Cys Thr Ser Thr Pro Leu Arg Pro Ala His Gly His His His
    370                 375                 380
Val Val Tyr Met Ser Pro Ser Arg Gly Ser Ser Asn Gly Gly Ala Leu
385                 390                 395                 400
Glu Thr Arg Cys Val Met His Gly Leu Asp
                405                 4l0
<210>29
<211>1365
<212>DNA
<213>稻
<400>29
atgtcgagcg gcggcggcgg cggcgacgac tacaagcggg aggagtcggt ggcactcatg    60
gtcatcgtct ccctcgcggc gctctccctc ctctccctcg tcgccgcctt cgcctactac    120
tgctacatca cccgcaaggt ctcccgccgc ctccactcgc tcgacctccc caagcaccac    180
cgccgctcct cctcctcctc gcctcctccc atgcccccgc cgctgcctcc ccctcctcct    240
tccgcgaatg ccccgacgct cgggaaggag agcccgtcca gcaactccgc cagcgacggc    300
gcggcggcgg cggtcgtggt cggcggggag aggggggccg tccaggtgtt cagctaccgc    360
cagctgcacg ccgccacggg cgggttcggg cgggcgcacg tggtggggca ggggagcttc    420
ggggccgtct accgcggggt gctccccgat gggaggaagg tcgcggtcaa gctcatggat    480
cgccccggca agcaggggga agaggagttc gagatggagg tggagctgct gagtcggctt    540
cgatcacctt atcttttggg cttgattggc cattgttcag agggtggaca ccggctgctg    600
gtctatgaat tcatggccaa tgggggtctc caggagcatc tctacccaaa tggagctttt    660
gaaaagattg aaacattttc gatctacttg gtgaaacaac gcccgatttt tgacaaaaat    720
atcgggcacc cgatttgtag gcgcgcccat ttttctcgtc aactgatatc ccacaaagct    780
gacattgtag gttcctgtgg tggtatctca aaattggact ggcctactag aatgagaata    840
gctcttgaag cagcaaaagg tctggaatat cttcacgagc gtgttaatcc acctgttata    900
cacagagact tcaagagcag caacattcta ctggacaagg acttccgtgc aagagtgtca    960
gattttggtt tggctaagct tggatctgat agagctggtg gtcatgtatc aactcgagtt    1020
ctaggcacac aaggttatgt tgcaccagat tacggtgttg tacttctgga gttgcttact    1080
ggcagggtgc cagttgatat gaagaggcct ccaggcgaag gtgttctagt taactgggca    1140
ttgcctatgc tcacagaccg agagaaggtt gtgcagatct tggatcctgc actggagggt    1200
caatattcat tgaaagatgc tgtccaagtg gctgccattg ctgccatgtg tgttcaacaa    1260
gaggctgact acaggccact aatggctgat gtggttcaat cgttggttcc gcttgtcaag    1320
aatcgttcta ctccaaagac gtgcaaccct agtgtccaag cgtag                    1365
<210>30
<211>454
<212>PRT
<213>稻
<400>30
Met Ser Ser Gly Gly Gly Gly Gly Asp Asp Tyr Lys Arg Glu Glu Ser
1               5                   10                  15
Val Ala Leu Met Val Ile Val Ser Leu Ala Ala Leu Ser Leu Leu Ser
            20                  25                  30
Leu Val Ala Ala Phe Ala Tyr Tyr Cys Tyr Ile Thr Arg Lys Val Ser
        35                  40                  45
Arg Arg Leu His Ser Leu Asp Leu Pro Lys His His Arg Arg Ser Ser
    50                  55                  60
Ser Ser Ser Pro Pro Pro Met Pro Pro Pro Leu Pro Pro Pro Pro Pro
65                  70                  75                  80
Ser Ala Asn Ala Pro Thr Leu Gly Lys Glu Ser Pro Ser Ser Asn Ser
                85                  90                  95
Ala Ser Asp Gly Ala Ala Ala Ala Val Val Val Gly Gly Glu Arg Gly
            100                 105                 110
Ala Val Gln Val Phe Ser Tyr Arg Gln Leu His Ala Ala Thr Gly Gly
        115                 120                 125
Phe Gly Arg Ala His Val Val Gly Gln Gly Ser Phe Gly Ala Val Tyr
    130                 135                 140
Arg Gly Val Leu Pro Asp Gly Arg Lys Val Ala Val Lys Leu Met Asp
145                 150                 155                 160
Arg Pro Gly Lys Gln Gly Glu Glu Glu Phe Glu Met Glu Val Glu Leu
                165                 170                 175
Leu Ser Arg Leu Arg Ser Pro Tyr Leu Leu Gly Leu Ile Gly His Cys
            180                 185                 190
Ser Glu Gly Gly His Arg Leu Leu Val Tyr Glu Phe Met Ala Asn Gly
        195                 200                 205
Gly Leu Gln Glu His Leu Tyr Pro Asn Gly Ala Phe Glu Lys Ile Glu
    210                 215                 220
Thr Phe Ser Ile Tyr Leu Val Lys Gln Arg Pro Ile Phe Asp Lys Asn
225                 230                 235                 240
Ile Gly His Pro Ile Cys Arg Arg Ala His Phe Ser Arg Gln Leu Ile
                245                 250                 255
Ser His Lys Ala Asp Ile Val Gly Ser Cys Gly Gly Ile Ser Lys Leu
            260                 265                 270
Asp Trp Pro Thr Arg Met Arg Ile Ala Leu Glu Ala Ala Lys Gly Leu
        275                 280                 285
Glu Tyr Leu His Glu Arg Val Asn Pro Pro Val Ile His Arg Asp Phe
    290                 295                 300
Lys Ser Ser Asn Ile Leu Leu Asp Lys Asp Phe Arg Ala Arg Val Ser
305                 310                 315                 320
Asp Phe Gly Leu Ala Lys Leu Gly Ser Asp Arg Ala Gly Gly His Val
                325                 330                 335
Ser Thr Arg Val Leu Gly Thr Gln Gly Tyr Val Ala Pro Asp Tyr Gly
            340                 345                 350
Val Val Leu Leu Glu Leu Leu Thr Gly Arg Val Pro Val Asp Met Lys
        355                 360                 365
Arg Pro Pro Gly Glu Gly Val Leu Val Asn Trp Ala Leu Pro Met Leu
    370                 375                 380
Thr Asp Arg Glu Lys Val Val Gln Ile Leu Asp Pro Ala Leu Glu Gly
385                 390                 395                 400
Gln Tyr Ser Leu Lys Asp Ala Val Gln Val Ala Ala Ile Ala Ala Met
                405                 410                 415
Cys Val Gln Gln Glu Ala Asp Tyr Arg Pro Leu Met Ala Asp Val Val
            420                 425                 430
Gln Ser Leu Val Pro Leu Val Lys Asn Arg Ser Thr Pro Lys Thr Cys
        435                 440                 445
Asn Pro Ser Val Gln Ala
    450
<210>31
<211>1923
<212>DNA
<213>稻
<400>31
ggcccccaaa cccctcaaaa ccctcgtcgt cttctcgcga tcgctattcc ctcctccatt    60
cctcctcctc cacctccgag acctagggtt ccaatgtcga gcggcggcgg cggcggcgac    120
gactacaagc gggaggagtc ggtggcactc atggtcatcg tctccctcgc ggcgctctcc    180
ctcctctccc tcgtcgccgc cttcgcctac tactgctaca tcacccgcaa ggtctcccgc    240
cgcctccact cgctcgacct ccccaagcac caccgccgct cctcctcctc ctcgcctcct    300
cccatgcccc cgccgctgcc tccccctcct ccttccgcga atgccccgac gctcgggaag    360
gagagcccgt ctagcaactc cgccagcgac ggcgcggcgg cggcggtcgt ggtcggcggg    420
gagagggggg ccgtccaggt gttcagctac cgccagctgc acgccgccac gggcgggttc    480
gggcgggcgc acgtggtggg gcaggggagc ttcggggccg tctaccgcgg ggtgctcccc    540
gatgggagga aggtcgcggt caagctcatg gatcgccccg gcaagcaggg ggaagaggag    600
ttcgagatgg aggtggagct gctgagtcgg cttcgatcac cttatctttt gggcttgatt    660
ggccattgtt cagagggtgg acaccggctg ctggtctatg aattcatggc caatgggggt    720
ctccaggagc atctctaccc aaatggaggt tcctgtggtg gtatctcaaa attggactgg    780
cctactagaa tgagaatagc tcttgaagca gcaaaaggtc tggaatatct tcacgagcgt    840
gttaatccac ctgttataca cagagacttc aagagcagca acattctact ggacaaggac    900
ttccgtgcaa gagtgtcaga ttttggtttg gctaagcttg gatctgatag agctggtggt    960
catgtatcaa ctcgagttct aggcacacaa ggttatgttg caccagaata tgctttgacc    1020
gggcatttga cgaccaaatc cgatgtctat agttacggtg ttgtacttct ggagttgctt    1080
actggcaggg tgccagttga tatgaagagg cctccaggcg aaggtgttct agttaactgg    1140
gcattgccta tgctcacaga ccgagagaag gttgtgcaga tcttggatcc tgcactggag    1200
ggtcaatatt cattgaaaga tgctgtccaa gtggctgcca ttgctgccat gtgtgtttaa    1260
caagaggctg actacaggcc actaatggct gatgtggttc aatcgttggt tccgcttgtc    1320
aagaatcgtt ctactccaaa gacgtgcaac cctagtgtcc aagcgtagaa gccacttgaa    1380
ggggaagttg aatgctcagt ttccaggttg gtgcttgact tttctggaaa ttttcatcta    1440
catctaacaa ctactgctga gtttatgaga tcagtatgct ccataactta attctcttcc    1500
tctgccagtg aattcctgat tttgcgaggt gaatcgtaag cagttagatt tagaaatcaa    1560
gcattaattt agttcgatgg accagaaagc tagtttcagt ttgaagggaa gtcctctagt    1620
catgtgcaat tagtgatcat gttaggtggt ttggcttagt acttatggtt gtgccctgtg    1680
ggaatgatca gagagtgttg tttccagctg gcagaattgc aatgtactgc tgaattttct    1740
tttggcttgt caattatgtt aggtgtcttt ggagatccat gttcgttgtc ttaactcttg    1800
tgctaatacg ttggtctcat cagcttggcc tataaacatc gccgatgtat ctttttgtat    1860
atgtatatag taggattctg gaacttataa aaacaaacat ttgccagttg agcattttca    1920
tgc                                                                  1923
<210>32
<211>419
<212>PRT
<213>稻
<400>32
Gly Pro Gln Thr Pro Gln Asn Pro Arg Arg Leu Leu Ala Ile Ala Ile
1               5                   10                  15
Pro Ser Ser Ile Pro Pro Pro Pro Pro Pro Arg Pro Arg Val Pro Met
            20                  25                  30
Ser Ser Gly Gly Gly Gly Gly Asp Asp Tyr Lys Arg Glu Glu Ser Val
        35                  40                  45
Ala Leu Met Val Ile Val Ser Leu Ala Ala Leu Ser Leu Leu Ser Leu
    50                  55                  60
Val Ala Ala Phe Ala Tyr Tyr Cys Tyr Ile Thr Arg Lys Val Ser Arg
65                  70                  75                  80
Arg Leu His Ser Leu Asp Leu Pro Lys His His Arg Arg Ser Ser Ser
                85                  90                  95
Ser Ser Pro Pro Pro Met Pro Pro Pro Leu Pro Pro Pro Pro Pro Ser
            100                 105                 110
Ala Asn Ala Pro Thr Leu Gly Lys Glu Ser Pro Ser Ser Asn Ser Ala
        115                 120                 125
Ser Asp Gly Ala Ala Ala Ala Val Val Val Gly Gly Glu Arg Gly Ala
    130                 135                 140
Val Gln Val Phe Ser Tyr Arg Gln Leu His Ala Ala Thr Gly Gly Phe
145                 150                 155                 160
Gly Arg Ala His Val Val Gly Gln Gly Ser Phe Gly Ala Val Tyr Arg
                165                 170                 175
Gly Val Leu Pro Asp Gly Arg Lys Val Ala Val Lys Leu Met Asp Arg
            180                 185                 190
Pro Gly Lys Gln Gly Glu Glu Glu Phe Glu Met Glu Val Glu Leu Leu
        195                 200                 205
Ser Arg Leu Arg Ser Pro Tyr Leu Leu Gly Leu Ile Gly His Cys Ser
    210                 215                 220
Glu Gly Gly His Arg Leu Leu Val Tyr Glu Phe Met Ala Asn Gly Gly
225                 230                 235                 240
Leu Gln Glu His Leu Tyr Pro Asn Gly Gly Ser Cys Gly Gly Ile Ser
                245                 250                 255
Lys Leu Asp Trp Pro Thr Arg Met Arg Ile Ala Leu Glu Ala Ala Lys
            260                 265                 270
Gly Leu Glu Tyr Leu His Glu Arg Val Asn Pro Pro Val Ile His Arg
        275                 280                 285
Asp Phe Lys Ser Ser Asn Ile Leu Leu Asp Lys Asp Phe Arg Ala Arg
    290                 295                 300
Val Ser Asp Phe Gly Leu Ala Lys Leu Gly Ser Asp Arg Ala Gly Gly
305                 310                 315                 320
His Val Ser Thr Arg Val Leu Gly Thr Gln Gly Tyr Val Ala Pro Glu
                 325                 330                 335
Tyr Ala Leu Thr Gly His Leu Thr Thr Lys Ser Asp Val Tyr Ser Tyr
            340                 345                 350
Gly Val Val Leu Leu Glu Leu Leu Thr Gly Arg Val Pro Val Asp Met
        355                 360                 365
Lys Arg Pro Pro Gly Glu Gly Val Leu Val Asn Trp Ala Leu Pro Met
    370                 375                 380
Leu Thr Asp Arg Glu Lys Val Val Gln Ile Leu Asp Pro Ala Leu Glu
385                 390                 395                 400
Gly Gln Tyr Ser Leu Lys Asp Ala Val Gln Val Ala Ala Ile Ala Ala
                405                 410                 415
Met Cys Val
<210>33
<211>3912
<212>DNA
<213>稻
<400>33
atggcgcgga tacggcgcgc gagctccgga cgagacatgt cagataattt ggtgcagcat    60
aacagacgct cagaagcaga aatttctact catgtagatg ctgcgcctcc tgatgcagcc    120
tcaaatacta gtgcagctcc ttctggatta gtacaacctc cagtatctcc tcacaatgca    180
tgttgttcac ataacatggt acaaaagaga gggagccaag attgccattg tgtttaccca    240
gtaagagttg agctttttct ccgaaatgtt tcactgacgt caaattggag cgatgaattt    300
ctgggggaac ttgcttctca actcagtctg agggttactc agtttgagat tgtaaatttc    360
tatgttgttg gggcttctgg gctaaacatc acaatgtata tagctcccca tacaggaatt    420
agtttctcag ccgaccaagt taccgcaatg aattattcac ttagtcagca tacagttcag    480
atcaaccctg tactagttgg tgactacaat cttcttaatt taacctggtt caggccactg    540
gttctagctc ctgtttattt tagtgttaag gtagagaaca ctaaaaggat gtttggtgat    600
atcaatatga tacttcctat gaatgatata aacattattt ctttatattt acagccctct    660
ccaacattca caatatcacc taaaccctct ccatctcaag catctacagt accaagacac    720
agtgcggata ccagcaatga aaaacacatg agcttgatta ctatcatttg catatttatt    780
ggtgctctaa ttgctgtctt ggtgattgcc atgtttattt gcttctgcaa attaaggaaa    840
gggaaaagga aggttcctcc agttgagaca cccaagcaaa gaacaccaga tgcggtttct    900
gcagtggact cacttcctcg cccaacaagt acaaggttcc ttgcatatga tgaactgaaa    960
gaagcaacca acaactttga tccgtcaagt atgcttggag aaggaggttt tggccgtgtc    1020
tttaaagggg tactaactga tggcactgcc gttgctataa agaagcttac tagtggaggg    1080
caccaaggag ataaggaatt tctagttgaa gtggagatgc tgagcaggtt gcaccaccga    1140
aaccttgtga aactcattgg ttactatagt aaccgtacat tgggagctag ccgccccttg    1200
gactgggaca ctagaatgag gatagcacta gatgctgcca ggggattggc ataccttcat    1260
gaggattctc agccttgcgt aatccacagg gatttcaagg cttctaatat attgcttgag    1320
gatgactttc atgctaaagt gtctgatttt ggtttggcca aacaggcacc ggaaggtcgc    1380
acaaattatc tctcaacacg tgttatggga acattcgggt atgtagcacc agagtatgca    1440
atgacaggac acttgcttgt aaaaagcgat gtatatagct atggagttgt tctacttgaa    1500
ctacttactg ggaggaggcc tgtggatatg tcacaacctt ctggccagga aaatctagtg    1560
acatggctta cacaaatgtt tcctgatctt tccactaaaa gccttgtgtc acatcaacct    1620
ttgctggcca agttgtcagg tgtagagata cttatttgct caattttgac tacgcaggca    1680
cgaccaattt tacgagataa agatacgcta gaagaactag ctgatcccaa gcttggtggc    1740
cagtatccaa aagatgattt tgtgcgagta tgcacaattg cagccgcctg tgtttcaccg    1800
gaggcaagcc aaaggccaac aatgggcgag gtggtgcagt cactgaagat ggtccaacgc    1860
tctgagttcc aggaatccat accaacacct ccagcacgac ccaatgcctc agcccctttg    1920
agactgagaa catatcgaga acggctttct ctgaagatct tcacgaaggg cggtaacagt    1980
ggtgaacaag acccggccac catggtcggc ttcgccgacc agaccgccga cgtctccgcc    2040
gccgcgttcc agaccatgta ccgcctcaac gtcggcggcg cctacatccc gccgtccaac    2100
gactccggcc tcacgcggcc gtggtacgac gacacgccgt tcgtccaggg ccccctgcgc    2160
ggcctcgtct acaacgccgg cccgcacttc cacatcaagt accccagcga cgccgccgag    2220
tacgccgcgc cgccggaggt gtacctcggc ggccgctcca tgggcaggga ccagcgcctc    2280
aaccagaact ccaacctcac ctggagcctc cacgtggagt gcaacttcac ctacgtcgtg    2340
cgcctccatt tctgcgagct ccagctcatc cacggcaacc agcgggtgtt cgacatctac    2400
atcaacaacc ggacggcgca gacggacgtg gacgtgctgg agatggcgac ggagcgcggc    2460
gtgccggtgt acaaggacta cgcggtgagg ctgagcaacg acaccgccga cgagcatctg    2520
tgggtggcgg tgcacccctc ggtgatgctc cgcccgcagt tctacgacgc catcctcaac    2580
ggcctcgagg tgttcaaggt gaacaacacc ggcggcagcc tggcgtcgcc ggaccccgtc    2640
ccgtacaagc tgctcgcgga gaaggagctc ggctggggcg ggccgccgga gttctccacc    2700
gacaacccgg ccaacatggc gtcggtgatg ggcggcacgg cgggcggcgc ggcggcggcc    2760
gggatcgtgg cggccatctg cgtggtggtg tacagcaaca agaggagcaa gaagctgggc    2820
ggcggcggcg ccgactcgca cacctccgcg tggctgccgc tgtaccactc ccacaccagc    2880
ggcaagtcgt cggggcacat cacggcgaac atcgccggca tgtgccgcca cttctcgttc    2940
gcggagatca aggcggcgac caagaacttc tccaacgacc tggccatcgg cgtgggcggg    3000
ttcggcgtgg tgtaccgcgg cgtggtggac ggcgacgtga aggtggcggt gaagcggtcc    3060
aacccgtcgt cggagcaagg cataaccgag ttccagacgg aggtggagat gctctccaag    3120
ctccgccacc gccacctcgt ctccctcatc ggcttctgcg aggaggacgg cgagatggtg    3180
ctcgtctacg actacatgga gcacggcacc ctgcgcgagc acctctacca caacggcggc    3240
aagcccacgc tgtcgtggcg ccaccgcctc gacatctgca tcggcgccgc ccgcggcctc    3300
cactacctcc acaccggcga atcgcacgtc agcaccgtcg tcaagggcag cttcggctac    3360
ctcgacccgg agtactaccg ccggcagcag ctcaccgaca agtccgacgt ctactccttc    3420
ggcgtcgtgc tgttcgaggt gctcatggcg cgcccggcgc tcgacccggc gctgccgcgc    3480
gaccaggtca gcctcgccga ctacgcgctc gcctgcaagc gcggcggcgc gctgccggac    3540
gtcgtcgacc cggcgatcag ggaccagatc gcgcccgagt gcctcgccaa gttcgccgac    3600
acggcggaga agtgcctctc cgagaacggc accgagcgcc ccaccatggg cgacgtgctc    3660
tggaacctcg agagcgcgat gcacttccag gacgcgttcg acgccgccgc cggccgcccc    3720
gtccccgcgc tcgacgccgc cgccggcagc agcagccacc tcgacgacgg gagcacggcc    3780
agcatcaaca cgctggccac gtcgtccacg tcgcacccgc acgagccgtg cgtcgacgtt    3840
gtcttggagc ccgacgacgt cgtcgcggag cgcgccacct tctcgcagct cgtccagccc    3900
accggccggt ga                                                       3912
<210>34
<211>1303
<212>PRT
<213>稻
<400>34
Met Ala Arg Ile Arg Arg Ala Ser Ser Gly Arg Asp Met Ser Asp Asn
1               5                   10                  15
Leu Val Gln His Asn Arg Arg Ser Glu Ala Glu Ile Ser Thr His Val
            20                  25                  30
Asp Ala Ala Pro Pro Asp Ala Ala Ser Asn Thr Ser Ala Ala Pro Ser
        35                  40                  45
Gly Leu Val Gln Pro Pro Val Ser Pro His Asn Ala Cys Cys Ser His
    50                  55                  60
Asn Met Val Gln Lys Arg Gly Ser Gln Asp Cys His Cys Val Tyr Pro
65                  70                  75                  80
Val Arg Val Glu Leu Phe Leu Arg Asn Val Ser Leu Thr Ser Asn Trp
                85                  90                  95
Ser Asp Glu Phe Leu Gly Glu Leu Ala Ser Gln Leu Ser Leu Arg Val
            100                 105                 110
Thr Gln Phe Glu Ile Val Asn Phe Tyr Val Val Gly Ala Ser Gly Leu
        115                 120                 125
Asn Ile Thr Met Tyr Ile Ala Pro His Thr Gly Ile Ser Phe Ser Ala
    130                 135                 140
Asp Gln Val Thr Ala Met Asn Tyr Ser Leu Ser Gln His Thr Val Gln
145                 150                 155                 160
Ile Asn Pro Val Leu Val Gly Asp Tyr Asn Leu Leu Asn Leu Thr Trp
                165                 170                 175
Phe Arg Pro Leu Val Leu Ala Pro Val Tyr Phe Ser Val Lys Val Glu
            180                 185                 190
Asn Thr Lys Arg Met Phe Gly Asp Ile Asn Met Ile Leu Pro Met Asn
        195                 200                 205
Asp Ile Asn Ile Ile Ser Leu Tyr Leu Gln Pro Ser Pro Thr Phe Thr
    210                 215                 220
Ile Ser Pro Lys Pro Ser Pro Ser Gln Ala Ser Thr Val Pro Arg His
225                 230                 235                 240
Ser Ala Asp Thr Ser Asn Glu Lys His Met Ser Leu Ile Thr Ile Ile
                245                 250                 255
Cys Ile Phe Ile Gly Ala Leu Ile Ala Val Leu Val Ile Ala Met Phe
            260                 265                 270
Ile Cys Phe Cys Lys Leu Arg Lys Gly Lys Arg Lys Val Pro Pro Val
        275                 280                 285
Glu Thr Pro Lys Gln Arg Thr Pro Asp Ala Val Ser Ala Val Asp Ser
    290                 295                 300
Leu Pro Arg Pro Thr Ser Thr Arg Phe Leu Ala Tyr Asp Glu Leu Lys
305                 310                 315                 320
Glu Ala Thr Asn Asn Phe Asp Pro Ser Ser Met Leu Gly Glu Gly Gly
                325                 330                 335
Phe Gly Arg Val Phe Lys Gly Val Leu Thr Asp Gly Thr Ala Val Ala
            340                 345                 350
Ile Lys Lys Leu Thr Ser Gly Gly His Gln Gly Asp Lys Glu Phe Leu
        355                 360                 365
Val Glu Val Glu Met Leu Ser Arg Leu His His Arg Asn Leu Val Lys
    370                 375                 380
Leu Ile Gly Tyr Tyr Ser Asn Arg Thr Leu Gly Ala Ser Arg Pro Leu
385                 390                 395                 400
Asp Trp Asp Thr Arg Met Arg Ile Ala Leu Asp Ala Ala Arg Gly Leu
                405                 410                 415
Ala Tyr Leu His Glu Asp Ser Gln Pro Cys Val Ile His Arg Asp Phe
            420                 425                 430
Lys Ala Ser Asn Ile Leu Leu Glu Asp Asp Phe His Ala Lys Val Ser
        435                 440                 445
Asp Phe Gly Leu Ala Lys Gln Ala Pro Glu Gly Arg Thr Asn Tyr Leu
    450                 455                 460
Ser Thr Arg Val Met Gly Thr Phe Gly Tyr Val Ala Pro Glu Tyr Ala
465                 470                 475                 480
Met Thr Gly His Leu Leu Val Lys Ser Asp Val Tyr Ser Tyr Gly Val
                485                 490                 495
Val Leu Leu Glu Leu Leu Thr Gly Arg Arg Pro Val Asp Met Ser Gln
            500                 505                 510
Pro Ser Gly Gln Glu Asn Leu Val Thr Trp Leu Thr Gln Met Phe Pro
        515                 520                 525
Asp Leu Ser Thr Lys Ser Leu Val Ser His Gln Pro Leu Leu Ala Lys
    530                 535                 540
Leu Ser Gly Val Glu Ile Leu Ile Cys Ser Ile Leu Thr Thr Gln Ala
545                 550                 555                 560
Arg Pro Ile Leu Arg Asp Lys Asp Thr Leu Glu Glu Leu Ala Asp Pro
                565                 570                 575
Lys Leu Gly Gly Gln Tyr Pro Lys Asp Asp Phe Val Arg Val Cys Thr
            580                 585                 590
Ile Ala Ala Ala Cys Val Ser Pro Glu Ala Ser Gln Arg Pro Thr Met
        595                 600                 605
Gly Glu Val Val Gln Ser Leu Lys Met Val Gln Arg Ser Glu Phe Gln
    610                 615                 620
Glu Ser Ile Pro Thr Pro Pro Ala Arg Pro Asn Ala Ser Ala Pro Leu
625                 630                 635                 640
Arg Leu Arg Thr Tyr Arg Glu Arg Leu Ser Leu Lys Ile Phe Thr Lys
                645                 650                 655
Gly Gly Asn Ser Gly Glu Gln Asp Pro Ala Thr Met Val Gly Phe Ala
            660                 665                 670
Asp Gln Thr Ala Asp Val Ser Ala Ala Ala Phe Gln Thr Met Tyr Arg
        675                 680                 685
Leu Asn Val Gly Gly Ala Tyr Ile Pro Pro Ser Asn Asp Ser Gly Leu
    690                 695                 700
Thr Arg Pro Trp Tyr Asp Asp Thr Pro Phe Val Gln Gly Pro Leu Arg
705                 710                 715                 720
Gly Leu Val Tyr Asn Ala Gly Pro His Phe His Ile Lys Tyr Pro Ser
                725                 730                 735
Asp Ala Ala Glu Tyr Ala Ala Pro Pro Glu Val Tyr Leu Gly Gly Arg
            740                 745                 750
Ser Met Gly Arg Asp Gln Arg Leu Asn Gln Asn Ser Asn Leu Thr Trp
        755                 760                 765
Ser Leu His Val Glu Cys Asn Phe Thr Tyr Val Val Arg Leu His Phe
    770                 775                 780
Cys Glu Leu Gln Leu Ile His Gly Asn Gln Arg Val Phe Asp Ile Tyr
785                 790                 795                 800
Ile Asn Asn Arg Thr Ala Gln Thr Asp Val Asp Val Leu Glu Met Ala
                805                 810                 815
Thr Glu Arg Gly Val Pro Val Tyr Lys Asp Tyr Ala Val Arg Leu Ser
            820                 825                 830
Asn Asp Thr Ala Asp Glu His Leu Trp Val Ala Val His Pro Ser Val
        835                 840                 845
Met Leu Arg Pro Gln Phe Tyr Asp Ala Ile Leu Asn Gly Leu Glu Val
    850                 855                 860
Phe Lys Val Asn Asn Thr Gly Gly Ser Leu Ala Ser Pro Asp Pro Val
865                 870                 875                 880
Pro Tyr Lys Leu Leu Ala Glu Lys Glu Leu Gly Trp Gly Gly Pro Pro
                885                 890                 895
Glu Phe Ser Thr Asp Asn Pro Ala Asn Met Ala Ser Val Met Gly Gly
            900                 905                 910
Thr Ala Gly Gly Ala Ala Ala Ala Gly Ile Val Ala Ala Ile Cys Val
        915                 920                 925
Val Val Tyr Ser Asn Lys Arg Ser Lys Lys Leu Gly Gly Gly Gly Ala
    930                 935                 940
Asp Ser His Thr Ser Ala Trp Leu Pro Leu Tyr His Ser His Thr Ser
945                 950                 955                 960
Gly Lys Ser Ser Gly His Ile Thr Ala Asn Ile Ala Gly Met Cys Arg
                965                 970                 975
His Phe Ser Phe Ala Glu Ile Lys Ala Ala Thr Lys Asn Phe Ser Asn
            980                 985                 990
Asp Leu Ala Ile Gly Val Gly Gly Phe Gly Val Val Tyr Arg Gly Val
        995                 1000                1005
Val Asp Gly Asp Val Lys Val Ala Val Lys Arg Ser Asn Pro Ser
    1010                1015                1020
Ser Glu Gln Gly Ile Thr Glu Phe Gln Thr Glu Val Glu Met Leu
    1025                1030                1035
Ser Lys Leu Arg His Arg His Leu Val Ser Leu Ile Gly Phe Cys
    1040                1045                1050
Glu Glu Asp Gly Glu Met Val Leu Val Tyr Asp Tyr Met Glu His
    1055                1060                1065
Gly Thr Leu Arg Glu His Leu Tyr His Asn Gly Gly Lys Pro Thr
    1070                1075                1080
Leu Ser Trp Arg His Arg Leu Asp Ile Cys Ile Gly Ala Ala Arg
    1085                1090                1095
Gly Leu His Tyr Leu His Thr Gly Glu Ser His Val Ser Thr Val
    1100                1105                1110
Val Lys Gly Ser Phe Gly Tyr Leu Asp Pro Glu Tyr Tyr Arg Arg
    1115                1120                1125
Gln Gln Leu Thr Asp Lys Ser Asp Val Tyr Ser Phe Gly Val Val
    1130                1135                1140
Leu Phe Glu Val Leu Met Ala Arg Pro Ala Leu Asp Pro Ala Leu
    1145                1150                1155
Pro Arg Asp Gln Val Ser Leu Ala Asp Tyr Ala Leu Ala Cys Lys
    1160                1165                1170
Arg Gly Gly Ala Leu Pro Asp Val Val Asp Pro Ala Ile Arg Asp
    1175                1180                1185
Gln Ile Ala Pro Glu Cys Leu Ala Lys Phe Ala Asp Thr Ala Glu
    1190                1195                1200
Lys Cys Leu Ser Glu Asn Gly Thr Glu Arg Pro Thr Met Gly Asp
    1205                1210                1215
Val Leu Trp Asn Leu Glu Ser Ala Met His Phe Gln Asp Ala Phe
    1220                1225                1230
Asp Ala Ala Ala Gly Arg Pro Val Pro Ala Leu Asp Ala Ala Ala
    1235                1240                1245
Gly Ser Ser Ser His Leu Asp Asp Gly Ser Thr Ala Ser Ile Asn
    1250                1255                1260
Thr Leu Ala Thr Ser Ser Thr Ser His Pro His Glu Pro Cys Val
    1265                1270                1275
Asp Val Val Leu Glu Pro Asp Asp Val Val Ala Glu Arg Ala Thr
    1280                1285                1290
Phe Ser Gln Leu Val Gln Pro Thr Gly Arg
    1295                1300
<210>35
<211>2463
<212>DNA
<213>稻
<400>35
atggcgcgga tacggcgcgc gagctccgga cgagctcaac tctcaggccg tgagaatttg    60
ggtttggtgt cgcgggaatg gtggtcatac tactatgtag gattcagtgc tctctgctgc    120
cgtggcgata ctggatatct ggaatctgat cgaagaacct ctgatctaag tttgagtcac    180
tacaaatgga tttgtgatat tgattatcaa attcaggcca atggatcctc ctttacaaga    240
aaatggtcat tactgaactc ttgttactgg aatgatgaga attcctgcat tgctgggttt    300
gcggaaaggc ttttggaaga tgctcgaagg aaaaccttct taaatttttt ggctgtggta    360
tttactctgg aattgattac cagaatcaat ttgattgccc aaacatcagc tctaaatgtg    420
gttgcccctg ctatatctcc atctcaaagt tggagaccag ttcgctccat gttgtcaaaa    480
gctaaagttg acattagtat ttcagtcagc gaacaaagac gaaagaagct atattcatca    540
ccagctactc tatctgtgca ccctccaatg tcagcgccaa gctatagctc catttctgac    600
atgtcagata atttggtgca gcataacaga cgctcagaag cagaaatttc tactcatgta    660
gatgctgcgc ctcctgatgc agcctcaaat actagtgcag ctccttctgg attagtacaa    720
cctccagtat ctcctcacaa tgcatgttgt tcacataaca tggtacaaaa gagagggagc    780
caagattgcc attgtgttta cccagtaaga gttgagcttt ttctccgaaa tgtttcactg    840
acgtcaaatt ggagcgatga atttctgggg gaacttgctt ctcaactcag tctgagggtt    900
actcagtttg agattgtaaa tttctatgtt gttggggctt ctgggctaaa catcacaatg    960
tatatagctc cccatacagg aattagtttc tcagccgacc aagttaccgc aatgaattat    1020
tcacttagtc agcatacagt tcagatcaac cctgtactag ttggtgacta caatcttctt    1080
aatttaacct ggttcaggcc actggttcta gctcctgctc caacattcac aatatcacct    1140
aaaccctctc catctcaagc atctacagta ccaagacaca gtgcggatac cagcaatgaa    1200
aaacacatga gcttgattac tatcatttgc atatttattg gtgctctaat tgctgtcttg    1260
gtgattgcca tgtttatttg cttctgcaaa ttaaggaaag ggaaaaggaa ggttcctcca    1320
gttgagacac ccaagcaaag aacaccagat gcggtttctg cagtggactc acttcctcgc    1380
ccaacaagta caaggttcct tgcatatgat gaactgaaag aagcaaccaa caactttgat    1440
ccgtcaagta tgcttggaga aggaggtttt ggccgtgtct ttaaaggggt actaactgat    1500
ggcactgccg ttgctataaa gaagcttact agtggagggc accaaggaga taaggaattt    1560
ctagttgaag tggagatgct gagcaggttg caccaccgaa accttgtgaa actcattggt    1620
tactatagta accgtgagtc atcacagaac ctactgtgct atgagcttgt tcctaatgga    1680
agcctagagg cttggcttca tggtacattg ggagctagcc gccccttgga ctgggacact    1740
agaatgagga tagcactaga tgctgccagg ggattggcat accttcatga ggattctcag    1800
ccttgcgtaa tccacaggga tttcaaggct tctaatatat tgcttgagga tgactttcat    1860
gctaaagtgt ctgattttgg tttggccaaa caggcaccgg aaggttgcac aaattatctc    1920
tcaacacgtg ttatgggaac attcgggtat gtagcaccag agtatgcaat gacaggacac    1980
ttgcttgtaa aaagcgatgt atatagctat ggagttgttc tacttgaact acttactggg    2040
aggaggcctg tggatatgtc acaaccttct ggccaggaaa atctagtgac atgggcacga    2100
ccaattttac gagataaaga tacgctagaa gaactagctg atcccaagct tggtggccag    2160
tatccaaaag atgattttgt gcgagtatgc acaattgcag ccgcctgtgt ttcaccggag    2220
gcaagccaaa ggccaacaat gggcgaggtg gtgcagtcac tgaagatggt ccaacgctct    2280
gagttccagg aatccatacc aacacctcca gcacgaccca atgttaggca gtcctcaacc    2340
acctatgaat ctgatggcac ttcatccatg ttctcttctg gacccttttc aggcctcagc    2400
ccctttgaga ctgagaacat atcgagaacg gctttctctg aagatcttca cgaagggcgg    2460
taa                                                                  2463
<210>36
<211>820
<212>PRT
<213>稻
<400>36
Met Ala Arg Ile Arg Arg Ala Ser Ser Gly Arg Ala Gln Leu Ser Gly
1               5                   10                  15
Arg Glu Asn Leu Gly Leu Val Ser Arg Glu Trp Trp Ser Tyr Tyr Tyr
            20                  25                  30
Val Gly Phe Ser Ala Leu Cys Cys Arg Gly Asp Thr Gly Tyr Leu Glu
        35                  40                  45
Ser Asp Arg Arg Thr Ser Asp Leu Ser Leu Ser His Tyr Lys Trp Ile
    50                  55                  60
Cys Asp Ile Asp Tyr Gln Ile Gln Ala Asn Gly Ser Ser Phe Thr Arg
65                  70                  75                  80
Lys Trp Ser Leu Leu Asn Ser Cys Tyr Trp Asn Asp Glu Asn Ser Cys
                85                  90                  95
Ile Ala Gly Phe Ala Glu Arg Leu Leu Glu Asp Ala Arg Arg Lys Thr
            100                 105                 110
Phe Leu Asn Phe Leu Ala Val Val Phe Thr Leu Glu Leu Ile Thr Arg
        115                 120                 125
Ile Asn Leu Ile Ala Gln Thr Ser Ala Leu Asn Val Val Ala Pro Ala
    130                 135                 140
Ile Ser Pro Ser Gln Ser Trp Arg Pro Val Arg Ser Met Leu Ser Lys
145                 150                 155                 160
Ala Lys Val Asp Ile Ser Ile Ser Val Ser Glu Gln Arg Arg Lys Lys
                165                 170                 175
Leu Tyr Ser Ser Pro Ala Thr Leu Ser Val His Pro Pro Met Ser Ala
            180                 185                 190
Pro Ser Tyr Ser Ser Ile Ser Asp Met Ser Asp Asn Leu Val Gln His
        195                 200                 205
Asn Arg Arg Ser Glu Ala Glu Ile Ser Thr His Val Asp Ala Ala Pro
    210                 215                 220
Pro Asp Ala Ala Ser Asn Thr Ser Ala Ala Pro Ser Gly Leu Val Gln
225                 230                 235                 240
Pro Pro Val Ser Pro His Asn Ala Cys Cys Ser His Asn Met Val Gln
                245                 250                 255
Lys Arg Gly Ser Gln Asp Cys His Cys Val Tyr Pro Val Arg Val Glu
            260                 265                 270
Leu Phe Leu Arg Asn Val Ser Leu Thr Ser Asn Trp Ser Asp Glu Phe
        275                 280                 285
Leu Gly Glu Leu Ala Ser Gln Leu Ser Leu Arg Val Thr Gln Phe Glu
    290                 295                 300
Ile Val Asn Phe Tyr Val Val Gly Ala Ser Gly Leu Asn Ile Thr Met
305                 310                 315                 320
Tyr Ile Ala Pro His Thr Gly Ile Ser Phe Ser Ala Asp Gln Val Thr
                325                 330                 335
Ala Met Asn Tyr Ser Leu Ser Gln His Thr Val Gln Ile Asn Pro Val
            340                 345                 350
Leu Val Gly Asp Tyr Asn Leu Leu Asn Leu Thr Trp Phe Arg Pro Leu
        355                 360                 365
Val Leu Ala Pro Ala Pro Thr Phe Thr Ile Ser Pro Lys Pro Ser Pro
    370                 375                 380
Ser Gln Ala Ser Thr Val Pro Arg His Ser Ala Asp Thr Ser Asn Glu
385                 390                 395                 400
Lys His Met Ser Leu Ile Thr Ile Ile Cys Ile Phe Ile Gly Ala Leu
                405                 410                 415
Ile Ala Val Leu Val Ile Ala Met Phe Ile Cys Phe Cys Lys Leu Arg
            420                 425                 430
Lys Gly Lys Arg Lys Val Pro Pro Val Glu Thr Pro Lys Gln Arg Thr
        435                 440                 445
Pro Asp Ala Val Ser Ala Val Asp Ser Leu Pro Arg Pro Thr Ser Thr
    450                 455                 460
Arg Phe Leu Ala Tyr Asp Glu Leu Lys Glu Ala Thr Asn Asn Phe Asp
465                 470                 475                 480
Pro Ser Ser Met Leu Gly Glu Gly Gly Phe Gly Arg Val Phe Lys Gly
                485                 490                 495
Val Leu Thr Asp Gly Thr Ala Val Ala Ile Lys Lys Leu Thr Ser Gly
            500                 505                 510
Gly His Gln Gly Asp Lys Glu Phe Leu Val Glu Val Glu Met Leu Ser
        515                 520                 525
Arg Leu His His Arg Asn Leu Val Lys Leu Ile Gly Tyr Tyr Ser Asn
    530                 535                 540
Arg Glu Ser Ser Gln Asn Leu Leu Cys Tyr Glu Leu Val Pro Asn Gly
545                 550                 555                 560
Ser Leu Glu Ala Trp Leu His Gly Thr Leu Gly Ala Ser Arg Pro Leu
                565                 570                 575
Asp Trp Asp Thr Arg Met Arg Ile Ala Leu Asp Ala Ala Arg Gly Leu
            580                 585                 590
Ala Tyr Leu His Glu Asp Ser Gln Pro Cys Val Ile His Arg Asp Phe
        595                 600                 605
Lys Ala Ser Asn Ile Leu Leu Glu Asp Asp Phe His Ala Lys Val Ser
    610                 615                 620
Asp Phe Gly Leu Ala Lys Gln Ala Pro Glu Gly Cys Thr Asn Tyr Leu
625                 630                 635                 640
Ser Thr Arg Val Met Gly Thr Phe Gly Tyr Val Ala Pro Glu Tyr Ala
                645                 650                 655
Met Thr Gly His Leu Leu Val Lys Ser Asp Val Tyr Ser Tyr Gly Val
            660                 665                 670
Val Leu Leu Glu Leu Leu Thr Gly Arg Arg Pro Val Asp Met Ser Gln
        675                 680                 685
Pro Ser Gly Gln Glu Asn Leu Val Thr Trp Ala Arg Pro Ile Leu Arg
    690                 695                 700
Asp Lys Asp Thr Leu Glu Glu Leu Ala Asp Pro Lys Leu Gly Gly Gln
705                 710                 715                 720
Tyr Pro Lys Asp Asp Phe Val Arg Val Cys Thr Ile Ala Ala Ala Cys
                725                 730                 735
Val Ser Pro Glu Ala Ser Gln Arg Pro Thr Met Gly Glu Val Val Gln
            740                 745                 750
Ser Leu Lys Met Val Gln Arg Ser Glu Phe Gln Glu Ser Ile Pro Thr
        755                 760                 765
Pro Pro Ala Arg Pro Asn Val Arg Gln Ser Ser Thr Thr Tyr Glu Ser
    770                 775                 780
Asp Gly Thr Ser Ser Met Phe Ser Ser Gly Pro Phe Ser Gly Leu Ser
785                 790                 795                 800
Pro Phe Glu Thr Glu Asn Ile Ser Arg Thr Ala Phe Ser Glu Asp Leu
                805                 810                 815
His Glu Gly Arg
    820
<210>37
<211>2670
<212>DNA
<213>稻
<400>37
atggggcggc gtggaggagg aggacgagcg ggaggcgcgt ggattggtgg ctgtgtactt    60
gcgctcgccg ccaccttggt cgtctgcgtg ctcgtgatcc gtggagctgg aggactaaat    120
gtaaaaccac ctgcagcaac tagcagacgt gttaacatac agcaggaact atatgcacca    180
agcccaacga tcagccacag aggtcttgct attcctccac ttccaacaac ttcatcccca    240
gttttcccac ctcccatcag atcttatcct ccacttcctg caaataagcc ataccccaat    300
agtccagttg tggcacctcc aaagggaagg catcaccatt ctttgcctgt aaataatacc    360
cgtgtaaaag gacctgccta ttctccttca aattctccca gtatccatag aaaacatggc    420
attccagttg ctgcacctcc aaagcaacat tccagcaatt taccaccttc acatcatagg    480
ccccacaaag gatcctttcc tgtcataagc cctactccac ataaagctga taatgcttct    540
gcgacgaaac atggacgttc tggcttacac catagtcctg cacctgcacc tgtaggcttg    600
cctccatctg aaggaaatgc acgaggaaat cctgcgtatg caccacgtca tccccatgaa    660
tatcactcgc cttcaaattc tccagaacct ggtctaccac ctgtgaatcc gcctgacagt    720
catgcattta aaaagcccaa gagtttggca ccagcacccc aatcatttcc gccaccgcct    780
ctgagttcat attgcatggc gttaaattgt caagatcctc tgaccaatag tctccctgga    840
actacatgtc tttgtgtgtg gccaataaaa gttgagcttc gtttaggtat agctttgtac    900
acattctttg cattggtatc agaacttgca caagatattg catctggagt gctcatgaaa    960
caaagtcaag ttcgtgtaat gggagcaaat gctgcaactg aggacccaga gaaaacagtt    1020
gtccttattg atcttgtgcc actgggagaa aaatttgaca aggcaacagc acttttagta    1080
tttgaaaggt tttggcacaa gcaggtcaac ataaactcta tgcattttgg aaactatgat    1140
gtgttatatg ttacctacca aggtcttcct ccgtcgccac caacagctcc cgggatgaac    1200
aatggtctta gcaatgttaa tgatccaagg ttgcatccac ttgctgttga tgtgggaaac    1260
cacagagaaa caaaaagcag gggcataatt gttataattg ttctttcaag tgtctttgct    1320
tttattttat gttctggagc tgcgttggta atttgtttca agattagaaa ccgcaaccat    1380
ttaactgaag agtcacctat gccaccgaag cctgcaggtc ctgggtctgc agttgttggg    1440
agcaggctag gaagcagacc tatttcagca tctccatctt tcagctcaag catagtgaca    1500
tataaaggga cagcgaaaac atttagcttg attgagatgg aaagagctac acaaagattt    1560
gacaactcca gaattattgg cgagggtggt tttggacgtg tttatgaagg tattcttgag    1620
gatggagaac gggttgctgt caaaattctt aagagggacg accagcaagg tacacgggaa    1680
tttttagctg aggttgagat gcttagccga ttgcatcaca gaaacctggt taagttgata    1740
ggtatatgca cagaagaaca tatccggtgt cttgtgtatg agcttgttcc aaatggtagt    1800
gtggaatctc acttgcacgg atcagataag ggaactgctc cactttattg ggatgctagg    1860
cttaaaattg cacttggtgc tgcacgtgct cttgcttatt tgcatgaaga ttctagtccc    1920
cgtgtcatac accgtgactt caagtcaagt aacatcttat tggaacatga cttcaccccc    1980
aaggtgtcag actttggcct agcaagaaca gccataggtg aggggaatga gcatatttca    2040
actcgtgtta tgggaacttt cgggtatgtt gctcctgaat acgcaatgac tgggcatctt    2100
ctagtaaaga gtgatgtcta cagctatggt gtcgtcctcc ttgagcttct taccggaagg    2160
aaaccggtgg atattttgag acctccaggg caagaaaatt tagttgcatg ggcttgtcct    2220
tttcttacta gcagagatgg cttggaaaca ataattgatc catcacttgg aaatagcatc    2280
ctatttgaca gcattgcaaa agtagcagct attgcttcta tgtgcgtgca gcctgaggtg    2340
gatcagcgcc catttatggg tgaagttgtt caagctttga agttggtatg cgatgaaggc    2400
agcgagttca atgaatcaag aagtttcagc caagatttac atattcagga ttctgggatt    2460
ataagtagag caagcctgga tgtggacgta gaacctgttg tatctgctga gctgttcaat    2520
gcatcagcac attatgacac tcttgatgca tctggttctt ttcgacgata ttcaagttca    2580
ggtcctctta gggtaggtag aaccgggcac aataggggta gctcaagcga gcactgtggt    2640
acacaaagat tcaggataga ttcagagtag                                     2670
<210>38
<211>889
<212>PRT
<213>稻
<400>38
Met Gly Arg Arg Gly Gly Gly Gly Arg Ala Gly Gly Ala Trp Ile Gly
1               5                   10                  15
Gly Cys Val Leu Ala Leu Ala Ala Thr Leu Val Val Cys Val Leu Val
            20                  25                  30
Ile Arg Gly Ala Gly Gly Leu Asn Val Lys Pro Pro Ala Ala Thr Ser
        35                  40                  45
Arg Arg Val Asn Ile Gln Gln Glu Leu Tyr Ala Pro Ser Pro Thr Ile
    50                  55                  60
Ser His Arg Gly Leu Ala Ile Pro Pro Leu Pro Thr Thr Ser Ser Pro
65                  70                  75                  80
Val Phe Pro Pro Pro Ile Arg Ser Tyr Pro Pro Leu Pro Ala Asn Lys
                85                  90                  95
Pro Tyr Pro Asn Ser Pro Val Val Ala Pro Pro Lys Gly Arg His His
            100                 105                 110
His Ser Leu Pro Val Asn Asn Thr Arg Val Lys Gly Pro Ala Tyr Ser
        115                 120                 125
Pro Ser Asn Ser Pro Ser Ile His Arg Lys His Gly Ile Pro Val Ala
    130                 135                 140
Ala Pro Pro Lys Gln His Ser Ser Asn Leu Pro Pro Ser His His Arg
145                 150                 155                 160
Pro His Lys Gly Ser Phe Pro Val Ile Ser Pro Thr Pro His Lys Ala
                165                 170                 175
Asp Asn Ala Ser Ala Thr Lys His Gly Arg Ser Gly Leu His His Ser
            180                 185                 190
Pro Ala Pro Ala Pro Val Gly Leu Pro Pro Ser Glu Gly Asn Ala Arg
        195                 200                 205
Gly Asn Pro Ala Tyr Ala Pro Arg His Pro His Glu Tyr His Ser Pro
    210                 215                 220
Ser Asn Ser Pro Glu Pro Gly Leu Pro Pro Val Asn Pro Pro Asp Ser
225                 230                 235                 240
His Ala Phe Lys Lys Pro Lys Ser Leu Ala Pro Ala Pro Gln Ser Phe
                245                 250                 255
Pro Pro Pro Pro Leu Ser Ser Tyr Cys Met Ala Leu Asn Cys Gln Asp
            260                 265                 270
Pro Leu Thr Asn Ser Leu Pro Gly Thr Thr Cys Leu Cys Val Trp Pro
        275                 280                 285
Ile Lys Val Glu Leu Arg Leu Gly Ile Ala Leu Tyr Thr Phe Phe Ala
    290                 295                 300
Leu Val Ser Glu Leu Ala Gln Asp Ile Ala Ser Gly Val Leu Met Lys
305                 310                 315                 320
Gln Ser Gln Val Arg Val Met Gly Ala Asn Ala Ala Thr Glu Asp Pro
                325                 330                 335
Glu Lys Thr Val Val Leu Ile Asp Leu Val Pro Leu Gly Glu Lys Phe
            340                 345                 350
Asp Lys Ala Thr Ala Leu Leu Val Phe Glu Arg Phe Trp His Lys Gln
        355                 360                 365
Val Asn Ile Asn Ser Met His Phe Gly Asn Tyr Asp Val Leu Tyr Val
    370                 375                 380
Thr Tyr Gln Gly Leu Pro Pro Ser Pro Pro Thr Ala Pro Gly Met Asn
385                 390                 395                 400
Asn Gly Leu Ser Asn Val Asn Asp Pro Arg Leu His Pro Leu Ala Val
                405                 410                 415
Asp Val Gly Asn His Arg Glu Thr Lys Ser Arg Gly Ile Ile Val Ile
            420                 425                 430
Ile Val Leu Ser Ser Val Phe Ala Phe Ile Leu Cys Ser Gly Ala Ala
        435                 440                 445
Leu Val Ile Cys Phe Lys Ile Arg Asn Arg Asn His Leu Thr Glu Glu
    450                 455                 460
Ser Pro Met Pro Pro Lys Pro Ala Gly Pro Gly Ser Ala Val Val Gly
465                 470                 475                 480
Ser Arg Leu Gly Ser Arg Pro Ile Ser Ala Ser Pro Ser Phe Ser Ser
                485                 490                 495
Ser Ile Val Thr Tyr Lys Gly Thr Ala Lys Thr Phe Ser Leu Ile Glu
            500                 505                 510
Met Glu Arg Ala Thr Gln Arg Phe Asp Asn Ser Arg Ile Ile Gly Glu
        515                 520                 525
Gly Gly Phe Gly Arg Val Tyr Glu Gly Ile Leu Glu Asp Gly Glu Arg
    530                 535                 540
Val Ala Val Lys Ile Leu Lys Arg Asp Asp Gln Gln Gly Thr Arg Glu
545                 550                 555                 560
Phe Leu Ala Glu Val Glu Met Leu Ser Arg Leu His His Arg Asn Leu
                565                 570                 575
Val Lys Leu Ile Gly Ile Cys Thr Glu Glu His Ile Arg Cys Leu Val
            580                 585                 590
Tyr Glu Leu Val Pro Asn Gly Ser Val Glu Ser His Leu His Gly Ser
        595                 600                 605
Asp Lys Gly Thr Ala Pro Leu Tyr Trp Asp Ala Arg Leu Lys Ile Ala
    610                 615                 620
Leu Gly Ala Ala Arg Ala Leu Ala Tyr Leu His Glu Asp Ser Ser Pro
625                 630                 635                 640
Arg Val Ile His Arg Asp Phe Lys Ser Ser Asn Ile Leu Leu Glu His
                645                 650                 655
Asp Phe Thr Pro Lys Val Ser Asp Phe Gly Leu Ala Arg Thr Ala Ile
            660                 665                 670
Gly Glu Gly Asn Glu His Ile Ser Thr Arg Val Met Gly Thr Phe Gly
        675                 680                 685
Tyr Val Ala Pro Glu Tyr Ala Met Thr Gly His Leu Leu Val Lys Ser
    690                 695                 700
Asp Val Tyr Ser Tyr Gly Val Val Leu Leu Glu Leu Leu Thr Gly Arg
705                 710                 715                 720
Lys Pro Val Asp Ile Leu Arg Pro Pro Gly Gln Glu Asn Leu Val Ala
                725                 730                 735
Trp Ala Cys Pro Phe Leu Thr Ser Arg Asp Gly Leu Glu ThrIleIle
            740                 745                 750
Asp Pro Ser Leu Gly Asn Ser Ile Leu Phe Asp Ser Ile Ala Lys Val
        755                 760                 765
Ala Ala Ile Ala Ser Met Cys Val Gln Pro Glu Val Asp Gln Arg Pro
    770                 775                 780
Phe Met Gly Glu Val Val Gln Ala Leu Lys Leu Val Cys Asp Glu Gly
785                 790                 795                 800
Ser Glu Phe Asn Glu Ser Arg Ser Phe Ser Gln Asp Leu His Ile Gln
                805                 810                 815
Asp Ser Gly Ile Ile Ser Arg Ala Ser Leu Asp Val Asp Val Glu Pro
            820                 825                 830
Val Val Ser Ala Glu Leu Phe Asn Ala Ser Ala His Tyr Asp Thr Leu
        835                 840                 845
Asp Ala Ser Gly Ser Phe Arg Arg Tyr Ser Ser Ser Gly Pro Leu Arg
    850                 855                 860
Val Gly Arg Thr Gly His Asn Arg Gly Ser Ser Ser Glu His Cys Gly
865                 870                 875                 880
Thr Gln Arg Phe Arg Ile Asp Ser Glu
                885
<210>39
<211>2913
<212>DNA
<213>稻
<400>39
atgcggtcgc tcgcttgttg cgcggtgctt cttctcgctt cggttcttgg atctacaggt    60
actgatctgg gtccttctcc tgtggtcgct aactcgccag atgctcaaga tcaaacttct    120
agccctcctg aacctacaat cgccctcggt ccagtaactc ttccaacagg ttgctctgaa    180
tttctaatgt ggtgtggcat tatggctctc aagatcataa ccagcattga caattgtcct    240
tacaattgct ttgtctcagc accctctgct ccatcagcaa gccctcctgt ggcgaagggc    300
gctgtcagcc cagctgttcc cactcgacca caaaatgcgc ctactccagt aacaccccct    360
aaagaatata atgcgcctcc tccagttgag cttacgcctc ctgctcccac tcatgtggcg    420
ccagtagctc ccccgcaagc tgcagttgaa aatcctgcac cagtgcttcc tgggacacct    480
gctttgttgc cttctgttca ggctcctgct ccatctgtgg ccaggaatcc taatctaccg    540
atagtgcaac ctccttctgt gaacaatcca ccaagcggac caattggatc agggaatggc    600
gtccctccgt atccaccacc tcaaagaagt ttacctgcca ttcctccttc cacttcagga    660
gttccgcgag aaagtgtaaa acctccagtt gcaccaccta ttattgcaca agcaccacgt    720
cagcaagcac tggcaccaag tagtgaccat agcaatggaa actcagtgcc cccagcaaat    780
acatcacctc cccataagaa tagtcatatt ccacgtgcac tgccaccaaa ggaatccagt    840
agtcaaactg gcacagctca caaaccgcca attagagggc ctcatatttc tccaaccatg    900
ccaccaatcc ctccccaacc agggccgaaa gcaccatcag cccatcctat ttgggcatta    960
cctccaccac cgcctaatct agattgcaat tcattagcat gcccagagcc tctaacagat    1020
ccacctgcgg gagccccatg tgtttgtgtt ctaccaatca aagttggagt ccgcttaagt    1080
gttgatctgt attcattctt tccattggta tctgattttg cggaagaagt gtcatctggg    1140
gtaaatatgg cacagagaca ggttcgtgtt atgggtgcaa atgtagctgg tgatcagcct    1200
gacaagacag tagttcttgt tgacctagta ccaatgcaag tgaagtttga caatgctact    1260
gcttttttaa cgtttgaaaa cttatggagc aaaaaaattt ccctaaaacc atcagttttt    1320
ggggactacg agattctgta tgttgtatat ccagggcttc ctccttctcc accttcagca    1380
ccggaaagtg ttggtgacgg ggcatttgga aacaacagaa atgcaagggc aatgaagcct    1440
ctcggggttg atgtaggcag gcccaaaaaa agagtcaacg gcagcctaat tgctattgcc    1500
gtcttgtcta ctgttatagc attgattatt tgcactctag ctgcatggtt gctgataatc    1560
agattcaggg gttcggatgg cttggctcaa agatttccac atagcgcact tccaaaattt    1620
tccagatcat ctggtacagg tcaaacactg ttagctggtc gctatagttc accatcaggt    1680
ccatcaggtt cattgggctc aagtatcgca acatatgcag gacaggcaaa gacattcaaa    1740
tttgctgaga ttgagaaggc cacaaacagc tttgatgatt caacagtact tggagagggt    1800
ggcttcggat gtgtctacca gggcacgctt gaagatggaa ccagggttgc agtaaaggtt    1860
ctgaagaggt atgatggcca aggcgagaga gagttcttgg ctgaggttga gatgctggga    1920
cgcttgcatc accgaaattt ggtcaagttg ttaggcatat gtgtagagga gaacgcaaga    1980
tgtctggttt atgaacttat tccgaatggc agtgtagaat cccatttgca tggagtggat    2040
cttgagacag caccactcga ttggaatgcc cgcatgaaga tagccttggg ggctgcacga    2100
gctcttgcat atttacacga agattcaagc ccttgtgtga ttcatcgtga ttttaagtca    2160
agcaacatcc tattggagca tgatttcaca ccgaaagtgt ctgatttcgg actggccagg    2220
actgcaaggg gggaggggaa ccagcacatc tccactcgtg tcatgggaac atttggatat    2280
gttgcaccgg agtatgccat gacaggacat ctccttgtca agagcgatgt gtacagctat    2340
ggagtagtgt tgcttgagct cctcaccggt agaaagccag tggacatgtc taggcccggg    2400
gggcaagaaa acctagtttc atgggctcgc ccgcttctga ccaatgtggt aagcctacgt    2460
caagctgttg atccacttct tggccctaac gtacccctgg acaatgtcgc aaaagcagct    2520
gccatcgcat caatgtgtgt acaacctgag gttgcgcatc gcccgagcat gggtgaagta    2580
gtgcaggcct taaaacttgt ttgcagtgac ggtgatgagg gcctcggatc aggaagtttc    2640
agccaggaat tggcggcaca agctgcagca atctatgatg taactggcat ggaagctgag    2700
agggtgctgt tatctgagat gtttggctca acccctgtct tcactcccgc tgcggattca    2760
ggttctttcc gaaagcagtc cagctcaggt ccactgatga caggcaagaa cagaaagttc    2820
tggcagagat tgcgaagcct atcaagaggg agtatgagtg agcatggtgc ctcaccagat    2880
tttgagacgc gctcgcagtg tagtaatagg tga                                 2913
<210>40
<211>970
<212>PRT
<213>稻
<400>40
Met Arg Ser Leu Ala Cys Cys Ala Val Leu Leu Leu Ala Ser Val Leu
1               5                   10                  15
Gly Ser Thr Gly Thr Asp Leu Gly Pro Ser Pro Val Val Ala Asn Ser
            20                  25                  30
Pro Asp Ala Gln Asp Gln Thr Ser Ser Pro Pro Glu Pro Thr Ile Ala
        35                  40                  45
Leu Gly Pro Val Thr Leu Pro Thr Gly Cys Ser Glu Phe Leu Met Trp
    50                  55                  60
Cys Gly Ile Met Ala Leu Lys Ile Ile Thr Ser Ile Asp Asn Cys Pro
65                  70                  75                  80
Tyr Asn Cys Phe Val Ser Ala Pro Ser Ala Pro Ser Ala Ser Pro Pro
                85                  90                  95
Val Ala Lys Gly Ala Val Ser Pro Ala Val Pro Thr Arg Pro Gln Asn
            100                 105                 110
Ala Pro Thr Pro Val Thr Pro Pro Lys Glu Tyr Asn Ala Pro Pro Pro
        115                 120                 125
Val Glu Leu Thr Pro Pro Ala Pro Thr His Val Ala Pro Val Ala Pro
    130                 135                 140
Pro Gln Ala Ala Val Glu Asn Pro Ala Pro Val Leu Pro Gly Thr Pro
145                 150                 155                 160
Ala Leu Leu Pro Ser Val Gln Ala Pro Ala Pro Ser Val Ala Arg Asn
                165                 170                 175
Pro Asn Leu Pro Ile Val Gln Pro Pro Ser Val Asn Asn Pro Pro Ser
            180                 185                 190
Gly Pro Ile Gly Ser Gly Asn Gly Val Pro Pro Tyr Pro Pro Pro Gln
        195                 200                 205
Arg Ser Leu Pro Ala Ile Pro Pro Ser Thr Ser Gly Val Pro Arg Glu
    210                 215                 220
Ser Val Lys Pro Pro Val Ala Pro Pro Ile Ile Ala Gln Ala Pro Arg
225                 230                 235                 240
Gln Gln Ala Leu Ala Pro Ser Ser Asp His Ser Asn Gly Asn Ser Val
                245                 250                 255
Pro Pro Ala Asn Thr Ser Pro Pro His Lys Asn Ser His Ile Pro Arg
            260                 265                 270
Ala Leu Pro Pro Lys Glu Ser Ser Ser Gln Thr Gly Thr Ala His Lys
        275                 280                 285
Pro Pro Ile Arg Gly Pro His Ile Ser Pro Thr Met Pro Pro Ile Pro
    290                 295                 300
Pro Gln Pro Gly Pro Lys Ala Pro Ser Ala His Pro Ile Trp Ala Leu
305                 310                 315                 320
Pro Pro Pro Pro Pro Asn Leu Asp Cys Asn Ser Leu Ala Cys Pro Glu
                325                 330                 335
Pro Leu Thr Asp Pro Pro Ala Gly Ala Pro Cys Val Cys Val Leu Pro
            340                 345                 350
Ile Lys Val Gly Val Arg Leu Ser Val Asp Leu Tyr Ser Phe Phe Pro
        355                 360                 365
Leu Val Ser Asp Phe Ala Glu Glu Val Ser Ser Gly Val Asn Met Ala
    370                 375                 380
Gln Arg Gln Val Arg Val Met Gly Ala Asn Val Ala Gly Asp Gln Pro
385                 390                 395                 400
Asp Lys Thr Val Val Leu Val Asp Leu Val Pro Met Gln Val Lys Phe
                405                 410                 415
Asp Asn Ala Thr Ala Phe Leu Thr Phe Glu Asn Leu Trp Ser Lys Lys
            420                 425                 430
Ile Ser Leu Lys Pro Ser Val Phe Gly Asp Tyr Glu Ile Leu Tyr Val
        435                 440                 445
Val Tyr Pro Gly Leu Pro Pro Ser Pro Pro Ser Ala Pro Glu Ser Val
    450                 455                 460
Gly Asp Gly Ala Phe Gly Asn Asn Arg Asn Ala Arg Ala Met Lys Pro
465                 470                 475                 480
Leu Gly Val Asp Val Gly Arg Pro Lys Lys Arg Val Asn Gly Ser Leu
                485                 490                 495
Ile Ala Ile Ala Val Leu Ser Thr Val Ile Ala Leu Ile Ile Cys Thr
            500                 505                 510
Leu Ala Ala Trp Leu Leu Ile Ile Arg Phe Arg Gly Ser Asp Gly Leu
        515                 520                 525
Ala Gln Arg Phe Pro His Ser Ala Leu Pro Lys Phe Ser Arg Ser Ser
    530                 535                 540
Gly Thr Gly Gln Thr Leu Leu Ala Gly Arg Tyr Ser Ser Pro Ser Gly
545                 550                 555                 560
Pro Ser Gly Ser Leu Gly Ser Ser Ile Ala Thr Tyr Ala Gly Gln Ala
                565                 570                 575
Lys Thr Phe Lys Phe Ala Glu Ile Glu Lys Ala Thr Asn Ser Phe Asp
            580                 585                 590
Asp Ser Thr Val Leu Gly Glu Gly Gly Phe Gly Cys Val Tyr Gln Gly
        595                 600                 605
Thr Leu Glu Asp Gly Thr Arg Val Ala Val Lys Val Leu Lys Arg Tyr
    610                 615                 620
Asp Gly Gln Gly Glu Arg Glu Phe Leu Ala Glu Val Glu Met Leu Gly
625                 630                 635                 640
Arg Leu His His Arg Asn Leu Val Lys Leu Leu GlyIle Cys Val Glu
                645                 650                 655
Glu Asn Ala Arg Cys Leu Val Tyr Glu Leu Ile Pro Asn Gly Ser Val
            660                 665                 670
Glu Ser His Leu His Gly Val Asp Leu Glu Thr Ala Pro Leu Asp Trp
        675                 680                 685
Asn Ala Arg Met Lys Ile Ala Leu Gly Ala Ala Arg Ala Leu Ala Tyr
    690                 695                 700
Leu His Glu Asp Ser Ser Pro Cys Val Ile His Arg Asp Phe Lys Ser
705                 710                 715                 720
Ser Asn Ile Leu Leu Glu His Asp Phe Thr Pro Lys Val Ser Asp Phe
                725                 730                 735
Gly Leu Ala Arg Thr Ala Arg Gly Glu Gly Asn Gln His Ile Ser Thr
            740                 745                 750
Arg Val Met Gly Thr Phe Gly Tyr Val Ala Pro Glu Tyr Ala Met Thr
        755                 760                 765
Gly His Leu Leu Val Lys Ser Asp Val Tyr Ser Tyr Gly Val Val Leu
    770                 775                 780
Leu Glu Leu Leu Thr Gly Arg Lys Pro Val Asp Met Ser Arg Pro Gly
785                 790                 795                 800
Gly Gln Glu Asn Leu Val Ser Trp Ala Arg Pro Leu Leu Thr Asn Val
                805                 810                 815
Val Ser Leu Arg Gln Ala Val Asp Pro Leu Leu Gly Pro Asn Val Pro
            820                 825                 830
Leu Asp Asn Val Ala Lys Ala Ala Ala Ile Ala Ser Met Cys Val Gln
        835                 840                 845
Pro Glu Val Ala His Arg Pro Ser Met Gly Glu Val Val Gln Ala Leu
    850                 855                 860
Lys Leu Val Cys Ser Asp Gly Asp Glu Gly Leu Gly Ser Gly Ser Phe
865                 870                 875                 880
Ser Gln Glu Leu Ala Ala Gln Ala Ala Ala Ile Tyr Asp Val Thr Gly
                885                 890                 895
Met Glu Ala Glu Arg Val Leu Leu Ser Glu Met Phe Gly Ser Thr Pro
            900                 905                 910
Val Phe Thr Pro Ala Ala Asp Ser Gly Ser Phe Arg Lys Gln Ser Ser
        915                 920                 925
Ser Gly Pro Leu Met Thr Gly Lys Asn Arg Lys Phe Trp Gln Arg Leu
    930                 935                 940
Arg Ser Leu Ser Arg Gly Ser Met Ser Glu His Gly Ala Ser Pro Asp
945                 950                 955                 960
Phe Glu Thr Arg Ser Gln Cys Ser Asn Arg
                965                 970
<210>41
<211>1317
<212>DNA
<213>稻
<400>41
ggcagatcaa ctttgtctgt tagcagggtg agctctgcat cggcgtcaat gctctcaaca    60
gtggcaactt gcacaacatc agtaaagaca ttttcacttt cccagcttga aaaggccact    120
gatggttttg attcaaaaag agtgttgggt caaggtgggt ttggacgcgt ctaccatggg    180
accatggatg gcggagacga gattgctgtt aaattgctca caagagaaga caggagtggc    240
gatcgagagt tcattgcgga ggttgaaatg ctcagtcgac tacatcaccg taatcttgtc    300
aaattgattg gcatttgcat tgagcacaac aaaaggtgtc ttgtttatga gcttatacgc    360
aatggaagtg ttgaatctca ccttcatggt gctgataagg ctaagggcat gctgaactgg    420
gatgttagga tgaaaattgc tctgggtgca gctagaggct tagcatatct acatgaagac    480
tcaaaccctc atgttataca tcgtgacttc aagggcagca atatattgtt ggaggaagat    540
ttcactccta aggttactga ttttggttta gcaagggagg caactaatgg aattcaaccc    600
atttctacta gggtaatggg tacttttggg tacgttgctc cagaatatgc catgaccggg    660
catcttcttg tgaagagtga tgtctacagt tacggtgttg tcttgctgga gcttttatca    720
ggaaggaagc ccgtatgcat gtctgatacc aatggtcctc agaaccttgt gacttgggct    780
cgtcctctgc tatgccataa ggagggtttg gagaggttga tcgacccttc tctgaatggc    840
aatttcaact ttgatgatgt agctaaagta gcatccatcg cttccatgtg tgttcacaat  900
gatccgtcac agaggccatt catgggtgaa gtagtgcagg cactgaagct tatttacaat  960
gatgcggagg cggcttgcga tgattcttac agccacaggg actcatcgtg tgaccagtac  1020
gatgactacc atggggccct ggcccttgac agcggtagtg gtagctggtg gaatagaagc  1080
tcaaatcctt ctgggttttt tgacaaccgg aaccccctac cagttattac catggaatac  1140
agctctggca ggatcgaagg agcgcgtgac ccccgctttg cattgtcaac aggtggtcat  1200
gcacaatcac cagccctgca gaatagatca ggacccatcc ggatgaagaa aaagcttgcc  1260
tcattttacc ggtctagagg tagcttcagc gagcatggcc agctgcctcg ccattga     1317
<210>42
<211>438
<212>PRT
<213>稻
<400>42
Gly Arg Ser Thr Leu Ser Val Ser Arg Val Ser Ser Ala Ser Ala Ser
1               5                   10                  15
Met Leu Ser Thr Val Ala Thr Cys Thr Thr Ser Val Lys Thr Phe Ser
            20                  25                  30
Leu Ser Gln Leu Glu Lys Ala Thr Asp Gly Phe Asp Ser Lys Arg Val
        35                  40                  45
Leu Gly Gln Gly Gly Phe Gly Arg Val Tyr His Gly Thr Met Asp Gly
    50                  55                  60
Gly Asp Glu Ile Ala Val Lys Leu Leu Thr Arg Glu Asp Arg Ser Gly
65                  70                  75                  80
Asp Arg Glu Phe Ile Ala Glu Val Glu Met Leu Ser Arg Leu His His
                85                  90                  95
Arg Asn Leu Val Lys Leu Ile Gly Ile Cys Ile Glu His Asn Lys Arg
            100                 105                 110
Cys Leu Val Tyr Glu Leu Ile Arg Asn Gly Ser Val Glu Ser His Leu
        115                 120                 125
His Gly Ala Asp Lys Ala Lys Gly Met Leu Asn Trp Asp Val Arg Met
    130                 135                 140
Lys Ile Ala Leu Gly Ala Ala Arg Gly Leu Ala Tyr Leu His Glu Asp
145                 150                 155                 160
Ser Asn Pro His Val Ile His Arg Asp Phe Lys Gly Ser Asn Ile Leu
                165                 170                 175
Leu Glu Glu Asp Phe Thr Pro Lys Val Thr Asp Phe Gly Leu Ala Arg
            180                 185                 190
Glu Ala Thr Asn Gly Ile Gln Pro Ile Ser Thr Arg Val Met Gly Thr
        195                 200                 205
Phe Gly Tyr Val Ala Pro Glu Tyr Ala Met Thr Gly His Leu Leu Val
    210                 215                 220
Lys Ser Asp Val Tyr Ser Tyr Gly Val Val Leu Leu Glu Leu Leu Ser
225                 230                 235                 240
Gly Arg Lys Pro Val Cys Met Ser Asp Thr Asn Gly Pro Gln Asn Leu
                245                 250                 255
Val Thr Trp Ala Arg Pro Leu Leu Cys His Lys Glu Gly Leu Glu Arg
            260                 265                 270
Leu Ile Asp Pro Ser Leu Asn Gly Asn Phe Asn Phe Asp Asp Val Ala
        275                 280                 285
Lys Val Ala Ser Ile Ala Ser Met Cys Val His Asn Asp Pro Ser Gln
    290                 295                 300
Arg Pro Phe Met Gly Glu Val Val Gln Ala Leu Lys Leu Ile Tyr Asn
305                 310                 315                 320
Asp Ala Glu Ala Ala Cys Asp Asp Ser Tyr Ser His Arg Asp Ser Ser
                325                 330                 335
Cys Asp Gln Tyr Asp Asp Tyr His Gly Ala Leu Ala Leu Asp Ser Gly
            340                 345                 350
Ser Gly Ser Trp Trp Asn Arg Ser Ser Asn Pro Ser Gly Phe Phe Asp
        355                 360                 365
Asn Arg Asn Pro Leu Pro Val Ile Thr Met Glu Tyr Ser Ser Gly Arg
    370                 375                 380
Ile Glu Gly Ala Arg Asp Pro Arg Phe Ala Leu Ser Thr Gly Gly His
385                 390                 395                 400
Ala Gln Ser Pro Ala Leu Gln Asn Arg Ser Gly Pro Ile Arg Met Lys
                405                 410                 415
Lys Lys Leu Ala Ser Phe Tyr Arg Ser Arg Gly Ser Phe Ser Glu His
            420                 425                 430
Gly Gln Leu Pro Arg His
        435
<210>43
<211>2172
<212>DNA
<213>稻
<400>43
atgccgccgc ggcgagcggc gctgctcctc ctcgctctcg ccgtgtatgt gccactggga    60
acggcaagct caacaactat cgcgtcgtac ttacttgggt tatggagtag agcacatcgg    120
cattctcttc ctgcccctgc tccagctcca gctccagctc cagcccctga aactcaccga    180
cctggtatta gacacccagt gcctaggcat cacaggaaaa ggcctcatgt tgccccacca    240
ctaccaccac catcatcatc agaaagacaa gtagcaccat atcagttgtt tccaagaatt    300
gatgagttag aaattgagat tgcagcagga acatttctga aacagagtca agttcggata    360
atgggtgctg ggagtagtct tcaagatcct gaaaaaacta ctgtcaccgt tgatttggtg    420
ccactaggtc agaagtttga taggacttca gccttactga ctagcaacag atttttgcaa    480
aagaaggtgc caataaactc gtccatattt ggtgattata acgtaatata tgttcattat    540
cctggcctgc cttctttggt ccctagtgtt ccaggatcct tgggcccaat aagcagtagc    600
caatacccct ttagtgcaaa tgtacacaat agaagacatc agaagattaa ctctaaaagt    660
gttgccataa ttgcattatc agctgttgtg cttgtattaa tgagctttgg catttgcatc    720
atatggaaat ataaaggatt tgaaaagtct cgtggcactg gtcgtgtttc gaattcgtca    780
gccacaagaa aaacaggtat gaggtcatca ttctccagta tgaccagctc gacggcatct    840
tttgtttcaa caattgcaac atgcccacct acagttaaga cattctctat ttctgagctt    900
gaaaaggcca cagaaaactt cagcttcaac aaaataatag gtgaaggagg gtatggccgt    960
gtttatcgag gtacaattga tgatgaagtt gatgttgcag tcaaattgct tacaagaaaa    1020
catcaaaaca gagatcgtga gtttattgcc gaggttgaga tgctaagtcg tttgcatcat    1080
cgtaatcttg tcaagctgat cggtatatgc attgaacgga gcacaaggtg cttggtgttt    1140
gagcttgttc caaacggaag tgtggagtct catctgcacg gttctgataa aatatacggc    1200
ccacttgatt ttgatactag aatgaaaata gcccttggtg cagcaagggg tctggcctac    1260
ctacatgagg atgccaatcc ccatgttata caccgtgatt tcaaggccag caacgttctt    1320
ttggaaaatg atttcactcc caaggttgcg gatttcgggt tggcaaagga agcctcagaa    1380
ggaatggacc atatttctac tcaggtcatg gggacttttg ggtacgttgc cccggagtat    1440
gcgatgaccg ggcatctcct ggtgaaaagc gacgtgtaca gctacggtgt cgtgctgctg    1500
gagctcctct cggggaggaa gccggtggac atgacgcagc cgccggggtc ggagaacctc    1560
gtcacctggg cgcgccccct cctcaccgac cgggacggcc tccagcagct ggtcgacccg    1620
tcgatgccgg cggcgagcta cggcttcgag aagctggcca aggcggcggc catcgcgtcc    1680
atgtgcgtgc acgtcgaggc gtcgcaccgg ccgttcatgg gcgaggtcgt gcaggccctg    1740
aagctcatct acaacggcaa caacgacgac acctgcacca gcggctcgtt cggcggcggc    1800
ggcggcgagg agtacgagga cgaggaggcg tcgtcgccgt ggaacaaccg ctcgtggagc    1860
cacgacttcg ccgcgacgcc gccgccggcg tcgcgcaggc tggcgttccc gcgggctccg    1920
gcccgcccga cgacgatgga ctacagctcg gacccggccg acggggcggc ggggacgtcg    1980
tcggcgtcgg cgcggcggca gcggtcgacg tcgagcctgg tgctggacaa gatcgagtcg    2040
ctggcggcgt acgactggtc cggcccgctg agggccagca gggggaggaa cttctacagg    2100
ctgaggggaa gcatgagcga gcatggcggc catccttccg aagattgctc catggagggc    2160
tactggatgt ag                                                        2172
<210>44
<211>723
<212>PRT
<213>稻
<400>44
Met Pro Pro Arg Arg Ala Ala Leu Leu Leu Leu Ala Leu Ala Val Tyr
1               5                   10                  15
Val Pro Leu Gly Thr Ala Ser Ser Thr Thr Ile Ala Ser Tyr Leu Leu
            20                  25                  30
Gly Leu Trp Ser Arg Ala His Arg His Ser Leu Pro Ala Pro Ala Pro
        35                  40                  45
Ala Pro Ala Pro Ala Pro Ala Pro Glu Thr Hi s Arg Pro Gly Ile Arg
    50                  55                  60
His Pro Val Pro Arg His His Arg Lys Arg Pro His Val Ala Pro Pro
65                  70                  75                  80
Leu Pro Pro Pro Ser Ser Ser Glu Arg Gln Val Ala Pro Tyr Gln Leu
                85                  90                  95
Phe Pro Arg Ile Asp Glu Leu Glu Ile Glu Ile Ala Ala Gly Thr Phe
            100                 105                 110
Leu Lys Gln Ser Gln Val Arg Ile Met Gly Ala Gly Ser Ser Leu Gln
        115                 120                 125
Asp Pro Glu Lys Thr Thr Val Thr Val Asp Leu Val Pro Leu Gly Gln
    130                 135                 140
Lys Phe Asp Arg Thr Ser Ala Leu Leu Thr Ser Asn Arg Phe Leu Gln
145                 150                 155                 160
Lys Lys Val Pro Ile Asn Ser Ser Ile Phe Gly Asp Tyr Asn Val Ile
                165                 170                 175
Tyr Val His Tyr Pro Gly Leu Pro Ser Leu Val Pro Ser Val Pro Gly
            180                 185                 190
Ser Leu Gly Pro Ile Ser Ser Ser Gln Tyr Pro Phe Ser Ala Asn Val
        195                 200                 205
His Asn Arg Arg His Gln Lys Ile Asn Ser Lys Ser Val Ala Ile Ile
    210                 215                 220
Ala Leu Ser Ala Val Val Leu Val Leu Met Ser Phe Gly Ile Cys Ile
225                 230                 235                 240
Ile Trp Lys Tyr Lys Gly Phe Glu Lys Ser Arg Gly Thr Gly Arg Val
                245                 250                 255
Ser Asn Ser Ser Ala Thr Arg Lys Thr Gly Met Arg Ser Ser Phe Ser
            260                 265                 270
Ser Met Thr Ser Ser Thr Ala Ser Phe Val Ser Thr Ile Ala Thr Cys
        275                 280                 285
Pro Pro Thr Val Lys Thr Phe Ser Ile Ser Glu Leu Glu Lys Ala Thr
    290                 295                 300
Glu Asn Phe Ser Phe Asn Lys Ile Ile Gly Glu Gly Gly Tyr Gly Arg
305                 310                 315                 320
Val Tyr Arg Gly Thr Ile Asp Asp Glu Val Asp Val Ala Val Lys Leu
                325                 330                 335
Leu Thr Arg Lys His Gln Asn Arg Asp Arg Glu Phe Ile Ala Glu Val
            340                 345                 350
Glu Met Leu Ser Arg Leu His His Arg Asn Leu Val Lys Leu Ile Gly
        355                 360                 365
Ile Cys Ile Glu Arg Ser Thr Arg Cys Leu Val Phe Glu Leu Val Pro
    370                 375                 380
Asn Gly Ser Val Glu Ser Hi s Leu His Gly Ser Asp Lys Ile Tyr Gly
385                 390                 395                 400
Pro Leu Asp Phe Asp Thr Arg Met Lys Ile Ala Leu Gly Ala Ala Arg
                405                 410                 415
Gly Leu Ala Tyr Leu His Glu Asp Ala Asn Pro His Val Ile His Arg
            420                 425                 430
Asp Phe Lys Ala Ser Asn Val Leu Leu Glu Asn Asp Phe Thr Pro Lys
        435                 440                 445
Val Ala Asp Phe Gly Leu Ala Lys Glu Ala Ser Glu Gly Met Asp His
    450                 455                 460
Ile Ser Thr Gln Val Met Gly Thr Phe Gly Tyr Val Ala Pro Glu Tyr
465                 470                 475                 480
Ala Met Thr Gly His Leu Leu Val Lys Ser Asp Val Tyr Ser Tyr Gly
                485                 490                 495
Val Val Leu Leu Glu Leu Leu Ser Gly Arg Lys Pro Val Asp Met Thr
            500                 505                 510
Gln Pro Pro Gly Ser Glu Asn Leu Val Thr Trp Ala Arg Pro Leu Leu
        515                 520                 525
Thr Asp Arg Asp Gly Leu Gln Gln Leu Val Asp Pro Ser Met Pro Ala
    530                 535                 540
Ala Ser Tyr Gly Phe Glu Lys Leu Ala Lys Ala Ala Ala Ile Ala Ser
545                 550                 555                 560
Met Cys Val His Val Glu Ala Ser His Arg Pro Phe Met Gly Glu Val
                565                 570                 575
Val Gln Ala Leu Lys Leu Ile Tyr Asn Gly Asn Asn Asp Asp Thr Cys
            580                 585                 590
Thr Ser Gly Ser Phe Gly Gly Gly Gly Gly Glu Glu Tyr Glu Asp Glu
        595                 600                 605
Glu Ala Ser Ser Pro Trp Asn Asn Arg Ser Trp Ser His Asp Phe Ala
    610                 615                 620
Ala Thr Pro Pro Pro Ala Ser Arg Arg Leu Ala Phe Pro Arg Ala Pro
625                 630                 635                 640
Ala Arg Pro Thr Thr Met Asp Tyr Ser Ser Asp Pro Ala Asp Gly Ala
                645                 650                 655
Ala Gly Thr Ser Ser Ala Ser Ala Arg Arg Gln Arg Ser Thr Ser Ser
            660                 665                 670
Leu Val Leu Asp Lys Ile Glu Ser Leu Ala Ala Tyr Asp Trp Ser Gly
        675                 680                 685
Pro Leu Arg Ala Ser Arg Gly Arg Asn Phe Tyr Arg Leu Arg Gly Ser
    690                 695                 700
Met Ser Glu His Gly Gly His Pro Ser Glu Asp Cys Ser Met Glu Gly
705                 710                 715                 720
Tyr Trp Met
<210>45
<211>1257
<212>DNA
<213>甘蔗(Saccharum officinarum)
<400>45
atgacggacg gcggcgacga gtacaagcgc gaggagtcgg tgaccctgct ggtcatcgtc    60
tccctcgccg cgctctcgct cctctccctc atcgcggcct tcgcctacta ctgctacatt    120
acgcgcaagg tctcccgccg cctccactcg ctccatctcc ccaagcgttc cagctcccct    180
cctccgcctc ctccccgggc cccgccgcgg cagcagcagg ggaaggacag cccgtccagc    240
aactccgcca gcgacggggg tggggcggcg gcggcgatgt cggtggtggt tgctggggag    300
aggggcgtgc aggtgttcag ctaccggcag ctccacgcgg ccacgggcgg gttcggtcgg    360
gcgcacatgg ttgggcaggg cagcttcggc gccgtgtacc gcggggtgct ccccgacggg    420
aggaaggtcg cggtcaagct catggaccgc ccagggaagc agggcgaaga ggagttcgag    480
atggaggtgg agttgctgag taggctccga tcgccgtatt tattgggcct gattggccat    540
tgttcggaag gtggacaccg tctactggta tatgagttca tggccaatgg gggtctccag    600
gagcatctct atccaaacag aggttcctgt ggtggaatct caaaattgga ctgggacaca    660
agaatgagaa ttgcacttga agcagccaaa ggtttggaat atcttcatga gcgtgttaat    720
ccacctgtta tacatagaga cttcaagagt agcaatattc tcctggacaa ggacttccat    780
gcaagagttt cagactttgg tctaaccaaa cttggatctg atagagctgg tggtcatgtc    840
tcaactcgag ttttgggcac acaaggctat gttgcaccag aatacgcatt gactgggcat    900
ttgactacca aatcagatgt gtacagttac ggtgttgtgc ttttggaact gcttactggc    960
agagtaccag ttgatatgaa gaggcctcct ggagaaggtg ttttagttaa ctgggcattg    1020
cctatgctca ctgaccgaga aaaagtcgtg cggatcttgg atccagcatt ggaaggtcaa    1080
tattccttga aagatgctgt ccaagtggct gctattgctg ccatgtgtgt tcaaccagag    1140
gctgactata ggccattaat ggctgatgtt gtccaatcgc tggttccact tgtcaagaac    1200
cgttctaatc agaaagcttg caaccccaat gtgcaatcat cgaagccact cgactag       1257
<210>46
<211>418
<212>PRT
<213>甘蔗
<400>46
Met Thr Asp Gly Gly Asp Glu Tyr Lys Arg Glu Glu Ser Val Thr Leu
1               5                   10                  15
Leu Val Ile Val Ser Leu Ala Ala Leu Ser Leu Leu Ser Leu Ile Ala
            20                  25                  30
Ala Phe Ala Tyr Tyr Cys Tyr Ile Thr Arg Lys Val Ser Arg Arg Leu
        35                  40                  45
His Ser Leu His Leu Pro Lys Arg Ser Ser Ser Pro Pro Pro Pro Pro
    50                  55                  60
Pro Arg Ala Pro Pro Arg Gln Gln Gln Gly Lys Asp Ser Pro Ser Ser
65                  70                  75                  80
Asn Ser Ala Ser Asp Gly Gly Gly Ala Ala Ala Ala Met Ser Val Val
                85                  90                  95
Val Ala Gly Glu Arg Gly Val Gln Val Phe Ser Tyr Arg Gln Leu His
            100                 105                 110
Ala Ala Thr Gly Gly Phe Gly Arg Ala His Met Val Gly Gln Gly Ser
        115                 120                 125
Phe Gly Ala Val Tyr Arg Gly Val Leu Pro Asp Gly Arg Lys Val Ala
    130                 135                 140
Val Lys Leu Met Asp Arg Pro Gly Lys Gln Gly Glu Glu Glu Phe Glu
145                 150                 155                 160
Met Glu Val Glu Leu Leu Ser Arg Leu Arg Ser Pro Tyr Leu Leu Gly
                165                 170                 175
Leu Ile Gly His Cys Ser Glu Gly Gly His Arg Leu Leu Val Tyr Glu
            180                 185                 190
Phe Met Ala Asn Gly Gly Leu Gln Glu His Leu Tyr Pro Asn Arg Gly
        195                 200                 205
Ser Cys Gly Gly Ile Ser Lys Leu Asp Trp Asp Thr Arg Met Arg Ile
    210                 215                 220
Ala Leu Glu Ala Ala Lys Gly Leu Glu Tyr Leu His Glu Arg Val Asn
225                 230                 235                 240
Pro Pro Val Ile His Arg Asp Phe Lys Ser Ser Asn Ile Leu Leu Asp
                245                 250                 255
Lys Asp Phe His Ala Arg Val Ser Asp Phe Gly Leu Thr Lys Leu Gly
            260                 265                 270
Ser Asp Arg Ala Gly Gly His Val Ser Thr Arg Val Leu Gly Thr Gln
        275                 280                 285
Gly Tyr Val Ala Pro Glu Tyr Ala Leu Thr Gly His Leu Thr Thr Lys
    290                 295                 300
Ser Asp Val Tyr Ser Tyr Gly Val Val Leu Leu Glu Leu Leu Thr Gly
305                 310                 315                 320
Arg Val Pro Val Asp Met Lys Arg Pro Pro Gly Glu Gly Val Leu Val
                325                 330                 335
Asn Trp Ala Leu Pro Met Leu Thr Asp Arg Glu Lys Val Val ArgIle
            340                 345                 350
Leu Asp Pro Ala Leu Glu Gly Gln Tyr Ser Leu Lys Asp Ala Val Gln
        355                 360                 365
Val Ala Ala Ile Ala Ala Met Cys Val Gln Pro Glu Ala Asp Tyr Arg
    370                 375                 380
Pro Leu Met Ala Asp Val Val Gln Ser Leu Val Pro Leu Val Lys Asn
385                 390                 395                 400
ArgSer Asn Gln Lys Ala Cys Asn Pro Asn Val Gln Ser Ser Lys Pro
               405                 410                 415
Leu Asp
<210>47
<211>921
<212>DNA
<213>大豆(Glycine max)
<400>47
agcaagtcaa atgtcattgg ccatggtgga tttggacttg tttaccgggg agtgctcaac  60
gatggcagga aagttgcaat caaattcatg gatcaggcag gaaagcaagg agaagaagaa  120
tttaaagtag aggtggaact gctaagtcgg ttgcattctc catatctgct ggcattgctt  180
gggtactgct ctgatagtaa tcataaattg ttggtgtatg aatttatggc aaatggtgga  240
ctgcaggaac atctctatcc tgtcagcaat tctattatta cgcctgtaaa attggattgg  300
gaaacacgac taagaatagc acttgaagct gctaagggtt tggaatatct tcatgagcat  360
gtcagtcccc cagtgattca cagagatttt aagagtagca acatcctctt ggacaagaaa  420
tttcatgcca aggtttctga ttttggattg gcgaagcttg gacctgatag agctggtgga  480
catgtttcaa ctcgggtttt gggcacccag ggatatgttg cccctgaata tgcactaaca  540
gggcatttaa caacaaaatc agatgtgtac agttatggtg ttgtactttt ggagctgctc  600
actggccggg tgcctgttga tatgaagaga cctccagggg aaggtgttct tgtttcttgg  660
gctctgcccc ttttgactga tagagaaaag gttgtaaaga ttatggatcc ttcattggag  720
ggacaatact ctatgaaaga ggttgtccag gtggctgcaa ttgctgcaat gtgtgtgcaa  780
ccagaggcag attatcggcc tctcatggct gatgttgtgc agtcattggt tccactggtg  840
aagactcaaa ggtccccttc aaaggtagga agctcctcta gtttcaattc ccctaagttg  900
tcccctggcc caacatttta a                                            921
<210>48
<211>306
<212>PRT
<213>大豆
<400>48
Ser Lys Ser Asn Val Ile Gly His Gly Gly Phe Gly Leu Val Tyr Arg
1               5                   10                  15
Gly Val Leu Asn Asp Gly Arg Lys Val Ala Ile Lys Phe Met Asp Gln
            20                  25                  30
Ala Gly Lys Gln Gly Glu Glu Glu Phe Lys Val Glu Val Glu Leu Leu
        35                  40                  45
Ser Arg Leu His Ser Pro Tyr Leu Leu Ala Leu Leu Gly Tyr Cys Ser
    50                  55                  60
Asp Ser Asn His Lys Leu Leu Val Tyr Glu Phe Met Ala Asn Gly Gly
65                  70                  75                  80
Leu Gln Glu His Leu Tyr Pro Val Ser Asn Ser Ile Ile Thr Pro Val
                85                  90                  95
Lys Leu Asp Trp Glu Thr Arg Leu Arg Ile Ala Leu Glu Ala Ala Lys
            100                 105                 110
Gly Leu Glu Tyr Leu His Glu His Val Ser Pro Pro Val Ile His Arg
        115                 120                 125
Asp Phe Lys Ser Ser Asn Ile Leu Leu Asp Lys Lys Phe His Ala Lys
    130                 135                 140
Val Ser Asp Phe Gly Leu Ala Lys Leu Gly Pro Asp Arg Ala Gly Gly
145                 150                 155                 160
His Val Ser Thr Arg Val Leu Gly Thr Gln Gly Tyr Val Ala Pro Glu
                165                 170                 175
Tyr Ala Leu Thr Gly His Leu Thr Thr Lys Ser Asp Val Tyr Ser Tyr
            180                 185                 190
Gly Val Val Leu Leu Glu Leu Leu Thr Gly Arg Val Pro Val Asp Met
        195                 200                 205
Lys Arg Pro Pro Gly Glu Gly Val Leu Val Ser Trp Ala Leu Pro Leu
    210                 215                 220
Leu Thr Asp Arg Glu Lys Val Val Lys Ile Met Asp Pro Ser Leu Glu
225                 230                 235                 240
Gly Gln Tyr Ser Met Lys Glu Val Val Gln Val Ala Ala Ile Ala Ala
                245                 250                 255
Met Cys Val Gln Pro Glu Ala Asp Tyr Arg Pro Leu Met Ala Asp Val
            260                 265                 270
Val Gln Ser Leu Val Pro Leu Val Lys Thr Gln Arg Ser Pro Ser Lys
        275                 280                 285
Val Gly Ser Ser Ser Ser Phe Asn Ser Pro Lys Leu Ser Pro Gly Pro
    290                 295                 300
Thr Phe
305
<210>49
<211>1140
<212>DNA
<213>马铃薯(Solanum tuberosum)
<400>49
acagggtgag gaagaattca aagtggaggt ggagttgcta tgccgcttgc gctcaccgta    60
tttgctgtca ttgattggct attgttcaga aagcagccat aaattgcttg tttatgagtt    120
catggcaaat ggtggtttac aggagcactt gtatccaatt aaaggttcca ataattgttg    180
tccgaagttg gactggaaga cccggttaag aatagctttg gaggctgcta aaggtttgga    240
atatctacat gagcatgtca atcccccaat tatacataga gacctcaaaa gtagcaatat    300
tcttttggac aaaaacttcc atgccaaagt ttctgacttt ggattggcca agcttggatc    360
tgataaagct ggtggccatg tctctacccg cgttttgggg acacagggat atgttgctcc    420
agaatatgca ttaacaggac acttgaccac caaatcagat gtttacagtt atggggttgt    480
cctcctagag ttgttgactg gcagagttcc agttgatatg aagagatcac ctggcgaagg    540
tgttcttgtt tcttgggcat tgccccgtct cactgatagg gaaaaagtcg tagagataat    600
ggatccagct ctggagggtc agtattcaat gaaagaagtt attcaagtag ctgctattgc    660
tgcaatgtgt gtacagcccg aggctgatta caggccactg atggcagacg ttgtgcagtc    720
gttggttcca ctggtgaaac aaccgcgacc aactgtgaag cctggtagct cgtctagctt    780
tcacgccaca cagtccccct ccccccatgt tacacaatct cctaaggctt agactttttt    840
caagcgaaat gggcatatca tatctcttga tccttaattc tagtccaact tctataacta    900
gtggccattt agtttgtgtt tggactatct agcttatgga accccctttc atttagtaac    960
tttaatctaa caaattttga tggagcaagc cagctgatgt aatattttct catgctaaac    1020
taggtggagc aaaaacagtt tctctgtatg taacatgtca aagctcccat ctaatatggg    1080
gattgtattt gagtattctt ggttagaagc agattcaaga tttgaagtta ctatatgata    1140
<210>50
<211>276
<212>PRT
<213>马铃薯
<400>50
Gln Gly Glu Glu Glu Phe Lys Val Glu Val Glu Leu Leu Cys Arg Leu
1               5                   10                  15
Arg Ser Pro Tyr Leu Leu Ser Leu Ile Gly Tyr Cys Ser Glu Ser Ser
            20                  25                  30
His Lys Leu Leu Val Tyr Glu Phe Met Ala Asn Gly Gly Leu Gln Glu
        35                  40                  45
His Leu Tyr Pro Ile Lys Gly Ser Asn Asn Cys Cys Pro Lys Leu Asp
    50                  55                  60
Trp Lys Thr Arg Leu Arg Ile Ala Leu Glu Ala Ala Lys Gly Leu Glu
65                  70                  75                  80
Tyr Leu His Glu His Val Asn Pro Pro Ile Ile His Arg Asp Leu Lys
                85                  90                  95
Ser Ser Asn Ile Leu Leu Asp Lys Asn Phe His Ala Lys Val Ser Asp
            100                 105                 110
Phe Gly Leu Ala Lys Leu Gly Ser Asp Lys Ala Gly Gly His Val Ser
        115                 120                 125
Thr Arg Val Leu Gly Thr Gln Gly Tyr Val Ala Pro Glu Tyr Ala Leu
    130                 135                 140
Thr Gly His Leu Thr Thr Lys Ser Asp Val Tyr Ser Tyr Gly Val Val
145                 150                 155                 160
Leu Leu Glu Leu Leu Thr Gly Arg Val Pro Val Asp Met Lys Arg Ser
                165                 170                 175
Pro Gly Glu Gly Val Leu Val Ser Trp Ala Leu Pro Arg Leu Thr Asp
            180                 185                 190
Arg Glu Lys Val Val Glu Ile Met Asp Pro Ala Leu Glu Gly Gln Tyr
        195                 200                 205
Ser Met Lys Glu Val Ile Gln Val Ala Ala Ile Ala Ala Met Cys Val
    210                 215                 220
Gln Pro Glu Ala Asp Tyr Arg Pro Leu Met Ala Asp Val Val Gln Ser
225                 230                 235                 240
Leu Val Pro Leu Val Lys Gln Pro Arg Pro Thr Val Lys Pro Gly Ser
                245                 250                 255
Ser Ser Ser Phe His Ala Thr Gln Ser Pro Ser Pro His Val Thr Gln
            260                 265                 270
Ser Pro Lys Ala
        275
<210>51
<211>1995
<212>DNA
<213>烟草(Nicotiana tabacum)
<400>51
taagatacca cagctatgct gacttatgaa agattttgga aaaagaaggt gcctctcaat    60
agaacgatgt ttggggatta tgaagtgatg cacattatct atccagggct gccttcttct    120
cctccatctg gcattgattc tggtaatggt ccaactggaa gtgctgtcaa tcaacaattc    180
cctattactg ctgattttgt aaacaagagt cagagaatga gtccccgagt catttttctc    240
attgcttcat cagcattagt actgttggtg gtatgctgtg gtgcactagt tgtcctctta    300
aaatgcagga ggactggccg accgtcaaat gctgttggtc cagtgtttac accatctatg    360
cacaagagat ctggtaaggg aattgggtcg acaatatcaa gtagcccgac tagttcaaca    420
tcgatttccc tcatttctgc tatgcctgct tctatccttt ctgtcaaaac atttacgctt    480
gcggagcttg agagggcaac tgacaagttt agtttaaaaa gggttttagg tgaaggagga    540
tttggacgtg tttatcatgg tatcttagaa gacagaacag aagttgccgt gaaagtactg    600
actagggata accaaaatgg agatcgtgaa ttcattgctg aagttgagat gctaagccga  660
ttgcatcacc gtaacctggt gaaattaatt ggtatatgca gtgaagagcg gactcgcagc  720
ttggtatatg aacttgttcg gaacggtagt gtggagtctc atttgcatgg aagagacggg  780
agaaaagagc cacttgattg ggatgtgagg ttgaaaattg ctcttggtgc tgcgagagga  840
ctagcttacc ttcatgaaga ttctaatcct cgtgtaattc atcgtgattt taaagccagc  900
aatgttttgt tagaagatga cttcacgccc aaggttgcag attttgggtt agcaagggaa  960
gcaaccgaag gaagtcacca catatctaca agagtcatgg gaacttttgg gtatgttgct  1020
cctgaatatg caatgacggg acacctactt gttaaaagtg atgtgtatag ttatggagtt  1080
gtattattgg agcttctctc cggaagaaaa cctgtggaca tgtctcaacc tcctggagaa  1140
gaaaacctgg taacttgggc gcgacctctt ctgaccacta gagaaggttt ggagcaactt  1200
gtggatcctt ctttggctgg aagctatgac tttgatgata tggcaaaggt ggctgccatt  1260
gcttcaatgt gcgttcaccc ggaggtgact caaaggccat ttatgggaga agtggtgcaa  1320
gctctcaaac taatttataa tgacaatgat gaaacttgtg ctgatggatg tagccagaag  1380
gagtcttctc tgccagattc agatttcaaa ggtgtccctt ccgatagcag ttggtggaat  1440
gctggtgggg ttacaccaag attaacatat ggacaagcct ccactttcat gaccatggat  1500
tacagttctg gtccgcttga agagttcgaa aacagaccgt tttcagcttc aagttttaat  1560
cttggtggag gggcgggttt aacaataagc cacggtaaca gatcaggtcc tttgaggact  1620
gtaaggagta aacctgctct ctataggtta aggggcagta tgagtgaaca cggtgcactt  1680
cttccaagac atgattggag ggatggcacc aattatgatg cttcttttta gagtgatttg  1740
tcaaatgtac agtgccgaag gccgtttcta tttgggaaaa aagatggttc tccggtgtag  1800
attaggagtt tgaaattgcc gctgtatccc tgagagagtg gactaagcct tctaattttg  1860
gtaatcttac attcatttta atagacagga aagataaaca ggacactcct tgttgtatat  1920
gttgtcaaat taactttttc tttagtccaa tattggattg gactactagt ctttctaaaa  1980
aaaaaaaaaa aaaaa                                                   1995
<210>52
<211>571
<212>PRT
<213>烟草
<400>52
Met Leu Thr Tyr Glu Arg Phe Trp Lys Lys Lys Val Pro Leu Asn Arg
1               5                   10                  15
Thr Met Phe Gly Asp Tyr Glu Val Met His Ile Ile Tyr Pro Gly Leu
            20                  25                  30
Pro Ser Ser Pro Pro Ser Gly Ile Asp Ser Gly Asn Gly Pro Thr Gly
        35                  40                  45
Ser Ala Val Asn Gln Gln Phe Pro Ile Thr Ala Asp Phe Val Asn Lys
    50                  55                  60
Ser Gln Arg Met Ser Pro Arg Val Ile Phe Leu Ile Ala Ser Ser Ala
65                  70                  75                  80
Leu Val Leu Leu Val Val Cys Cys Gly Ala Leu Val Val Leu Leu Lys
                85                  90                  95
Cys Arg Arg Thr Gly Arg Pro Ser Asn Ala Val Gly Pro Val Phe Thr
            100                 105                 110
Pro Ser Met His Lys Arg Ser Gly Lys Gly Ile Gly Ser Thr Ile Ser
        115                 120                 125
Ser Ser Pro Thr Ser Ser Thr Ser Ile Ser Leu Ile Ser Ala Met Pro
    130                 135                 140
Ala Ser Ile Leu Ser Val Lys Thr Phe Thr Leu Ala Glu Leu Glu Arg
145                 150                 155                 160
Ala Thr Asp Lys Phe Ser Leu Lys Arg Val Leu Gly Glu Gly Gly Phe
                165                 170                 175
Gly Arg Val Tyr His Gly Ile Leu Glu Asp Arg Thr Glu Val Ala Val
            180                 185                 190
Lys Val Leu Thr Arg Asp Asn Gln Asn Gly Asp Arg Glu Phe Ile Ala
        195                 200                 205
Glu Val Glu Met Leu Ser Arg Leu His His Arg Asn Leu Val Lys Leu
    210                 215                 220
Ile Gly Ile Cys Ser Glu Glu Arg Thr Arg Ser Leu Val Tyr Glu Leu
225                 230                 235                 240
Val Arg Asn Gly Ser Val Glu Ser His Leu His Gly Arg Asp Gly Arg
                245                 250                 255
Lys Glu Pro Leu Asp Trp Asp Val Arg Leu Lys Ile Ala Leu Gly Ala
            260                 265                 270
Ala Arg Gly Leu Ala Tyr Leu His Glu Asp Ser Asn Pro Arg Val Ile
        275                 280                 285
His Arg Asp Phe Lys Ala Ser Asn Val Leu Leu Glu Asp Asp Phe Thr
    290                 295                 300
Pro Lys Val Ala Asp Phe Gly Leu Ala Arg Glu Ala Thr Glu Gly Ser
305                 310                 315                 320
His His Ile Ser Thr Arg Val Met Gly Thr Phe Gly Tyr Val Ala Pro
                325                 330                 335
Glu Tyr Ala Met Thr Gly His Leu Leu Val Lys Ser Asp Val Tyr Ser
            340                 345                 350
Tyr Gly Val Val Leu Leu Glu Leu Leu Ser Gly Arg Lys Pro Val Asp
        355                 360                 365
Met Ser Gln Pro Pro Gly Glu Glu Asn Leu Val Thr Trp Ala Arg Pro
    370                 375                 380
Leu Leu Thr Thr Arg Glu Gly Leu Glu Gln Leu Val Asp Pro Ser Leu
385                 390                 395                 400
Ala Gly Ser Tyr Asp Phe Asp Asp Met Ala Lys Val Ala Ala Ile Ala
                405                 410                 415
Ser Met Cys Val His Pro Glu Val Thr Gln Arg Pro Phe Met Gly Glu
            420                 425                 430
Val Val Gln Ala Leu Lys Leu Ile Tyr Asn Asp Asn Asp Glu Thr Cys
        435                 440                 445
Ala Asp Gly Cys Ser Gln Lys Glu Ser Ser Leu Pro Asp Ser Asp Phe
    450                 455                 460
Lys Gly Val Pro Ser Asp Ser Ser Trp Trp Asn Ala Gly Gly Val Thr
465                 470                 475                 480
Pro Arg Leu Thr Tyr Gly Gln Ala Ser Thr Phe Met Thr Met Asp Tyr
                485                 490                 495
Ser Ser Gly Pro Leu Glu Glu Phe Glu Asn Arg Pro Phe Ser Ala Ser
            500                 505                 510
Ser Phe Asn Leu Gly Gly Gly Ala Gly Leu Thr Ile Ser His Gly Asn
        515                 520                 525
Arg Ser Gly Pro Leu Arg Thr Val Arg Ser Lys Pro Ala Leu Tyr Arg
    530                 535                 540
Leu Arg Gly Ser Met Ser Glu His Gly Ala Leu Leu Pro Arg His Asp
545                 550                 555                 560
Trp Arg Asp Gly Thr Asn Tyr Asp Ala Ser Phe
                565                 570
<210>53
<211>1059
<212>DNA
<213>蒺藜苜蓿(Medicago truncatula)
<400>53
atgttaagtc gtttgcatca tcgcaatcta gtgaaactta tcggtatatg cattgaaggg    60
cgcaggcgtt gtctggtata cgagcttgtt cctaatggca gtgttgagtc ccatctgcat    120
ggtgatgaca agaatagggg acctctagat tgggaagcac gtatgaaaat tgcccttgga    180
gctgcgagag gattggcgta tcttcacgag gattccaatc cccgtgtaat tcatcgagac    240
ttcaaagcta gcaatgtgtt attagaagac gactttaccc ctaaggtttc tgatttcggt    300
ttagcaagag aagcaactga ggggagtaat catatttcta cacgggtgat ggggactttt    360
gggtacgttg ccccagaata tgcaatgacg ggccatttac tggttaaaag tgatgtttat    420
agttacggtg ttgtgcttct tgaacttctc acaggcagaa aaccagtgga tatgtctcaa    480
cctcagggac aggagaatct tgttacctgg gcacgggcac tgttgactag tagagaaggt    540
ttagagcagc tagtggatcc atctttggct ggaggttaca actttgatga catggcaaag    600
gtagcagcta ttgcgtcaat gtgtgttcac tccgaggtga cacagagacc ttttatggga    660
gaagttgtgc aggctcttaa attaatatac aatgacacag acgagactgg tggagattat    720
tgtagtcaga aggactcctc tgctcaggag tctgatttca gaggtgagct tgccccttct    780
gatagcagtt ggtggaatgg tggaggttta actcctcgat taacttatgg acaagcatct    840
tcctttatca caatggagta cagttctggt ccacttgaag atatggaaaa cagaccgttt    900
tcaacttcaa gctttaatgg agatgagcta tctttaccaa ttaggcatgg gaataggtca    960
ggtcccttaa gaacgacccg aagcaagtta tccttatata gattttcagg aagtcggagt    1020
gagcatgggg aagtttcgtc taagcgaaat tggatttga                           1059
<210>54
<211>352
<212>PRT
<213>蒺藜苜蓿
<400>54
Met Leu Ser Arg Leu His His Arg Asn Leu Val Lys Leu Ile Gly Ile
1               5                   10                  15
Cys Ile Glu Gly Arg Arg Arg Cys Leu Val Tyr Glu Leu Val Pro Asn
            20                  25                  30
Gly Ser Val Glu Ser His Leu His Gly Asp Asp Lys Asn Arg Gly Pro
        35                  40                  45
Leu Asp Trp Glu Ala Arg Met Lys Ile Ala Leu Gly Ala Ala Arg Gly
    50                  55                  60
Leu Ala Tyr Leu His Glu Asp Ser Asn Pro Arg Val Ile His Arg Asp
65                  70                  75                  80
Phe Lys Ala Ser Asn Val Leu Leu Glu Asp Asp Phe Thr Pro Lys Val
                85                  90                  95
Ser Asp Phe Gly Leu Ala Arg Glu Ala Thr Glu Gly Ser Asn His Ile
            100                 105                 110
Ser Thr Arg Val Met Gly Thr Phe Gly Tyr Val Ala Pro Glu Tyr Ala
        115                 120                 125
Met Thr Gly His Leu Leu Val Lys Ser Asp Val Tyr Ser Tyr Gly Val
    130                 135                 140
Val Leu Leu Glu Leu Leu Thr Gly Arg Lys Pro Val Asp Met Ser Gln
145                 150                 155                 160
Pro Gln Gly Gln Glu Asn Leu Val Thr Trp Ala Arg Ala Leu Leu Thr
                165                 170                 175
Ser Arg Glu Gly Leu Glu Gln Leu Val Asp Pro Ser Leu Ala Gly Gly
            180                 185                 190
Tyr Asn Phe Asp Asp Met Ala Lys Val Ala Ala Ile Ala Ser Met Cys
        195                 200                 205
Val His Ser Glu Val Thr Gln Arg Pro Phe Met Gly Glu Val Val Gln
    210                 215                 220
Ala Leu Lys Leu Ile Tyr Asn Asp Thr Asp Glu Thr Gly Gly Asp Tyr
225                 230                 235                 240
Cys Ser Gln Lys Asp Ser Ser Ala Gln Glu Ser Asp Phe Arg Gly Glu
                245                 250                 255
Leu Ala Pro Ser Asp Ser Ser Trp Trp Asn Gly Gly Gly Leu Thr Pro
            260                 265                 270
Arg Leu Thr Tyr Gly Gln Ala Ser Ser Phe Ile Thr Met Glu Tyr Ser
        275                 280                 285
Ser Gly Pro Leu Glu Asp Met Glu Asn Arg Pro Phe Ser Thr Ser Ser
    290                 295                 300
Phe Asn Gly Asp Glu Leu Ser Leu Pro Ile Arg His Gly Asn Arg Ser
305                 310                 315                 320
Gly Pro Leu Arg Thr Thr Arg Ser Lys Leu Ser Leu Tyr Arg Phe Ser
                325                 330                 335
Gly Ser Arg Ser Glu His Gly Glu Val Ser Ser Lys Arg Asn Trp Ile
            340                 345                 350
<210>55
<211>983
<212>DNA
<213>杨属物种(Populus sp.)
<400>55
atgggccata agcctccaga caaatacaaa ggagtccagg ttttcacata caaggagctt  60
gaaatcgcca caaacaaatt cagtgaagca aatgtgacat ggaatgaagg gtatggagtg  120
gtgtatggag gtaccctaag tgatggaact gtggcagcaa ttaagatgct ccatagagca  180
gggaagcaag gagagcgtgc atttaggata gaggtggatt tgctaagcag gttgcactca  240
ccatacttgg tggagctact tggttattgt gctgaccaga accacaggct cctagtattt  300
gaatttatgc ctaatgggac tcttcaacac catctccatc acaagcaata tcgaccgttg  360
gattggggga cacgattgag aattgccctt gattgtgcta gggccctgga gttccttcat  420
gagctcacaa tcccagcagt aatccatcgt gacttcaagt gtagtaacat cttactagac  480
caaaattttc gggctaaggt ttcagatttc ggatcggcta agatgggctc ggaaaggatc  540
aatgctcgaa attcgatgtg tttgccgagt accactggtt atctagcacc agagcatgct  600
tcaacaggta agctcaccac aaaatcagat gtatacagct atggagttgt tcttttacag  660
ctcttaactg gtcgtaaacc tgttgatacc aagcagccct ctggtgaaca tgtccttgtc  720
tcctgggctc ttccaaggct aaccaacaga gataaggtag tggaaatggt tgatccagcc  780
atgcaagacc agtattcaaa gaaggacttg atccaggtgg ctgctattgc agctgtgtgt  840
gtgcaaccag aagcagatta taggcctctc atgacagatg ttgtgcagtc tctaatccct  900
ctggtcaaga acctctcttc tgtatcttcc tcttgttcct ctaaatttat gaatcagatg  960
ctgtgcagtc caaggcctat gta                                    983
<210>56
<211>327
<212>PRT
<213>杨属物种
<400>56
Met Gly His Lys Pro Pro Asp Lys Tyr Lys Gly Val Gln Val Phe Thr
1               5                   10                  15
Tyr Lys Glu Leu Glu Ile Ala Thr Asn Lys Phe Ser Glu Ala Asn Val
            20                  25                  30
Thr Trp Asn Glu Gly Tyr Gly Val Val Tyr Gly Gly Thr Leu Ser Asp
        35                  40                  45
Gly Thr Val Ala Ala Ile Lys Met Leu His Arg Ala Gly Lys Gln Gly
    50                  55                  60
Glu Arg Ala Phe Arg Ile Glu Val Asp Leu Leu Ser Arg Leu His Ser
65                  70                  75                  80
Pro Tyr Leu Val Glu Leu Leu Gly Tyr Cys Ala Asp Gln Asn His Arg
                85                  90                  95
Leu Leu Val Phe Glu Phe Met Pro Asn Gly Thr Leu Gln His His Leu
            100                 105                 110
His His Lys Gln Tyr Arg Pro Leu Asp Trp Gly Thr Arg Leu Arg Ile
        115                 120                 125
Ala Leu Asp Cys Ala Arg Ala Leu Glu Phe Leu His Glu Leu Thr Ile
    130                 135                 140
Pro Ala Val Ile His Arg Asp Phe Lys Cys Ser Asn Ile Leu Leu Asp
145                 150                 155                 160
Gln Asn Phe Arg Ala Lys Val Ser Asp Phe Gly Ser Ala Lys Met Gly
                165                 170                 175
Ser Glu Arg Ile Asn Ala Arg Asn Ser Met Cys Leu Pro Ser Thr Thr
            180                 185                 190
Gly Tyr Leu Ala Pro Glu His Ala Ser Thr Gly Lys Leu Thr Thr Lys
        195                 200                 205
Ser Asp Val Tyr Ser Tyr Gly Val Val Leu Leu Gln Leu Leu Thr Gly
    210                 215                 220
Arg Lys Pro Val Asp Thr Lys Gln Pro Ser Gly Glu His Val Leu Val
225                 230                 235                 240
Ser Trp Ala Leu Pro Arg Leu Thr Asn Arg Asp Lys Val Val Glu Met
                245                 250                 255
Val Asp Pro Ala Met Gln Asp Gln Tyr Ser Lys Lys Asp Leu Ile Gln
            260                 265                 270
Val Ala Ala Ile Ala Ala Val Cys Val Gln Pro Glu Ala Asp Tyr Arg
        275                 280                 285
Pro Leu Met Thr Asp Val Val Gln Ser Leu Ile Pro Leu Val Lys Asn
    290                 295                 300
Leu Ser Ser Val Ser Ser Ser Cys Ser Ser Lys Phe Met Asn Gln Met
305                 310                 315                 320
Leu Cys Ser Pro Arg Pro Met
                325
<210>57
<211>282
<212>PRT
<213>拟南芥
<220>
<221>不确定
<222>(75)..(75)
<223>Xaa可以是任意天然产生的氨基酸
<220>
<221>不确定
<222>(121)..(121)
<223>Xaa可以是任意天然产生的氨基酸
<400>57
Phe Ser Glu Glu Lys Lys Ile Gly Asn Gly Asp Val Tyr Lys Gly Val
1               5                   10                  15
Leu Ser Asp Gly Thr Val Ala Ala Ile Lys Lys Leu His Met Phe Asn
            20                  25                  30
Asp Asn Ala Ser Asn Gln Lys His Glu Glu Arg Ser Phe Arg Leu Glu
        35                  40                  45
Val Asp Leu Leu Ser Arg Leu Gln Cys Pro Tyr Leu Val Glu Leu Leu
    50                  55                  60
Gly Tyr Cys Ala Asp Gln Asn His Arg Ile Xaa Ile Tyr Glu Phe Met
65                  70                  75                  80
Pro Asn Gly Thr Val Glu His His Leu His Asp His Asn Phe Lys Asn
                85                  90                  95
Leu Lys Asp Arg Pro Gln Pro Leu Asp Trp Gly Ala Arg Leu Arg Ile
            100                 105                 110
Ala Leu Asp Cys Ala Arg Ala Leu Xaa Phe Leu His Glu Asn Thr Ile
        115                 120                 125
Ser Thr Val Ile His Arg Asn Phe Lys Cys Thr Asn Ile Leu Leu Asp
    130                 135                 140
Gln Asn Asn Arg Ala Lys Val Ser Asp Phe Gly Leu Ala Lys Thr Gly
145                 150                 155                 160
Ser Asp Lys Leu Asn Gly Glu Ile Ser Thr Arg Val  Ile Gly Thr Thr
                165                 170                 175
Gly Tyr Leu Ala Pro Glu Tyr Ala Ser Thr Gly Lys Leu Thr Thr Lys
            180                 185                 190
Ser Asp Val Tyr Ser Tyr Gly Ile Val Leu Leu Gln Leu Leu Thr Gly
        195                 200                 205
Arg Thr Pro Ile Asp Ser Arg Arg Pro Arg Gly Gln Asp Val Leu Val
    210                 215                 220
Ser Trp Ala Leu Pro Arg Leu Thr Asn Arg Glu Lys Ile Ser Glu Met
225                 230                 235                 240
Val Asp Pro Thr Met Lys Gly Gln Tyr Ser Gln Lys Asp Leu Ile Gln
                245                 250                 255
Val Ala Ala Ile Ala Ala Val Cys Val Gln Pro Glu Ala Ser Tyr Arg
            260                 265                 270
Pro Leu Met Thr Asp Val Val His Ser Leu
        275                 280
<210>58
<211>2194
<212>DNA
<213>稻
<400>58
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct    60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact    120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt    180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc    240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata    300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga    360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt    420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat    480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag    540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt    600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc    660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat    720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa    780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca    840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag    900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa    960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata    1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag    1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc    1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt    1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct    1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt    1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt    1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt    1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa    1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt    1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga    1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt    1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc    1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct    1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg    1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg    1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa    1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct    2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg    2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc    2160
ttggtgtagc ttgccacttt caccagcaaa gttc                                2194
<210>59
<211>1620
<212>DNA
<213>拟南芥
<400>59
atggaatttg agtgccaaga gagacttgaa gctgcgaacg atcaaagaag tgagtctggt    60
cttttgaata ccgatttgag aataggtaat gatgggtctg ttgagattcc aaatgtgaag    120
ttgtgttgtc agaaaaagaa gggaacttta gtgcccagtg gctcgaaaca gttactctct    180
gacaaggatt tgtctactac cattattgat ttacctcagg cattgatatc tgagattctt    240
aattgccttg acccaaaaga gttgggtcta gtgtcttgtg tttcaactta tctgcatagg    300
ttagcatctg agcatcacgc ttggaaggag ttctatcgtg agagatgggg actccctgta    360
gttttcggag ctgcaagttc agggctttct gatgagagat catggaaaga tctgtttgtt    420
gaaagggaat ttaggagtag gaccttttta ggacgttata gtattgatac tctgtatggt    480
cacactgaag cagtccggac tgtttttctc ttagcttctg ccaagctcgt tttcacttct    540
ggatatgatt ccattgttcg gatgtgggac atggaagaag gcttgtctat tgcggcatct    600
aaacctctcg gttgtacgat tagggcactt gctgctgata caaagctgtt ggtagctggc    660
ggtactgatg gattcattca ttgctggaaa tcactggatg gtctccggaa cctgtttgat    720
ctcacaggtt ttcagaaaga gaagactgag tttcggctat ggggacatga gggtcctatt    780
acatctcttg ccctggacat gacaagtatc tttagcggtt catgggatat gtctgttcgt    840
atatgggatc gatcttcaat gaagtgtgtc aaaaccttga ggcatagtga ttgggtttgg    900
ggacttgcac ctcatgaaac caccctcgct agcacgtcag gttctgatgt atatatttgg    960
gacgttagca gtgagactcc attggcgatc atccctgatg ctcatgaggg taccacttac    1020
tctttggcaa gaagccatac tggggatttc ctgtttactg gtggagaaga tggagggatt    1080
aaaatgtttg agatcagaag atacggtagt gaaacaagcg ttgtacttat atctcaatgg    1140
atgcctcaca ctagtcctgt ctactctctt tcttttgagt ttccttggct tgtctcagca    1200
tccggtgacg gtaaactcgc acttatcgac gttaggaaac tgttaaaaac taaccgttgt    1260
gcctattcca aaaggatttc ttcgagtact gtggaaccgc cacaacgaat gctgcacggg    1320
ttcgggtcaa acttgttctc tgtggacgtg ggttatgacc gtatagtgtg tggaggtgaa    1380
gaaggcacag tccggatatg gaacttcaca caagcattgg agatagagcg aaggacccga    1440
gctctgaaag gaatgaggca tgagaatagg atgagacgaa ggagaatgca aatggagatg    1500
aacgcaaaga atggaaggcc tgaccaatgc tccattgctg ctcataagaa ccccatcaat    1560
ggagaaagga accgagcctg gcatagtaaa cgaagagcaa gcgggaaggc gaaggcctaa    1620
<210>60
<211>539
<212>PRT
<213>拟南芥
<400>60
Met Glu Phe Glu Cys Gln Glu Arg Leu Glu Ala Ala Asn Asp Gln Arg
1               5                   10                  15
Ser Glu Ser Gly Leu Leu Asn Thr Asp Leu Arg Ile Gly Asn Asp Gly
            20                  25                  30
Ser Val Glu Ile Pro Asn Val Lys Leu Cys Cys Gln Lys Lys Lys Gly
        35                  40                  45
Thr Leu Val Pro Ser Gly Ser Lys Gln Leu Leu Ser Asp Lys Asp Leu
    50                  55                  60
Ser Thr Thr Ile Ile Asp Leu Pro Gln Ala Leu Ile Ser Glu Ile Leu
65                  70                  75                  80
Asn Cys Leu Asp Pro Lys Glu Leu Gly Leu Val Ser Cys Val Ser Thr
                85                  90                  95
Tyr Leu His Arg Leu Ala Ser Glu His His Ala Trp Lys Glu Phe Tyr
            100                 105                 110
Arg Glu Arg Trp Gly Leu Pro Val Val Phe Gly Ala Ala Ser Ser Gly
        115                 120                 125
Leu Ser Asp Glu Arg Ser Trp Lys Asp Leu Phe Val Glu Arg Glu Phe
    130                 135                 140
Arg Ser Arg Thr Phe Leu Gly Arg Tyr Ser Ile Asp Thr Leu Tyr Gly
145                 150                 155                 160
Hi s Thr Glu Ala Val Arg Thr Val Phe Leu Leu Ala Ser Ala Lys Leu
                 165                 170                 175
Val Phe Thr Ser Gly Tyr Asp Ser Ile Val Arg Met Trp Asp Met Glu
            180                 185                 190
Glu Gly Leu Ser Ile Ala Ala Ser Lys Pro Leu Gly Cys Thr Ile Arg
        195                 200                 205
Ala Leu Ala Ala Asp Thr Lys Leu Leu Val Ala Gly Gly Thr Asp Gly
    210                 215                 220
Phe Ile His Cys Trp Lys Ser Leu Asp Gly Leu Arg Asn Leu Phe Asp
225                 230                 235                 240
Leu Thr Gly Phe Gln Lys Glu Lys Thr Glu Phe Arg Leu Trp Gly His
                245                 250                 255
Glu Gly Pro Ile Thr Ser Leu Ala Leu Asp Met Thr Ser Ile Phe Ser
            260                 265                 270
Gly Ser Trp Asp Met Ser Val Arg Ile Trp Asp Arg Ser Ser Met Lys
        275                 280                 285
Cys Val Lys Thr Leu Arg His Ser Asp Trp Val Trp Gly Leu Ala Pro
    290                 295                 300
His Glu Thr Thr Leu Ala Ser Thr Ser Gly Ser Asp Val Tyr Ile Trp
305                 310                 315                 320
Asp Val Ser Ser Glu Thr Pro Leu Ala Ile Ile Pro Asp Ala His Glu
                325                 330                 335
Gly Thr Thr Tyr Ser Leu Ala Arg Ser His Thr Gly Asp Phe Leu Phe
            340                 345                 350
Thr Gly Gly Glu Asp Gly Gly Ile Lys Met Phe Glu Ile Arg Arg Tyr
        355                 360                 365
Gly Ser Glu Thr Ser Val Val Leu Ile Ser Gln Trp Met Pro His Thr
    370                 375                 380
Ser Pro Val Tyr Ser Leu Ser Phe Glu Phe Pro Trp Leu Val Ser Ala
385                 390                 395                 400
Ser Gly Asp Gly Lys Leu Ala Leu Ile Asp Val Arg Lys Leu Leu Lys
                405                 410                 415
Thr Asn Arg Cys Ala Tyr Ser Lys Arg Ile Ser Ser Ser Thr Val Glu
            420                 425                 430
Pro Pro Gln Arg Met Leu His Gly Phe Gly Ser Asn Leu Phe Ser Val
        435                 440                 445
Asp Val Gly Tyr Asp Arg Ile Val Cys Gly Gly Glu Glu Gly Thr Val
    450                 455                 460
Arg Ile Trp Asn Phe Thr Gln Ala Leu Glu Ile Glu Arg Arg Thr Arg
465                 470                 475                 480
Ala Leu Lys Gly Met Arg His Glu Asn Arg Met Arg Arg Arg Arg Met
                485                 490                 495
Gln Met Glu Met Asn Ala Lys Asn Gly Arg Pro Asp Gln Cys Ser Ile
            500                 505                 510
Ala Ala His Lys Asn Pro Ile Asn Gly Glu Arg Asn Arg Ala Trp His
        515                 520                 525
Ser Lys Arg Arg Ala Ser Gly Lys Ala Lys Ala
    530                 535
<210>61
<211>1689
<212>DNA
<213>稻
<400>61
atggactttg attgcaaaac agcaagagga gactcttcat ctgtgaatcg ttcatgcatt    60
gtcactgaag gcactgtcgt ccaggcaaag cccgtttctc acaacgggaa agctaaacac    120
tggaatagcc tcagtacatt gaataaccag aagtgcagtt atgaattact ttccgaccca    180
aagaaaaatg ttgaaacaag tgatggtgag accgcctcaa agtgtgactc atggtgcttc    240
actgatttgc catccgcatt ggtctgtgaa gtgcttgaac acctcgatcc aaaggaactt    300
ggcattgtat cttgcgtctc caccctactg cataccctag ccacagatca tcaggggtgg    360
aagaagttct actgtgaaag gtgggggatt cctactcctc cagtcaccct caatgggccc    420
ttggttccag gaggaacttc agattggaag tcttggaaaa cattatttgt ggagcgggag    480
tttcgaagta aatcattcat gggaagattc agtgtggatg ttctccgtga ccacagtgag    540
gatgtacgca ctgtgttcct tctagcatca gtaaatctga tatttactgg tggtaatgac    600
tctgtgatcc gaatgtggga cttggaggaa gggcttttga ttgataagtc ccgcccactt    660
tgttgcacca tccgggccat tgcagctgac actaggcttt tggtcactgc aggaaccaat    720
gcctttattc attgttggag ggctgttgaa ggtaattctt accctttcca catctctggg    780
aatggcactg accagagtcc tgagtttcgc ctttgggggc atgaaggacc tgtgacttgt    840
cttgccttgg attcattgag gattttcagt ggtagctggg atatgactgt ccgtgtttgg    900
gacagatccg aaatgaaatg tgttcagaag ttcatgcatg cagattgggt ttggagcgtg    960
gcacctcatg gaaatactgt tgccagtaca gctggtaggg atgcctatgt atgggatatc    1020
aggagtggtg agttggaaaa tgttatttcc aatgcccatt atggtaatgc attttcttta    1080
gctcgaacac acctagctga tgtgctgttt accggaggag aggatggggc aattcgcctg    1140
ttcaatgttt ctgaggtctc tgatgatgaa gatattaagc cagctgctac ttgggttcca    1200
cataccggcc ctgttcattc cctcgctttt gagtatccat ggcttgtctc agcctctagt    1260
gatggcaggg ttgcactgat tgatttgagg aagcttctga ccccaagaaa gtcatcaaaa    1320
caaccattca gggttaagaa ctttgatcca agttccattg aacctccaca gagaatgctt    1380
catggctttg ggtgcgatct tttttctgtc gccattggtg cagacaggat tgtctgtgga    1440
ggcgaggatg gcgctgtcaa agtctggaac ttctcagaag cactggagat tgagaagagg    1500
gcacaagctc taagaagtat gaggcaggag aaccgcatga ggcgaaaaaa ggcacaagta    1560
gagatgaatg caaatggtag aaggtctgac caatgtggct caatagccat gaaaagaaac    1620
caactgaagg gtgataagag tgtcacttgg cacagcaagc gtgccatcaa tgataaggtc    1680
aagtcttag                                                            1689
<210>62
<211>562
<212>PRT
<213>稻
<400>62
Met Asp Phe Asp Cys Lys Thr Ala Arg Gly Asp Ser Ser Ser Val Asn
1               5                   10                  15
Arg Ser Cys Ile Val Thr Glu Gly Thr Val Val Gln Ala Lys Pro Val
            20                  25                  30
Ser His Asn Gly Lys Ala Lys His Trp Asn Ser Leu Ser Thr Leu Asn
        35                  40                  45
Asn Gln Lys Cys Ser Tyr Glu Leu Leu Ser Asp Pro Lys Lys Asn Val
    50                  55                  60
Glu Thr Ser Asp Gly Glu Thr Ala Ser Lys Cys Asp Ser Trp Cys Phe
65                  70                  75                  80
Thr Asp Leu Pro Ser Ala Leu Val Cys Glu Val Leu Glu His Leu Asp
                85                  90                  95
Pro Lys Glu Leu Gly Ile Val Ser Cys Val Ser Thr Leu Leu His Thr
            100                 105                 110
Leu Ala Thr Asp His Gln Gly Trp Lys Lys Phe Tyr Cys Glu Arg Trp
        115                 120                 125
Gly Ile Pro Thr Pro Pro Val Thr Leu Asn Gly Pro Leu Val Pro Gly
    130                 135                 140
Gly Thr Ser Asp Trp Lys Ser Trp Lys Thr Leu Phe Val Glu Arg Glu
145                 150                 155                 160
Phe Arg Ser Lys Ser Phe Met Gly Arg Phe Ser Val Asp Val Leu Arg
                165                 170                 175
Asp His Ser Glu Asp Val Arg Thr Val Phe Leu Leu Ala Ser Val Asn
            180                 185                 190
Leu Ile Phe Thr Gly Gly Asn Asp Ser Val Ile Arg Met Trp Asp Leu
        195                 200                 205
Glu Glu Gly Leu Leu Ile Asp Lys Ser Arg Pro Leu Cys Cys ThrIle
    210                 215                 220
Arg Ala Ile Ala Ala Asp Thr Arg Leu Leu Val Thr Ala Gly Thr Asn
225                 230                 235                 240
Ala Phe Ile His Cys Trp Arg Ala Val Glu Gly Asn Ser Tyr Pro Phe
                245                 250                 255
His Ile Ser Gly Asn Gly Thr Asp Gln Ser Pro Glu Phe Arg Leu Trp
            260                 265                 270
Gly His Glu Gly Pro Val Thr Cys Leu Ala Leu Asp Ser Leu Arg Ile
        275                 280                 285
Phe Ser Gly Ser Trp Asp Met Thr Val Arg Val Trp Asp Arg Ser Glu
    290                 295                 300
Met Lys Cys Val Gln Lys Phe Met His Ala Asp Trp Val Trp Ser Val
305                 310                 315                 320
Ala Pro His Gly Asn Thr Val Ala Ser Thr Ala Gly Arg Asp Ala Tyr
                325                 330                 335
Val Trp Asp Ile Arg Ser Gly Glu Leu Glu Asn Val Ile Ser Asn Ala
            340                 345                 350
His Tyr Gly Asn Ala Phe Ser Leu Ala Arg Thr His Leu Ala Asp Val
        355                 360                 365
Leu Phe Thr Gly Gly Glu Asp Gly Ala Ile Arg Leu Phe Asn Val Ser
    370                 375                 380
Glu Val Ser Asp Asp Glu Asp Ile Lys Pro Ala Ala Thr Trp Val Pro
385                 390                 395                 400
His Thr Gly Pro Val His Ser Leu Ala Phe Glu Tyr Pro Trp Leu Val
                405                 410                 415
Ser Ala Ser Ser Asp Gly Arg Val Ala Leu Ile Asp Leu Arg Lys Leu
            420                 425                 430
Leu Thr Pro Arg Lys Ser Ser Lys Gln Pro Phe Arg Val Lys Asn Phe
        435                 440                 445
Asp Pro Ser Ser Ile Glu Pro Pro Gln Arg Met Leu His Gly Phe Gly
    450                 455                 460
Cys Asp Leu Phe Ser Val Ala Ile Gly Ala Asp Arg Ile Val Cys Gly
465                 470                 475                 480
Gly Glu Asp Gly Ala Val Lys Val Trp Asn Phe Ser Glu Ala Leu Glu
                485                 490                 495
Ile Glu Lys Arg Ala Gln Ala Leu Arg Ser Met Arg Gln Glu Asn Arg
            500                 505                 510
Met Arg Arg Lys Lys Ala Gln Val Glu Met Asn Ala Asn Gly Arg Arg
        515                 520                 525
Ser Asp Gln Cys Gly Ser Ile Ala Met Lys Arg Asn Gln Leu Lys Gly
    530                 535                 540
Asp Lys Ser Val Thr Trp His Ser Lys Arg Ala Ile Asn Asp Lys Val
545                 550                 555                 560
Lys Ser
<210>63
<211>1728
<212>DNA
<213>蒺藜苜蓿(Medicago trunculata)
<400>63
atggcatttg attgtccaca gagtattaag gtttctcaaa atttggtaga aaatccaggt    60
ataagcatag acatagttga attgaatcca aaacccaatt ccaaagcaat ttcaatttca    120
ttccctgatt ttgttacaaa taccaaatct gaatctggaa aaggtgagat ttttaagggg    180
aaatccaagc tgaattctaa gaaaggaatc aaagcagcct ctgctggtgc tttgaatcaa    240
tcatcagttc ctggtgatgt ggttattggt aattgtaggt caattaccga cctgcctccg    300
gtgttgatat ctgagattct gaattgtctt gatcccaaag aacttggaat tgtttcatgt    360
gtgtcgttga ttctgcgtag tcttgcttct gagcatcatg cttggaagga attctattgt    420
gaaaggtggg ggcttccagc agttcctgag gctgtcctgg attcggattc tggggttggg    480
gattcggtta aggatgaaaa gtcatggaag gatattttcg tggaaagaga ttataggagt    540
aagactttta tgggaaggta tagtatggat gtgttgtatg gacatactga ggcggttcgg    600
actgttttct tgttggcttc tacaaagctt atatttacat ctgggtatga cactgttgtg    660
aggatgtgga acatggaaag tgggttgtcg gttgcatcgt ctaaaccact tggctgcacc    720
attcgtgcgg ttgcagctga tacaaggctg ctagttgctg gtggtactga tgggttcatt    780
cattgttgga gggctgttga aggtttgcca catctgtttg agcttagaaa ctcacaacaa    840
aataagaatg aggttcgact ttggggtcat gatggtccgg ttacttcact tgctttagat    900
ttgacaagga tttatagcgg ctcttgggac acgactgttc gtgtttggga ccgtcactcg    960
atgaaatgca ctgtcgtgtt gaggcatagt gactgggttt ggggacttgt ccctcatgat    1020
actacagttg tcagcacatc aggttcaaat gtctatgttt gggatacaaa tagtggtaat    1080
ttggcaactg ttgttctaaa tgctcatgtt ggtaatactt atgctctggc aagaagccat    1140
actggggatt tcatttttac tgggggtgaa gatggttcaa ttcacatgta cgagattgtt    1200
gacggtagtt atgtgaccga agctctgcat gttgctacat gggatcccca ctctggtcct    1260
gtgtattccc ttgcctttga gtttccttgg cttgtttctg catcaagtga cggcaaattg    1320
gctctaattg acgtgaggaa gctgctgcgc aggagcaagc gtgccattgg aaagagagct    1380
acgaaggcaa agtattcggg cgaagttaat gtagagcctc cacagaggat gttgcatgga    1440
tttaagagta atcttttctc tgtaggtata ggagctgatc gaattgtttg cggaggtgaa    1500
gaaggtgtcg ttaggatttg gaatttcaca gaagctttgg aaattgaaag cagagttcgt    1560
gcattgagag gaatgcgatt agagaacaga atgagacgac gtaagaacca aacagagctc    1620
aacagtaaag gcggtaagag tgatcaatgt tcagctgcgg ccaagaagag ttcagtgact    1680
tgtatttggc cgagtaaacg tgggatgggt ggaaagacga aggcatag                 1728
<210>64
<211>575
<212>PRT
<213>蒺藜苜蓿
<400>64
Met Ala Phe Asp Cys Pro Gln Ser Ile Lys Val Ser Gln Asn Leu Val
1               5                   10                  15
Glu Asn Pro Gly Ile Ser Ile Asp Ile Val Glu Leu Asn Pro Lys Pro
            20                  25                  30
Asn Ser Lys Ala Ile Ser Ile Ser Phe Pro Asp Phe Val Thr Asn Thr
        35                  40                  45
Lys Ser Glu Ser Gly Lys Gly Glu Ile Phe Lys Gly Lys Ser Lys Leu
    50                  55                  60
Asn Ser Lys Lys Gly Ile Lys Ala Ala Ser Ala Gly Ala Leu Asn Gln
65                  70                  75                  80
Ser Ser Val Pro Gly Asp Val Val Ile Gly Asn Cys Arg Ser Ile Thr
                85                  90                  95
Asp Leu Pro Pro Val Leu Ile Ser Glu Ile Leu Asn Cys Leu Asp Pro
            100                 105                 110
Lys Glu Leu Gly Ile Val Ser Cys Val Ser Leu Ile Leu Arg Ser Leu
        115                 120                 125
Ala Ser Glu His His Ala Trp Lys Glu Phe Tyr Cys Glu Arg Trp Gly
    130                 135                 140
Leu Pro Ala Val Pro Glu Ala Val Leu Asp Ser Asp Ser Gly Val Gly
145                 150                 155                 160
Asp Ser Val Lys Asp Glu Lys Ser Trp Lys Asp Ile Phe Val Glu Arg
                165                 170                 175
Asp Tyr Arg Ser Lys Thr Phe Met Gly Arg Tyr Ser Met Asp Val Leu
            180                 185                 190
Tyr Gly His Thr Glu Ala Val Arg Thr Val Phe Leu Leu Ala Ser Thr
        195                 200                 205
Lys Leu Ile Phe Thr Ser Gly Tyr Asp Thr Val Val Arg Met Trp Asn
    210                 215                 220
Met Glu Ser Gly Leu Ser Val Ala Ser Ser Lys Pro Leu Gly Cys Thr
225                 230                 235                 240
Ile Arg Ala Val Ala Ala Asp Thr Arg Leu Leu Val Ala Gly Gly Thr
                245                 250                 255
Asp Gly Phe Ile His Cys Trp Arg Ala Val Glu Gly Leu Pro His Leu
            260                 265                 270
Phe Glu Leu Arg Asn Ser Gln Gln Asn Lys Asn Glu Val Arg Leu Trp
        275                 280                 285
Gly His Asp Gly Pro Val Thr Ser Leu Ala Leu Asp Leu Thr Arg Ile
    290                 295                 300
Tyr Ser Gly Ser Trp Asp Thr Thr Val Arg Val Trp Asp Arg His Ser
305                 310                 315                 320
Met Lys Cys Thr Val Val Leu Arg His Ser Asp Trp Val Trp Gly Leu
                325                 330                 335
Val Pro His Asp Thr Thr Val Val Ser Thr Ser Gly Ser Asn Val Tyr
            340                 345                 350
Val Trp Asp Thr Asn Ser Gly Asn Leu Ala Thr Val Val Leu Asn Ala
        355                 360                 365
His Val Gly Asn Thr Tyr Ala Leu Ala Arg Ser His Thr Gly Asp Phe
    370                 375                 380
Ile Phe Thr Gly Gly Glu Asp Gly Ser Ile His Met Tyr Glu Ile Val
385                 390                 395                 400
Asp Gly Ser Tyr Val Thr Glu Ala Leu His Val Ala Thr Trp Asp Pro
                405                 410                 415
His Ser Gly Pro Val Tyr Ser Leu Ala Phe Glu Phe Pro Trp Leu Val
            420                 425                 430
Ser Ala Ser Ser Asp Gly Lys Leu Ala Leu Ile Asp Val Arg Lys Leu
        435                 440                 445
Leu Arg Arg Ser Lys Arg Ala Ile Gly Lys Arg Ala Thr Lys Ala Lys
    450                 455                 460
Tyr Ser Gly Glu Val Asn Val Glu Pro Pro Gln Arg Met Leu His Gly
465                 470                 475                 480
Phe Lys Ser Asn Leu Phe Ser Val Gly Ile Gly Ala Asp Arg Ile Val
                485                 490                 495
Cys Gly Gly Glu Glu Gly Val Val Arg Ile Trp Asn Phe Thr Glu Ala
            500                 505                 510
Leu Glu Ile Glu Ser Arg Val Arg Ala Leu Arg Gly Met Arg Leu Glu
        515                 520                 525
Asn Arg Met Arg Arg Arg Lys Asn Gln Thr Glu Leu Asn Ser Lys Gly
    530                 535                 540
Gly Lys Ser Asp Gln Cys Ser Ala Ala Ala Lys Lys Ser Ser Val Thr
545                 550                 555                 560
Cys Ile Trp Pro Ser Lys Arg Gly Met Gly Gly Lys Thr Lys Ala
                565                 570                 575
<210>65
<211>1683
<212>DNA
<213>普通小麦(Triticum aestivum)
<400>65
atggactttg attgcaataa ggcaggagag tcttcagcca agcattgttc tagcatttgc  60
aacgagggca cactcatcca ggcaaacacc ttaattcatt gtggaaaggc taaaaagtgg  120
aatagcctca acaaattcaa caacccggag tcaagtcatg gatcacttcc aagggttaat  180
gaccccaagg aagatggtga aacaggaaat gatgcaactg cctctgagtg tagcgttatg  240
tgcttcactg atctgccgtc tgcattggtc tgtgaagtcc ttgcgcgcct tgatccaaag  300
gggcttgggg ttgtatcttg tgtctccaca gttctgcaga ccctagccac agatcatcag  360
ggatggaaga aattctactg tgagaggtgg ggacttccaa atgctcccat cggaccccta  420
gttccaggtg gaaccccaga tgggaggtcg tggaaagcat tgtttgtgga ccgggagttt  480
caaagcagat cattcatggg aagatttagt gtggatgttc tccgtggtca caatgaggat  540
gtacgcactg tgtaccttct ggcatcagca aatctgatat tcactggtgg ccatgattct  600
gtggttcgga tgtggaatat ggaggaaggg ctactaattg atgagtcccg cccatttggt  660
tgcactatcc gggcaattgc agctgacagt aggcttttgg taactggagg atccaaagcc  720
ttcattcagt gttggagggc tattgagggg gcctcgcacc tttctcacat ttctgggaat  780
ggtactaacc agaattctga atttcgccta tgggggcatg aagggcctgt gacttgtctt  840
tccttggatt caacaaggat ttacagtggt tcttgggata tgactgttcg tgtttgggac  900
agagccgaga tgaagtgtgt gcaaaagttc atgcatgctg actgggtttt ggccctggct  960
cctcatggaa atactgttgc cagtacagct ggtagagacg catatgtgtg ggatatcgga  1020
agtggcgagt taacaactat aatttccaat gcccatgttg gtaatgcata ttctgtagct  1080
cgaacacacc tggcaggtgt gctgtttact ggaggagagg acggggcaat tcgcttgttc  1140
gatgtttctg agatatcgga tgatgagaat attaaaccag ctgccacttg gttgccgcat  1200
tctggccctg ttcattctct tgcttttgag tacccatggc ttgtttctgc ctctagtgat  1260
ggcaggattg cactaattga tttgaggaag atcctgaccc ccctaaactc atcaaagcgc  1320
cgtttcaggg ttaagccctt tgatccaagt accgtagagc ctccacagcg aatgcttcat  1380
ggctttggat gctatctttt ctccgtcggc atcggtgcag atagaatcat atgtggaggc  1440
gaggatggct ctgtcagggt ctggaacttc tcggaagcac tggagattga gaagaaggca  1500
caggctttaa ggagtctgag acaggagaac cgcatgaggc ggaggaaggc gcaagtggag  1560
atgaatgcaa atggtagaag ggttgaccat tgctcagtag ccatgaaaag gaacccattg  1620
aagggtgata agagtgtcac ttggcaaatc aagcgtccca tcagtgacaa ggtcaagtct  1680
tag                                                                1683
<210>66
<211>560
<212>PRT
<213>普通小麦
<400>66
Met Asp Phe Asp Cys Asn Lys Ala Gly Glu Ser Ser Ala Lys His Cys
1               5                   10                  15
Ser Ser Ile Cys Asn Glu Gly Thr Leu Ile Gln Ala Asn Thr Leu Ile
            20                  25                  30
His Cys Gly Lys Ala Lys Lys Trp Asn Ser Leu Asn Lys Phe Asn Asn
        35                  40                  45
Pro Glu Ser Ser His Gly Ser Leu Pro Arg Val Asn Asp Pro Lys Glu
    50                  55                  60
Asp Gly Glu Thr Gly Asn Asp Ala Thr Ala Ser Glu Cys Ser Val Met
65                  70                  75                  80
Cys Phe Thr Asp Leu Pro Ser Ala Leu Val Cys Glu Val Leu Ala Arg
                85                  90                  95
Leu Asp Pro Lys Gly Leu Gly Val Val Ser Cys Val Ser Thr Val Leu
            100                 105                 110
Gln Thr Leu Ala Thr Asp His Gln Gly Trp Lys Lys Phe Tyr Cys Glu
        115                 120                 125
Arg Trp Gly Leu Pro Asn Ala Pro Ile Gly Pro Leu Val Pro Gly Gly
    130                 135                 140
Thr Pro Asp Gly Arg Ser Trp Lys Ala Leu Phe Val Asp Arg Glu Phe
145                 150                 155                 160
Gln Ser Arg Ser Phe Met Gly Arg Phe Ser Val Asp Val Leu Arg Gly
                165                 170                 175
His Asn Glu Asp Val Arg Thr Val Tyr Leu Leu Ala Ser Ala Asn Leu
            180                 185                 190
Ile Phe Thr Gly Gly His Asp Ser Val Val Arg Met Trp Asn Met Glu
        195                 200                 205
Glu Gly Leu Leu Ile Asp Glu Ser Arg Pro Phe Gly Cys Thr Ile Arg
    210                 215                 220
Ala Ile Ala Ala Asp Ser Arg Leu Leu Val Thr Gly Gly Ser Lys Ala
225                 230                 235                 240
Phe Ile Gln Cys Trp Arg Ala Ile Glu Gly Ala Ser His Leu Ser His
                245                 250                 255
Ile Ser Gly Asn Gly Thr Asn Gln Asn Ser Glu Phe Arg Leu Trp Gly
            260                 265                 270
His Glu Gly Pro Val Thr Cys Leu Ser Leu Asp Ser Thr Arg Ile Tyr
        275                 280                 285
Ser Gly Ser Trp Asp Met Thr Val Arg Val Trp Asp Arg Ala Glu Met
    290                 295                 300
Lys Cys Val Gln Lys Phe Met His Ala Asp Trp Val Leu Ala Leu Ala
305                 310                 315                 320
Pro His Gly Asn Thr Val Ala Ser Thr Ala Gly Arg Asp Ala Tyr Val
                325                 330                 335
Trp Asp Ile Gly Ser Gly Glu Leu Thr Thr Ile Ile Ser Asn Ala His
            340                 345                 350
Val Gly Asn Ala Tyr Ser Val Ala Arg Thr His Leu Ala Gly Val Leu
        355                 360                 365
Phe Thr Gly Gly Glu Asp Gly Ala Ile Arg Leu Phe Asp Val Ser Glu
    370                 375                 380
Ile Ser Asp Asp Glu Asn Ile Lys Pro Ala Ala Thr Trp Leu Pro His
385                 390                 395                 400
Ser Gly Pro Val His Ser Leu Ala Phe Glu Tyr Pro Trp Leu Val Ser
                405                 410                 415
Ala Ser Ser Asp Gly Arg Ile Ala Leu Ile Asp Leu Arg Lys Ile Leu
            420                 425                 430
Thr Pro Leu Asn Ser Ser Lys Arg Arg Phe Arg Val Lys Pro Phe Asp
        435                 440                 445
Pro Ser Thr Val Glu Pro Pro Gln Arg Met Leu His Gly Phe Gly Cys
    450                 455                 460
Tyr Leu Phe Ser Val Gly Ile Gly Ala Asp Arg Ile Ile Cys Gly Gly
465                 470                 475                 480
Glu Asp Gly Ser Val Arg Val Trp Asn Phe Ser Glu Ala Leu Glu Ile
                485                 490                 495
Glu Lys Lys Ala Gln Ala Leu Arg Ser Leu Arg Gln Glu Asn Arg Met
            500                 505                 510
Arg Arg Arg Lys Ala Gln Val Glu Met Asn Ala Asn Gly Arg Arg Val
        515                 520                 525
Asp His Cys Ser Val Ala Met Lys Arg Asn Pro Leu Lys Gly Asp Lys
    530                 535                 540
Ser Val Thr Trp Gln Ile Lys Arg Pro Ile Ser Asp Lys Val Lys Ser
545                 550                 555                 560
<210>67
<211>1632
<212>DNA
<213>美洲山杨(Populus tremuloides)
<400>67
atggcatttg aatgccaaaa gagcactgag gtgtcgaaaa gtcttgccat ttgtgttgaa  60
aaaagtaatt ccaatacgga acatcttgaa atttcgaagt ctcctttaga ctgttaccct  120
aagaagggga ttttaagcag tttgagttca aaacagcttt cttgtaatga tgttttgctc  180
aattgtcgcc ggtcaattac cgaccttcct ccggcattga tttctgagat tcttagttgc  240
cttgatcctc aagagcttgg tatagtttca tgtgtatcga gagtacttaa tagtcttgca  300
accgagaata gtgtttggaa ggaagtatat ggtgagagat ggggactccc tatagttcct  360
gcaccattgg gtgcaggggt ttcaaatgag aagtcatgga aggaactgtt tgtggagagg    420
gagtacagga gtaagatttt tttgagtcgt tatagcattg atactttgca tgggcatact    480
gaagcagtta gaacagtttc tctattggct tctgccaagc tcatttttac ctctgggtat    540
gatatgattg tgcgaatgtg ggacatggaa gacgggttgt atattgcatc atcacggcct    600
cttggttgca ctatacgagc agttgcagcg gacacgaagc tgttggttgc tggtggtact    660
gatggtttta ttcaaggctg gagggcagtt gagggtctca agcacttgtt tgaccttaaa    720
ggttctgagg tgccaaacac tgaatttaga atttgggagc atgagggacc tataacctct    780
cttgccttgg accccacaag gatttatagt gggtcatggg acatgactgt tcgtatatgg    840
gatcgttcct cacttgaatg cataaagatc ttgaggcatg gtgactgggt gtggagcctt    900
gttccgcatg atactacagt tgctagcaca tcaggttcag acgtgtatgt ttgggacact    960
aatagtggga ctctgctaac tgttattcat agtgctcatg taggtaacac ttattctttg    1020
gctcgaagcc atacagagga tttcattttt acaggaggag aagatggggc tatgcacatg    1080
tttgagatca ctggtcctaa acctgaggct aatgttttta aggttgcaac ttggatgcct    1140
cactcagggc ctgtttattc ccttgcattt gagtttccat ggcttgtttc agcttctagt    1200
gatgggaggc tgtcactagt tgatgtgaga aaactactaa ggaccaacag acgttctcta    1260
cgaaagaatg tttcaagggt taccgataag gaccgtaaca atgttgaacc acctcagagg    1320
atgttacatg ggtttgggcc caatttgttt tcagtagatg ttggtgctga ccgtattgta    1380
tgtggaggag aggaaggtgt tgttaggatc tggaacttct caaaggcgct ggaaagggag    1440
cggacagctc gtgccatgag aggaatacgg ttggagaaca ggatgaggcg tcgtagactt    1500
caaatagaga tgagcagtaa gggtggtagg actgatcaat gctctgttgc agccaagaag    1560
aacccaatgc atgtagacaa gagtggtgtc tggcgcaata aacatgggat gagtggcaag    1620
ctgaaagcat ag                                                        1632
<210>68
<211>543
<212>PRT
<213>美洲山杨
<400>68
Met Ala Phe Glu Cys Gln Lys Ser Thr Glu Val Ser Lys Ser Leu Ala
1               5                   10                  15
Ile Cys Val Glu Lys Ser Asn Ser Asn Thr Glu His Leu Glu Ile Ser
            20                  25                  30
Lys Ser Pro Leu Asp Cys Tyr Pro Lys Lys Gly Ile Leu Ser Ser Leu
        35                  40                  45
Ser Ser Lys Gln Leu Ser Cys Asn Asp Val Leu Leu Asn Cys Arg Arg
    50                  55                  60
Ser Ile Thr Asp Leu Pro Pro Ala Leu Ile Ser Glu Ile Leu Ser Cys
65                  70                  75                  80
Leu Asp Pro Gln Glu Leu Gly Ile Val Ser Cys Val Ser Arg Val Leu
                85                  90                  95
Asn Ser Leu Ala Thr Glu Asn Ser Val Trp Lys Glu Val Tyr Gly Glu
            100                 105                 110
Arg Trp Gly Leu Pro Ile Val Pro Ala Pro Leu Gly Ala Gly Val Ser
        115                 120                 125
Asn Glu Lys Ser Trp Lys Glu Leu Phe Val Glu Arg Glu Tyr Arg Ser
    130                 135                 140
Lys Ile Phe Leu Ser Arg Tyr Ser Ile Asp Thr Leu His Gly His Thr
145                 150                 155                 160
Glu Ala Val Arg Thr Val Ser Leu Leu Ala Ser Ala Lys Leu Ile Phe
                165                 170                 175
Thr Ser Gly Tyr Asp Met Ile Val Arg Met Trp Asp Met Glu Asp Gly
            180                 185                 190
Leu Tyr Ile Ala Ser Ser Arg Pro Leu Gly Cys Thr Ile Arg Ala Val
        195                 200                 205
Ala Ala Asp Thr Lys Leu Leu Val Ala Gly Gly Thr Asp Gly Phe Ile
    210                 215                 220
Gln Gly Trp Arg Ala Val Glu Gly Leu Lys His Leu Phe Asp Leu Lys
225                 230                 235                 240
Gly Ser Glu Val Pro Asn Thr Glu Phe Arg Ile Trp Glu His Glu Gly
                245                 250                 255
Pro Ile Thr Ser Leu Ala Leu Asp Pro Thr Arg Ile Tyr Ser Gly Ser
            260                 265                 270
Trp Asp Met Thr Val Arg Ile Trp Asp Arg Ser Ser Leu Glu CysIle
        275                 280                 285
Lys Ile Leu Arg His Gly Asp Trp Val Trp Ser Leu Val Pro His Asp
    290                 295                 300
Thr Thr Val Ala Ser Thr Ser Gly Ser Asp Val Tyr Val Trp Asp Thr
305                 310                 315                 320
Asn Ser Gly Thr Leu Leu Thr Val Ile His Ser Ala His Val Gly Asn
                325                 330                 335
Thr Tyr Ser Leu Ala Arg Ser His Thr Glu Asp Phe Ile Phe Thr Gly
            340                 345                 350
Gly Glu Asp Gly Ala Met His Met Phe Glu Ile Thr Gly Pro Lys Pro
        355                 360                 365
Glu Ala Asn Val Phe Lys Val Ala Thr Trp Met Pro His Ser Gly Pro
    370                 375                 380
Val Tyr Ser Leu Ala Phe Glu Phe Pro Trp Leu Val Ser Ala Ser Ser
385                 390                 395                 400
Asp Gly Arg Leu Ser Leu Val Asp Val Arg Lys Leu Leu Arg Thr Asn
                405                 410                 415
Arg Arg Ser Leu Arg Lys Asn Val Ser Arg Val Thr Asp Lys Asp Arg
            420                 425                 430
Asn Asn Val Glu Pro Pro Gln Arg Met Leu His Gly Phe Gly Pro Asn
        435                 440                 445
Leu Phe Ser Val Asp Val Gly Ala Asp Arg Ile Val Cys Gly Gly Glu
    450                 455                 460
Glu Gly Val Val Arg Ile Trp Asn Phe Ser Lys Ala Leu Glu Arg Glu
465                 470                 475                 480
Arg Thr Ala Arg Ala Met Arg Gly Ile Arg Leu Glu Asn Arg Met Arg
                485                 490                 495
Arg Arg Arg Leu Gln Ile Glu Met Ser Ser Lys Gly Gly Arg Thr Asp
            500                 505                 510
Gln Cys Ser Val Ala Ala Lys Lys Asn Pro Met His Val Asp Lys Ser
        515                 520                 525
Gly Val Trp Arg Asn Lys His Gly Met Ser Gly Lys Leu Lys Ala
    530                 535                 540
<210>69
<211>1695
<212>DNA
<213>玉蜀黍(Zea mays)
<400>69
atggcctttg actgcaacaa ggaaagagga gtttcttcgc ctgacagttg ctcccgcatt    60
tgcaccgagg gcactctcgt ccaggcaaat cccttatctc actactggaa gcctaaacgt    120
ttggagaact tcaacaagtt ggagaaccag aagtccagtt atgaatctgc tccgagtggc    180
tctgatccaa aacaggatgc tgaagcgagt gatgaggcaa ctgcctcact gtgtggcttc    240
aggtgcttca ctgatctgcc agcttcgttg gtctgcgagg tccttgcacg tctcgatgcg    300
aaggaccttg gaattgtatc ctgtgtctcc accctcctgc acgccttagc cacagatcat    360
cagggatgga agaagttata ctgcgaaagg tgggggcttc cagacctccc caccaccctg    420
aatgggccct tgctgccggg tgtcccccta gatgggaagt tttggaaaac atttttcgtg    480
gagcgggagt ttaggagcaa atccttcatg ggaagattca atctggatat tctccgtggc    540
cacaatgagg atgtgcgtgc tgtgtccctt ttggtatcag caaatctgat attcacaggc    600
ggccgcgatt ctgtggttag gatgtggaag atggaggaag ggttattgat tgatacatcc    660
cgtgcacttg gtggcaccat ccgggcgatt gcagctgact cgaggctttt agtgagtgga    720
ggaactaatg cctatattca gtgttggagg gccgttgaag gcaatggtca attatttcac    780
atctctggaa gtggtaccga ccagaatgcg gagtttcgcc tctggggtca tgaaggtcct    840
gtgacttgtc ttgccctgga ttcactgagg atttatagtg gttcttggga catgactgtt    900
cgtgtttggg acagagacca gatggagtgt gtgcaaaagt tcatgcatgc agactgggtt    960
tgggatcttg ctctgcgtgg aaatactgtt gccagtactg ctggtagaga tgcatatgta    1020
tgggatatca gggctggcga gttaacaagc ttaatttcca atgcccatgt tggtagcgca    1080
tattcaattg cttggacaca cctgccagat gtgctgttta ctggtggaga ggatggtgct    1140
attcgattgt tcaatgtttt tgatgtctgt gatgatgagg gtgacattaa accagtggca    1200
acttgggtgc cacattcagg tcctgttcat tctcttgctt ttgagtatcc atggcttgtg    1260
tcagcctcga gtgatggcag gattgcactt attgatttga ggaagcttct gtcctccaaa    1320
agttcatcaa agggtctgcg tgttaagaga gttgatggaa gcgcaataga gcctccacag    1380
aggatgcttc atggcgttgg atgtgatctc ttctccatcg ctattggtgc agataggatt    1440
gtatgtgccg gtgaggatgg ttctgttaga gtctggaact tctcaaaagc attggagatt    1500
gagaggaggg cacaggctct aaggagtttg aggcaggaga accgcatcag gcggaggaaa    1560
tcacaagcgg agatgaatac aaatactaga aggcctgacc agtgttcaat agccatgaaa    1620
aagaaccaac tgaagggtga taagagcgca acttggcaca acaagcgtgc cattaatgag    1680
aaggccaagt cttag                                                     1695
<210>70
<211>564
<212>PRT
<213>玉蜀黍
<400>70
Met Ala Phe Asp Cys Asn Lys Glu Arg Gly Val Ser Ser Pro Asp Ser
1               5                   10                  15
Cys Ser Arg Ile Cys Thr Glu Gly Thr Leu Val Gln Ala Asn Pro Leu
            20                  25                  30
Ser His Tyr Trp Lys Pro Lys Arg Leu Glu Asn Phe Asn Lys Leu Glu
        35                  40                  45
Asn Gln Lys Ser Ser Tyr Glu Ser Ala Pro Ser Gly Ser Asp Pro Lys
    50                  55                  60
Gln Asp Ala Glu Ala Ser Asp Glu Ala Thr Ala Ser Leu Cys Gly Phe
65                  70                  75                  80
Arg Cys Phe Thr Asp Leu Pro Ala Ser Leu Val Cys Glu Val Leu Ala
                85                  90                  95
Arg Leu Asp Ala Lys Asp Leu Gly Ile Val Ser Cys Val Ser Thr Leu
            100                 105                 110
Leu His Ala Leu Ala Thr Asp His Gln Gly Trp Lys Lys Leu Tyr Cys
        115                 120                 125
Glu Arg Trp Gly Leu Pro Asp Leu Pro Thr Thr Leu Asn Gly Pro Leu
    130                 135                 140
Leu Pro Gly Val Pro Leu Asp Gly Lys Phe Trp Lys Thr Phe Phe Val
145                 150                 155                 160
Glu Arg Glu Phe Arg Ser Lys Ser Phe Met Gly Arg Phe Asn Leu Asp
                165                 170                 175
Ile Leu Arg Gly His Asn Glu Asp Val Arg Ala Val Ser Leu Leu Val
            180                 185                 190
Ser Ala Asn Leu Ile Phe Thr Gly Gly Arg Asp Ser Val Val Arg Met
        195                 200                 205
Trp Lys Met Glu Glu Gly Leu Leu Ile Asp Thr Ser Arg Ala Leu Gly
    210                 215                 220
Gly Thr Ile Arg Ala Ile Ala Ala Asp Ser Arg Leu Leu Val Ser Gly
225                 230                 235                 240
Gly Thr Asn Ala Tyr Ile Gln Cys Trp Arg Ala Val Glu Gly Asn Gly
                245                 250                 255
Gln Leu Phe His Ile Ser Gly Ser Gly Thr Asp Gln Asn Ala Glu Phe
            260                 265                 270
Arg Leu Trp Gly His Glu Gly Pro Val Thr Cys Leu Ala Leu Asp Ser
        275                 280                 285
Leu Arg Ile Tyr Ser Gly Ser Trp Asp Met Thr Val Arg Val Trp Asp
    290                 295                 300
Arg Asp Gln Met Glu Cys Val Gln Lys Phe Met His Ala Asp Trp Val
305                 310                 315                 320
Trp Asp Leu Ala Leu Arg Gly Asn Thr Val Ala Ser Thr Ala Gly Arg
                325                 330                 335
Asp Ala Tyr Val Trp Asp Ile Arg Ala Gly Glu Leu Thr Ser Leu Ile
            340                 345                 350
Ser Asn Ala His Val Gly Ser Ala Tyr Ser Ile Ala Trp Thr His Leu
        355                 360                 365
Pro Asp Val Leu Phe Thr Gly Gly Glu Asp Gly Ala Ile Arg Leu Phe
    370                 375                 380
Asn Val Phe Asp Val  Cys Asp Asp Glu Gly Asp Ile Lys Pro Val Ala
385                 390                 395                 400
Thr Trp Val Pro His Ser Gly Pro Val His Ser Leu Ala Phe Glu Tyr
                405                 410                 415
Pro Trp Leu Val Ser Ala Ser Ser Asp Gly Arg Ile Ala Leu Ile Asp
            420                 425                 430
Leu Arg Lys Leu Leu Ser Ser Lys Ser Ser Ser Lys Gly Leu Arg Val
        435                 440                 445
Lys Arg Val Asp Gly Ser Ala Ile Glu Pro Pro Gln Arg Met Leu His
    450                 455                 460
Gly Val Gly Cys Asp Leu Phe Ser Ile Ala Ile Gly Ala Asp Arg Ile
465                 470                 475                 480
Val Cys Ala Gly Glu Asp Gly Ser Val Arg Val Trp Asn Phe Ser Lys
                485                 490                 495
Ala Leu Glu Ile Glu Arg Arg Ala Gln Ala Leu Arg Ser Leu Arg Gln
            500                 505                 510
Glu Asn Arg Ile Arg Arg Arg Lys Ser Gln Ala Glu Met Asn Thr Asn
        515                 520                 525
Thr Arg Arg Pro Asp Gln Cys Ser Ile Ala Met Lys Lys Asn Gln Leu
    530                 535                 540
Lys Gly Asp Lys Ser Ala Thr Trp His Asn Lys Arg Ala Ile Asn Glu
545                 550                 555                 560
Lys Ala Lys Ser
<210>71
<211>1278
<212>DNA
<213>葡萄(Vitis vinifera)
<400>71
tggggagctc cggttgtttc ggggttttca gatgagaaat catggaggga attgtttgtg    60
gagagagagt ttaggagcaa aacctttagg ggacgattta gtattgatgt tctgtatggt    120
cgcactgagg cggttcgagc tgttttcctt ttggcctctg caaagctcat tttcacttct    180
gggtatgatt ccattgttcg aatgtgggat atggaagaag ggttgtcaat tgcgtgttca    240
cggcctctcg gttgcacaat aagagcagtg gctgcggata agaaactgtt gcttgcgggg    300
ggtagtgatg ggtttattca ttgttggaga gctgtagagg ggctctcttg cttgtttgac    360
cttgtgggtt ctcaaaacct gagtactgag ttccgaattt gggaacatga aggtcctgtg    420
acttgtcttg ctttggatat taagagaatt tatagtggct catgggacat gactgtgcgc    480
atatgggacc gttcttcgtt taaggttgta aaggtcttga ggcacacaga ctgggtttgg    540
ggccttgttc ctcgtgatac tacagttgct agcacttctg gctcagatgt gtatgtttgg    600
gacgctgata gtgggactct gctgacgata atctctaatg ctcatgtggg taatgcttat    660
gctttggcac ggagccacac aggggatttt ctattcactg ggggagaaga tggggcaata    720
catatgtttg aggtcgtgag tgattgcatg gaaaggaatg tattggaggt ttcaacgtgg    780
attcctcatt ctggtcctgt tcattccctg gcatttgagt ttccctggct tgtttcagct    840
tcagctgatg ggaggatgtc actgattgat gtgagaaagc ttttgcaaac ttgcaagcct    900
ttcttaggga agaatgtttc caaggttagg cacagggacc acaaaagtgt ggagccccct    960
cagaggatgt tacatgggtt tggctgcaat ttattctcag tggacattgg tgcagatcgt    1020
attgtctgtg gaggtgagaa aggtgtggtt agaatttgga acttctcaca agctttagaa    1080
gcagagcaga gggcccgtgc tttaagagga atacgtttag aaaccaggat gaggcggcgt    1140
aggcttcaaa tagagctgac tagtaagggt agtcgaactg atcaatgttc agttgcagcc    1200
agtaagaatc ctattaatgg tgataggagt ggtgtgtggc ccaataagcg gggaatgagt    1260
ggccggatga aagcatag                                                  1278
<210>72
<211>425
<212>PRT
<213>葡萄
<400>72
Trp Gly Ala Pro Val Val Ser Gly Phe Ser Asp Glu Lys Ser Trp Arg
1               5                   10                  15
Glu Leu Phe Val Glu Arg Glu Phe Arg Ser Lys Thr Phe Arg Gly Arg
            20                  25                  30
Phe Ser Ile Asp Val Leu Tyr Gly Arg Thr Glu Ala Val Arg Ala Val
        35                  40                  45
Phe Leu Leu Ala Ser Ala Lys Leu Ile Phe Thr Ser Gly Tyr Asp Ser
    50                  55                  60
Ile Val Arg Met Trp Asp Met Glu Glu Gly Leu Ser Ile Ala Cys Ser
65                  70                  75                  80
Arg Pro Leu Gly Cys Thr Ile Arg Ala Val Ala Ala Asp Lys Lys Leu
                85                  90                  95
Leu Leu Ala Gly Gly Ser Asp Gly Phe Ile His Cys Trp Arg Ala Val
            100                 105                 110
Glu Gly Leu Ser Cys Leu Phe Asp Leu Val Gly Ser Gln Asn Leu Ser
        115                 120                 125
Thr Glu Phe Arg Ile Trp Glu His Glu Gly Pro Val Thr Cys Leu Ala
    130                 135                 140
Leu AspI le Lys Arg Ile Tyr Ser Gly Ser Trp Asp Met Thr Val Arg
145                 150                 155                 160
Ile Trp Asp Arg Ser Ser Phe Lys Val Val Lys Val Leu Arg Hi s Thr
                165                 170                 175
Asp Trp Val Trp Gly Leu Val Pro Arg Asp Thr Thr Val Ala Ser Thr
            180                 185                 190
Ser Gly Ser Asp Val Tyr Val Trp Asp Ala Asp Ser Gly Thr Leu Leu
        195                 200                 205
Thr Ile Ile Ser Asn Ala His Val Gly Asn Ala Tyr Ala Leu Ala Arg
    210                 215                 220
Ser His Thr Gly Asp Phe Leu Phe Thr Gly Gly Glu Asp Gly Ala Ile
225                 230                 235                 240
His Met Phe Glu Val Val Ser Asp Cys Met Glu Arg Asn Val Leu Glu
                245                 250                 255
Val Ser Thr Trp Ile Pro His Ser Gly Pro Val His Ser Leu Ala Phe
            260                 265                 270
Glu Phe Pro Trp Leu Val Ser Ala Ser Ala Asp Gly Arg Met Ser Leu
        275                 280                 285
Ile Asp Val Arg Lys Leu Leu Gln Thr Cys Lys Pro Phe Leu Gly Lys
    290                 295                 300
Asn Val Ser Lys Val Arg His Arg Asp His Lys Ser Val Glu Pro Pro
305                 310                 315                 320
Gln Arg Met Leu His Gly Phe Gly Cys Asn Leu Phe Ser Val Asp Ile
                325                 330                 335
Gly Ala Asp Arg Ile Val Cys Gly Gly Glu Lys Gly Val Val Arg Ile
            340                 345                 350
Trp Asn Phe Ser Gln Ala Leu Glu Ala Glu Gln Arg Ala Arg Ala Leu
        355                 360                 365
Arg Gly Ile Arg Leu Glu Thr Arg Met Arg Arg Arg Arg Leu Gln Ile
    370                 375                 380
Glu Leu Thr Ser Lys Gly Ser Arg Thr Asp Gln Cys Ser Val Ala Ala
385                 390                 395                 400
Ser Lys Asn Pro Ile Asn Gly Asp Arg Ser Gly Val Trp Pro Asn Lys
                405                 410                 415
Arg Gly Met Ser Gly Arg Met Lys Ala
            420                 425
<210>73
<211>660
<212>DNA
<213>Senecio cambrensis
<400>73
atggcatttg agttaaaccc gagcacatcg aattctgaaa aagataaacc tcaggataat    60
tcatctgaaa ataatttact gattgattcg gaaagcggga aacattttgc tgctaagtta    120
ctggttgacg agtgttgttt gttgaaaggt tataaaacaa ttaccgacct tcctccagcg    180
atagtttctg aaatatttaa cagccttgat ccaaaggaac tcgggatagt ttcctgtgtg    240
aatacatctt tatatcgaat tgcatttgat caccacgttt ggaaggagtt ttattgtgag    300
agatggggac ttcctattgg agtccccaat acgtctttag agaaatcatg gagagacctt    360
tttgtggaac gtgagtttcg tagtaagacg tttatgggac cttactctac tgaaactctt    420
tatggtcata ctgaagctgt tcgtacagtt tttcttttac tttcaagaaa gattataatt    480
acttcgggat atgattcagt tattcgaatg tgggacatgg aaggtggtta ttcaattgct    540
tcgtcccgtc ctcttggttg taccatccga gccgttacag cagattcaaa actgttaatt    600
gctggcggtt ccgatggttt tattcatggt tggagagccc aagaagaaga ggacatcctt    660
<210>74
<211>220
<212>PRT
<213>Senecio cambrensis
<400>74
Met Ala Phe Glu Leu Asn Pro Ser Thr Ser Asn Ser Glu Lys Asp Lys
1               5                   10                  15
Pro Gln Asp Asn Ser Ser Glu Asn Asn Leu Leu Ile Asp Ser Glu Ser
            20                  25                  30
Gly Lys His Phe Ala Ala Lys Leu Leu Val Asp Glu Cys Cys Leu Leu
        35                  40                  45
Lys Gly Tyr Lys Thr Ile Thr Asp Leu Pro Pro Ala Ile Val Ser Glu
    50                  55                  60
Ile Phe Asn Ser Leu Asp Pro Lys Glu Leu Gly Ile Val Ser Cys Val
65                  70                  75                  80
Asn Thr Ser Leu Tyr Arg Ile Ala Phe Asp His His Val Trp Lys Glu
                85                  90                  95
Phe Tyr Cys Glu Arg Trp Gly Leu Pro Ile Gly Val Pro Asn Thr Ser
            100                 105                 110
Leu Glu Lys Ser Trp Arg Asp Leu Phe Val Glu Arg Glu Phe Arg Ser
        115                 120                 125
Lys Thr Phe Met Gly Pro Tyr Ser Thr Glu Thr Leu Tyr Gly His Thr
    130                 135                 140
Glu Ala Val Arg Thr Val Phe Leu Leu Leu Ser Arg Lys Ile Ile Ile
145                 150                 155                 160
Thr Ser Gly Tyr Asp Ser Val Ile Arg Met Trp Asp Met Glu Gly Gly
                165                 170                 175
Tyr Ser Ile Ala Ser Ser Arg Pro Leu Gly Cys Thr Ile Arg Ala Val
            180                 185                 190
Thr Ala Asp Ser Lys Leu Leu Ile Ala Gly Gly Ser Asp Gly Phe Ile
        195                 200                 205
His Gly Trp Arg Ala Gln Glu Glu Glu Asp Ile Leu
    210                 215                 220
<210>75
<211>847
<212>DNA
<213>向日葵(Helianthus annuus)
<220>
<221>misc feature
<222>(789)..(789)
<223>n是a、c、g或t
<400>75
gcgggcgacg gagtccccgt ctctttaaat gctgagtgtt ctgatgagag atcttggaag  60
gcattatttg tggaacggga attccggagc aaaacatttc tgggccggta tacaatcgat  120
acgctttacg gtcatacaga acccgttcgc actctttttg ttttgctctc gaaaaagctt  180
ataataactt ccggttatga ctcgattatt cgaatgtggg acgttgaaga tggttattca  240
atcgcttcat ctcggcctct gggttgcacc atccgagccg ttgcagctga ttctaagctg  300
ttaattgctg gcgggtctga tgggtttata catggctgga gagctgaaga aggacaccct  360
cacttgtttg acataaaagg accccaaaac cagaacaccg agtttcgact ttgggaacat  420
caaggcccga taacttgtat cgggctagat tcatctagga tttacagcgg gtcatgggac  480
atgaccatac gcgtctggga tcgtgtctcg ctcaagtgct tgactgtctt gatgcataac  540
gactgggtgt ggagcctggt cccacatgat ggtactgtag taagtacttc tggttcagat  600
gtatatatct gggagactaa taccttttca cttattgaca ttatcaaaga tgcccatgtg  660
ggtaatgctt attctctagc tagaagtcac accggtaatt tcatcttcac tggtggtgaa  720
gatggtgcta tacatatgtt tgagattact agtaatggat gtggttcagt tcgccggcta  780
gcaacgtgng gtccacatac gggtcctgta tattctcttt catttgagtt tccatggcta  840
gtttctg                                                            847
<210>76
<211>282
<212>PRT
<213>向日葵
<220>
<221>不确定
<222>(263)..(263)
<223>Xaa可以是任意天然产生的氨基酸
<400>76
Ala Gly Asp Gly Val Pro Val Ser Leu Asn Ala Glu Cys Ser Asp Glu
1               5                   10                  15
Arg Ser Trp Lys Ala Leu Phe Val Glu Arg Glu Phe Arg Ser Lys Thr
            20                  25                  30
Phe Leu Gly Arg Tyr Thr Ile Asp Thr Leu Tyr Gly His Thr Glu Pro
        35                  40                  45
Val Arg Thr Leu Phe Val Leu Leu Ser Lys Lys Leu Ile Ile Thr Ser
    50                  55                  60
Gly Tyr Asp Ser Ile Ile Arg Met Trp Asp Val Glu Asp Gly Tyr Ser
65                  70                  75                  80
Ile Ala Ser Ser Arg Pro Leu Gly Cys Thr Ile Arg Ala Val Ala Ala
                85                  90                  95
Asp Ser Lys Leu Leu Ile Ala Gly Gly Ser Asp Gly Phe Ile His Gly
            100                 105                 110
Trp Arg Ala Glu Glu Gly His Pro His Leu Phe Asp Ile Lys Gly Pro
        115                 120                 125
Gln Asn Gln Asn Thr Glu Phe Arg Leu Trp Glu His Gln Gly Pro Ile
    130                 135                 140
Thr Cys Ile Gly Leu Asp Ser Ser Arg Ile Tyr Ser Gly Ser Trp Asp
145                 150                 155                 160
Met Thr Ile Arg Val Trp Asp Arg Val Ser Leu Lys Cys Leu Thr Val
                165                 170                 175
Leu Met His Asn Asp Trp Val Trp Ser Leu Val Pro His Asp Gly Thr
            180                 185                 190
Val Val Ser Thr Ser Gly Ser Asp Val Tyr Ile Trp Glu Thr Asn Thr
        195                 200                 205
Phe Ser Leu Ile Asp Ile Ile Lys Asp Ala His Val Gly Asn Ala Tyr
    210                 215                 220
Ser Leu Ala Arg Ser His Thr Gly Asn Phe Ile Phe Thr Gly Gly Glu
225                 230                 235                 240
Asp Gly Ala Ile His Met Phe Glu Ile Thr Ser Asn Gly Cys Gly Ser
                245                 250                 255
Val Arg Arg Leu Ala Thr Xaa Gly Pro His Thr Gly Pro Val Tyr Ser
            260                 265                 270
Leu Ser Phe Glu Phe Pro Trp Leu Val Ser
        275                 280
<210>77
<211>728
<212>DNA
<213>乳浆大戟(Euphorbia esula)
<400>77
ggatggaaag ccgtggaggg tcttccacat ttgttcaacc ttaagggtag ttccgagaat  60
cttccaaacg atgaatttcg actttgggaa cacgagggac ctataacctc tctcgccttg  120
gatcgcacga gaatttacag tggttcttgg gacatgactg ttcgtgtatg ggatcgttcc  180
acattgaagt gccttaaaat cttgaggcat agcgattggg tatggggcct tgttccgcac  240
gataccaccg ttgccacctc atcgggttcc gatgtgtata tttgggatac tcaaaccgga  300
actcttatag ccgatattaa taacgcccat gtcgggaaca tttattctct agcccgaagc  360
cacacgggag attttctctt caccggagga gaagatgggg ctatacatat gtttgagatc  420
attggtaata atggatccaa gcctaaggtc tacaagatcg caacttggat tccacactcg  480
ggtcccgtct actccctctc gtttgaattt ccgtggcttg tttcggcttc tagtgatggg  540
aaactctcgc ttatagatgt tcgaaagcta cttcgaacaa gtaggcgctc tatgggaaag  600
aagaatcttg gtagggttag caaaatggat agtaacaatg tggagccacc tcaacggatg  660
ctccacgggt ttggacccaa tttgttttcg gtagacattg gggctgaccg gattgtttgt  720
ggagggga                                                           728
<210>78
<211>241
<212>PRT
<213>乳浆大戟
<400>78
Gly Trp Lys Ala Val Glu Gly Leu Pro His Leu Phe Asn Leu Lys Gly
1               5                   10                  15
Ser Ser Glu Asn Leu Pro Asn Asp Glu Phe Arg Leu Trp Glu His Glu
            20                  25                  30
Gly Pro Ile Thr Ser Leu Ala Leu Asp Arg Thr Arg Ile Tyr Ser Gly
        35                  40                  45
Ser Trp Asp Met Thr Val Arg Val Trp Asp Arg Ser Thr Leu Lys Cys
    50                  55                  60
Leu Lys Ile Leu Arg His Ser Asp Trp Val Trp Gly Leu Val Pro His
65                  70                  75                  80
Asp Thr Thr Val Ala Thr Ser Ser Gly Ser Asp Val Tyr Ile Trp Asp
                85                  90                  95
Thr Gln Thr Gly Thr Leu Ile Ala Asp Ile Asn Asn Ala His Val Gly
            100                 105                 110
Asn Ile Tyr Ser Leu Ala Arg Ser His Thr Gly Asp Phe Leu Phe Thr
        115                 120                 125
Gly Gly Glu Asp Gly Ala Ile His Met Phe Glu Ile Ile Gly Asn Asn
    130                 135                 140
Gly Ser Lys Pro Lys Val Tyr Lys Ile Ala Thr Trp Ile Pro His Ser
145                 150                 155                 160
Gly Pro Val Tyr Ser Leu Ser Phe Glu Phe Pro Trp Leu Val Ser Ala
                165                 170                 175
Ser Ser Asp Gly Lys Leu Ser Leu Ile Asp Val Arg Lys Leu Leu Arg
            180                 185                 190
Thr Ser Arg Arg Ser Met Gly Lys Lys Asn Leu Gly Arg Val Ser Lys
        195                 200                 205
Met Asp Ser Asn Asn Val Glu Pro Pro Gln Arg Met Leu His Gly Phe
    210                 215                 220
Gly Pro Asn Leu Phe Ser Val Asp Ile Gly Ala Asp Arg Ile Val Cys
225                 230                 235                 240
Gly
<210>79
<211>713
<212>DNA
<213>番茄(Lycopersicon esculentum)
<400>79
atcgtcttgc ttcggagcac catgtgtgga aggagttcta ttgtgaaagg tgggggcagc    60
caatattgtt ggcacctttg ggcgcagagc atgcagatga gaagtcgtgg aaggagcttt    120
tcgtggagag ggagttccgt agtaaaacat tcatgggacg ctatagtatt gatacattgt    180
atggtcatac cgaggctgtt aggactgttt ctgttttatc ttcaaagaaa cttctgttta    240
cttcagggta tgatcagata gtgcgaatgt gggacttgga agaaggttta tctattgcat    300
catctcgccc tcttggctgc actattcgtg cagttgcggc tgattcgagg ctcttagtag    360
cagggggtac agatggattc atacatggtt ggagagcaga ggatggaaat ccacatctct    420
ttgatcttag atcacctcag aaccagaaca tggaattcag agtttgggaa catgaaggac    480
caataacatg tctggcattg gatttgaata agatgtacag tggttcttgg gacatgagta    540
ttcgtgtttg ggatcgttct tctttgaaat gtctgaaagt tctaatgcac aatgactggg    600
tttggagcct tgctccccat gatacaacag tagcgagcgc tgcaggctca gatctttatg    660
tctgggaaca ctatattggg tcagaacttg ccaccatcac caatggtcat gct           713
<210>80
<211>236
<212>PRT
<213>番茄
<400>80
Arg Leu Ala Ser Glu His His Val Trp Lys Glu Phe Tyr Cys Glu Arg
1               5                   10                  15
Trp Gly Gln Pro Ile Leu Leu Ala Pro Leu Gly Ala Glu His Ala Asp
            20                  25                  30
Glu Lys Ser Trp Lys Glu Leu Phe Val Glu Arg Glu Phe Arg Ser Lys
        35                  40                  45
Thr Phe Met Gly Arg Tyr Ser Ile Asp Thr Leu Tyr Gly His Thr Glu
    50                  55                  60
Ala Val Arg Thr Val Ser Val Leu Ser Ser Lys Lys Leu Leu Phe Thr
65                  70                  75                  80
Ser Gly Tyr Asp Gln Ile Val Arg Met Trp Asp Leu Glu Glu Gly Leu
                85                  90                  95
Ser Ile Ala Ser Ser Arg Pro Leu Gly Cys Thr Ile Arg Ala Val Ala
            100                 105                 110
Ala Asp Ser Arg Leu Leu Val Ala Gly Gly Thr Asp Gly Phe Ile His
        115                 120                 125
Gly Trp Arg Ala Glu Asp Gly Asn Pro His Leu Phe Asp Leu Arg Ser
    130                 135                 140
Pro Gln Asn Gln Asn Met Glu Phe Arg Val Trp Glu His Glu Gly Pro
145                 150                 155                 160
Ile Thr Cys Leu Ala Leu Asp Leu Asn Lys Met Tyr Ser Gly Ser Trp
                165                 170                 175
Asp Met Ser Ile Arg Val Trp Asp Arg Ser Ser Leu Lys Cys Leu Lys
            180                 185                 190
Val Leu Met His Asn Asp Trp Val Trp Ser Leu Ala Pro His Asp Thr
        195                 200                 205
Thr Val Ala Ser Ala Ala Gly Ser Asp Leu Tyr Val Trp Glu His Tyr
    210                 215                 220
Ile Gly Ser Glu Leu Ala Thr Ile Thr Asn Gly His
225                 230                 235
<210>81
<211>717
<212>DNA
<213>Aquilegia formosa x Aquilegia pubescens
<400>81
gtccctcgag actctactat tgctagtact gccggggtgg atatgtatgt ttgggacatt    60
gatagtgggg aattgcttgc tgtaattcaa aaggctcatg ttggcaacac tctctctttg    120
gcccgaagtc acacagggaa tttgattttc actggtgggg atgatgggac tataagtatg    180
tttgagcttt tggacgattc tacgctcttg catgtggcaa cttggagccc acatactggt    240
gctgtgcact ctcttgcatt tgagttccct tggcttgtgt cagcctctag cgacggaaag    300
ctctcattga ttgacattag acggttgctg aaatctagcc agcggtctgt gtcaagagac    360
ctcaaaaggg taaattgtcc agtttcgttg actgtggagg ctccacagag gatgttacat    420
ggttttggta gtaatttatt ctcagtgggc attggttctg atcggattgt atgtggtggt    480
gaggaaggtg tagttagaat ttggaacttt tcacaagcta tggagattga gcgtagggtt    540
caggccttaa ggggcatgag attagaaaac cgaatgaggc ggcggaaggc ccaaatagag    600
atgaacagca agggtggtcg ctctgatcag tgttcagttg cagctaagaa gaaccagatt    660
aatggagaca gggcctggca tggtaggcga ggagcgagtg gaaagctgaa ggcctag       717
<210>82
<211>238
<212>PRT
<213>Aquilegia formosa x Aquilegia pubescens
<400>82
Val Pro Arg Asp Ser Thr Ile Ala Ser Thr Ala Gly Val Asp Met Tyr
1               5                   10                  15
Val Trp Asp Ile Asp Ser Gly Glu Leu Leu Ala Val Ile Gln Lys Ala
            20                  25                  30
His Val Gly Asn Thr Leu Ser Leu Ala Arg Ser His Thr Gly Asn Leu
        35                  40                  45
Ile Phe Thr Gly Gly Asp Asp Gly Thr Ile Ser Met Phe Glu Leu Leu
    50                  55                  60
Asp Asp Ser Thr Leu Leu His Val Ala Thr Trp Ser Pro His Thr Gly
65                  70                  75                  80
Ala Val His Ser Leu Ala Phe Glu Phe Pro Trp Leu Val Ser Ala Ser
                85                  90                  95
Ser Asp Gly Lys Leu Ser Leu Ile Asp Ile Arg Arg Leu Leu Lys Ser
            100                 105                 110
Ser Gln Arg Ser Val Ser Arg Asp Leu Lys Arg Val Asn Cys Pro Val
        115                 120                 125
Ser Leu Thr Val Glu Ala Pro Gln Arg Met Leu His Gly Phe Gly Ser
    130                 135                 140
Asn Leu Phe Ser Val Gly Ile Gly Ser Asp Arg Ile Val Cys Gly Gly
145                 150                 155                 160
Glu Glu Gly Val Val Arg Ile Trp Asn Phe Ser Gln Ala Met Glu Ile
                165                 170                 175
Glu Arg Arg Val Gln Ala Leu Arg Gly Met Arg Leu Glu Asn Arg Met
            180                 185                 190
Arg Arg Arg Lys Ala Gln Ile Glu Met Asn Ser Lys Gly Gly Arg Ser
        195                 200                 205
Asp Gln Cys Ser Val Ala Ala Lys Lys Asn Gln Ile Asn Gly Asp Arg
    210                 215                 220
Ala Trp His Gly Arg Arg Gly Ala Ser Gly Lys Leu Lys Ala
225                 230                 235
<210>83
<211>621
<212>DNA
<213>陆地棉(Gossypium hirsutum)
<400>83
ggccgcttcg accggagttg cactggagac ttccttttta ctggtggaga agatggagcg  60
atacacatgt ttgagattat aagtgggtct gacgaatcta gtgtcgtgca ggttgcaaca  120
tggattcctc actcaggtgc tgtttactca cttgcatttg agtttccctg gcttgtttca  180
gcttccagtg atggtaaact tgcactaatt gatgttcgga agttgttgag ggccggtaag  240
cgcaccttgg ggaaaagggt ttcaagggat aatgacattg accaaaggaa catagagcca  300
ccccagagaa tgctccatgg atttgggtgc aatttgttct cagtcggtat tggtgcagat  360
cgaattgtct gtgggggtga agaaggtgtt gttcgtatct ggaacttctc agaagctcta  420
gaaattgagc agagggcacg ggcactaaga ggaatacgtt tggagaatag gatgaggcga  480
cgcagacttc aaattgagat gaataataag ggtggtcgaa ctgatcaatg ttctgttgca  540
gccaagaaga aaacagtcaa tggtgatagg aatagtgtct ggcacagtaa acgtagcata  600
agctccaagg tgaagacata a    621
<210>84
<211>206
<212>PRT
<213>陆地棉
<400>84
Gly Arg Phe Asp Arg Ser Cys Thr Gly Asp Phe Leu Phe Thr Gly Gly
1               5                   10                  15
Glu Asp Gly Ala Ile His Met Phe Glu Ile Ile Ser Gly Ser Asp Glu
            20                  25                  30
Ser Ser Val Val Gln Val Ala Thr Trp Ile Pro His Ser Gly Ala Val
        35                  40                  45
Tyr Ser Leu Ala Phe Glu Phe Pro Trp Leu Val Ser Ala Ser Ser Asp
    50                  55                  60
Gly Lys Leu Ala Leu Ile Asp Val Arg Lys Leu Leu Arg Ala Gly Lys
65                  70                  75                  80
Arg Thr Leu Gly Lys Arg Val Ser Arg Asp Asn Asp Ile Asp Gln Arg
                85                  90                  95
Asn Ile Glu Pro Pro Gln Arg Met Leu His Gly Phe Gly Cys Asn Leu
            100                 105                 110
Phe Ser Val Gly Ile Gly Ala Asp Arg Ile Val Cys Gly Gly Glu Glu
        115                 120                 125
Gly Val Val Arg Ile Trp Asn Phe Ser Glu Ala Leu Glu Ile Glu Gln
    130                 135                 140
Arg Ala Arg Ala Leu Arg Gly Ile Arg Leu Glu Asn Arg Met Arg Arg
145                 150                 155                 160
Arg Arg Leu Gln Ile Glu Met Asn Asn Lys Gly Gly Arg Thr Asp Gln
                165                 170                 175
Cys Ser Val Ala Ala Lys Lys Lys Thr Val Asn Gly Asp Arg Asn Ser
            180                 185                 190
Val Trp His Ser Lys Arg Ser Ile Ser Ser Lys Val Lys Thr
        195                 200                 205
<210>85
<211>631
<212>DNA
<213>两色蜀黍(Sorghum bicolor)
<400>85
gatacatccc gtgcacttgg tggcaccatc cgggcgattg cagctgactc taggctttta  60
gtgagtggag gaactaatgc ctatattcag tgttggaggg ctgttgaagg caatgatcac  120
ttatttcaca tctctggaag tggtactgac cagaatgcgg agtttcgcct ctgggggcat  180
gaaggtcctg tgactagtct tgccttggat tcactgagga tttatagtgg ttcttgggac  240
atgactgttc gtgtttggga cagagcccag atggattgcg tgcaaaagtt catgcatgca  300
gactgggtgt ggtctcttgc tctgcgtgga aatactgttg ccagtactgc tggtagagat  360
gcatatgtat gggatatcag ggacggcgag ttaacaagct tagtttccaa tgcccatgtt  420
ggtaatgcat attcattggc ttggacacac ctggcggatg tgctgtttac tggtggagag  480
gatggcgcta ttcgcttgtt caatgtttct gatgtctctg atgatgagga ggacattaaa  540
ccagtggcaa cttgggtgcc acattcaggt cctgttcatt ctcttgcttt tgagtatcca  600
tggcttgtgt cagcctcgag tgatggcagg a                                 631
<210>86
<211>210
<212>PRT
<213>两色蜀黍
<400>86
Asp Thr Ser Arg Ala Leu Gly Gly Thr Ile Arg Ala Ile Ala Ala Asp
1               5                   10                  15
Ser Arg Leu Leu Val Ser Gly Gly Thr Asn Ala Tyr Ile Gln Cys Trp
            20                  25                  30
Arg Ala Val Glu Gly Asn Asp His Leu Phe His Ile Ser Gly Ser Gly
        35                  40                  45
Thr Asp Gln Asn Ala Glu Phe Arg Leu Trp Gly His Glu Gly Pro Val
    50                  55                  60
Thr Ser Leu Ala Leu Asp Ser Leu Arg Ile Tyr Ser Gly Ser Trp Asp
65                  70                  75                  80
Met Thr Val Arg Val Trp Asp Arg Ala Gln Met Asp Cys Val Gln Lys
                85                  90                  95
Phe Met His Ala Asp Trp Val Trp Ser Leu Ala Leu Arg Gly Asn Thr
            100                 105                 110
Val Ala Ser Thr Ala Gly Arg Asp Ala Tyr Val Trp Asp Ile Arg Asp
        115                 120                 125
Gly Glu Leu Thr Ser Leu Val Ser Asn Ala His Val Gly Asn Ala Tyr
    130                 135                 140
Ser Leu Ala Trp Thr His Leu Ala Asp Val Leu Phe Thr Gly Gly Glu
145                 150                 155                 160
Asp Gly Ala Ile Arg Leu Phe Asn Val Ser Asp Val Ser Asp Asp Glu
                165                 170                 175
Glu Asp Ile Lys Pro Val Ala Thr Trp Val Pro His Ser Gly Pro Val
           180                 185                 190
His Ser Leu Ala Phe Glu Tyr Pro Trp Leu Val Ser Ala Ser Ser Asp
        195                 200                 205
Gly Arg
    210
<210>87
<211>573
<212>DNA
<213>牵牛(Ipomea nil)
<400>87
ggagaagacg gagccataca catgtttgag gttgtaaaaa acgcaaggtt tcatgtaaag  60
aaggttgcaa catggattcc tcactcgggc cctgtttatt ctcttgcatt tgaattcccc  120
tggcttgttt ccgcttcaag cgatggaaaa ctggcactta tcgatgtgag gaagttattg  180
aagacaagta ggtattcagc aacaggaagc cgtccttgta aggttgacaa tctggaccat  240
acaagtgttg agcctccgca acgaatgctt catggatttg ggtccaattt atttgcagtg  300
gatgttggtc tggatcgtat tgtgtgtgga ggtgaagaag gcgctgttag gatctggaac  360
ttctcacaag cgttggagat agagcagagg gtccgtgctt tacgaggttt aaggttagaa  420
aacaggatga ggaggcgtaa gcttcagtcc aacatgaata gcaaaggcac ccggagtgat  480
cagtgctcgg ttgcagcaaa gaagaaccaa atcaatggcg ataggaatag ctggcagaac  540
aagcgtaggg taagcgggaa gctcaaggct tag                               573
<210>88
<211>190
<212>PRT
<213>牵牛
<400>88
Gly Glu Asp Gly Ala Ile His Met Phe Glu Val Val Lys Asn Ala Arg
1               5                   10                  15
Phe His Val Lys Lys Val Ala Thr Trp Ile Pro His Ser Gly Pro Val
            20                  25                  30
Tyr Ser Leu Ala Phe Glu Phe Pro Trp Leu Val Ser Ala Ser Ser Asp
        35                  40                  45
Gly Lys Leu Ala Leu Ile Asp Val Arg Lys Leu Leu Lys Thr Ser Arg
    50                  55                  60
Tyr Ser Ala Thr Gly Ser Arg Pro Cys Lys Val Asp Asn Leu Asp Hi s
65                  70                  75                  80
Thr Ser Val Glu Pro Pro Gln Arg Met Leu His Gly Phe Gly Ser Asn
                85                  90                  95
Leu Phe Ala Val Asp Val Gly Leu Asp Arg Ile Val Cys Gly Gly Glu
            100                 105                 110
Glu Gly Ala Val Arg Ile Trp Asn Phe Ser Gln Ala Leu Glu Ile Glu
        115                 120                 125
Gln Arg Val Arg Ala Leu Arg Gly Leu Arg Leu Glu Asn Arg Met Arg
    130                 135                 140
Arg Arg Lys Leu Gln Ser Asn Met Asn Ser Lys Gly Thr Arg Ser Asp
145                 150                 155                 160
Gln Cys Ser Val Ala Ala Lys Lys Asn Gln Ile Asn Gly Asp Arg Asn
                165                 170                 175
Ser Trp Gln Asn Lys Arg Arg Val Ser Gly Lys Leu Lys Ala
           180                 185                 190
<210>89
<211>615
<212>DNA
<213>马铃薯
<400>89
ttttccttgg cccgaattca cacagggaag ctccttattc cactgaaggg gaagatggag  60
ctatacgcat gttcgagatc attagaaatg ataaagcttc atctcaggcg tgtggcgaca  120
tggattcctc actcgggtgc tgtttattct cttgcatttg agttcccttg gcttgtttca  180
gcttccagtg atggaaaact ctcacttatt gatgtgagaa agctgttgag gacgaatcgg  240
agttatgtga tggagaagcc ttcgaaggtt gacaataggg ctaaaaatgt agagccacct  300
caaagaatgt tacatggatt tgggagcaat ctgtttgctg tggatattgg tcttgatcgt  360
atcgtatgtg ctggagaaga aggcattgtt aggatctgga acttctcaga agctttggag  420
gttgagcaga gagttcgagc attaagagga ttaaggttag agaacagaat gaggaggcgt  480
aaacttcagt ctgaaatgac tggtaaaggc agtcgtgctg atcagtgctc agttgctgct  540
aagaagaatc aattgaatgg tgataggaac agctggcgca acaagcgtag ggtgactggg  600
aagctgaagg cctag                                                   615
<210>90
<211>204
<212>PRT
<213>马铃薯
<400>90
Phe Ser Leu Ala Arg Ile His Thr Gly Lys Leu Leu Ile Pro Leu Lys
1               5                   10                  15
Gly Lys Met Glu Leu Tyr Ala Cys Ser Arg Ser Leu Glu Met Ile Lys
            20                  25                  30
Leu His Leu Arg Arg Val Ala Thr Trp Ile Pro His Ser Gly Ala Val
        35                  40                  45
Tyr Ser Leu Ala Phe Glu Phe Pro Trp Leu Val  Ser Ala Ser Ser Asp
    50                  55                  60
Gly Lys Leu Ser Leu Ile Asp Val Arg Lys Leu Leu Arg Thr Asn Arg
65                  70                  75                  80
Ser Tyr Val Met Glu Lys Pro Ser Lys Val Asp Asn Arg Ala Lys Asn
                85                  90                  95
Val Glu Pro Pro Gln Arg Met Leu His Gly Phe Gly Ser Asn Leu Phe
            100                 105                 110
Ala Val Asp Ile Gly Leu Asp Arg Ile Val Cys Ala Gly Glu Glu Gly
        115                 120                 125
Ile Val Arg Ile Trp Asn Phe Ser Glu Ala Leu Glu Val Glu Gln Arg
    130                 135                 140
Val Arg Ala Leu Arg Gly Leu Arg Leu Glu Asn Arg Met Arg Arg Arg
145                 150                 155                 160
Lys Leu Gln Ser Glu Met Thr Gly Lys Gly Ser Arg Ala Asp Gln Cys
                165                 170                 175
Ser Val Ala Ala Lys Lys Asn Gln Leu Asn Gly Asp Arg Asn Ser Trp
            180                 185                 190
Arg Asn Lys Arg Arg Val Thr Gly Lys Leu Lys Ala
        195                 200
<210>91
<211>632
<212>DNA
<213>菱叶凤尾蕉(Zamia fischeri)
<400>91
ggcagacatt ctcaatcgcc tcaatgcaag agaactcagc atagtttcat gtgtatgtac  60
cctctttcga aggatttctt cagatagcca tggatggaag gagttctact gtgagagatg  120
ggggcttcct gcgcctagca aaatttccgc gtcttcggcc ccgggaccag agaagtcgtg  180
gagagagttg tatttggaga gagatgcccg aagcaaggcc ttcctgggcc gatttaatgt  240
agacatgctg catggccaca ctgcagctct tcgatctgtt tgccttctgc catctgcaaa  300
tctcatattt acagcaggat atgacacagt actcagaatg tggaacatgg aggaaggtct  360
cttgatcgct tgttcccggc ctcttggttg cacgctccgt gccatagcgg cagacatgga  420
tatgttggtg gtggcaggaa ctgatccttt cgtgcgctgt tggcaagcaa tttctgagct  480
tcctaactta tttgacattt cgggggtttc agggcagaac actgaatctt gccttcgtgg  540
acatgttgga cccataactt gccttggcct agattcgttg aaaatttaca gtggctcttg  600
ggacatgagc attcgggtat gggatagggt ta                                632
<210>92
<211>210
<212>PRT
<213>菱叶凤尾蕉
<400>92
Ala Asp Ile Leu Asn Arg Leu Asn Ala Arg Glu Leu Ser Ile Val Ser
1               5                   10                  15
Cys Val Cys Thr Leu Phe Arg Arg Ile Ser Ser Asp Ser His Gly Trp
            20                  25                  30
Lys Glu Phe Tyr Cys Glu Arg Trp Gly Leu Pro Ala Pro Ser Lys Ile
        35                  40                  45
Ser Ala Ser Ser Ala Pro Gly Pro Glu Lys Ser Trp Arg Glu Leu Tyr
    50                  55                  60
Leu Glu Arg Asp Ala Arg Ser Lys Ala Phe Leu Gly Arg Phe Asn Val
65                  70                  75                  80
Asp Met Leu His Gly His Thr Ala Ala Leu Arg Ser Val Cys Leu Leu
                85                  90                  95
Pro Ser Ala Asn Leu Ile Phe Thr Ala Gly Tyr Asp Thr Val Leu Arg
            100                 105                 110
Met Trp Asn Met Glu Glu Gly Leu Leu Ile Ala Cys Ser Arg Pro Leu
        115                 120                 125
Gly Cys Thr Leu Arg Ala Ile Ala Ala Asp Met Asp Met Leu Val Val
    130                 135                 140
Ala Gly Thr Asp Pro Phe Val Arg Cys Trp Gln Ala Ile Ser Glu Leu
145                 150                 155                 160
Pro Asn Leu Phe Asp Ile Ser Gly Val Ser Gly Gln Asn Thr Glu Ser
                165                 170                 175
Cys Leu Arg Gly His Val Gly Pro Ile Thr Cys Leu Gly Leu Asp Ser
            180                 185                 190
Leu Lys Ile Tyr Ser Gly Ser Trp Asp Met Ser Ile Arg Val Trp Asp
        195                 200                 205
Arg Val
    210
<210>93
<211>507
<212>DNA
<213>鳄梨(Persea americana)
<400>93
gcgacatggc ttcctcacac gggctctgtt aattctctag catttgagtt cccatggctt  60
gtgtcatctt ccagtgatgg acgacttgct ctgattgatg tgagaaagct gttaaggtca  120
agccgacgta cgtcatcaag acaccatgtt aaagctaaac ggtctgcccc cgtaaatgtg  180
gagccgcctc aaaggatgtt gcatgggtat gggtgcaatt tgttttctgt ggatattggc  240
gcggatagga ttgtttgtgg tggagaggag ggtgttgtgc gtatctggaa cttctctaag  300
gcacttgaga ttgagcagag gattcgggct ctgaaaggga tacggttgga gaaccgaatg  360
aggcggcgga agatacaatt agagatgagc agtaagaatc gacctggaga tcaatgctct  420
gttgcagcca aaaggaatca gatgcctggt gatagaaaca gggtttggcg tggaaggcgc  480
aatatgagtg aaaagccgaa ggcctaa                                      507
<210>94
<211>168
<212>PRT
<213>鳄梨
<400>94
Ala Thr Trp Leu Pro His Thr Gly Ser Val Asn Ser Leu Ala Phe Glu
1               5                   10                  15
Phe Pro Trp Leu Val Ser Ser Ser Ser Asp Gly Arg Leu Ala Leu Ile
            20                  25                  30
Asp Val Arg Lys Leu Leu Arg Ser Ser Arg Arg Thr Ser Ser Arg His
        35                  40                  45
His Val Lys Ala Lys Arg Ser Ala Pro Val Asn Val Glu Pro Pro Gln
    50                  55                  60
Arg Met Leu His Gly Tyr Gly Cys Asn Leu Phe Ser Val Asp Ile Gly
65                  70                  75                  80
Ala Asp Arg Ile Val Cys Gly Gly Glu Glu Gly Val Val Arg Ile Trp
                85                  90                  95
Asn Phe Ser Lys Ala Leu Glu Ile Glu Gln Arg Ile Arg Ala Leu Lys
            100                 105                 110
Gly Ile Arg Leu Glu Asn Arg Met Arg Arg Arg Lys Ile Gln Leu Glu
        115                 120                 125
Met Ser Ser Lys Asn Arg Pro Gly Asp Gln Cys Ser Val Ala Ala Lys
    130                 135                 140
Arg Asn Gln Met Pro Gly Asp Arg Asn Arg Val Trp Arg Gly Arg Arg
145                 150                 155                 160
Asn Met Ser Glu Lys Pro Lys Ala
                165
<210>95
<211>498
<212>DNA
<213>大豆
<220>
<221>misc_feature
<222>(127)..(127)
<223>n是a、c、g或t
<400>95
gttgctgctt ggattcctca ctctgcccct gtgtattccc tggcctttga gtttccatgg  60
cttgtttctg catcaagtga tggccagcta gcactaattg atgtgagaaa gctgttgagg  120
attagcnagc gagctctagg gaaaagagtt tcaaaggtaa agcatttggg tggagacata  180
gtggagcctc cacagaggat gttgcatgga tttaagagcc atcttttctc tgtggatata  240
ggagctgaac gaattgtcag tggaggtgaa gaaggtgttg tcaggatctg gaatttcacg  300
gaagctttgg aaattgaacg gagagcccga gcattaagag gaatacgatt agagcacaga  360
atgaggcgac ggaagcttca aacagagctg agccataaaa gtggtcggag tgatcagtgt  420
tcagttgcag cccagaaaaa ttctgtcact tgtatttggc ccactaaacg tggcatgagc  480
ggaaagctga aagcatag                                                498
<210>96
<211>165
<212>PRT
<213>大豆
<220>
<221>不确定
<222>(43)..(43)
<223>Xaa可以是任意天然产生的氨基酸
<400>96
Val Ala Ala Trp Ile Pro His Ser Ala Pro Val Tyr Ser Leu Ala Phe
1               5                   10                  15
Glu Phe Pro Trp Leu Val Ser Ala Ser Ser Asp Gly Gln Leu Ala Leu
            20                  25                  30
Ile Asp Val Arg Lys Leu Leu Arg Ile Ser Xaa Arg Ala Leu Gly Lys
        35                  40                  45
Arg Val Ser Lys Val Lys His Leu Gly Gly Asp Ile Val Glu Pro Pro
    50                  55                  60
Gln Arg Met Leu His Gly Phe Lys Ser His Leu Phe Ser Val Asp Ile
65                  70                  75                  80
Gly Ala Glu Arg Ile Val Ser Gly Gly Glu Glu Gly Val Val Arg Ile
                85                  90                  95
Trp Asn Phe Thr Glu Ala Leu Glu Ile Glu Arg Arg Ala Arg Ala Leu
            100                 105                 110
Arg Gly Ile Arg Leu Glu His Arg Met Arg Arg Arg Lys Leu Gln Thr
        115                 120                 125
Glu Leu Ser His Lys Ser Gly Arg Ser Asp Gln Cys Ser Val Ala Ala
    130                 135                 140
Gln Lys Asn Ser Val Thr Cys Ile Trp Pro Thr Lys Arg Gly Met Ser
145                 150                 155                 160
Gly Lys Leu Lys Ala
                165
<210>97
<211>12
<212>PRT
<213>人工序列
<220>
<223>基序1
<220>
<221>不确定
<222>(3)..(3)
<223>Xaa可以是任意天然产生的氨基酸
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Val″/取代=″Leu″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Arg″/取代=″Gly″
<220>
<221>不确定
<222>(11)..(11)
<223>Xaa可以是任意天然产生的氨基酸
<400>97
Trp Lys Xaa Phe Tyr Cys Glu Arg Trp Gly Xaa Pro
1               5                   10
<210>98
<211>16
<212>PRT
<213>人工序列
<220>
<223>基序2
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Ser″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Tyr″
<220>
<221>变体
<222>(12)..(12)
<223>/取代=″Ser″
<220>
<221>变体
<222>(14)..(14)
<223>/取代=″Ala″/取代=″Gly″
<400>98
Ser Leu Ala Phe Glu Phe Pro Trp Leu Val Ser Ala Ser Ser Asp Gly
1               5                   10                  15
<210>99
<211>15
<212>PRT
<213>人工序列
<220>
<223>基序3
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Phe″
<220>
<221>变体
<222>(8)..(8)
<223>取代=″Thr″
<220>
<221>变体
<222>(9)..(9)
<223>取代=″Ser″
<220>
<221>变体
<222>(10)..(10)
<223>取代=″Ile″
<220>
<221>变体
<222>(12)..(12)
<223>取代=″Ile″
<400>99
Ile Tyr Ser Gly Ser Trp Asp Met Thr Val Arg Val Trp Asp Arg
1               5                   10                  15
<210>100
<211>7
<212>PRT
<213>人工序列
<220>
<223>基序4
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Asp″
<400>100
Phe Thr Gly Gly Glu Asp Gly
1               5
<210>101
<211>9
<212>PRT
<213>人工序列
<220>
<223>基序5
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Ala″
<400>101
Glu Pro Pro Gln Arg Met Leu His Gly
1               5
<210>102
<211>38
<212>PRT
<213>人工序列
<220>
<223>保守区1
<400>102
Ser Gln Trp Met Pro His Thr Ser Pro Val Tyr Ser Leu Ser Phe Glu
1               5                   10                  15
Phe Pro Trp Leu Val Ser Ala Ser Gly Asp Gly Lys Leu Ala Leu Ile
            20                  25                  30
Asp Val Arg Lys Leu Leu
        35
<210>103
<211>65
<212>PRT
<213>人工序列
<220>
<223>保守区2
<400>103
Val Glu Pro Pro Gln Arg Met Leu His Gly Phe Gly Ser Asn Leu Phe
1               5                   10                  15
Ser Val Asp Val Gly Tyr Asp Arg Ile Val Cys Gly Gly Glu Glu Gly
            20                  25                  30
Thr Val Arg Ile Trp Asn Phe Thr Gln Ala Leu Glu Ile Glu Arg Arg
        35                  40                  45
Thr Arg Ala Leu Lys Gly Met Arg His Glu Asn Arg Met Arg Arg Arg
    50                  55                  60
Arg
65
<210>104
<211>1167
<212>DNA
<213>稻
<400>104
atccaagcca agaagaggga gagcaccaag gacacgcgac tagcagaagc cgagcgaccg    60
ccttcttcga tccatatctt ccggtcgagt tcttggtcga tctcttccct cctccacctc    120
ctcctcacag ggtatgtgcc cttcggttgt tcttggattt attgttctag gttgtgtagt    180
acgggcgttg atgttaggaa aggggatctg tatctgtgat gattcctgtt cttggatttg    240
ggatagaggg gttcttgatg ttgcatgtta tcggttcggt ttgattagta gtatggtttt    300
caatcgtctg gagagctcta tggaaatgaa atggtttagg gtacggaatc ttgcgatttt    360
gtgagtacct tttgtttgag gtaaaatcag agcaccggtg attttgcttg gtgtaataaa    420
agtacggttg tttggtcctc gattctggta gtgatgcttc tcgatttgac gaagctatcc    480
tttgtttatt ccctattgaa caaaaataat ccaactttga agacggtccc gttgatgaga    540
ttgaatgatt gattcttaag cctgtccaaa atttcgcagc tggcttgttt agatacagta    600
gtccccatca cgaaattcat ggaaacagtt ataatcctca ggaacagggg attccctgtt    660
cttccgattt gctttagtcc cagaattttt tttcccaaat atcttaaaaa gtcactttct    720
ggttcagttc aatgaattga ttgctacaaa taatgctttt atagcgttat cctagctgta    780
gttcagttaa taggtaatac ccctatagtt tagtcaggag aagaacttat ccgatttctg    840
atctccattt ttaattatat gaaatgaact gtagcataag cagtattcat ttggattatt    900
ttttttatta gctctcaccc cttcattatt ctgagctgaa agtctggcat gaactgtcct    960
caattttgtt ttcaaattca catcgattat ctatgcatta tcctcttgta tctacctgta    1020
gaagtttctt tttggttatt ccttgactgc ttgattacag aaagaaattt atgaagctgt    1080
aatcgggata gttatactgc ttgttcttat gattcatttc ctttgtgcag ttcttggtgt    1140
agcttgccac tttcaccagc aaagttc                                        1167
<210>105
<211>55
<212>DNA
<213>人工序列
<220>
<223>引物:prm6999
<400>105
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgaa tcgtttttct cgttt      55
<210>106
<211>49
<212>DNA
<213>人工序列
<220>
<223>引物:prm7000
<400>106
ggggaccact ttgtacaaga aagctgggta tccaatctta tcgcttagg                49
<210>107
<211>1602
<212>DNA
<213>芜青(Brassica rapa)
<400>107
atggaattag agtgccaaga gagagctgaa gttgcgattg ttggcgaagg tttatccaat    60
caaggagctg agttgagaat tggagatggg tctgtcgagg ttccatgtgt gaagctttgt    120
tatcagcaaa agaagtcaac tttggtggtg cccagggaca aggatttgtc tacaaatact    180
catcgataca ccattatcga tttgcctcag gctttgatat ccgagattct taactgcctt    240
gacccaaaag agttgggcct tgtgtcctgt gtttcgactt gtctgcatag gttagcttcg    300
gagcatcacg cgtggaaagg cttctactgc gagagatggg ggctccccgt cgtcttaggg    360
ggtaaaactt ctgaagagag gtcatggaaa gagctgttta ttgagaggga gtttaggagc    420
aagacttttt taggacgtca tagtattgat accctttatg gtcacactga agcagttcgc    480
actgtgtttc ttttagcttc tgctaagctc attttcactt ctggatatga ctgcgttgtt    540
cggatgtggg gaatggaaga aggcttgtct attgcagcgt ctaaaccgct tggttgtact    600
attagagcag ttgcggctga tacgaagctc ttggtagctg gcggtactga tggttttata    660
cattgctgga aagcagtgga tggtctgaga gacttgtttg acctcacggg ttttcagaaa    720
gagaagacgg agtttcgcct ttgggagcat gagggtccta ttacatctct tgccctggat    780
atgacgagta tctttagcgg ttcgtgggac atgtctgttc gtatatggga tagatcttca    840
ttcaagtgta tcaaaacgtt gaggcatagc gattgggttt ggggactagc gcctcatgag    900
acaagcatcg cgtgtgctgc tggttcggat gtgtacattt gggacattag cagtgagact    960
ccagaggcga ttatccatga tgctcatgag ggtaacactt actctcttgc aagaagccac    1020
agtggggatt tcttgtttac tggtggggaa gatggaggga tcaaaatgtt tgagatcaga    1080
aaacacggta atgaaacaag cgtcctgctc atatctcaat ggatgcctca cactggtccc    1140
gtctactctc tttctttcga gttcccctgg cttgtatcag catctggtga cggtaaactc    1200
gctcttatcg acgttaggaa gttgttgaag actaaccgtc gtggcttacc caagagggtt    1260
tcttcgagaa ttgtggaacc cccacagaga atgctgcacg ggttcggttc aaacctgttc    1320
tctgtggacg tgggctgtga ccgtatagtt tgtggaggtg aagaaggcgt agttcggata    1380
tggaacttca cacaagcgtt ggagattgag aggagagctc gagctctgaa aggaatgagg    1440
cttgagaaca ggatgaggcg aaggaggatg cagatggaga tgaatgcgaa gagtggaagg    1500
cctgaccaat gctcgattgc tgctcataag aaccctgtta atggagatag gaatcgagcg    1560
tggcatacaa aacgaagagc aagtggcaag gcgaaggcct aa                       1602
<210>108
<211>533
<212>PRT
<213>芜青
<400>108
Met Glu Leu Glu Cys Gln Glu Arg Ala Glu Val Ala Ile Val Gly Glu
1               5                   10                  15
Gly Leu Ser Asn Gln Gly Ala Glu Leu Arg Ile Gly Asp Gly Ser Val
            20                  25                  30
Glu Val Pro Cys Val Lys Leu Cys Tyr Gln Gln Lys Lys Ser Thr Leu
        35                  40                  45
Val Val Pro Arg Asp Lys Asp Leu Ser Thr Asn Thr His Arg Tyr Thr
    50                  55                  60
Ile Ile Asp Leu Pro Gln Ala Leu Ile Ser Glu Ile Leu Asn Cys Leu
65                  70                  75                  80
Asp Pro Lys Glu Leu Gly Leu Val Ser Cys Val Ser Thr Cys Leu His
                85                  90                  95
Arg Leu Ala Ser Glu His His Ala Trp Lys Gly Phe Tyr Cys Glu Arg
            100                 105                 110
Trp Gly Leu Pro Val Val Leu Gly Gly Lys Thr Ser Glu Glu Arg Ser
        115                 120                 125
Trp Lys Glu Leu Phe Ile Glu Arg Glu Phe Arg Ser Lys Thr Phe Leu
    130                 135                 140
Gly Arg His Ser Ile Asp Thr Leu Tyr Gly His Thr Glu Ala Val Arg
145                 150                 155                 160
Thr Val Phe Leu Leu Ala Ser Ala Lys Leu Ile Phe Thr Ser Gly Tyr
                165                 170                 175
Asp Cys Val Val Arg Met Trp Gly Met Glu Glu Gly Leu Ser Ile Ala
            180                 185                 190
Ala Ser Lys Pro Leu Gly Cys Thr Ile Arg Ala Val Ala Ala Asp Thr
        195                 200                 205
Lys Leu Leu Val Ala Gly Gly Thr Asp Gly Phe Ile His Cys Trp Lys
    210                 215                 220
Ala Val Asp Gly Leu Arg Asp Leu Phe Asp Leu Thr Gly Phe Gln Lys
225                 230                 235                 240
Glu Lys Thr Glu Phe Arg Leu Trp Glu His Glu Gly Pro Ile Thr Ser
                245                 250                 255
Leu Ala Leu Asp Met Thr Ser Ile Phe Ser Gly Ser Trp Asp Met Ser
            260                 265                 270
Val Arg Ile Trp Asp Arg Ser Ser Phe Lys Cys Ile Lys Thr Leu Arg
        275                 280                 285
His Ser Asp Trp Val Trp Gly Leu Ala Pro His Glu Thr Ser Ile Ala
    290                 295                 300
Cys Ala Ala Gly Ser Asp Val Tyr Ile Trp Asp Ile Ser Ser Glu Thr
305                 310                 315                 320
Pro Glu Ala Ile Ile His Asp Ala His Glu Gly Asn Thr Tyr Ser Leu
                325                 330                 335
Ala Arg Ser His Ser Gly Asp Phe Leu Phe Thr Gly Gly Glu Asp Gly
            340                 345                 350
Gly Ile Lys Met Phe Glu Ile Arg Lys His Gly Asn Glu Thr Ser Val
        355                 360                 365
Leu Leu Ile Ser Gln Trp Met Pro His Thr Gly Pro Val Tyr Ser Leu
    370                 375                 380
Ser Phe Glu Phe ProTrp Leu Val Ser Ala Ser Gly Asp Gly Lys Leu
385                 390                 395                 400
Ala Leu Ile Asp Val Arg Lys Leu Leu Lys Thr Asn Arg Arg Gly Leu
                405                 410                 415
Pro Lys Arg Val Ser Ser Arg Ile Val Glu Pro Pro Gln Arg Met Leu
            420                 425                 430
His Gly Phe Gly Ser Asn Leu Phe Ser Val Asp Val Gly Cys Asp Arg
        435                 440                 445
Ile Val Cys Gly Gly Glu Glu Gly Val Val Arg Ile Trp Asn Phe Thr
    450                 455                 460
Gln Ala Leu Glu Ile Glu Arg Arg Ala Arg Ala Leu Lys Gly Met Arg
465                 470                 475                 480
Leu Glu Asn Arg Met Arg Arg Arg Arg Met Gln Met Glu Met Asn Ala
                485                 490                 495
Lys Ser Gly Arg Pro Asp Gln Cys Ser Ile Ala Ala His Lys Asn Pro
            500                 505                 510
Val Asn Gly Asp Arg Asn Arg Ala Trp His Thr Lys Arg Arg Ala Ser
        515                 520                 525
Gly Lys Ala Lys Ala
    530
<210>109
<211>1716
<212>DNA
<213>两色蜀黍
<400>109
atggcctttg actgcaacaa ggaaagagga gattcttcgc ctgataattg ctcccgcatt    60
tgcactgagg gtactctcgt ccaggcaaat cccttatctc actactggaa gcctaagggt    120
ttgaagagcc tcaacaaatt ggagaaccag aagtccagtc atggatctgt tccgagagac    180
gataatccag aacaagaagc tgaagcgagc gatgaggcat ctgcctcaac ctgtggcatc    240
aggtgcttca ccgatctgcc ggctgctttg gtctgcgagg tccttgcacg cctcgatgca    300
aaggaccttg gaattgtatc ctgtgtctcc accctcctgc atgccttagc cacagatcat    360
cagggatgga agaagttata ctgcgaaagg tgggggcttc cagaccttcc cgacgccctg    420
aatgggccct tgttgcctgg tgccccccta gatgggaagt cttggaaaac atttttcgtg    480
gagcgggagt tcaggagtaa atcattcatg ggtagattca atgtggatat tctccgtggc    540
cacaatgagg atgttcgagc cgtcttcctt ttggtatcag caaatctgat attcactggc    600
gtcactggcg gccgcgattc tgtggttaga atgtggaaaa tggaggaagg gttattgatt    660
gatacatccc gtgcacttgg tggcaccatc cgggcgattg cagctgactc taggctttta    720
gtgagtggag gaactaatgc ctatattcag tgttggaggg ctgttgaagg caatgatcac    780
ttatttcaca tctctggaag tggtactgac cagaatgcgg agtttcgcct ctgggggcat    840
gaaggtcctg tgactagtct tgccttggat tcactgagga tttatagtgg ttcttgggac    900
atgactgttc gtgtttggga cagagcccag atggattgcg tgcaaaagtt catgcatgca    960
gactgggtgt ggtctcttgc tctgcgtgga aatactgttg ccagtactgc tggtagagat    1020
gcatatgtat gggatatcag ggacggcgag ttaacaagct tagtttccaa tgcccatgtt    1080
ggtaatgcat attcattggc ttggacacac ctggcggatg tgctgtttac tggtggagag    1140
gatggcgcta ttcgcttgtt caatgtttct gatgtctctg atgatgagga ggacattaaa    1200
ccagtggcaa cttgggtgcc acattcaggt cctgttcatt ctcttgcttt tgagtatcca    1260
tggcttgtgt cagcctcgag tgatggcagg agtgatggca ggattgcact tattgatttg    1320
aggaagcttc tgactcccaa aagatcatca aaaggtctgc gtgttaagag ctttgatgca    1380
agtgccatag agcctccaca gaggatgctt catggcgttg gatgtgatct cttctccatc    1440
gccattggtg cagataggat tgtatgtgca ggtgaggatg gttctgttag agtctggaac    1500
ttctcagaag cactggagat tgagaggagg gcacaggctc taaggagttt gaggcaggag    1560
aaccgcatga ggcggaggaa ggcacaagta gagatgaatg caaatggtag aaggcctgac    1620
cagtgctcaa tagccatgaa aaagaaccaa ctgaaggctg ataagagtgc cacttggcac    1680
aacaagcgtg ccgttaatga gaaggccaag tcttag                              1716
<210>110
<211>57l
<212>PRT
<213>两色蜀黍
<400>110
Met Ala Phe Asp Cys Asn Lys Glu Arg Gly Asp Ser Ser Pro Asp Asn
1               5                   10                  15
Cys Ser Arg Ile Cys Thr Glu Gly Thr Leu Val Gln Ala Asn Pro Leu
            20                  25                  30
Ser His Tyr Trp Lys Pro Lys Gly Leu Lys Ser Leu Asn Lys Leu Glu
        35                  40                  45
Asn Gln Lys Ser Ser His Gly Ser Val Pro Arg Asp Asp Asn Pro Glu
    50                  55                  60
Gln Glu Ala Glu Ala Ser Asp Glu Ala Ser Ala Ser Thr Cys Gly Ile
65                  70                  75                  80
Arg Cys Phe Thr Asp Leu Pro Ala Ala Leu Val Cys Glu Val Leu Ala
                85                  90                  95
Arg Leu Asp Ala Lys Asp Leu Gly Ile Val Ser Cys Val Ser Thr Leu
            100                 105                 110
Leu His Ala Leu Ala Thr Asp His Gln Gly Trp Lys Lys Leu Tyr Cys
        115                 120                 125
Glu Arg Trp Gly Leu Pro Asp Leu Pro Asp Ala Leu Asn Gly Pro Leu
    130                 135                 140
Leu Pro Gly Ala Pro Leu Asp Gly Lys Ser Trp Lys Thr Phe Phe Val
145                 150                 155                 160
Glu Arg Glu Phe Arg Ser Lys Ser Phe Met Gly Arg Phe Asn Val Asp
                165                 170                 175
Ile Leu Arg Gly His Asn Glu Asp Val Arg Ala Val Phe Leu Leu Val
            180                 185                 190
Ser Ala Asn Leu Ile Phe Thr Gly Val Thr Gly Gly Arg Asp Ser Val
        195                 200                 205
Val Arg Met Trp Lys Met Glu Glu Gly Leu Leu Ile Asp Thr Ser Arg
    210                 215                 220
Ala Leu Gly Gly Thr Ile Arg Ala Ile Ala Ala Asp Ser Arg Leu Leu
225                 230                 235                 240
Val Ser Gly Gly Thr Asn Ala Tyr Ile Gln Cys Trp Arg Ala Val Glu
                245                 250                 255
Gly Asn Asp His Leu Phe His Ile Ser Gly Ser Gly Thr Asp Gln Asn
            260                 265                 270
Ala Glu Phe Arg Leu Trp Gly His Glu Gly Pro Val Thr Ser Leu Ala
        275                 280                 285
Leu Asp Ser Leu Arg Ile Tyr Ser Gly Ser Trp Asp Met Thr Val Arg
    290                 295                 300
Val Trp Asp Arg Ala Gln Met Asp Cys Val Gln Lys Phe Met His Ala
305                 310                 315                 320
Asp Trp Val Trp Ser Leu Ala Leu Arg Gly Asn Thr Val Ala Ser Thr
                325                 330                 335
Ala Gly Arg Asp Ala Tyr Val Trp Asp Ile Arg Asp Gly Glu Leu Thr
            340                 345                 350
Ser Leu Val Ser Asn Ala His Val Gly Asn Ala Tyr Ser Leu Ala Trp
        355                 360                 365
Thr His Leu Ala Asp Val Leu Phe Thr Gly Gly Glu Asp Gly Ala Ile
    370                 375                 380
Arg Leu Phe Asn Val Ser Asp Val Ser Asp Asp Glu Glu Asp Ile Lys
385                 390                 395                 400
Pro Val Ala Thr Trp Val Pro His Ser Gly Pro Val His Ser Leu Ala
                405                 410                 415
Phe Glu Tyr Pro Trp Leu Val Ser Ala Ser Ser Asp Gly Arg Ser Asp
            420                 425                 430
Gly Arg Ile Ala Leu Ile Asp Leu Arg Lys Leu Leu Thr Pro Lys Arg
        435                 440                 445
Ser Ser Lys Gly Leu Arg Val Lys Ser Phe Asp Ala Ser Ala Ile Glu
    450                 455                 460
Pro Pro Gln Arg Met Leu His Gly Val Gly Cys Asp Leu Phe Ser Ile
465                 470                 475                 480
Ala Ile Gly Ala Asp Arg Ile Val Cys Ala Gly Glu Asp Gly Ser Val
                485                 490                 495
Arg Val Trp Asn Phe Ser Glu Ala Leu Glu Ile Glu Arg Arg Ala Gln
            500                 505                 510
Ala Leu Arg Ser Leu Arg Gln Glu Asn Arg Met Arg Arg Arg Lys Ala
        515                 520                 525
Gln Val Glu Met Asn Ala Asn Gly Arg Arg Pro Asp Gln Cys Ser Ile
    530                 535                 540
Ala Met Lys Lys Asn Gln Leu Lys Ala Asp Lys Ser Ala Thr Trp His
545                 550                 555                 560
Asn Lys Arg Ala Val Asn Glu Lys Ala Lys Ser
                565                 570
<210>111
<211>1779
<212>DNA
<213>葡萄
<400>111
atggcatttg aatgccaaga gagtatagag gtttgtttgg tgaaaaattc aatagattct  60
gatgaacaac aggstggatt gagtgatttt aattccaatt ttaatcatat cacttcaatt  120
tttgatgcca aatctcaatt ggaaaccgaa actgcacacc gagaaagtgg agtggtttgt  180
ttgttgaaga attcaattga agaacgggct ggattgactc agtttagtcc cgattctgat  240
cacaatactt taatacrtga ctcgggaaat tcccaatcgg aaattgaaat cggaatccaa  300
aaaccttcaa cttcaaaccc caaagttaac gacacttcag gacattatcg taggttgata  360
actgatcttc cgtccgcgtt gatatcggaa attcttaatt gccttgaccc gaaagagctt  420
ggtgtggttt cgtgtgtctc aactgttctc aataggctag cgtcygagca ctccgtttgg  480
aaagatttct attgtgagag gtggggagct ccggttgttt cggggttttc agatgagaaa  540
tcatggaggg aattgtttgt ggagagggag tttaggagca aaacctttag gggacgattt  600
agcattgatg ttctgtatgg tcacactgag gcggttcgag ctgttttcct tttggcctct  660
gcaaagctca ttttcacttc tgggtatgat tccattgttc gaatgtggga tatggaagaa  720
gggttgtcaa ttgcgtgttc acggcctctc ggttgcacaa taagagcagt ggctgcggat  780
aagaaactgt tgcttgcggg gggtagtgat gggtttattc attgttggag agctgtagag  840
gggctctctt gcttgtttga ccttgtgggt tctcaaaacc tgagtactga gttccgaatt  900
tgggaacatg aaggtcctgt gacttgtctt gctttggata ttaagagaat ttatagtggc  960
tcatgggaca tgactgtgcg catatgggac cgttcttctt ttaaggttgt aaaggtcttg  1020
aggcacacag actgggtttg gggccttgtt cctcgtgata ctacagttgc tagcacttct  1080
ggctcagatg tgtatgtttg ggacgctgat agtgggactc tgctgacgat aatctctaat  1140
gctcatgtgg gtaatgctta tgctttggca cggagccaca caggggattt tctattcact  1200
gggggagaag atggggcaat acatatgttt gaggtcgtga gtgattgcat ggaaaggaat  1260
gtattggagg tttcaacgtg gattcctcat tctggtcctg ttcattccct ggcatttgag  1320
tttccctggc ttgtttcagc ttcagctgat gggaggatgt cactgattga tgtgagaaag  1380
cttttgcaaa cttgcaagcc ttccttaggg aagaatgttt ccaaggttag gcacagggac  1440
cacaaaagtg tggagccccc tcagaggatg ttacatgggt ttggctgcaa tttattctca  1500
gtggacattg gtgcagatcg tattgtctgt ggaggtgagg aaggtgtggt tagaatttgg  1560
aacttctcac aagctttaga agcagagcag agggcccgtg ctttaagagg aatacgtcta  1620
gaaaacagga tgaggcggcg taggcttcaa atagagctga ctagtaaggg tagtcgaact  1680
gatcaatgtt cagttgcagc cagtaagaat cctattaatg gtgataggag tggtgtgtgg  1740
cacaataagc ggggaatgag tggcaggatg aaagcatag                         1779
<210>112
<211>592
<212>PRT
<213>葡萄
<220>
<221>不确定
<222>(25)..(25)
<223>Xaa可以是任意天然产生的氨基酸
<220>
<221>不确定
<222>(86)..(86)
<223>Xaa可以是任意天然产生的氨基酸
<400>112
Met Ala Phe Glu Cys Gln Glu Ser Ile Glu Val Cys Leu Val Lys Asn
1               5                   10                  15
Ser Ile Asp Ser Asp Glu Gln Gln Xaa Gly Leu Ser Asp Phe Asn Ser
            20                  25                  30
Asn Phe Asn His Ile Thr Ser Ile Phe Asp Ala Lys Ser Gln Leu Glu
        35                  40                  45
Thr Glu Thr Ala His Arg Glu Ser Gly Val Val Cys Leu Leu Lys Asn
    50                  55                  60
Ser Ile Glu Glu Arg Ala Gly Leu Thr Gln Phe Ser Pro Asp Ser Asp
65                  70                  75                  80
His Asn Thr Leu Ile Xaa Asp Ser Gly Asn Ser Gln Ser Glu Ile Glu
                85                  90                  95
Ile Gly Ile Gln Lys Pro Ser Thr Ser Asn Pro Lys Val Asn Asp Thr
            100                 105                 110
Ser Gly His Tyr Arg Arg Leu Ile Thr Asp Leu Pro Ser Ala Leu Ile
        115                 120                 125
Ser Glu Ile Leu Asn Cys Leu Asp Pro Lys Glu Leu Gly Val Val Ser
    130                 135                 140
Cys Val Ser Thr Val Leu Asn Arg Leu Ala Ser Glu His Ser Val Trp
145                 150                 155                 160
Lys Asp Phe Tyr Cys Glu Arg Trp Gly Ala Pro Val Val Ser Gly Phe
                165                 170                 175
Ser Asp Glu Lys Ser Trp Arg Glu Leu Phe Val Glu Arg Glu Phe Arg
            180                 185                 190
Ser Lys Thr Phe Arg Gly Arg Phe Ser Ile Asp Val Leu Tyr Gly His
        195                 200                 205
Thr Glu Ala Val Arg Ala Val Phe Leu Leu Ala Ser Ala Lys Leu Ile
    210                 215                 220
Phe Thr Ser Gly Tyr Asp Ser Ile Val Arg Met Trp Asp Met Glu Glu
225                 230                 235                 240
Gly Leu Ser Ile Ala Cys Ser Arg Pro Leu Gly Cys Thr Ile Arg Ala
                245                 250                 255
Val Ala Ala Asp Lys Lys Leu Leu Leu Ala Gly Gly Ser Asp Gly Phe
            260                 265                 270
Ile His Cys Trp Arg Ala Val Glu Gly Leu Ser Cys Leu Phe Asp Leu
        275                 280                 285
Val Gly Ser Gln Asn Leu Ser Thr Glu Phe Arg Ile Trp Glu His Glu
    290                 295                 300
Gly Pro Val Thr Cys Leu Ala Leu Asp Ile Lys Arg Ile Tyr Ser Gly
305                 310                 315                 320
Ser Trp Asp Met Thr Val Arg Ile Trp Asp Arg Ser Ser Phe Lys Val
                325                 330                 335
Val Lys Val Leu Arg His Thr Asp Trp Val Trp Gly Leu Val Pro Arg
            340                 345                 350
Asp Thr Thr Val Ala Ser Thr Ser Gly Ser Asp Val Tyr Val Trp Asp
        355                 360                 365
Ala Asp Ser Gly Thr Leu Leu Thr Ile Ile Ser Asn Ala His Val Gly
    370                 375                 380
Asn Ala Tyr Ala Leu Ala Arg Ser His Thr Gly Asp Phe Leu Phe Thr
385                 390                 395                 400
Gly Gly Glu Asp Gly Ala Ile His Met Phe Glu Val Val Ser Asp Cys
                405                 410                 415
Met Glu Arg Asn Val Leu Glu Val Ser Thr Trp Ile Pro His Ser Gly
            420                 425                 430
Pro Val His Ser Leu Ala Phe Glu Phe Pro Trp Leu Val Ser Ala Ser
        435                 440                 445
Ala Asp Gly Arg Met Ser Leu Ile Asp Val Arg Lys Leu Leu Gln Thr
    450                 455                 460
Cys Lys Pro Ser Leu Gly Lys Asn Val Ser Lys Val Arg His Arg Asp
4654                 70                 475                 480
His Lys Ser Val Glu Pro Pro Gln Arg Met Leu His Gly Phe Gly Cys
                485                 490                 495
Asn Leu Phe Ser Val Asp Ile Gly Ala Asp Arg Ile Val Cys Gly Gly
            500                 505                 510
Glu Glu Gly Val Val Arg Ile Trp Asn Phe Ser Gln Ala Leu Glu Ala
        515                 520                 525
Glu Gln Arg Ala Arg Ala Leu Arg Gly Ile Arg Leu Glu Asn Arg Met
    530                 535                 540
Arg Arg Arg Arg Leu Gln Ile Glu Leu Thr Ser Lys Gly Ser Arg Thr
545                 550                 555                 560
Asp Gln Cys Ser Val Ala Ala Ser Lys Asn Pro Ile Asn Gly Asp Arg
                565                 570                 575
Ser Gly Val Trp His Asn Lys Arg Gly Met Ser Gly Arg Met Lys Ala
            580                 585                 590
<210>113
<211>745
<212>DNA
<213>玉蜀黍
<400>113
atggcggaca aggagcctgt cgtggagcga tccgaggcgt ctgaggagga ggacgcctcc  60
gccgcggccg ccgcggggga ggaagaggac acgggtgccc aggtggcccc catcgtgcgg  120
cttgaggagg tactcgtcac caccggtgag gaggacgagg acgtcctgct cgacatgaag  180
gcgaagctgt accggtttga taaagacggg aatcaatgga aggaacgggg cacgggcacc  240
gtcaagcttc tcaagaacaa ggagaccggc aaggtccgac tggtcatgcg ccaggccaag  300
acgcttaaga tctgcgcgaa ccacctcgtg gcccccacca cgagaatgca ggaacatgcc  360
ggcagcgaca aatcgtgcgt ctggcacgct tctgactttg cggatggcga actcaaggag  420
gagatgtttg ccatcaggtt tggttcggta gaaaactgca agaagttcaa ggagttggtt  480
gaggagattg ctgagtcact tacagagaac gaggacaagg aaggtcaaga tggctcttcc  540
acggccggat tgctggagaa gctcactgtg agcgagggca aatctgagga aagtggcaag  600
tcggagtcca ctgattctgg caaagtgacc gaaaccaaag ccgatgcagc cccagccgag  660
tagttggtgt ggttgcacta cccagctttc ttgtacaaag ttggcattat aagaaagcat  720
tgcttatcaa tttgttgcaa cgaac                                        745
<210>114
<211>220
<212>PRT
<213>玉蜀黍
<400>114
Met Ala Asp Lys Glu Pro Val Val Glu Arg Ser Glu Ala Ser Glu Glu
1               5                   10                  15
Glu Asp Ala Ser Ala Ala Ala Ala Ala Gly Glu Glu Glu Asp Thr Gly
            20                  25                  30
Ala Gln Val Ala Pro Ile Val Arg Leu Glu Glu Val Leu Val Thr Thr
        35                  40                  45
Gly Glu Glu Asp Glu Asp Val Leu Leu Asp Met Lys Ala Lys Leu Tyr
    50                  55                  60
Arg Phe Asp Lys Asp Gly Asn Gln Trp Lys Glu Arg Gly Thr Gly Thr
65                  70                  75                  80
Val Lys Leu Leu Lys Asn Lys Glu Thr Gly Lys Val Arg Leu Val Met
                85                  90                  95
Arg Gln Ala Lys Thr Leu Lys Ile Cys Ala Asn His Leu Val Ala Pro
            100                 105                 110
Thr Thr Arg Met Gln Glu His Ala Gly Ser Asp Lys Ser Cys Val Trp
        115                 120                 125
His Ala Ser Asp Phe Ala Asp Gly Glu Leu Lys Glu Glu Met Phe Ala
    130                 135                 140
Ile Arg Phe Gly Ser Val Glu Asn Cys Lys Lys Phe Lys Glu Leu Val
145                 150                 155                 160
Glu Glu Ile Ala Glu Ser Leu Thr Glu Asn Glu Asp Lys Glu Gly Gln
                165                 170                 175
Asp Gly Ser Ser Thr Ala Gly Leu Leu Glu Lys Leu Thr Val Ser Glu
            180                 185                 190
Gly Lys Ser Glu Glu Ser Gly Lys Ser Glu Ser Thr Asp Ser Gly Lys
        195                 200                 205
Val Thr Glu Thr Lys Ala Asp Ala Ala Pro Ala Glu
    210                 215                 220
<210>115
<211>196
<212>PRT
<213>玉蜀黍
<400>115
Met Ala Asp Lys Glu Pro Val Val Glu Arg Pro Glu Ala Gly Glu Glu
1               5                   10                  15
Glu Glu Asp Ala Ser Ala Ala Ala Ala Ala Gly Glu Glu Glu Asp Thr
            20                  25                  30
Gly Ala Gln Val Ala Pro Ile Val Arg Leu Glu Glu Val Ala Val Thr
        35                  40                  45
Thr Gly Glu Glu Asp Glu Asp Val Leu Leu Asp Met Lys Ala Lys Leu
    50                  55                  60
Leu Pro Ile Arg Gln Arg Arg Met Arg Gln Ala Lys Thr Leu Lys Ile
65                  70                  75                  80
Cys Ala Asn His Leu Val Ala Ser Thr Thr Lys Met Gln Glu His Ala
                85                  90                  95
Gly Ser Asp Lys Ser Cys Val Trp His Ala Ala Asp Phe Ala Asp Gly
            100                 105                 110
Glu Leu Lys Glu Glu Met Phe Ala Ile Arg Phe Gly Ser Val Glu Asn
        115                 120                 125
Cys Lys Lys Phe Lys Glu Leu Val Glu Glu Ile Ala Glu Ser Leu Thr
    130                 135                 140
Lys Asn Glu Gly Lys Glu Gly Glu Asp Gly Gly Ser Thr Ala Gly Leu
145                 150                 155                 160
Leu Ala Lys Leu Thr Val Ser Glu Gly Lys Ser Glu Gly Ser Gly Lys
                165                 170                 175
Ser Glu Ser Thr Asp Ser Gly Lys Val Thr Glu Thr Lys Ala Asp Thr
            180                 185                 190
Ala Pro Ala Glu
        195
<210>116
<211>725
<212>DNA
<213>拟南芥
<400>116
atgccaactt tgtacaaaaa agcaggcttc acaatggcga gcattagcaa cgagcccgag  60
cgtgagaaca gagacgaaga agagactgga gccaacgaag atgaagacac cggtgctcag  120
gttgctccta tcgtcaggct tgaagaagtc gccgtcacca ccggtgaaga agacgaagac  180
accatcctcg atctgaaatc gaagttgtat cgatttgata aagatggaag tcagtggaag  240
gagagaggtg ctggtactgt taagtttttg aaacatagag tttctgggaa gattcgtctc  300
gttatgaggc aatcgaaaac tttgaagatc tgtgctaatc atcttgttgg atcgggtatg  360
agtgttcagg aacacgctgg gaatgataag tcttgtgtat ggcacgctcg tgatttctcc  420
gatggtgaat tgaaggatga gctcttctgt atccggtttg cttcagttga gaattgcaaa  480
gcatttatgc aaaagttcaa ggaagtagct gaatctgaag aagagaaaga agagagcaaa  540
gatgcctctg ataccgctgg tcttcttgag aagttaacag tggaagagaa ggaaagtgag  600
aagaaaccag tggagaaggc agaggaaaac aaaaagagtg aagctgttga agaaaagaaa  660
acagaggagt ctgttccctc agcttaagat gcacccagct ttcttgtaca aagttggcat  720
tataa                                                              725
<210>117
<211>228
<212>PRT
<213>拟南芥
<400>117
Met Pro Thr Leu Tyr Lys Lys Ala Gly Phe Thr Met Ala Ser Ile Ser
1               5                   10                  15
Asn Glu Pro Glu Arg Glu Asn Arg Asp Glu Glu Glu Thr Gly Ala Asn
            20                  25                  30
Glu Asp Glu Asp Thr Gly Ala Gln Val Ala Pro Ile Val Arg Leu Glu
        35                  40                  45
Glu Val Ala Val Thr Thr Gly Glu Glu Asp Glu Asp Thr Ile Leu Asp
    50                  55                  60
Leu Lys Ser Lys Leu Tyr Arg Phe Asp Lys Asp Gly Ser Gln Trp Lys
65                  70                  75                  80
Glu Arg Gly Ala Gly Thr Val Lys Phe Leu Lys His Arg Val Ser Gly
                85                  90                  95
Lys Ile Arg Leu Val Met Arg Gln Ser Lys Thr Leu Lys Ile Cys Ala
            100                 105                 110
Asn His Leu Val Gly Ser Gly Met Ser Val Gln Glu His Ala Gly Asn
        115                 120                 125
Asp Lys Ser Cys Val Trp His Ala Arg Asp Phe Ser Asp Gly Glu Leu
    130                 135                 140
Lys Asp Glu Leu Phe Cys Ile Arg Phe Ala Ser Val Glu Asn Cys Lys
145                 150                 155                 160
Ala Phe Met Gln Lys Phe Lys Glu Val Ala Glu Ser Glu Glu Glu Lys
                165                 170                 175
Glu Glu Ser Lys Asp Ala Ser Asp Thr Ala Gly Leu Leu Glu Lys Leu
            180                 185                 190
Thr Val Glu Glu Lys Glu Ser Glu Lys Lys Pro Val Glu Lys Ala Glu
        195                 200                 205
Glu Asn Lys Lys Ser Glu Ala Val Glu Glu Lys Lys Thr Glu Glu Ser
    210                 215                 220
Val Pro Ser Ala
225
<210>118
<211>217
<212>PRT
<213>拟南芥
<400>118
Met Ala Ser Ile Ser Asn Glu Pro Lys Arg Glu Asn Arg Asp Glu Glu
1               5                   10                  15
Glu Thr Gly Ala Asn Glu Asp Glu Asp Thr Gly Ala Gln Val Ala Pro
            20                  25                  30
Ile Val Arg Leu Glu Glu Val Ala Val Thr Thr Gly Glu Glu Asp Glu
        35                  40                  45
Asp Thr Ile Leu Asp Leu Lys Ser Lys Leu Tyr Arg Phe Asp Lys Asp
    50                  55                  60
Gly Ser Gln Trp Lys Glu Arg Gly Ala Gly Thr Val Lys Phe Leu Lys
65                  70                  75                  80
His Arg Val Ser Gly Lys Ile Arg Leu Val Met Arg Gln Ser Lys Thr
                85                  90                  95
Leu Lys Ile Cys Ala Asn His Leu Val Gly Ser Gly Met Ser Val Gln
            100                 105                 110
Glu His Ala Gly Asn Asp Lys Ser Cys Val Trp His Ala Arg Asp Phe
        115                 120                 125
Ser Asp Gly Glu Leu Lys Asp Glu Leu Phe Cys Ile Arg Phe Ala Ser
    130                 135                 140
Val Glu Asn Cys Lys Ala Phe Met Gln Lys Phe Lys Glu Val Ala Glu
145                 150                 155                 160
Ser Glu Glu Glu Lys Glu Glu Ser Lys Asp Ala Ser Asp Thr Ala Gly
                165                 170                 175
Leu Leu Glu Lys Leu Thr Val Glu Glu Lys Glu Ser Glu Lys Lys Pro
            180                 185                 190
Val Glu Lys Ala Glu Glu Asn Lys Lys Ser Glu Ala Val Glu Glu Lys
        195                 200                 205
Lys Thr Glu Glu Ser Val Pro Ser Ala
    210                 215
<210>119
<211>1416
<212>DNA
<213>拟南芥
<400>119
gcgaaacccc caaattctct tctctctatc tctctcgcgt acgccgcacc gtagcgacca  60
attgaatcca cgaggaaatc tcagtaaata ctatggcgac caacgaaccc gagcacgagc  120
acagagacga ggaagaggcc ggagctaacg aggatgagga caccggagct caggtcgctc  180
cgatcgttag gcttgaggag gttgccgtca ctaccggcga ggaagacgaa gatgccgtcc  240
ttgatctgaa atcgaagctt tatcgattcg ataaggatgc gaatcagtgg aaggagagag  300
gagctggtac tgtgaagttc ttaaagcata agaacactgg gaagattcgt ctcgttatga  360
ggcaatctaa aactttgaag atctgtgcta atcacttcgt taaatcgggc atgagtgttc  420
aggaacacgt tgggaatgaa aagtcatgtg tgtggcacgc tcgtgacttt gctgatggtg  480
aactcaagga tgagcttttc tgtatccgat ttgcttctat tgagaattgc aaaacattta  540
tgcaaaagtt caaggaagtt gctgagtctg aagaagagaa agaagagagc aaagatgccg  600
ctgacactgc tggccttctt gagaaattga ctgtggaaga gacaaaaacg gaggagaaaa  660
ccgaagcgaa agctgtggag acggcaaaga ctgaagtgaa agcagaagaa aagaaagaga  720
gcgaggcaga gaaatctggt gaagcaaaga aaacagaaga aagtggtccc tcaacataag  780
aagcgtcatc atttaagttg ccaaatcctg gcgaggtaat taagcctcga aatgttttga  840
tgcatcatga gtctaccatt gtcttggcac tatctatcta tacatgtttt gtcgagtcat  900
atcaagtggt tgggggatcg cttggggtcg ggttttactg aatgctgagt cgttatgggt  960
ctaatagttt ttgagtctaa agtgtcgggt gatatgagag atttgggtga aatatttttt  1020
catgttggtt atctgaaaga gtacattggt ttcattgttt taagttttct catggatcct  1080
ttttggatgg tcttattttg aggatacaaa tgtgtttgtc catggacaag aatcagaagt  1140
ctccattttt tttttttcaa aatttaatgc atgtgatttt ttaatcttaa ggtaattgcc  1200
aattgtttga caaaaaaaag gtaattgcca atctactttg ctctcttgtg ttagtcgatg  1260
ctagtcttga ccctgataaa gatccaaaat gtatattaac agtattcata aaattcttca  1320
gttataacga actgttcacg gaaaaaaaat gacattgtac tatactgtgc taaaattacc  1380
aaagcatgat ttatataaat catatccagt aagacc                            1416
<210>120
<211>228
<212>PRT
<213>拟南芥
<400>120
Met Ala Thr Asn Glu Pro Glu His Glu His Arg Asp Glu Glu Glu Ala
1               5                   10                  15
Gly Ala Asn Glu Asp Glu Asp Thr Gly Ala Gln Val Ala Pro Ile Val
            20                  25                  30
Arg Leu Glu Glu Val Ala Val Thr Thr Gly Glu Glu Asp Glu Asp Ala
        35                  40                  45
Val Leu Asp Leu Lys Ser Lys Leu Tyr Arg Phe Asp Lys Asp Ala Asn
    50                  55                  60
Gln Trp Lys Glu Arg Gly Ala Gly Thr Val Lys Phe Leu Lys His Lys
65                  70                  75                  80
Asn Thr Gly Lys Ile Arg Leu Val Met Arg Gln Ser Lys Thr Leu Lys
                85                  90                  95
Ile Cys Ala Asn His Phe Val Lys Ser Gly Met Ser Val Gln Glu His
            100                 105                 110
Val Gly Asn Glu Lys Ser Cys Val Trp His Ala Arg Asp Phe Ala Asp
        115                 120                 125
Gly Glu Leu Lys Asp Glu Leu Phe Cys Ile Arg Phe Ala Ser Ile Glu
    130                 135                 140
Asn Cys Lys Thr Phe Met Gln Lys Phe Lys Glu Val Ala Glu Ser Glu
145                 150                 155                 160
Glu Glu Lys Glu Glu Ser Lys Asp Ala Ala Asp Thr Ala Gly Leu Leu
                165                 170                 175
Glu Lys Leu Thr Val Glu Glu Thr Lys Thr Glu Glu Lys Thr Glu Ala
            180                 185                 190
Lys Ala Val Glu Thr Ala Lys Thr Glu Val Lys Ala Glu Glu Lys Lys
        195                 200                 205
Glu Ser Glu Ala Glu Lys Ser Gly Glu Ala Lys Lys Thr Glu Glu Ser
    210                 215                 220
Gly Pro Ser Thr
225
<210>121
<211>660
<212>DNA
<213>拟南芥
<400>121
atggcgagca ctgagccaga gcgtgagaac cgtgaagatg aaaccgaagt caacgaagat  60
gaagacaccg gagctcaggt agctccgatc gttaggcttg aagaggttgc agtcaccacc  120
ggcgaagaag atgaagacgc cgtcctcgat ctgaaatcga agatgtatcg attcgataaa  180
gaagggaacc aatggaagga gagaggagct ggaactgtga agttattgaa gcataaggaa  240
actggaaaag ttcgtcttgt tatgagacaa tctaaaaccc taaagatctg tgccaatcac  300
ctcatttcgt ctgggatgag tgttcaggaa catagtggga atgaaaagtc ttgtttatgg  360
cacgctactg atttctccga cggcgagttg aaagatgagc ttttctgcat tcgatttgct  420
tccattgaga attgcaaaac atttatggag aagttcactg aaatagctga aagccagcaa  480
gtagggaaag agagcaccca gggcgacgag gctgctggtt taatagagaa tctttcggtt  540
gaggaaaata taagtgagga gaaagccaag gaagcagaag agaaagagcc tgcaaaggaa  600
gataaagaaa caaaaaagga gaaggtagaa gaagagaaga aaacagaggc aagcacttaa  660
<210>122
<211>260
<212>PRT
<213>拟南芥
<400>122
Met Ala Ser Thr Glu Pro Glu Arg Glu Asn Arg Glu Asp Glu Thr Glu
1               5                   10                  15
Val Asn Glu Asp Glu Asp Thr Gly Ala Gln Val Ala Pro Ile Val Arg
            20                  25                  30
Leu Glu Glu Val Ala Val Thr Thr Gly Glu Glu Asp Glu Asp Ala Val
        35                  40                  45
Leu Asp Leu Tyr Val Thr Arg Ser Val Asn Ile Leu Val Ser Leu Pro
    50                  55                  60
Leu Val Lys Met Tyr Arg Phe Asp Lys Glu Gly Asn Gln Trp Lys Glu
65                  70                  75                  80
Arg Gly Ala Gly Thr Val Lys Leu Leu Lys His Lys Glu Thr Gly Lys
                85                  90                  95
Val Arg Leu Val Met Arg Gln Ser Lys Thr Leu Lys Ile Cys Ala Asn
            100                 105                 110
His Leu Ile Ser Ser Gly Met Ser Val Gln Glu His Ser Gly Asn Glu
        115                 120                 125
Lys Ser Cys Leu Trp His Ala Thr Asp Phe Ser Asp Gly Glu Leu Lys
    130                 135                 140
Asp Glu Leu Phe Cys Ile Arg Phe Ala Ser Ile Glu Arg Lys Met Val
145                 150                 155                 160
Trp Lys Ile Leu Glu Trp Leu Thr Asp Ser Val Ala Ser Thr Asp Cys
                165                 170                 175
Lys Thr Phe Met Glu Lys Phe Thr Glu Ile Ala Glu Ser Gln Gln Val
            180                 185                 190
Gly Lys Glu Ser Thr Gln Gly Asp Glu Ala Ala Gly Leu Ile Glu Asn
        195                 200                 205
Leu Ser Val Glu Glu Asn Ile Ser Glu Glu Lys Ala Lys Glu Ala Glu
    210                 215                 220
Glu Lys Glu Pro Ala Lys Glu Asp Lys Glu Thr Lys Lys Glu Lys Val
225                 230                 235                 240
Thr Gln Ser Val Ile Asp Met Phe Gly Val Ala Ala Lys Gly Thr Ile
                245                 250                 255
Met Trp Cys Phe
            260
<210>123
<211>1104
<212>DNA
<213>番茄
<400>123
aaaaaaagca aaaagaaaag aggcaaagtt atcaaatcaa aaaccctact tcctcccttg  60
ttgttcttct tcttcttcaa atccggggta aatctttcta aaaccaaaaa tctagagtga  120
tggcaagcac tactgttgaa cccaaattgg agaagaaaga agaggaagta gaagcagaag  180
tagaagaaaa cccaactggc gatgatgaag acactggtgc acaagttgct cccattgtta  240
ggctacaaga agttgctgtc tccactggtg aagaaaatga acatgttctt cttgatctga  300
aatcaaagtt ataccgattt gacaaggaag ggagtcaatg gaaagagaga ggtgttggga  360
ctgtgaagct tctcaagcac aaggaaactg gaaaggttag gcttgtgatg aggcaatcca  420
agacgctgaa aatctgtgcc aaccacttgg tccttcctac tatgtcgatc caagaacatg  480
ctgggaatga gaagtcttgt gtgtggcatg ctgctgactt tgctgatgga gaactgaaag  540
atgagacttt ttgcatccgc tttgcttcag ttgagaattg caaggctttc aaagagaagg  600
ttgaagaaat tgctgaatct caacagacaa agtctggaca aagtgaagaa gctggtgctg  660
ctgctactga acttattgaa aagcttagtg ttgaaagcaa agataaaaat gacaaacctg  720
aagacaaaga ggcccctgca gctacagagg aaaaggaaga taagaaggaa gagaaagctg  780
aagaaaagaa ttaaaatgtt tgtattgtcg gtcagttttt ttttttgaaa ggttaatagc  840
attcgttgtt tctgtctgat ccaatagata tgatagatat aagcaatgtg tctcttgtgg  900
tcttatttgt tgttgttggg atggtttgga ttttcatttg ggtcttgagt cgagtgcagc  960
ttcatgtttt attgtggtct ttggtgtttc cttgtactta tttattgtgt gtttgcaaat  1020
tttggttcat ggggtacacc acccagtata agggattacg tttgttaaaa cctttagcac  1080
tgttagtgag atcatttttg agtt                                         1104
<210>124
<211>224
<212>PRT
<213>番茄
<400>124
Met Ala Ser Thr Thr Val Glu Pro Lys Leu Glu Lys Lys Glu Glu Glu
1               5                   10                  15
Val Glu Ala Glu Val Glu Glu Asn Pro Thr Gly Asp Asp Glu Asp Thr
            20                  25                  30
Gly Ala Gln Val Ala Pro Ile Val Arg Leu Gln Glu Val Ala Val Ser
        35                  40                  45
Thr Gly Glu Glu Asn Glu His Val Leu Leu Asp Leu Lys Ser Lys Leu
    50                  55                  60
Tyr Arg Phe Asp Lys Glu Gly Ser Gln Trp Lys Glu Arg Gly Val Gly
65                  70                  75                  80
Thr Val Lys Leu Leu Lys His Lys Glu Thr Gly Lys Val Arg Leu Val
                85                  90                  95
Met Arg Gln Ser Lys Thr Leu Lys Ile Cys Ala Asn His Leu Val Leu
            100                 105                 110
ProThr Met Ser Ile Gln Glu His Ala Gly Asn Glu Lys Ser Cys Val
       115                 120                 125
Trp His Ala Ala Asp Phe Ala Asp Gly Glu Leu Lys Asp Glu Thr Phe
    130                 135                 140
Cys Ile Arg Phe Ala Ser Val Glu Asn Cys Lys Ala Phe Lys Glu Lys
145                 150                 155                 160
Val Glu Glu Ile Ala Glu Ser Gln Gln Thr Lys Ser Gly Gln Ser Glu
                165                 170                 175
Glu Ala Gly Ala Ala Ala Thr Glu Leu Ile Glu Lys Leu Ser Val Glu
            180                 185                 190
Ser Lys Asp Lys Asn Asp Lys Pro Glu Asp Lys Glu Ala Pro Ala Ala
        195                 200                 205
Thr Glu Glu Lys Glu Asp Lys Lys Glu Glu Lys Ala Glu Glu Lys Asn
    210                 215                 220
<210>125
<211>442
<212>DNA
<213>稻
<400>125
caacctctcc ccccacgatc gccctcctcc ccgaaacttc tggaaccgag agcagcagac    60
gttagctctt ctcctccgat ggcggacaag gagcccgtcg tggaccgccc cgaggacgag    120
gaggaggcct ccgccgccgc cgccgccgcg ggcggcgagg aggaggacac gggcgcccag    180
gtcgccccca tcgtgcggct cgaggaggtc gccgtcacca ccggcgagga ggacgaggac    240
gtgctcctcg acatgaaggc gaagctttac cggtttgaca aggaggggaa ccagtggaag    300
gagcggggga cgggcaccgt caagctcctc aagcacaagg agaacggcaa ggtccgcctc    360
gtcatgcgcc aggccaagac gctcaagatc tgcgcgaacc acctagttgc ttcgaccacg    420
aagatgcagg agcatgcggg ca                                             442
<210>126
<211>121
<212>PRT
<213>稻
<400>126
Met Ala Asp Lys Glu Pro Val Val Asp Arg Pro Glu Asp Glu Glu Glu
1               5                   10                  15
Ala Ser Ala Ala Ala Ala Ala Ala Gly Gly Glu Glu Glu Asp Thr Gly
            20                  25                  30
Ala Gln Val Ala Pro Ile Val Arg Leu Glu Glu Val Ala Val Thr Thr
        35                  40                  45
Gly Glu Glu Asp Glu Asp Val Leu Leu Asp Met Lys Ala Lys Leu Tyr
    50                  55                  60
Arg Phe Asp Lys Glu Gly Asn Gln Trp Lys Glu Arg Gly Thr Gly Thr
65                  70                  75                  80
Val Lys Leu Leu Lys His Lys Glu Asn Gly Lys Val Arg Leu Val Met
                85                  90                  95
Arg Gln Ala Lys Thr Leu Lys Ile Cys Ala Asn His Leu Val Ala Ser
            100                 105                 110
Thr Thr Lys Met Gln Glu His Ala Gly
        115                 120
<210>127
<211>1063
<212>DNA
<213>玉蜀黍
<400>127
gcacgcggta aacaccccac gtctcaagct gcccctttct caccgccgcg gccgccacgc  60
gcagcagcaa ccgagcagga gcgcagccag caagctcagg cccgagccct actgcaaccg  120
ccgctgctac cgcactgaac accatggccg acccggcgga gcaccgtcca gcggaggagg  180
acgaggaagc cgcggcggcc ggcgaggatg aggacaccgg cgctcaggtc gcgcccatcg  240
tgaagctgga ggaggtcgcc gttaccaccg gagaggagga cgaggacgta cttgtcgaca  300
tgaaggcgaa gctctaccgg ttcgacaagg aggcgaacca gtggaaagaa cgtggcacag  360
gcactgtgaa gctgcttaag cacaaggaga ccgccaaggt ccgcctcgtc atgcgtcagg  420
cgaagacgct taagatctgt gctaaccatc ttgtggtggc gacgactaag atgcaggagc  480
acgcagggag cgacaagtcg tgcgtgtggc acgcgctgga cttcgccgac ggtgagctca  540
aggaggagat gtttgctatc cgttttggat ctgtcgagaa ttgcaagaag ttcaaggaca  600
ctgttgaaga gatagctgaa gagcaaggaa agaccgaggt gaaagaaaac gaggaagtct  660
ccattgccgc cgcagatttg gtacagaagt taacagtgac agaggctagc aacgagggag  720
atgcagagga agaggaggct cctgcatctg accataagaa ggatgctaaa gggtaaagat  780
tgaaggcaaa caaggccaaa tgattatgat tccattcatt tcgttgtcaa ggttcatctt  840
ccccacaaat tttcattaca aagtttcatt gcattttctc ctgagatgat ttgtgtgtgt    900
gtgtgtgtgt gtgtgtgtgt gttgggtgaa atctgagttg tcagtcatct acatgtcttt    960
cttggttgtt agacttattc tcagtcgcct gtttatctgg gatggctagg tacatcatgt    1020
ttgtacaatt atttggggtt gatttaaaaa aaagaaaaaa aaa                      1063
<210>128
<211>210
<212>PRT
<213>玉蜀黍
<400>128
Met Ala Asp Pro Ala Glu His Arg Pro Ala Glu Glu Asp Glu Glu Ala
1               5                   10                  15
Ala Ala Ala Gly Glu Asp Glu Asp Thr Gly Ala Gln Val Ala Pro Ile
            20                  25                  30
Val Lys Leu Glu Glu Val Ala Val Thr Thr Gly Glu Glu Asp Glu Asp
        35                  40                  45
Val Leu Val Asp Met Lys Ala Lys Leu Tyr Arg Phe Asp Lys Glu Ala
    50                  55                  60
Asn Gln Trp Lys Glu Arg Gly Thr Gly Thr Val Lys Leu Leu Lys His
65                  70                  75                  80
Lys Glu Thr Ala Lys Val Arg Leu Val Met Arg Gln Ala Lys Thr Leu
                85                  90                  95
Lys Ile Cys Ala Asn His Leu Val Val Ala Thr Thr Lys Met Gln Glu
            100                 105                 110
His Ala Gly Ser Asp Lys Ser Cys Val Trp His Ala Leu Asp Phe Ala
        115                 120                 125
Asp Gly Glu Leu Lys Glu Glu Met Phe Ala Ile Arg Phe Gly Ser Val
    130                 135                 140
Glu Asn Cys Lys Lys Phe Lys Asp Thr Val Glu Glu Ile Ala Glu Glu
145                 150                 155                 160
Gln Gly Lys Thr Glu Val Lys Glu Asn Glu Glu Val Ser Ile Ala Ala
                165                 170                 175
Ala Asp Leu Val Gln Lys Leu Thr Val Thr Glu Ala Ser Asn Glu Gly
            180                 185                 190
Asp Ala Glu Glu Glu Glu Ala Pro Ala Ser Asp His Lys Lys Asp Ala
        195                 200                 205
Lys Gly
    210
<210>129
<211>1111
<212>DNA
<213>稻
<400>129
ggacgcgcag caaccggcag cagcagcaga ggaggaggcc agggcaaccc gcaaccccaa  60
accctactcc cgccgcgcca ccgccatggc cgacccagcg gagcaccgtg aggaggagga  120
ggaggccgcg gcggcggcgg cgggcgagga cgaggacacc ggcgcccagg tcgcgcccat  180
cgtcaagctc gaggaggtcg ccgtcaccac cggcgaggag gacgaggagg tcctcctcga  240
catgaagtcg aagctgtacc gcttcgacaa ggaggggaac caatggaagg agagaggcac  300
cggcacggtg aagctgctga agcacaagga gaccggcaag gtccgtctcg tcatgcgcca  360
ggctaagacg ctcaagatct gcgccaatca cctcgtggcg acgaccacga agatgcagga  420
gcacgccggc agcgacaagt cgtgcgtgtg gcacgcgctg gacttcgccg acggcgagct    480
caaggaggaa atgttcgcca tacgctttgg atccgtcgag aactgcaaga agttcaggga    540
gatggtagaa gagattgctg agcagcaagg aaagaacgag gagaaagaaa atgaggaagt    600
ctcctctact gcagggttgg ttgagaagct ttcagtgacc gagacaaaaa aggaggaaaa    660
tgcagagaaa gaggagactc ctgcagaaga ggataagaag gacgctaaag agtgaaagca    720
cccgcaacct ctaggcagct ttgatatgcc tgaagcgagt gaagtgttaa atgagcgtca    780
tttcattcat tttgtggtca aagttcttcc tttcacaaat tttcattgtg ttttcttttg    840
gatgaatgtt tgtgctaggc aaaatttgag ttgtatcagt cgggttcttg gttactacac    900
tgttacttaa accttgagtt gtttatccga gatggggtgg cggagtgggg gcacagcatg    960
tttgtacaat tatttgaagt tgcttttgga atgggcacgg tttgggttgt ccaaaatttg    1020
gacggtgatg ccctgtcact cacaattctt atctctgtct tgcaattata tgcgatgtga    1080
agctcttcgc ctcttcggtg acgagttgtc g                                   1111
<210>130
<211>209
<212>PRT
<213>稻
<400>130
Met Ala Asp Pro Ala Glu His Arg Glu Glu Glu Glu Glu Ala Ala Ala
1               5                   10                  15
Ala Ala Ala Gly Glu Asp Glu Asp Thr Gly Ala Gln Val Ala Pro Ile
            20                  25                  30
Val Lys Leu Glu Glu Val Ala Val Thr Thr Gly Glu Glu Asp Glu Glu
        35                  40                  45
Val Leu Leu Asp Met Lys Ser Lys Leu Tyr Arg Phe Asp Lys Glu Gly
    50                  55                  60
Asn Gln Trp Lys Glu Arg Gly Thr Gly Thr Val Lys Leu Leu Lys His
65                  70                  75                  80
Lys Glu Thr Gly Lys Val Arg Leu Val Met Arg Gln Ala Lys Thr Leu
                85                  90                  95
Lys Ile Cys Ala Asn His Leu Val Ala Thr Thr Thr Lys Met Gln Glu
            100                 105                 110
His Ala Gly Ser Asp Lys Ser Cys Val Trp His Ala Leu Asp Phe Ala
        115                 120                 125
Asp Gly Glu Leu Lys Glu Glu Met Phe Ala Ile Arg Phe Gly Ser Val
    130                 135                 140
Glu Asn Cys Lys Lys Phe Arg Glu Met Val Glu Glu Ile Ala Glu Gln
145                 150                 155                 160
Gln Gly Lys Asn Glu Glu Lys Glu Asn Glu Glu Val Ser Ser Thr Ala
                165                 170                 175
Gly Leu Val Glu Lys Leu Ser Val Thr Glu Thr Lys Lys Glu Glu Asn
            180                 185                 190
Ala Glu Lys Glu Glu Thr Pro Ala Glu Glu Asp Lys Lys Asp Ala Lys
        195                 200                 205
Glu
<210>131
<211>767
<212>DNA
<213>脂杨亚种
<400>131
tctcctctcc aagcaagaac atcaaatcta atggcaagca cagaacccga acacgagcac    60
agagaagatg aggaagctcc ggctggcgaa gacgaagaca ccggtgctca ggttgctccg    120
atcgtcaagc tcgaagaagt tgctgtctct accggtgaag aagatgaaga tgcgatcctc    180
gatctgaaat cgaagcttta tagatttgat aaggacggga atcagtggaa agagagaggt    240
gctggcactg tcaagttatt gaagcataaa gagtctggaa aagttcgtct tgttatgaga    300
caatctaaga ctctcaagat ctgcgctaat catctcgtgc tgccgactat gtccgtgcag    360
gagcacgcag ggaatgataa gtcgtgtgtg tggcacgcta cagatttcgc tgatggtgaa    420
ttgaaggatg agttgttctg cattcgtttc gcatctgttg aaaattgcaa aacctttatg    480
gaaatgtttc aagaagttgc tgaatcccaa gagagcaaag aggaaaatga ggatgcaact    540
gttgctgctg atgcattgga gaagttgagt gttgaaggga agaaaactga ggagaatgct    600
ggcgaagagg cacctgctgc aaccaagaat gaggaaacta agactgatac agataagaaa    660
ggggagaagc ctgctccctc aacttgaggg ttgatttgtt tgttttgcca ttcccttggc    720
agtatgatga gttcagttgt caaccatatt tcttgtccat tttgtgg                  767
<210>132
<211>218
<212>PRT
<213>脂杨亚种(Populus balsamifera subsp.Trichocarpa)
<400>132
Met Ala Ser Thr Glu Pro Glu His Glu His Arg Glu Asp Glu Glu Ala
1               5                   10                  15
Pro Ala Gly Glu Asp Glu Asp Thr Gly Ala Gln Val Ala Pro Ile Val
            20                  25                  30
Lys Leu Glu Glu Val Ala Val Ser Thr Gly Glu Glu Asp Glu Asp Ala
        35                  40                  45
Ile Leu Asp Leu Lys Ser Lys Leu Tyr Arg Phe Asp Lys Asp Gly Asn
    50                  55                  60
Gln Trp Lys Glu Arg Gly Ala Gly Thr Val Lys Leu Leu Lys His Lys
65                  70                  75                  80
Glu Ser Gly Lys Val Arg Leu Val Met Arg Gln Ser Lys Thr Leu Lys
                85                  90                  95
Ile Cys Ala Asn His Leu Val Leu Pro Thr Met Ser Val Gln Glu His
            100                 105                 110
Ala Gly Asn Asp Lys Ser Cys Val Trp His Ala Thr Asp Phe Ala Asp
        115                 120                 125
Gly Glu Leu Lys Asp Glu Leu Phe Cys Ile Arg Phe Ala Ser Val Glu
    130                 135                 140
Asn Cys Lys Thr Phe Met Glu Met Phe Gln Glu Val Ala Glu Ser Gln
145                 150                 155                 160
Glu Ser Lys Glu Glu Asn Glu Asp Ala Thr Val Ala Ala Asp Ala Leu
                165                 170                 175
Glu Lys Leu Ser Val Glu Gly Lys Lys Thr Glu Glu Asn Ala Gly Glu
            180                 185                 190
Glu Ala Pro Ala Ala Thr Lys Asn Glu Glu Thr Lys Thr Asp Thr Asp
        195                 200                 205
Lys Lys Gly Glu Lys Pro Ala Pro Ser Thr
    210                 215
<210>133
<211>1105
<212>DNA
<213>甘蔗
<400>133
ggagaacacc tacccgtctc cccaccctag ccccgccgtc gcgtcctctt cgaatcgaat  60
cgcgccgcga tcacctcatc tcatggcgga caaggagcct gtcgtggagc gacccgaggc  120
ggctgaggag gaggacgcct cagccgccgc cgctgccgcg ggggaggagg aggacacggg  180
cgcccaggtg gcccccatcg tgcggcttga ggaggtagac gtcaccaccg gcgaggagga  240
cgaggacgtc ctgctcgaca tgaaggcgaa gttgtaccga tttgacaaag acgggaacca  300
atggaaggaa cggggcaccg gcaccgtcaa gcttctcaag cacaaggaga ccggcaaggt  360
ccgactcgtc atgcgccagg ccaagacgct taagatctgc gcgaaccacc tcgtggcctc  420
gaccacgaag atgcaggagc atgccggcag cgacaagtca tgcgtctggc acgctgctga  480
ctttgccgat ggcgaactca aggaggagat gtttgccatc aggtttggtt ccgtagaaaa  540
ttgtaagaag ttcaaggagt tggttgagga gatttctgag tcgcttacaa agaacgaggg  600
caaggaaagt gaagatggtt cttccacagc tggattgctg gagaagctta ctgtgagtga  660
gcacaaatct gaggaaagtg acaagtcgga gtccactgat tctggcaaag tgaccgaaac  720
caaagccgac acagccccag ctgagtagtt ggtggtggca gatcctcccg gtgccaaatc  780
agtttgtgtc cttccagtgg aagtttggtg cccatttgcc atgaaatatg actgctaaca  840
tttgggggcg agttggagca gtctcagatg tttggatttg gtctagtctg gtttggtccg  900
ggcttgattt tgttaaaaac ttagtacatt ggggttggaa cgtttggtat gcgagtcgct  960
agtatttcac tgcatggatt gttatggatt gcggtataag gtgcatctta tatttttttt  1020
atttcgttca atacacatac atgtgttgta ttaatacttt atgccaatgc ccatggggag  1080
agttgaattt gaatgtcgag agtgg                                        1105
<210>134
<211>221
<212>PRT
<213>甘蔗
<400>134
Met Ala Asp Lys Glu Pro Val Val Glu Arg Pro Glu Ala Ala Glu Glu
1               5                   10                  15
Glu Asp Ala Ser Ala Ala Ala Ala Ala Ala Gly Glu Glu Glu Asp Thr
            20                  25                  30
Gly Ala Gln Val Ala Pro Ile Val Arg Leu Glu Glu Val Asp Val Thr
        35                  40                  45
Thr Gly Glu Glu Asp Glu Asp Val Leu Leu Asp Met Lys Ala Lys Leu
    50                  55                  60
Tyr Arg Phe Asp Lys Asp Gly Asn Gln Trp Lys Glu Arg Gly Thr Gly
65                  70                  75                  80
Thr Val Lys Leu Leu Lys His Lys Glu Thr Gly Lys Val Arg Leu Val
                85                  90                  95
Met Arg Gln Ala Lys Thr Leu Lys Ile Cys Ala Asn His Leu Val Ala
            100                 105                 110
Ser Thr Thr Lys Met Gln Glu His Ala Gly Ser Asp Lys Ser Cys Val
        115                 120                 125
Trp His Ala Ala Asp Phe Ala Asp Gly Glu Leu Lys Glu Glu Met Phe
    130                 135                 140
Ala Ile Arg Phe Gly Ser Val Glu Asn Cys Lys Lys Phe Lys Glu Leu
145                 150                 155                 160
Val Glu Glu Ile Ser Glu Ser Leu Thr Lys Asn Glu Gly Lys Glu Ser
                165                 170                 175
Glu Asp Gly Ser Ser Thr Ala Gly Leu Leu Glu Lys Leu Thr Val Ser
            180                 185                 190
Glu His Lys Ser Glu Glu Ser Asp Lys Ser Glu Ser Thr Asp Ser Gly
        195                 200                 205
Lys Val Thr Glu Thr Lys Ala Asp Thr Ala Pro Ala Glu
    210                 215                 220
<210>135
<211>1034
<212>DNA
<213>甘蔗
<400>135
acagcagcaa ccggtagcag gagcgcagcc agcaagcgca ggccccgagc cgtactgcaa  60
ccgccgctgc caccgcgccg aacgccatgg ccgacccggc ggagcaccgc cctgcggagg  120
aggaggagga ggccgcggcg gccggcgagg atgaggacac cggcgcccag gtcgcgccca  180
tcgtaaagct ggaggaggtc gccgttacca ccggagagga ggacgaggac gtgctcctcg  240
acatgaaggc gaagctttac cggttcgaca aggaggggaa ccagtggaaa gagcgcggca  300
ctggcactgt gaagctgctc aagcacaagg agaccgccaa ggtccgcctc gttatgcgtc  360
aggcgaagac gcttaagatc tgcgctaacc atctcgtggt ggcgacgact aagatgcagg  420
agcacgcggg gagcgacaag tcgtgcgtgt ggcacgcgct ggacttcgcc gacggcgagc  480
tcaaggagga gatgttcgct atccgttttg gatctgtcga gaattgtaag aagtttaagg  540
atattgttga agagatagct gaacagcaag gaaagactga ggagaaagaa aacgaggaag  600
cctccactgc cgctgatttg gtacagaagt taacagtgac ggaggccagc aaggaggaaa  660
ctgcggagaa agaggaggct cctgcatctg gcgataagaa ggatgctaaa gattgaaggc  720
gtttatatac gcaaacaatg gtcaaatgag tgtccttcca ttcattttgt tgtcaaggtt  780
catctaccct ccacaaattt tcatcgtgtt ttctctggga tgaatgcttg tgttaggtga  840
aatcagagtc atcagtcatc tacatggttt tcttggtcat agactgttat ttttaagtcg  900
cctgtttatc tgggatggct ggggtcagca tgtctgtaca attatttgga gttgcttttg  960
gaatggacgc ggtttgatga gtagcctaaa gcttgagatg gtggtgatgt cttttcgctc  1020
cacttttctt attc                                                    1034
<210>136
<211>209
<212>PRT
<213>甘蔗
<400>136
Met Ala Asp Pro Ala Glu His Arg Pro Ala Glu Glu Glu Glu Glu Ala
1               5                   10                  15
Ala Ala Ala Gly Glu Asp Glu Asp Thr Gly Ala Gln Val Ala Pro Ile
            20                  25                  30
Val Lys Leu Glu Glu Val Ala Val Thr Thr Gly Glu Glu Asp Glu Asp
        35                  40                  45
Val Leu Leu Asp Met Lys Ala Lys Leu Tyr Arg Phe Asp Lys Glu Gly
    50                  55                  60
Asn Gln Trp Lys Glu Arg Gly Thr Gly Thr Val Lys Leu Leu Lys His
65                  70                  75                  80
Lys Glu Thr Ala Lys Val Arg Leu Val Met Arg Gln Ala Lys Thr Leu
                85                  90                  95
Lys Ile Cys Ala Asn His Leu Val Val Ala Thr Thr Lys Met Gln Glu
            100                 105                 110
His Ala Gly Ser Asp Lys Ser Cys Val Trp His Ala Leu Asp Phe Ala
        115                 120                 125
Asp Gly Glu Leu Lys Glu Glu Met Phe Ala Ile Arg Phe Gly Ser Val
    130                 135                 140
Glu Asn Cys Lys Lys Phe Lys Asp Ile Val Glu Glu Ile Ala Glu Gln
145                 150                 155                 160
Gln Gly Lys Thr Glu Glu Lys Glu Asn Glu Glu Ala Ser Thr Ala Ala
                165                 170                 175
Asp Leu Val Gln Lys Leu Thr Val Thr Glu Ala Ser Lys Glu Glu Thr
            180                 185                 190
Ala Glu Lys Glu Glu Ala Pro Ala Ser Gly Asp Lys Lys Asp Ala Lys
        195                 200                 205
Asp
<210>137
<211>1039
<212>DNA
<213>紫苜蓿(Medicago sativa)
<400>137
atgtctacaa gcaccgatca tcacgaagag gaagatgttc ccgccggcga tgaagaagac  60
accggcgctc aaatcgctcc gatcatccaa cttcatgaag tcgctgtttc tactggtgaa  120
gaagatgaag aagctattct cgacctaaaa gcgaaactgt accgatttga caaggtaggg  180
aatcaatgga aggaacgagg ggcaggaact gttaagtttt tgaagcataa ggttactgga  240
aaagttaggc ttgttatgag acaatcaaag actcttaaga tctgtgctaa tcatctcatt  300
ttgcctaaaa tgactgtgca agagcatgct gggaatgaga aatcttgtgt ttggcacgcg  360
aaggactttg ctgatggtga attgaaagac gagtttttct gcattcgatt tgcgtcaatt  420
gaaaattgca gaaagttcat agagacattt caagaaattg ctgaatccct gaacaaagag  480
gaaagcaagg atgcatccac tgctgctgat ctccttgaga atttgagtgt tgaagggaaa  540
gcagatgcag aaaagaaaga taaagagaaa tctgaggaga aaactaagga gaaagagaca  600
ccagaaaaag aaagcaagga agatacagaa aagaaagttg aagagcctgc ttcatctgct  660
tgattatgat atgttcatat tttcgacaag gcaatatgga aaagtttggt ggttgacctt  720
cgtgccactc ttatcaatac tctctcatag tactagtctt caggttgttt tgttgctacg  780
ttattgagtg gttgatatcc ttcgttgaat tattgtcagc aaggttggtt ttttgagtcg  840
ggtttgaatc attgagattg gcgcttttgg tctatgggtc tatgggagtt gttattttcg  900
ttctattcat ttatttagtc gaaatttgaa tgagtcatgt tggtttggtg tcggggatgg  960
ggagggtgca gtcgggaaaa attagtagta agtacaaaca aaggttttga atgcatatta  1020
ttgagtataa cattttata                                               1039
<210>138
<211>220
<212>PRT
<213>紫苜蓿
<400>138
Met Ser Thr Ser Thr Asp His His Glu Glu Glu Asp Val Pro Ala Gly
1               5                   10                  15
Asp Glu Glu Asp Thr Gly Ala Gln Ile Ala Pro Ile Ile Gln Leu His
            20                  25                  30
Glu Val Ala Val Ser Thr Gly Glu Glu Asp Glu Glu Ala Ile Leu Asp
        35                  40                  45
Leu Lys Ala Lys Leu Tyr Arg Phe Asp Lys Val Gly Asn Gln Trp Lys
    50                  55                  60
Glu Arg Gly Ala Gly Thr Val Lys Phe Leu Lys His Lys Val Thr Gly
65                  70                  75                  80
Lys Val Arg Leu Val Met Arg Gln Ser Lys Thr Leu Lys Ile Cys Ala
                85                  90                  95
Asn His Leu Ile Leu Pro Lys Met Thr Val Gln Glu His Ala Gly Asn
            100                 105                 110
Glu Lys Ser Cys Val Trp His Ala Lys Asp Phe Ala Asp Gly Glu Leu
        115                 120                 125
Lys Asp Glu Phe Phe Cys Ile Arg Phe Ala Ser Ile Glu Asn Cys Arg
    130                 135                 140
Lys Phe Ile Glu Thr Phe Gln Glu Ile Ala Glu Ser Leu Asn Lys Glu
145                 150                 155                 160
Glu Ser Lys Asp Ala Ser Thr Ala Ala Asp Leu Leu Glu Asn Leu Ser
                165                 170                 175
Val Glu Gly Lys Ala Asp Ala Glu Lys Lys Asp Lys Glu Lys Ser Glu
            180                 185                 190
Glu Lys Thr Lys Glu Lys Glu Thr Pro Glu Lys Glu Ser Lys Glu Asp
        195                 200                 205
Thr Glu Lys Lys Val Glu Glu Pro Ala Ser Ser Ala
    210                 215                 220
<210>139
<211>30
<212>PRT
<213>人工序列
<220>
<223>基序2of玉蜀黍
<400>139
Glu Glu Glu Asp Thr Gly Ala Gln Val Ala Pro Ile Val Arg Leu Glu
1               5                   10                  15
Glu Val Ala Val Thr Thr Gly Glu Glu Asp Glu Asp Val Leu
            20                  25                  30
<210>140
<211>10
<212>PRT
<213>人工序列
<220>
<223>玉蜀黍的基序3
<400>140
Arg Gln Ala Lys Thr Leu Lys Ile Cys Ala
1               5                   10
<210>141
<211>5
<212>PRT
<213>人工序列
<220>
<223>玉蜀黍的基序4
<400>141
Asn His Leu Val Ala
1               5
<210>142
<211>17
<212>PRT
<213>人工序列
<220>
<223>玉蜀黍的基序5
<400>142
Asp Lys Ser Cys Val Trp His Ala Ala Asp Phe Ala Asp Gly Glu Leu
1               5                   10                  15
Lys
<210>143
<211>5
<212>PRT
<213>人工序列
<220>
<223>玉蜀黍的基序6
<400>143
Glu Ile Ala Glu Ser
1               5
<210>144
<211>9
<212>PRT
<213>人工序列
<220>
<223>玉蜀黍的基序7
<400>144
Leu Ala Lys Leu Thr Val Ser Glu Gly
1               5
<210>145
<211>30
<212>PRT
<213>人工序列
<220>
<223>拟南芥的基序2
<400>145
Glu Asp Glu Asp Thr Gly Ala Gln Val Ala Pro Ile Val Arg Leu Glu
1               5                   10                  15
Glu Val Ala Val Thr Thr Gly Glu Glu Asp Glu Asp Thr Ile
            20                  25                  30
<210>146
<211>10
<212>PRT
<213>人工序列
<220>
<223>拟南芥的基序3
<400>146
Arg Gln Ser Lys Thr Leu Lys Ile Cys Ala
1               5                   10
<210>147
<211>5
<212>PRT
<213>人工序列
<220>
<223>拟南芥的基序4
<400>147
Asn His Leu Val Gly
1               5
<210>148
<211>17
<212>PRT
<213>人工序列
<220>
<223>拟南芥的基序5
<400>148
Asp Lys Ser Cys Val Trp His Ala Arg Asp Phe Ser Asp Gly Glu Leu
1               5                   10                  15
Lys
<210>149
<211>5
<212>PRT
<213>人工序列
<220>
<223>拟南芥的基序6
<400>149
Glu Val Ala Glu Ser
1               5
<210>150
<211>9
<212>PRT
<213>人工序列
<220>
<223>拟南芥的基序7
<400>150
Leu Glu Lys Leu Thr Val Glu Glu Lys
1               5
<210>151
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物:prm06703
<400>151
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc ggacaaggag c    51
<210>152
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm06704
<400>152
ggggaccact ttgtacaaga aagctgggta gtgcaaccac accaactact     50
<210>153
<211>52
<212>DNA
<213>人工序列
<220>
<223>引物:prm06491
<400>153
ggggacaagt ttgtacaaaa aagcaggctt cacaatggcg agcattagca ac    52
<210>154
<211>49
<212>DNA
<213>人工序列
<220>
<223>引物:prm06492
<400>154
ggggaccact ttgtacaaga aagctgggtg catcttaagc tgagggaac        49
<210>155
<211>654
<212>DNA
<213>稻
<400>155
cttctacatc ggcttaggtg tagcaacacg actttattat tattattatt attattatta    60
ttattttaca aaaatataaa atagatcagt ccctcaccac aagtagagca agttggtgag    120
ttattgtaaa gttctacaaa gctaatttaa aagttattgc attaacttat ttcatattac    180
aaacaagagt gtcaatggaa caatgaaaac catatgacat actataattt tgtttttatt    240
attgaaatta tataattcaa agagaataaa tccacatagc cgtaaagttc tacatgtggt    300
gcattaccaa aatatatata gcttacaaaa catgacaagc ttagtttgaa aaattgcaat    360
ccttatcaca ttgacacata aagtgagtga tgagtcataa tattattttc tttgctaccc    420
atcatgtata tatgatagcc acaaagttac tttgatgatg atatcaaaga acatttttag    480
gtgcacctaa cagaatatcc aaataatatg actcacttag atcataatag agcatcaagt    540
aaaactaaca ctctaaagca accgatggga aagcatctat aaatagacaa gcacaatgaa    600
aatcctcatc atccttcacc acaattcaaa tattatagtt gaagcatagt agta          654
<210>156
<211>1394
<212>DNA
<213>稻
<400>156
atgcttgccg tgtcgccggc gatgtgcccc gacattgagg accgcgccgc ggtggccggc    60
gatgctggca tggaggtcgt cgggatgtcg tcggacgaca tggatcagtt cgacttctcc    120
gtcgatgaca tagacttcgg ggacttcttc ctgaggctgg aggacggtga tgtgctcccg    180
gacctcgagg tcgacccggc cgagatcttc accgacttcg aggcaattgc gacgagtgga    240
ggcgaaggtg tgcaggacca ggaggtgccc accgtcgagc tcttggcgcc tgcggacgac    300
gtcggtgtgc tggatccgtg cggcgatgtc gtcgtcgggg aggagaacgc ggcgtttgcc    360
ggggctggag aggagaaggg agggtgtaac caggacgatg atgcggggga agcgaatgtc    420
gacgatggag ccgcggcggt tgaggccaag tcttcgtcgc cgtcatcgac gacgtcgtcg    480
tcgcaggagg ctgagagccg gcacaagtca tccagcaaga gctcccatgg gaagaagaaa    540
gcgaaggtgg actggacgcc tgagcttcac cggaggttcg tgcaggcggt ggagcagctc    600
ggcatcgaca aggccgtgcc gtcgaggata cttgagatca tggggatcga ctctctcacc    660
cggcacaaca tagccagcca tcttcagaag taccggtcac acagaaaaca catgattgcg    720
agagaggcgg aggcagcgag ttggacccaa cggcggcaga tttacgccgc cggtggaggt    780
gctgtttgcg aagaggccgg agtccaacgc gtggaccgtg ccaaccattg gcttccctcc    840
tcctccgcca ccaccaccat caccggctcc gattcaacat tttgctcgcc cgttgcatgt    900
tggggccacc cgacgatgga cccgtcccga gttccagtgt ggccaccgcg gcacctcgtt    960
ccccgtggcc cggcgccacc atgggttcca ccgccgccgc cgtcggaccc tgctttctgg    1020
caccaccctt acatgagggg gccagcacat gtgccaactc aagggacacc  ttgcatggcg   1080
atgcccatgc cagctgcgag atttcctgct ccaccggtgc caggagttgt cccgtgtcca    1140
atgtataggc cattgactcc accagcactg gcgagcaaga atcagcagga cgcacagctt    1200
caactccagg ttcaaccatc aagcgagagc atcgacgcag ctatcggtga tgttttatcg    1260
aaaccgtggt tgcctttgcc tcttggactg aagccacctt cagtggacag tgtgatgggc    1320
gagctgcaga ggcaaggcgt agcaaacgtt cctccagcgt gtggatgata ttacccagct    1380
ttcttgtaca aagt                                                      1394
<210>157
<211>455
<212>PRT
<213>稻
<400>157
Met Leu Ala Val Ser Pro Ala Met Cys Pro Asp Ile Glu Asp Arg Ala
1               5                   10                  15
Ala Val Ala Gly Asp Ala Gly Met Glu Val Val Gly Met Ser Ser Asp
            20                  25                  30
Asp Met Asp Gln Phe Asp Phe Ser Val Asp Asp Ile Asp Phe Gly Asp
        35                  40                  45
Phe Phe Leu Arg Leu Glu Asp Gly Asp Val Leu Pro Asp Leu Glu Val
    50                  55                  60
Asp Pro Ala Glu Ile Phe Thr Asp Phe Glu Ala Ile Ala Thr Ser Gly
65                  70                  75                  80
Gly Glu Gly Val Gln Asp Gln Glu Val Pro Thr Val Glu Leu Leu Ala
                85                  90                  95
Pro Ala Asp Asp Val Gly Val Leu Asp Pro Cys Gly Asp Val Val Val
            100                 105                 110
Gly Lys Glu Asn Ala Ala Phe Ala Gly Ala Gly Glu Glu Lys Gly Gly
        115                 120                 125
Cys Asn Gln Asp Asp Asp Ala Gly Glu Ala Asn Ala Asp Asp Gly Ala
    130                 135                 140
Ala Ala Val Glu Ala Lys Ser Ser Ser Pro Ser Ser Ser Thr Ser Ser
145                 150                 155                 160
Ser Gln Glu Ala Glu Ser Arg His Lys Ser Ser Ser Lys Ser Ser His
                165                 170                 175
Gly Lys Lys Lys Ala Lys Val Asp Trp Thr Pro Glu Leu His Arg Arg
            180                 185                 190
Phe Val Gln Ala Val Glu Gln Leu Gly Ile Asp Lys Ala Val Pro Ser
        195                 200                 205
Arg Ile Leu Glu Ile Met Gly Ile Asp Ser Leu Thr Arg His Asn Ile
    210                 215                 220
Ala Ser His Leu Gln Lys Tyr Arg Ser His Arg Lys His Met Ile Ala
225                 230                 235                 240
Arg Glu Ala Glu Ala Ala Ser Trp Thr Gln Arg Arg Gln Ile Tyr Ala
                245                 250                 255
Ala Gly Gly Gly Ala Val Ala Lys Arg Pro Glu Ser Asn Ala Trp Thr
            260                 265                 270
Val Pro Thr Ile Gly Phe Pro Pro Pro Pro Pro Pro Pro Pro Ser Pro
        275                 280                 285
Ala Pro Met Gln His Phe Ala Arg Pro Leu His Val Trp Gly His Pro
    290                 295                 300
Thr Met Asp Pro Ser Arg Val Pro Val Trp Pro Pro Arg His Leu Val
305                 310                 315                 320
Pro Arg Gly Pro Ala Pro Pro Trp Val Pro Pro Pro Pro Pro Ser Asp
                325                 330                 335
Pro Ala Phe Trp His His Pro Tyr Met Arg Gly Pro Ala His Val Pro
            340                 345                 350
Thr Gln Gly Thr Pro Cys Met Ala Met Pro Met Pro Ala Ala Arg Phe
        355                 360                 365
Pro Ala Pro Pro Val Pro Gly Val Val Pro Cys Pro Met Tyr Arg Pro
    370                 375                 380
Leu Thr Pro Pro Ala Leu Thr Ser Lys Asn Gln Gln Asp Ala Gln Leu
385                 390                 395                 400
Gln Leu Gln Val Gln Pro Ser Ser Glu Ser Ile Asp Ala Ala Ile Gly
                405                 410                 415
Asp Val Leu Ser Lys Pro Trp Leu Pro Leu Pro Leu Gly Leu Lys Pro
            420                 425                 430
Pro Ser Val Asp Ser Val Met Gly Glu Leu Gln Arg Gln Gly Val Ala
        435                 440                 445
Asn Val Pro Pro Ala Cys Gly
    450                 455
<210>158
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm02251
<400>158
ggggacaagt ttgtacaaaa aagcaggctt cacaatgctt gccgtgtcgc    50
<210>159
<211>49
<212>DNA
<213>人工序列
<220>
<223>引物:prm02252
<400>159
ggggaccact ttgtacaaga aagctgggta atatcatcca cacgctgga               49
<210>160
<211>2193
<212>DNA
<213>稻
<400>160
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct    60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact    120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt    180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc    240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata    300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga    360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt    420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat    480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag    540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt    600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc    660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat    720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa    780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca    840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag    900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa    960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata    1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag    1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc    1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg    1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg    1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat    1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc    1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt    1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag    1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg    1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat    1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc    1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca    1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta    1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga    1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg    1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac    1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta    2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga    2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct    2160
tggtgtagct tgccactttc accagcaaag ttc                                 2193
<210>161
<211>21
<212>PRT
<213>人工序列
<220>
<223>GARP共有序列1
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Arg″
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Met″/取代=″Val″/取代=″Ala″
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Lys″/取代=″Met″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Leu″
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Asp″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Thr″/取代=″Ile″/取代=″Asn″
<220>
<221>变体
<222>(8)..(8)
<223>/取代=″Ala″/取代=″Pro″/取代=″Ser″/取代=″Thr″/取代=″Cys″/取代=″His″/取代=″Gln″/取代=″Asp″
<220>
<221>变体
<222>(9)..(9)
<223>/取代=″Gln″/取代=″Thr″/取代=″Asp″/取代=″Ser″
<220>
<221>变体
<222>(11)..(11)
<223>/取代=″Asp″
<220>
<221>变体
<222>(12)..(12)
<223>/取代=″Lys″/取代=″Gln″/取代=″Ala″/取代=″His″/取代=″Asp″/取代=″Glu″/取代=″Leu″/取代=″Ile″
<220>
<221>变体
<222>(13)..(13)
<223>/取代=″Arg″/取代=″Gln″/取代=″Ser″/取代=″Cys″/取代=″Val″/取代=″Ala″/取代=″His″
<220>
<221>变体
<222>(15)..(15)
<223>/取代=″Leu″/取代=″Ile″
<220>
<221>变体
<222>(16)..(16)
<223>/取代=″Lys″/取代=″Gln″/取代=″Asp″/取代=″His″/取代=″Asp″/取代=″Asn″/取代=″Arg″/取代=″Ser″
<220>
<221>变体
<222>(17)..(17)
<223>/取代=″Val″/取代=″Cys″
<220>
<221>变体
<222>(18)..(18)
<223>/取代=″Gly″/取代=″Leu″/取代=″Ile″
<220>
<221>变体
<222>(19)..(19)
<223>/取代=″Glu″/取代=″Ala″/取代=″Gln″/取代=″Asp″/取代=″Gly″/取代=″Thr″/取代=″Ile″/取代=″Lys″/取代=″His″
<220>
<221>变体
<222>(20)..(20)
<223>/取代=″Glu″/取代=″His″/取代=″Leu″/取代=″Ile″/取代=″Met″/取代=″Lys″/取代=″Arg″/取代=″Ser″
<400>161
Lys Pro Arg Val Val Trp Ser Val Glu Leu His Arg Lys Phe Val Ala
1               5                   10                  15
Ala Val Asn Gln Leu
            20
<210>162
<211>3
<212>PRT
<213>人工序列
<220>
<223>GARP共有序列2
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Val″/取代=″Leu″/取代=″Pro″/取代=″Ser″/取代=″His″/取代=″Gln″/取代=″Ala″/取代=″Gly″
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Glu″/取代=″Lys″/取代=″His″/取代=″Gln″/取代=″Asn″/取代=″Ala″
<400>162
Gly Ile Asp
1
<210>163
<211>11
<212>PRT
<213>人工序列
<220>
<223>GARP共有序列3
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Thr″
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Ile″/取代=″Tyr″/取代=″Phe″/取代=″Thr″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Ser″
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Arg″/取代=″Thr″/取代=″Gln″/取代=″Leu″/取代=″Ser″/取代=″Gly″/取代=″Ala″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Val″/取代=″Leu″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Met″/取代=″Arg″/取代=″Lys″
<220>
<221>变体
<222>(8)..(8)
<223>/取代=″Glu″/取代=″Gln″/取代=″Lys″/取代=″Arg″/取代=″Ser″
<220>
<221>变体
<222>(9)..(9)
<223>/取代=″Ile″/取代=″Phe″/取代=″His″/取代=″Val″/取代=″Met″/取代=″Thr″/取代=″Arg″/取代=″Ala″
<220>
<221>变体
<222>(10)..(10)
<223>/取代=″Ile″/取代=″Leu″
<220>
<221>变体
<222>(11)..(11)
<223>/取代=″Lys″/取代=″Gly″/取代=″Ser″/取代=″Asp″/取代=″Gln″/取代=″Glu″
<400>163
Ala Val Pro Lys Lys Ile Leu Asp Leu Met Asn
1           5                       10
<210>164
<211>8
<212>PRT
<213>人工序列
<220>
<223>GARP共有序列4
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Ile″/取代=″Met″/取代=″Thr″/取代=″Glu″/取代=″Leu″/取代=″Ser″/取代=″Asn″
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Asp″/取代=″Gly″/取代=″Asn″/取代=″Tyr″/取代=″Lys″/取代=″His″/取代=″Gln″/取代=″Pro″
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Gly″/取代=″Lys″/取代=″Thr″/取代=″Ser″/取代=″Cys″/取代=″Arg″/取代=″Asp″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Leu″
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Asp″/取代=″Ala″/取代=″Ser″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Asn″/取代=″Ile″/取代=″Leu″/取代=″Val″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″His″/取代=″Asp″/取代=″Ser″/取代=″Ala″/取代=″Tyr″/取代=″Phe″
<220>
<221>变体
<222>(8)..(8)
<223>/取代=″Glu″/取代=″His″
<400>164
Val Glu Asn Ile Thr Arg Glu Asn
1               5
<210>165
<211>9
<212>PRT
<213>人工序列
<220>
<223>GARP共有序列5
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Ile″/取代=″Leu″
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Lys″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Met″/取代=″Ile″
<220>
<221>变体
<222>(8)..(8)
<223>/取代=″Phe″
<220>
<221>变体
<222>(9)..(9)
<223>/取代=″Val″
<400>165
Val Ala Ser His Leu Gln Lys Tyr Arg
1               5
<210>166
<211>16
<212>PRT
<213>人工序列
<220>
<223>共有序列6
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Arg″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Met″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Ala″/取代=″Met″/取代=″Ile″
<220>
<221>变体
<222>(11)..(11)
<223>/取代=″Gly″/取代=″Val″
<220>
<221>变体
<222>(14)..(14)
<223>/取代=″Gly″
<220>
<221>变体
<222>(15)..(15)
<223>/取代=″Asn″/取代=″Thr″
<400>166
Ser His Arg Lys His Leu Leu Ala Arg Glu Ala Glu Ala Ala Ser Trp
1               5                   10                  15
<210>167
<211>48
<212>PRT
<213>人工序列
<220>
<223>GCT结构域共有序列
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Gln″
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Leu″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Lys″/取代=″Ser″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Val″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Val″/取代=″Leu″
<220>
<221>变体
<222>(13)..(13)
<223>/取代=″Glu″
<220>
<221>变体
<222>(14)..(14)
<223>/取代=″Ala″
<220>
<221>变体
<222>(15)..(15)
<223>/取代=″Leu″
<220>
<221>变体
<222>(16)..(16)
<223>/取代=″Thr″/取代=″Ala″/取代=″Val″
<220>
<221>变体
<222>(17)..(17)
<223>/取代=″Lys″/取代=″Arg″
<220>
<221>变体
<222>(20)..(20)
<223>/取代=″Thr″
<220>
<221>变体
<222>(22)..(22)
<223>/取代=″Pro″
<220>
<221>变体
<222>(27)..(27)
<223>/取代=″Asn″
<220>
<221>变体
<222>(30)..(30)
<223>/取代=″Ala″
<220>
<221>变体
<222>(31)..(31)
<223>/取代=″Met″/取代=″Leu″
<220>
<221>变体
<222>(32)..(32)
<223>/取代=″Glu″/取代=″Gly″
<220>
<221>变体
<222>(33)..(33)
<223>/取代=″Ser″
<220>
<221>变体
<222>(35)..(35)
<223>/取代=″Ile″
<220>
<221>变体
<222>(36)..(36)
<223>/取代=″Ala″/取代=″Ser″/取代=″Gly″
<220>
<221>变体
<222>(39)..(39)
<223>/取代=″His″/取代=″Glu″
<220>
<221>变体
<222>(40)..(40)
<223>/取代=″Lys″
<220>
<221>变体
<222>(41)..(41)
<223>/取代=″His″
<220>
<221>变体
<222>(43)..(43)
<223>/取代=″Ile″
<220>
<221>变体
<222>(44)..(44)
<223>/取代=″Asn″/取代=″Pro″/取代=″Ala″
<220>
<221>变体
<222>(45)..(45)
<223>/取代=″Glu″/取代=″Thr″/取代=″Lys″
<220>
<221>变体
<222>(46)..(46)
<223>/取代=″Ile″
<220>
<221>变体
<222>(48)..(48)
<223>/取代=″Gln″
<400>167
His Pro Ser Asn Glu Ser Ile Asp Ala Ala Ile Gly Asp Val Ile Ser
1               5                   10                  15
Asn Pro Trp Leu Pro Leu Pro Leu Gly Leu Lys Pro Pro Ser Val Asp
            20                  25                  30
Gly Val Met Thr Glu Leu Gln Arg Gln Gly Val Ser Asn Val Pro Pro
        35                  40                  45
<210>168
<211>1542
<212>DNA
<213>稻
<400>168
atgcttgagg tgtccacgct gcgaagccct aaggcggatc agcgggcggg cgtcggcggc    60
caccatgtcg tcggcttcgt cccggcgccg ccgtcgccgg ccgacgtcgc cgacgaggtc    120
gacgcgttca tcgtcgacga cagctgcctg ctcgagtaca tcgacttcag ctgctgcgac    180
gtgccgttct tccacgccga cgacggcgac atcctcccgg acctcgaggt cgaccccacg    240
gagctcctcg ccgagttcgc cagctccccg gacgacgagc cgccgccgac gacgtcggct    300
ccgggccccg gcgagccagc tgctgctgca ggagccaagg aagacgtgaa ggaagatgga    360
gccgccgccg ccgccgccgc cgccgccgct gactacgacg ggtcgccgcc gccaccgcgg    420
gggaagaaga agaaggacga cgaggaaagg tcgtcgtcgt tgccggagga gaaagacgcg    480
aagaacggcg gcggcgacga ggtcctgagc gcggtgacga cggaggattc ctcggccggt    540
gccgccaagt cgtgctcgcc gtcggcagag ggccacagca agaggaagcc gtcgtcgtcg    600
tcgtcatcgg cggcggccgg caagaactct cacggcaagc gcaaggtgaa ggtggactgg    660
acgccggagt tgcaccggcg gttcgtgcag gcggtggagc agctcgggat agacaaggcc    720
gtgccgtcca ggatcctgga gctcatgggc atcgagtgcc tcactcgcca caacatcgcc    780
agccatctcc agaaatatcg gtcgcacagg aaacatctga tggcgaggga ggcggaggcg    840
gcgagctgga cgcagaagcg gcagatgtac accgccgccg ccgccgccgc cgcggtggca    900
gccggcggcg ggccaaggaa ggacgccgcc gccgccactg cggcggtggc cccgtgggtc    960
atgccgacca tcggtttccc tccgccgcac gcggcggcga tggtgcctcc cccgccgcac    1020
cctccaccgt tctgccggcc gccgctgcac gtgtggggcc acccgaccgc cggcgtcgag    1080
ccgaccaccg cggcggcgcc accaccaccc tcgccgcacg cgcagccgcc gttgctgccc    1140
gtctggccgc gccacctggc gccgccgccg ccgccgctgc cggcggcgtg ggcgcacggc    1200
caccagccgg cgccggtgga cccggcggcg tactggcagc aacagtataa cttgcagagg    1260
tttcctgtac cgccggtgcc tggaatggtg ccgcacccca tgtacagacc gataccgccg    1320
ccgtcaccgc cgcaggggaa taaactcgct gccttgcagc ttcagcttga tgcccacccg    1380
tctaaggaga gcatagacgc agccatcgga gatgttttag tgaagccatg gctgccgctt    1440
cccctcggcc tcaagccacc gtcgctggac agcgtcatgt ctgagctgca caagcagggc    1500
atccccaagg tgccaccggc ggcgagcggt gccgccggct ga                       1542
<210>169
<211>513
<212>PRT
<213>稻
<400>169
Met Leu Glu Val Ser Thr Leu Arg Ser Pro Lys Ala Asp Gln Arg Ala
1               5                   10                  15
Gly Val Gly Gly His His Val Val Gly Phe Val Pro Ala Pro Pro Ser
            20                  25                  30
Pro Ala Asp Val Ala Asp Glu Val Asp Ala PheIle Val Asp Asp Ser
        35                  40                  45
Cys Leu Leu Glu Tyr Ile Asp Phe Ser Cys Cys Asp Val Pro Phe Phe
    50                  55                  60
His Ala Asp Asp Gly Asp Ile Leu Pro Asp Leu Glu Val Asp Pro Thr
65                  70                  75                  80
Glu Leu Leu Ala Glu Phe Ala Ser Ser Pro Asp Asp Glu Pro Pro Pro
                85                  90                  95
Thr Thr Ser Ala Pro Gly Pro Gly Glu Pro Ala Ala Ala Ala Gly Ala
            100                 105                 110
Lys Glu Asp Val Lys Glu Asp Gly Ala Ala Ala Ala Ala Ala Ala Ala
        115                 120                 125
Ala Ala Asp Tyr Asp Gly Ser Pro Pro Pro Pro Arg Gly Lys Lys Lys
    130                 135                 140
Lys Asp Asp Glu Glu Arg Ser Ser Ser Leu Pro Glu Glu Lys Asp Ala
145                 150                 155                 160
Lys Asn Gly Gly Gly Asp Glu Val Leu Ser Ala Val Thr Thr Glu Asp
                165                 170                 175
Ser Ser Ala Gly Ala Ala Lys Ser Cys Ser Pro Ser Ala Glu Gly His
            180                 185                 190
Ser Lys Arg Lys Pro Ser Ser Ser Ser Ser Ser Ala Ala Ala Gly Lys
        195                 200                 205
Asn Ser His Gly Lys Arg Lys Val Lys Val Asp Trp Thr Pro Glu Leu
    210                 215                 220
His Arg Arg Phe Val Gln Ala Val Glu Gln Leu Gly Ile Asp Lys Ala
225                 230                 235                 240
Val Pro Ser Arg Ile Leu Glu Leu Met Gly Ile Glu Cys Leu Thr Arg
                245                 250                 255
His Asn Ile Ala Ser His Leu Gln Lys Tyr Arg Ser His Arg Lys His
            260                 265                 270
Leu Met Ala Arg Glu Ala Glu Ala Ala Ser Trp Thr Gln Lys Arg Gln
        275                 280                 285
Met Tyr Thr Ala Ala Ala Ala Ala Ala Ala Val Ala Ala Gly Gly Gly
    290                 295                 300
Pro Arg Lys Asp Ala Ala Ala Ala Thr Ala Ala Val Ala Pro Trp Val
305                 310                 315                 320
Met Pro Thr Ile Gly Phe Pro Pro Pro His Ala Ala Ala Met Val Pro
                325                 330                 335
Pro Pro Pro His Pro Pro Pro Phe Cys Arg Pro Pro Leu His Val Trp
            340                 345                 350
Gly His Pro Thr Ala Gly Val Glu Pro Thr Thr Ala Ala Ala Pro Pro
        355                 360                 365
Pro Pro Ser Pro His Ala Gln Pro Pro Leu Leu Pro Val Trp Pro Arg
    370                 375                 380
His Leu Ala Pro Pro Pro Pro Pro Leu Pro Ala Ala Trp Ala His Gly
385                 390                 395                 400
His Gln Pro Ala Pro Val Asp Pro Ala Ala Tyr Trp Gln Gln Gln Tyr
                405                 410                 415
Asn Leu Gln Arg Phe Pro Val Pro Pro Val Pro Gly Met Val Pro His
            420                 425                 430
Pro Met Tyr Arg Pro Ile Pro Pro Pro Ser Pro Pro Gln Gly Asn Lys
        435                 440                 445
Leu Ala Ala Leu Gln Leu Gln Leu Asp Ala His Pro Ser Lys Glu Ser
    450                 455                 460
Ile Asp Ala Ala Ile Gly Asp Val Leu Val Lys Pro Trp Leu Pro Leu
465                 470                 475                 480
Pro Leu Gly Leu Lys Pro Pro Ser Leu Asp Ser Val Met Ser Glu Leu
                485                 490                 495
His Lys Gln Gly Ile Pro Lys Val Pro Pro Ala Ala Ser Gly Ala Ala
            500                 505                 510
Gly
<210>170
<211>1263
<212>DNA
<213>拟南芥
<400>170
atgttagctc tgtctccggc gacaagagat ggttgcgacg gagcgtcaga gtttcttgat    60
acgtcgtgtg gattcacgat tataaacccg gaggaggagg aggagtttcc ggatttcgct    120
gaccacggtg atcttcttga catcattgac ttcgacgata tattcggtgt ggccggagat    180
gtgcttcctg acttggagat cgaccctgag atcttatccg gggatttctc caatcacatg    240
aacgcttctt caacgattac tacgacgtcg gataagactg atagtcaagg ggagactact    300
aagggtagtt cggggaaagg tgaagaagtc gtaagcaaaa gagacgatgt tgcggcggag    360
acggtgactt atgacggtga cagtgaccgg aaaaggaagt attcctcttc agcttcttcc    420
aagaacaatc ggatcagtaa caacgaaggg aagagaaagg tgaaggtgga ttggacacca    480
gagctacaca ggagattcgt ggaggcagtg gaacagttag gagtggacaa agctgttcct    540
tctcgaattc tggagcttat gggagtccat tgtctcactc gtcacaacgt tgctagtcac    600
ctccaaaaat ataggtctca tcggaaacat ttgctagctc gtgaggccga agcggctaat    660
tggacacgca aaaggcatat ctatggagta gacaccggtg ctaatcttaa tggtcggact    720
aaaaatggat ggcttgcacc ggcacccact ctcgggtttc caccaccacc acccgtggct    780
gttgcaccgc cacctgtcca ccaccatcat tttaggcccc tgcatgtgtg gggacatccc    840
acggttgatc agtccattat gccgcatgtg tggcccaaac acttacctcc gccttctacc    900
gccatgccta atccgccgtt ttgggtctcc gattctccct attggcatcc aatgcataac    960
gggacgactc cgtatttacc gaccgtagct acgagattta gagcaccgcc agttgccgga    1020
atcccgcatg ctctgccgcc gcatcacacg atgtacaaac caaatcttgg atttggtggt    1080
gctcgtcctc cggtagactt acatccgtca aaagagagcg tggatgcagc cataggagat    1140
gtattgacga ggccatggct gccacttccg ttgggattaa atccgccggc tgttgacggt    1200
gttatgacag agcttcaccg tcacggtgtc tctgaggttc ctccgaccgc gtcttgtgcc    1260
tga                                                                  1263
<210>171
<211>420
<212>PRT
<213>拟南芥
<400>171
Met Leu Ala Leu Ser Pro Ala Thr Arg Asp Gly Cys Asp Gly Ala Ser
1               5                   10                  15
Glu Phe Leu Asp Thr Ser Cys Gly Phe Thr Ile Ile Asn Pro Glu Glu
            20                  25                  30
Glu Glu Glu Phe Pro Asp Phe Ala Asp His Gly Asp Leu Leu Asp Ile
        35                  40                  45
Ile Asp Phe Asp Asp Ile Phe Gly Val Ala Gly Asp Val Leu Pro Asp
    50                  55                  60
Leu Glu Ile Asp Pro Glu Ile Leu Ser Gly Asp Phe Ser Asn His Met
65                  70                  75                  80
Asn Ala Ser Ser Thr Ile Thr Thr Thr Ser Asp Lys Thr Asp Ser Gln
                85                  90                  95
Gly Glu Thr Thr Lys Gly Ser Ser Gly Lys Gly Glu Glu Val Val Ser
            100                 105                 110
Lys Arg Asp Asp Val Ala Ala Glu Thr Val Thr Tyr Asp Gly Asp Ser
        115                 120                 125
Asp Arg Lys Arg Lys Tyr Ser Ser Ser Ala Ser Ser Lys Asn Asn Arg
    130                 135                 140
Ile Ser Asn Asn Glu Gly Lys Arg Lys Val Lys Val Asp Trp Thr Pro
145                 150                 155                 160
Glu Leu His Arg Arg Phe Val Glu Ala Val Glu Gln Leu Gly Val Asp
                165                 170                 175
Lys Ala Val Pro Ser Arg Ile Leu Glu Leu Met Gly Val His Cys Leu
            180                 185                 190
Thr Arg His Asn Val Ala Ser His Leu Gln Lys Tyr Arg Ser His Arg
        195                 200                 205
Lys His Leu Leu Ala Arg Glu Ala Glu Ala Ala Asn Trp Thr Arg Lys
    210                 215                 220
Arg His Ile Tyr Gly Val Asp Thr Gly Ala Asn Leu Asn Gly Arg Thr
225                 230                 235                 240
Lys Asn Gly Trp Leu Ala Pro Ala Pro Thr Leu Gly Phe Pro Pro Pro
                245                 250                 255
Pro Pro Val Ala Val Ala Pro Pro Pro Val His His His His Phe Arg
            260                 265                 270
Pro Leu His Val Trp Gly His Pro Thr Val Asp Gln Ser Ile Met Pro
        275                 280                 285
His Val Trp Pro Lys His Leu Pro Pro Pro Ser Thr Ala Met Pro Asn
    290                 295                 300
Pro Pro Phe Trp Val Ser Asp Ser Pro Tyr Trp His Pro Met His Asn
305                 310                 315                 320
Gly Thr Thr Pro Tyr Leu Pro Thr Val Ala Thr Arg Phe Arg Ala Pro
                325                 330                 335
Pro Val Ala Gly Ile Pro His Ala Leu Pro Pro His His Thr Met Tyr
            340                 345                 350
Lys Pro Asn Leu Gly Phe Gly Gly Ala Arg Pro Pro Val Asp Leu His
        355                 360                 365
Pro Ser Lys Glu Ser Val Asp Ala Ala Ile Gly Asp Val Leu Thr Arg
    370                 375                 380
Pro Trp Leu Pro Leu Pro Leu Gly Leu Asn Pro Pro Ala Val Asp Gly
385                 390                 395                 400
Val Met Thr Glu Leu His Arg His Gly Val Ser Glu Val Pro Pro Thr
               405                 410                 415
Ala Ser Cys Ala
            420
<210>172
<211>1403
<212>DNA
<213>拟南芥
<400>172
gtatcattct tgttttctct aaatttttca aaaaaccttt agaattttca tttttttacg    60
attccgatgt taactgtttc tccggctcca gtactcatcg gaaacaactc aaaggatact    120
tacatggcgg cagatttcgc agattttacg acggaagact tgccggactt tacgacggtc  180
ggggattttt ccgatgatct tcttgatgga atcgattact acgacgatct tttcattggt  240
ttcgatggag acgatgtttt gccggatttg gagatagatt cggagattct tggggaatat  300
tccggtagcg gaagagatga ggaacaagaa atggagggta acacttcgac ggcatcggag  360
acatcggaga gagacgttgg tgtgtgtaag caagagggtg gtggtggtgg tgacggtggt  420
tttagggaca aaacggtgcg tcgaggcaaa cgtaaaggga agaaaagtaa agattgttta  480
tccgatgaga acgatattaa gaaaaaacct aaggtggatt ggacgccgga gttacaccgg  540
aaatttgtac aagcggtgga gcaattaggg gtagacaagg cggtgccgtc tcgaatcttg  600
gaaattatga acgttaaatc tctcactcgt cacaacgttg ctagccatct tcagaaatat  660
aggtcacatc ggaaacatct actagcgcgt gaagcagaag ctgccagctg gaatctccgg  720
agacatgcca cggtggcagt gcccggagta ggaggaggag ggaagaagcc gtggacagct  780
cctgccttag gctatcctcc acacgtggca ccaatgcatc atggtcactt caggcctttg  840
cacgtatggg gtcatcctac gtggccaaaa cacaagccta atactccggc gtctgctcat  900
cggacgtatc caatgccggc cattgcggcg gctccggcat cttggccagg tcatccaccg  960
tactggcatc agcaaccact ctatccacag ggatatggta tggcatcatc gaatcattca  1020
agcatcggtg ttcccacaag acaattagga cccactaatc ctcccatcga cattcatccc  1080
tcgaatgaga gcatagatgc agctattggg gacgttatat caaagccgtg gctgccgctt  1140
cctttgggac tgaaaccgcc gtcggttgac ggtgttatga cggagttaca acgtcaagga  1200
gtttctaatg ttcctcctct tccttgagaa agatctccaa aatttgtcga aatctcaaac  1260
ttttaacttc atttttttgg tatcttctat gtatttttgc aagggaaaga cgataaatcc  1320
ttgttgcttg atcatatgta tttctctata tgagtgcatg tatcgaagtt aagcaacttt  1380
aatatatcgt tataatcttc gat                                          1403
<210>173
<211>386
<212>PRT
<213>拟南芥
<400>173
Met Leu Thr Val Ser Pro Ala Pro Val Leu Ile Gly Asn Asn Ser Lys
1               5                   10                  15
Asp Thr Tyr Met Ala Ala Asp Phe Ala Asp Phe Thr Thr Glu Asp Leu
            20                  25                  30
Pro Asp Phe Thr Thr Val Gly Asp Phe Ser Asp Asp Leu Leu Asp Gly
        35                  40                  45
Ile Asp Tyr Tyr Asp Asp Leu Phe Ile Gly Phe Asp Gly Asp Asp Val
    50                  55                  60
Leu Pro Asp Leu Glu Ile Asp Ser Glu Ile Leu Gly Glu Tyr Ser Gly
65                  70                  75                  80
Ser Gly Arg Asp Glu Glu Gln Glu Met Glu Gly Asn Thr Ser Thr Ala
                85                  90                  95
Ser Glu Thr Ser Glu Arg Asp Val Gly Val Cys Lys Gln Glu Gly Gly
            100                 105                 110
Gly Gly Gly Asp Gly Gly Phe Arg Asp Lys Thr Val Arg Arg Gly Lys
        115                 120                 125
Arg Lys Gly Lys Lys Ser Lys Asp Cys Leu Ser Asp Glu Asn Asp Ile
    130                 135                 140
Lys Lys Lys Pro Lys Val Asp Trp Thr Pro Glu Leu His Arg Lys Phe
145                 150                 155                 160
Val Gln Ala Val Glu Gln Leu Gly Val Asp Lys Ala Val Pro Ser Arg
                165                 170                 175
Ile Leu Glu Ile Met Asn Val Lys Ser Leu Thr Arg His Asn Val Ala
            180                 185                 190
Ser His Leu Gln Lys Tyr Arg Ser His Arg Lys His Leu Leu Ala Arg
        195                 200                 205
Glu Ala Glu Ala Ala Ser Trp Asn Leu Arg Arg His Ala Thr Val Ala
    210                 215                 220
Val Pro Gly Val Gly Gly Gly Gly Lys Lys Pro Trp Thr Ala Pro Ala
225                 230                 235                 240
Leu Gly Tyr Pro Pro His Val Ala Pro Met His His Gly His Phe Arg
                245                 250                 255
Pro Leu His Val Trp Gly His Pro Thr Trp Pro Lys His Lys Pro Asn
            260                 265                 270
Thr Pro Ala Ser Ala His Arg Thr Tyr Pro Met Pro Ala Ile Ala Ala
        275                 280                 285
Ala Pro Ala Ser Trp Pro Gly His Pro Pro Tyr Trp His Gln Gln Pro
    290                 295                 300
Leu Tyr Pro Gln Gly Tyr Gly Met Ala Ser Ser Asn His Ser Ser Ile
305                 310                 315                 320
Gly Val Pro Thr Arg Gln Leu Gly Pro Thr Asn Pro Pro Ile Asp Ile
                325                 330                 335
His Pro Ser Asn Glu Ser Ile Asp Ala Ala Ile Gly Asp Val Ile Ser
            340                 345                 350
Lys Pro Trp Leu Pro Leu Pro Leu Gly Leu Lys Pro Pro Ser Val Asp
        355                 360                 365
Gly Val Met Thr Glu Leu Gln Arg Gln Gly Val Ser Asn Val Pro Pro
    370                 375                 380
Leu Pro
385
<210>174
<211>2833
<212>DNA
<213>小立碗藓(Physcomitrella patens)
<400>174
ttctaggagg tcagcttggt ccaagtccga atcgcatcca cgcgatagga tatgtcgatc    60
caaatcacac atttttacac tccccagaag gaggaaaaga agttttcgaa accagtagtg    120
aggaatcata gtttcgtttt ccgaaaccta caaattcatc atactcattt cggtaacaaa    180
tgctacttaa aagacatgtc aggaaaacat ataaagtgac agtgattctg catcaacgtg    240
acagggatcc atcagtggag aatgaataaa aaaaacaatt agagaatggt gagtagaatc    300
ctcagcaaaa ttacgtttta tttattaata ttatacttaa aagtaaaaca ggatgattca    360
tgatgtcatc accgaggttg tggagagatt caaaaagagg atggaggcta cttttatggg    420
gagggtgggt tcactttatg cagtaaagta gtagatctct atttaaaggg gggaaagagg    480
atgtctgctg aaggccagtg cagtggatga acgcaggcgc tcgtctatgt ttcatccatc    540
catccattgt gtcgatttag aggccaccat ggcttctgag ggtgagggga gaggatagat    600
agcatagagg ggggggggtg gagcaggcaa gggcaggagt gagattgtgg tggtggtgtg    660
attaggcgat ggagatatgg cgatggacat ggcgaggata gaagtcgagc ctcttgtcga    720
agtccacaac aacaccaaca acttgcttgt gcattgcgtg ctcgatgctt tgccggattc    780
ttcaccttgc ttgaaatcca gtgagacttc gtttgaagct gtggttgtaa aggaggacga    840
ggagggaggg aggccgctgt ttggcaagcc tgagctccac cctgcctcac cctcgagtga    900
tacagcggct gctgcaaatg gtgaattcgc tagatgcttg aattttgtga cggaggctga    960
ttgtggagat gtaggcgtac aatgttttga ggattttggt acgttgccgg actgtggtga    1020
ggcggggata agcagggaag agggtggagg tagagacggg gagcaggtgg agttgttaga    1080
gtctatgagc ctcgatggta gtaggaattc ggagaattta gagctagggg agctcggcga    1140
attgttgcag gggtcggaga cgctggattc ggttcctggg aacgaggttg gggaggagga    1200
ggcgctgctg ttggcgaaag cggcaaaggc gacgggcgtt gttgtttcgg cctccgatag    1260
tggtgaatgt agcagtgtcg ataggaagga aaatcaacaa agtccgaaat catgtaaaag    1320
tgccgcaccg gggaagaaga aggcgaaggt cgattggacg ccggagcttc atcggcgctt    1380
tgtccacgcg gtggaacagc ttggagtgga gaaagctttt ccctcgcgca tactagaact    1440
gatgggagta caatgtctca cccggcacaa tatcgccagt catttgcaga agtatcgctc    1500
gcatcgtcgc catcttgcag ccagggaagc cgaggcagca tcctggactc atcgtcgagc    1560
gtacacccag atgccctggt ctcgaagttc acggcgcgat ggccttcctt atcttgtacc    1620
cttacacacc cctcacatac aacctcgccc atccatggtc atggcaatgc aaccacagct    1680
tcagacgcag cacaccccgg tgtcgacgcc tcttaaggtg tgggggtatc ctacagtaga    1740
tcattcaagt gtacacatgt ggcagcaacc tgcagtggcg accccatcgt attggcaagc    1800
ccccgatggc tcttactggc agcatcctgc caccaattat gatgcgtatt cagctcgcgc    1860
ttgttatccc catcccatgc gagtttcgtt aggcactacg catgctggct ctccaatgat    1920
ggctccagga tttcctgacg agagctacta cggtgaagat gttcttgcag ctaccatgta    1980
tctttgtaac caatcatatg acagtgaatt aggacgagct gcgggcgtcg ctgcgtgcag    2040
taaaccaccg gagacgcatt tatcgaagga ggttcttgat gcagccatcg gagaagcgct    2100
tgctaaccct tggactcccc cgcccctggg actgaagccg ccgtctatgg agggagtaat    2160
cgcagagctt cagcggcagg gaatcaacac tgtgcctccc tctacctgtt agctttagtt    2220
gtttgctgta gagaatattt cattctacga ttcgcattcc aatgaccgct gaccgctggt    2280
gtcgcttggc tggtgttcat ctcgaggaat caatttggtg aaattttggt tatgtcacgg    2340
taggggggtc tattttctcc agagttcctc cggagaggtg tatgaaagga tcgattttct    2400
ttcttctttt ttttttttct tttttttctt ttttttttct tttttttttc cttcgaataa    2460
ggctgccttg gtggtgtttc ttcttagttt tttaacgagg gataccttat catatctgtc    2520
aagatatgtc actgaacgtt gctgcatgta gacttacgtt tatggtaaca ctttctcaat    2580
gccattaaaa accgaaacca gttcttctga ttgtttcatt ggaagtatcc tgacaacctg    2640
tcagcatctg ttggcatgtg gtttcctcac ccacaccctt ctttcagttg gttttgaatc    2700
tgcatctact gactgttaag gttttacgtg tatcaagtgt  acgatttttc cacaagataa   2760
tttctcaaca actctgcttt cgaagcacct ttcttctcca ccaatcaaga gtggtgggaa    2820
gatggaccaa ggt                                                       2833
<210>175
<211>511
<212>PRT
<213>小立碗藓
<400>175
Met Ala Met Asp Met Ala Arg Ile Glu Val Glu Pro Leu Val Glu Val
1               5                   10                  15
His Asn Asn Thr Asn Asn Leu Leu Val His Cys Val Leu Asp Ala Leu
            20                 25                 30
Pro Asp Ser Ser Pro Cys Leu Lys Ser Ser Glu Thr Ser Phe Glu Ala
        35                 40                 45
Val Val Val Lys Glu Asp Glu Glu Gly Gly Arg Pro Leu Phe Gly Lys
    50                 55                 60
Pro Glu Leu His Pro Ala Ser Pro Ser Ser Asp Thr Ala Ala Ala Ala
65                 70                 75                 80
Asn Gly Glu Phe Ala Arg Cys Leu Asn Phe Val Thr Glu Ala Asp Cys
                85                 90                 95
Gly Asp Val Gly Val Gln Cys Phe Glu Asp Phe Gly Thr Leu Pro Asp
            100                 105                 110
Cys Gly Glu Ala Gly Ile Ser Arg Glu Glu Gly Gly Gly Arg Asp Gly
        115                 120                 125
Glu Gln Val Glu Leu Leu Glu Ser Met Ser Leu Asp Gly Ser Arg Asn
    130                 135                 140
Ser Glu Asn Leu Glu Leu Gly Glu Leu Gly Glu Leu Leu Gln Gly Ser
145                 150                 155                 160
Glu Thr Leu Asp Ser Val Pro Gly Asn Glu Val Gly Glu Glu Glu Ala
                165                 170                 175
Leu Leu Leu Ala Lys Ala Ala Lys Ala Thr Gly Val Val Val Ser Ala
            180                 185                 190
Ser Asp Ser Gly Glu Cys Ser Ser Val Asp Arg Lys Glu Asn Gln Gln
        195                 200                 205
Ser Pro Lys Ser Cys Lys Ser Ala Ala Pro Gly Lys Lys Lys Ala Lys
    210                 215                 220
Val Asp Trp Thr Pro Glu Leu His Arg Arg Phe Val His Ala Val Glu
225                 230                 235                 240
Gln Leu Gly Val Glu Lys Ala Phe Pro Ser Arg Ile Leu Glu Leu Met
                245                 250                 255
Gly Val Gln Cys Leu Thr Arg His Asn Ile Ala Ser His Leu Gln Lys
            260                 265                 270
Tyr Arg Ser His Arg Arg His Leu Ala Ala Arg Glu Ala Glu Ala Ala
        275                 280                 285
Ser Trp Thr His Arg Arg Ala Tyr Thr Gln Met Pro Trp Ser Arg Ser
    290                 295                 300
Ser Arg Arg Asp Gly Leu Pro Tyr Leu Val Pro Leu His Thr Pro His
305                 310                 315                 320
Ile Gln Pro Arg Pro Ser Met Val Met Ala Met Gln Pro Gln Leu Gln
                325                 330                 335
Thr Gln His Thr Pro Val Ser Thr Pro Leu Lys Val Trp Gly Tyr Pro
            340                 345                 350
Thr Val Asp His Ser Ser Val His Met Trp Gln Gln Pro Ala Val Ala
        355                 360                 365
Thr Pro Ser Tyr Trp Gln Ala Pro Asp Gly Ser Tyr Trp Gln His Pro
    370                 375                 380
Ala Thr Asn Tyr Asp Ala Tyr Ser Ala Arg Ala Cys Tyr Pro His Pro
385                 390                 395                 400
Met Arg Val Ser Leu Gly Thr Thr His Ala Gly Ser Pro Met Met Ala
                405                 410                 415
Pro Gly Phe Pro Asp Glu Ser Tyr Tyr Gly Glu Asp Val Leu Ala Ala
            420                 425                 430
Thr Met Tyr Leu Cys Asn Gln Ser Tyr Asp Ser Glu Leu Gly Arg Ala
        435                 440                 445
Ala Gly Val Ala Ala Cys Ser Lys Pro Pro Glu Thr His Leu Ser Lys
    450                 455                 460
Glu Val Leu Asp Ala Ala Ile Gly Glu Ala Leu Ala Asn Pro Trp Thr
465                 470                 475                 480
Pro Pro Pro Leu Gly Leu Lys Pro Pro Ser Met Glu Gly Val Ile Ala
                485                 490                 495
Glu Leu Gln Arg Gln Gly IIe Asn Thr Val Pro Pro Ser Thr Cys
            500                 505                 510
<210>176
<211>2270
<212>DNA
<213>小立碗藓
<400>176
ggtggtggtg gtagaaggcg atggagatat ggcgatggac atggcgagga tagatgaatc    60
aaccgccgtc gaggtcaact cgctttcgct tgtgcattgc gtgttggatg ggttgcccga    120
ttcgccttgc ttgaaatcca gcccgacgtc attcgaggag gctgtggcgg aagggaggtc    180
ggtgttcggg gacgaggagg acatcatcaa caacagcaac gaccaggaca actcgtcctc    240
gtgcggtgca gtggtcacca cccacgaaga tttcgccgag tgcttgaatt ttgtgacgga    300
ggcggagtgt ggagatgtgg gtgtgcggtg tttcgaggat tttgacaagc tgccggactg    360
cggcgacgag ggggagacta gcaaagcgga ggaggagggg tgtgtacgaa taggcggagg    420
aggggagcag ggcgagctgt tagagtctgt gagccttgac tgtagtagga attcggagaa    480
tttagagctt cgggatctcg gggaattgtg ggaagggtcg gaacggcctg actcagtgcc    540
agggaacgag gtgggtgagg aggaggcgtt gctgttggcg gaggcggcca aggcgacggg    600
cgatgtcgtg tcggcctcgg atagtggaga atgtagcagt gtcgatagga aggacaatca    660
agccagtccg aaatccagta aaaatgcagc gccggggaag aagaaggcca aggtggactg    720
gacgcctgag cttcaccggc gcttcgtcca tgcagtggag cagctgggtg tggagaaagc    780
ctatccatcg cgtatcctag aactgatggg cgtgcaatgc ttgactcggc acaacatcgc    840
cagtcacttg cagaagtacc ggtcccaccg tcgccacctc gcagctcgag aagcagaggc    900
cgcgtcctgg acgcatcgtc gcacatacac tcaggctccc tggcctcgta gctcacggcg    960
cgatggcctc ccttatcttg tacctataca cacccctcac atacaacctc ggccttccat    1020
ggccatggca atgcaaccgc agcttcagac gccgcatcat ccgatatcca ctcctctcaa    1080
ggtctggggc taccccacag tagatcattc aaatgtacat atgtggcagc aacctgctgt    1140
ggcgacccca tcttactggc aagctgccga tggctcatac tggcaacatc ccgcgaccgg    1200
ttacgacgct ttctcagctc gtgcctgcta ctcgcatccc atgcagcgag ttcctgtaac    1260
gaccacgcat gcgggtttac caattgtggc gccaggattt cctgacgaga gctgctacta    1320
cggcgacgac atgcttgcag gctccatgta tctatgtaac caatcatatg atagtgaaat    1380
aggacgagct gcgggtgttg ctgcgtgcag caagccgata gagacgcatt tgtccaaaga    1440
ggtgttggat gcggccattg gcgaagctct cgccaatccc tggactcccc cacctctggg    1500
tctgaagcca ccatccatgg agggcgtcat tgcagagctt cagcggcagg ggatcaacac    1560
tgtgcctcct tcaacttgtt agctctcgac gatgtttttt tcttcctctt cctcttcctc    1620
ttcttctaga gagcaatttt tctttctacg actcatattc caatgaccgc tgaccgctgg    1680
tgtcgctggt gtcgctggtg ttcatcccga ggaactaatt tggtgaaaat tcggttaagt    1740
tgcgatagag gtctgatctc cggaaggttt attttttgtc ttctggagag gttgtataag    1800
aggttcccct gttttgcaat aaggcttcct tgatgagatt ttcctttatt tttcccctga    1860
ttctttctcc ttccatttta gtttcacaag aaggcatctt ctggccatgg cggtcacgat    1920
gtgtcacttt gatgctgcat gtggaccttt tttcttatat ctgtagtagc actcctccat    1980
ttcatgagga ataaagatca aacatcacac atcatcactc gaattcttca tctcctcctc    2040
ctcccttttc cactaggatg ccttctattg cattggttgt catgtgactc agtctttctc    2100
ttacacgcac tttaactcgc tggatgtctc actttctgac tgttcaaggt gaggtctgat    2160
aggttcgaga cgggattgct tgcgatgact caccatctcc taatttggaa ccaacattcc    2220
tcctcaacct atcaactctc actcaaactt gcattgtgtg agcattggtc               2270
<210>177
<211>517
<212>PRT
<213>小立碗藓
<400>177
Met Ala Met Asp Met Ala ArgIle Asp Glu Ser Thr Ala Val Glu Val
1               5                  10                  15
Asn Ser Leu Ser Leu Val His Cys Val Leu Asp Gly Leu Pro Asp Ser
            20                  25                  30
Pro Cys Leu Lys Ser Ser Pro Thr Ser Phe Glu Glu Ala Val Ala Glu
        35                  40                  45
Gly Arg Ser Val Phe Gly Asp Glu Glu Asp Ile Ile Asn Asn Ser Asn
    50                  55                  60
Asp Gln Asp Asn Ser Ser Ser Cys Gly Ala Val Val Thr Thr His Glu
65                  70                  75                  80
Asp Phe Ala Glu Cys Leu Asn Phe Val Thr Glu Ala Glu Cys Gly Asp
                85                  90                  95
Val Gly Val Arg Cys Phe Glu Asp Phe Asp Lys Leu Pro Asp Cys Gly
            100                 105                 110
Asp Glu Gly Glu Thr Ser Lys Ala Glu Glu Glu Gly Cys Val Arg Ile
        115                 120                 125
Gly Gly Gly Gly Glu Gln Gly Glu Leu Leu Glu Ser Val Ser Leu Asp
    130                 135                 140
Cys Ser Arg Asn Ser Glu Asn Leu Glu Leu Arg Asp Leu Gly Glu Leu
145                 150                 155                 160
Trp Glu Gly Ser Glu Arg Pro Asp Ser Val Pro Gly Asn Glu Val Gly
                165                 170                 175
Glu Glu Glu Ala Leu Leu Leu Ala Glu Ala Ala Lys Ala Thr Gly Asp
            180                 185                 190
Val Val Ser Ala Ser Asp Ser Gly Glu Cys Ser Ser Val Asp Arg Lys
        195                 200                 205
Asp Asn Gln Ala Ser Pro Lys Ser Ser Lys Asn Ala Ala Pro Gly Lys
    210                 215                 220
Lys Lys Ala Lys Val Asp Trp Thr Pro Glu Leu His Arg Arg Phe Val
225                 230                 235                 240
His Ala Val Glu Gln Leu Gly Val Glu Lys Ala Tyr Pro Ser Arg Ile
                245                 250                 255
Leu Glu Leu Met Gly Val Gln Cys Leu Thr Arg His Asn Ile Ala Ser
            260                 265                 270
His Leu Gln Lys Tyr Arg Ser His Arg Arg His Leu Ala Ala Arg Glu
        275                 280                 285
Ala Glu Ala Ala Ser Trp Thr His Arg Arg Thr Tyr Thr Gln Ala Pro
    290                 295                 300
Trp Pro Arg Ser Ser Arg Arg Asp Gly Leu Pro Tyr Leu Val Pro Ile
305                 310                 315                 320
His Thr Pro His Ile Gln Pro Arg Pro Ser Met Ala Met Ala Met Gln
                325                 330                 335
Pro Gln Leu Gln Thr Pro His His Pro Ile Ser Thr Pro Leu Lys Val
            340                 345                 350
Trp Gly Tyr Pro Thr Val Asp His Ser Asn Val His Met Trp Gln Gln
        355                 360                 365
Pro Ala Val Ala Thr Pro Ser Tyr Trp Gln Ala Ala Asp Gly Ser Tyr
    370                 375                 380
Trp Gln His Pro Ala Thr Gly Tyr Asp Ala Phe Ser Ala Arg Ala Cys
385                 390                 395                 400
Tyr Ser His Pro Met Gln Arg Val Pro Val Thr Thr Thr His Ala Gly
                405                 410                 415
Leu Pro Ile Val Ala Pro Gly Phe Pro Asp Glu Ser Cys Tyr Tyr Gly
            420                 425                 430
Asp Asp Met Leu Ala Gly Ser Met Tyr Leu Cys Asn Gln Ser Tyr Asp
        435                 440                 445
Ser Glu Ile Gly Arg Ala Ala Gly Val Ala Ala Cys Ser Lys Pro Ile
    450                 455                 460
Glu Thr His Leu Ser Lys Glu Val Leu Asp Ala Ala Ile Gly Glu Ala
465                 470                 475                 480
Leu Ala Asn Pro Trp Thr Pro Pro Pro Leu Gly Leu Lys Pro Pro Ser
                485                 490                 495
Met Glu Gly Val Ile Ala Glu Leu Gln Arg Gln Gly Ile Asn Thr Val
            500                 505                 510
Pro Pro Ser Thr Cys
        515
<210>178
<211>1843
<212>DNA
<213>玉蜀黍
<400>178
aaacagcgaa acagtgcaga gacaagctac aacaacctac cctaacaggc cattccttcc  60
actgcacttc attcgatcct gagctatagc tggctgcctg agctcgctcc aagaagtgta  120
tctatagtat agacactagg cttcgtgtgg cgtgctcgag atatgcttgc agtgtcgccg  180
tcgccggtgc ggtgtgccga tgcggaggag tgcggcggag gaggcgccag caaggaaatg  240
gaggagaccg ccgtcgggcc tgtgtccgac tcggacctgg atttcgactt cacggtcgac  300
gacatagact tcggggactt cttcctcagg ctagacgacg gggatgacgc gctgccgggc  360
ctcgaggtcg accctgccga gatcgtcttc gctgacttcg aggcaatcgc caccgccggc  420
ggcgatggcg gcgtcacgga ccaggaggtg cccagtgtcc tgccctttgc ggacgcggcg  480
cacataggcg ccgtggatcc gtgttgtggt gtccttggcg aggacaacga cgcagcgtgc  540
gcagacgtgg aagaagggaa aggggagtgc gaccatgccg acgaggtagc agccgccggt  600
aataataata gcgactccgg tgaggccggc tgtggaggag cctttgccgg cgaaaaatca  660
ccgtcgtcga cggcatcgtc gtcgcaggag gctgagagcc ggcgcaaggt gtccaagaag  720
cactcccaag ggaagaagaa agcaaaggtg gattggacgc cggagcttca ccggagattc  780
gttcaggcgg tggaggagct gggcatcgac aaggcggtgc cgtccaggat cctcgagatc  840
atggggatcg actccctcac gcggcataac atagccagcc atctgcagaa gtaccgttcc  900
cacaggaagc acatgcttgc gagggaggtg gaggcagcga cgtggacgac gcaccggcgg  960
ccgatgtacg ctgcccccag cggcgccgtg aagaggcccg actctaacgc gtggaccgtg  1020
ccgaccatcg gtttccctcc gccggcgggg acccctcctc gtccggtgca gcacttcggg  1080
aggccactgc acgtctgggg ccatccgagt ccgacgccag cggtggagtc accccgggtg  1140
ccaatgtggc ctcggcatct cgccccccgc gccccgccgc cgccgccgtg ggctccgcca  1200
ccgccagctg acccggcgtc gttctggcac catgcttaca tgagggggcc tgctgcccat  1260
atgccagacc aggtggcggt gactccatgc gtggcagtgc caatggcagc agcgcgtttc  1320
cctgctccac acgtgagggg ttctttgcca tggccacctc cgatgtacag acctctcgtt  1380
cctccagcac tcgcaggcaa gagccagcaa gacgcgctgt ttcagctaca gatacagcca  1440
tcaagcgaga gcatagatgc agcaataggt gatgtcttaa cgaagccgtg gctgccgctg  1500
cccctcggac tgaagccccc ttcggtagac agtgtcatgg gcgagctgca gaggcaaggc  1560
gtagcgaatg tgccgcaagc ttgtggatga tccccggggc tgcatagctg ctagctcgtc  1620
cctgcacgca gtgcaacaaa aggaatttgt cgacatgcct tttatgtttt gaattcccgt  1680
gaaccgttta tggagcactc tcaactcgtt cagggtcaga tgaacagaac attataggag  1740
tacattcttt gaggtttcag gtttgaggga aatcaacctg agtgcatcca agtacagtgt  1800
actgccacag tgccacgtcg gaaaatgaag tcttgacccg aat                    1843
<210>179
<211>475
<212>PRT
<213>玉蜀黍
<400>179
Met Leu Ala Val Ser Pro Ser Pro Val Arg Cys Ala Asp Ala Glu Glu
1               5                   10                  15
Cys Gly Gly Gly Gly Ala Ser Lys Glu Met Glu Glu Thr Ala Val Gly
            20                  25                  30
Pro Val Ser Asp Ser Asp Leu Asp Phe Asp Phe Thr Val Asp Asp Ile
        35                  40                  45
Asp Phe Gly Asp Phe Phe Leu Arg Leu Asp Asp Gly Asp Asp Ala Leu
    50                  55                  60
Pro Gly Leu Glu Val Asp Pro Ala Glu Ile Val Phe Ala Asp Phe Glu
65                  70                  75                  80
Ala Ile Ala Thr Ala Gly Gly Asp Gly Gly Val Thr Asp Gln Glu Val
                85                  90                  95
Pro Ser Val Leu Pro Phe Ala Asp Ala Ala His Ile Gly Ala Val Asp
            100                 105                 110
Pro Cys Cys Gly Val Leu Gly Glu Asp Asn Asp Ala Ala Cys Ala Asp
        115                 120                 125
Val Glu Glu Gly Lys Gly Glu Cys Asp His Ala Asp Glu Val Ala Ala
    130                 135                 140
Ala Gly Asn Asn Asn Ser Asp Ser Gly Glu Ala Gly Cys Gly Gly Ala
145                 150                 155                 160
Phe Ala Gly Glu Lys Ser Pro Ser Ser Thr Ala Ser Ser Ser Gln Glu
                165                 170                 175
Ala Glu Ser Arg Arg Lys Val Ser Lys Lys His Ser Gln Gly Lys Lys
            180                 185                 190
Lys Ala Lys Val Asp Trp Thr Pro Glu Leu His Arg Arg Phe Val Gln
        195                 200                 205
Ala Val Glu Glu Leu Gly Ile Asp Lys Ala Val Pro Ser Arg Ile Leu
    210                 215                 220
Glu Ile Met Gly Ile Asp Ser Leu Thr Arg His Asn Ile Ala Ser His
225                 230                 235                 240
Leu Gln Lys Tyr Arg Ser His Arg Lys His Met Leu Ala Arg Glu Val
                245                 250                 255
Glu Ala Ala Thr Trp Thr Thr His Arg Arg Pro Met Tyr Ala Ala Pro
            260                 265                 270
Ser Gly Ala Val Lys Arg Pro Asp Ser Asn Ala Trp Thr Val Pro Thr
        275                 280                 285
Ile Gly Phe Pro Pro Pro Ala Gly Thr Pro Pro Arg Pro Val Gln His
    290                 295                 300
Phe Gly Arg Pro Leu His Val Trp Gly His Pro Ser Pro Thr Pro Ala
305                 310                 315                 320
Val Glu Ser Pro Arg Val Pro Met Trp Pro Arg His Leu Ala Pro Arg
                325                 330                 335
Ala Pro Pro Pro Pro Pro Trp Ala Pro Pro Pro Pro Ala Asp Pro Ala
            340                 345                 350
Ser Phe Trp His His Ala Tyr Met Arg Gly Pro Ala Ala His Met Pro
        355                 360                 365
Asp Gln Val Ala Val Thr Pro Cys Val Ala Val Pro Met Ala Ala Ala
    370                 375                 380
Arg Phe Pro Ala Pro His Val Arg Gly Ser Leu Pro Trp Pro Pro Pro
385                 390                 395                 400
Met Tyr Arg Pro Leu Val Pro Pro Ala Leu Ala Gly Lys Ser Gln Gln
                405                 410                 415
Asp Ala Leu Phe Gln Leu Gln Ile Gln Pro Ser Ser Glu Ser Ile Asp
            420                 425                 430
Ala Ala Ile Gly Asp Val Leu Thr Lys Pro Trp Leu Pro Leu Pro Leu
        435                 440                 445
Gly Leu Lys Pro Pro Ser Val Asp Ser Val Met Gly Glu Leu Gln Arg
    450                 455                 460
Gln Gly Val Ala Asn Val Pro Gln Ala Cys Gly
465                 470                 475
<210>180
<211>2192
<212>DNA
<213>玉蜀黍
<400>180
ctcatcttct cttcttcttc ccccagtcct cccccccttt cccctcttcg gcctctctcg    60
ctcagctcac tcttcattaa gcgagctcac gtcgttcctc ccttcttctt cttcttatcc    120
gttgttcaat tcgttcagct agccggccag agatcgagca tcatctccat catcgattca    180
tccatctcat ctttctcttc ttctattcta tgtcgtcgtc gtcccagatt agatcgaagc    240
tgctagcagt ctatccagtc tctagctagc tagctagatc aagcccgcag actatacaat    300
ataatacaag ctagctacgt gcttattatt gctttattag tctagaataa tcttgatata    360
tacgatcgaa catatatctc gatctccacc gatacacacc cggccctatc catgcttgag    420
gtgtcgacgc tgcgcggccc tactagcagc ggcagcaagg cggagcagca ctgcggcggc    480
ggcggcggct tcgtcggcga ccaccatgtg gtgttcccga cgtccggcga ctgcttcgcc    540
atggtggacg acaacctcct ggactacatc gacttcagct gcgacgtgcc cttcttcgac    600
gctgacgggg acatcctccc cgacctggag gtagacacca cggagctcct cgccgagttc    660
tcgtccaccc ctcctgcgga cgacctgctg gcagtggcag tattcggcgc cgacgaccag    720
ccggcggcgg cagtagcaca agagaagccg tcgtcgtcgt tggagcaaac atgtggtgac    780
gacaaaggtg tagcagtagc cgccgccaga agaaagctgc agacgacgac gacgacgacg    840
acgacggagg aggaggattc ttctcctgcc gggtccgggg ccaacaagtc gtcggcgtcg    900
gcagagggcc acagcagcaa gaagaagtcg gcgggcaaga actccaacgg cggcaagcgc    960
aaggtgaagg tggactggac gccggagctg caccggcggt tcgtgcaggc ggtggagcag    1020
ctgggcatcg acaaggccgt gccgtccagg atcctggaga tcatgggcac ggactgcctc    1080
acaaggcaca acattgccag ccacctccag aagtaccggt cgcacagaaa gcacctgatg    1140
gcgcgggagg cggaggccgc cacctgggcg cagaagcgcc acatgtacgc gccgccagct    1200
ccaaggacga cgacgacgac ggacgccgcc aggccgccgt gggtggtgcc gacgaccatc    1260
gggttcccgc cgccgcgctt ctgccgcccg ctgcacgtgt ggggccaccc gccgccgcac    1320
gccgccgcgg ctgaagcagc agcggcgact cccatgctgc ccgtgtggcc gcgtcacctg    1380
gcgccgcccc ggcacctggc gccgtgggcg cacccgacgc cggtggaccc ggcgttctgg    1440
caccagcagt acagcgctgc caggaaatgg ggcccacagg cagccgccgt gacgcaaggg    1500
acgccatgcg tgccgctgcc gaggtttccg gtgcctcacc ccatctacag cagaccggcg    1560
atggtacctc cgccgccaag caccaccaag ctagctcaac tgcatctgga gctccaagcg    1620
cacccgtcca aggagagcat cgacgcagcc atcggagatg ttttagtgaa gccatggctg    1680
ccgcttccac tggggctcaa gccgccgtcg ctcgacagcg tcatgtcgga gctgcacaag    1740
caaggcgtac caaaaatccc accggcggct gccaccacca ccggcgccac cggatgacat    1800
actatctcgt cgacaataca tgcatgtaca atagacggat gtctagtagt atagtagatt    1860
gctgctagct agctagccgc tagagtgtag tagcatatgc atgccttttt tttcttcttc    1920
tttttttgcc cttattatta agctggctaa tagcgattga gatggagctt gacacagatc    1980
tgctagctag ctatttgagg gtttctcttg tatgctacct attgctgctg cttgctgctg    2040
agacaagtaa tgtacgtacg cctgtgcaaa cgacacatcg gattgtattg tattactagt    2100
tatatgaaca acaacaataa taataggcac atgcatgcct gcctagtatg tgagctgcta    2160
gctagctaca tgcatgttgc gcattccttt cc                                  2192
<210>181
<211>461
<212>PRT
<213>玉蜀黍
<400>181
Met Leu Glu Val Ser Thr Leu Arg Gly Pro Thr Ser Ser Gly Ser Lys
1               5                   10                  15
Ala Glu Gln His Cys Gly Gly Gly Gly Gly Phe Val Gly Asp His His
            20                  25                  30
Val Val Phe Pro Thr Ser Gly Asp Cys Phe Ala Met Val Asp Asp Asn
        35                  40                  45
Leu Leu Asp Tyr Ile Asp Phe Ser Cys Asp Val Pro Phe Phe Asp Ala
    50                  55                  60
Asp Gly Asp Ile Leu Pro Asp Leu Glu Val Asp Thr Thr Glu Leu Leu
65                  70                  75                  80
Ala Glu Phe Ser Ser Thr Pro Pro Ala Asp Asp Leu Leu Ala Val Ala
                85                  90                  95
Val Phe Gly Ala Asp Asp Gln Pro Ala Ala Ala Val Ala Gln Glu Lys
            100                 105                 110
Pro Ser Ser Ser Leu Glu Gln Thr Cys Gly Asp Asp Lys Gly Val Ala
        115                 120                 125
Val Ala Ala Ala Arg Arg Lys Leu Gln Thr Thr Thr Thr Thr Thr Thr
    130                 135                 140
Thr Glu Glu Glu Asp Ser Ser Pro Ala Gly Ser Gly Ala Asn Lys Ser
145                 150                 155                 160
Ser Ala Ser Ala Glu Gly His Ser Ser Lys Lys Lys Ser Ala Gly Lys
                165                 170                 175
Asn Ser Asn Gly Gly Lys Arg Lys Val Lys Val Asp Trp Thr Pro Glu
            180                 185                 190
Leu His Arg Arg Phe Val Gln Ala Val Glu Gln Leu Gly Ile Asp Lys
        195                 200                 205
Ala Val Pro Ser Arg Ile Leu Glu Ile Met Gly Thr Asp Cys Leu Thr
    210                 215                 220
Arg His Asn Ile Ala Ser His Leu Gln Lys Tyr Arg Ser His Arg Lys
225                 230                 235                 240
His Leu Met Ala Arg Glu Ala Glu Ala Ala Thr Trp Ala Gln Lys Arg
                245                 250                 255
His Met Tyr Ala Pro Pro Ala Pro Arg Thr Thr Thr Thr Thr Asp Ala
            260                 265                 270
Ala Arg Pro Pro Trp Val Val Pro Thr Thr Ile Gly Phe Pro Pro Pro
        275                 280                 285
Arg Phe Cys Arg Pro Leu His Val Trp Gly His Pro Pro Pro His Ala
    290                 295                 300
Ala Ala Ala Glu Ala Ala Ala Ala Thr Pro Met Leu Pro Val Trp Pro
305                 310                 315                 320
Arg His Leu Ala Pro Pro Arg His Leu Ala Pro Trp Ala His Pro Thr
                325                 330                 335
Pro Val Asp Pro Ala Phe Trp His Gln Gln Tyr Ser Ala Ala Arg Lys
            340                 345                 350
Trp Gly Pro Gln Ala Ala Ala Val Thr Gln Gly Thr Pro Cys Val Pro
        355                 360                 365
Leu Pro Arg Phe Pro Val Pro His Pro Ile Tyr Ser Arg Pro Ala Met
    370                 375                 380
Val Pro Pro Pro Pro Ser Thr Thr Lys Leu Ala Gln Leu His Leu Glu
385                 390                 395                 400
Leu Gln Ala His Pro Ser Lys Glu Ser Ile Asp Ala Ala Ile Gly Asp
                405                 410                 415
Val Leu Val Lys Pro Trp Leu Pro Leu Pro Leu Gly Leu Lys Pro Pro
            420                 425                 430
Ser Leu Asp Ser Val Met Ser Glu Leu His Lys Gln Gly Val Pro Lys
        435                 440                 445
Ile Pro Pro Ala Ala Ala Thr Thr Thr Gly Ala Thr Gly
    450                 455                 460
<210>182
<211>1221
<212>DNA
<213>普通小麦
<400>182
gaattgggca cgaggaccgc cccattgtgc cggacgcata atcgccgtcg tcgacaacgt  60
cgtcgtccac ggaggccgag agccgccaca agtcatcaag caagaactcc cacggaaaga  120
agaaagccaa ggtggactgg acgccggagc tgcaccggag gttcgtgcag gccgtagagc  180
agctcggcat cgacaaggca gtgccgtcta ggattttgga gatcatgggg atcaactcac  240
tcactcggca caacatagca agccatttgc agaagtaccg gtctcaccgg aagcacatga  300
ttgcgcggga ggcggaggcg gcgagctgga cccaacgacg acagatgtac gccgccggcg  360
ggccggccgc ggccgtgaag aggcaggact cgaacatgtg gaccgtgcca accatcggct  420
tcgcgccggc gcaccctcct cctcctcctc cccctccttc accggcagcc atgcagcact  480
acgctcggcc gttgcacgtc tggggtcacc ctacgatgga ctcgccccgg atgccgatgt  540
ggccgaggca cacaatatcc cgcgccccga tgccggcgtg ggctcccccg ccgccgccgc  600
cgtctgaccc ggctttctgg caccaccctt acatgagggg gcccgcagcg tatatgccga  660
cccatgggac tccttgcatg gcaatgccga tgacaccgaa atttcctgct gcacccgtgc  720
ccgtggccat gccgtgccca gtctatgcgt ccccctcccc ggcaccagcg ctggcgagca  780
agagccaaca agattcgcag ctccagctcc aagcacaacc atcaaatgag agcatagacg  840
cggccattgg tgacgtttta tccaaaccgt ggctgccgct gccgctgggg ctgaagcccc  900
cttcgttggg cagcgtcatg ggcgagcttg aaaggcaagg cgtggccaat gtgccccaag  960
cctgcgggtg agcgttggag ggtgcatccg cgtgcactcc atgcatgact gctgctccgt  1020
tcgatggagc agctagcagc aacaacaaca tcgtcgacat gtctttgttc ctttgaacgt  1080
tttgtggatc tctctctctc tctcttggtc aacttgtgca taatttcgat caagagaaac  1140
atcgttattt tgagttcact cccgagacac atttttgtta cacctaaact ttaagtttgc  1200
ggtaacagca gcatcaacaa c                                            1221
<210>183
<211>248
<212>PRT
<213>普通小麦
<400>183
Met Gly Ile Asn Ser Leu Thr Arg His Asn Ile Ala Ser His Leu Gln
1               5                   10                  15
Lys Tyr Arg Ser His Arg Lys His Met Ile Ala Arg Glu Ala Glu Ala
            20                  25                  30
Ala Ser Trp Thr Gln Arg Arg Gln Met Tyr Ala Ala Gly Gly Pro Ala
        35                  40                  45
Ala Ala Val Lys Arg Gln Asp Ser Asn Met Trp Thr Val Pro Thr Ile
    50                  55                  60
Gly Phe Ala Pro Ala His Pro Pro Pro Pro Pro Pro Pro Pro Ser Pro
65                  70                  75                  80
Ala Ala Met Gln His Tyr Ala Arg Pro Leu His Val Trp Gly His Pro
                85                  90                  95
Thr Met Asp Ser Pro Arg Met Pro Met Trp Pro Arg His Thr Ile Ser
            100                 105                 110
Arg Ala Pro Met Pro Ala Trp Ala Pro Pro Pro Pro Pro Pro Ser Asp
        115                 120                 125
Pro Ala Phe Trp His His Pro Tyr Met Arg Gly Pro Ala Ala Tyr Met
    130                 135                 140
Pro Thr His Gly Thr Pro Cys Met Ala Met Pro Met Thr Pro Lys Phe
145                 150                 155                 160
Pro Ala Ala Pro Val Pro Val Ala Met Pro Cys Pro Val Tyr Ala Ser
                165                 170                 175
Pro Ser Pro Ala Pro Ala Leu Ala Ser Lys Ser Gln Gln Asp Ser Gln
            180                 185                 190
Leu Gln Leu Gln Ala Gln Pro Ser Asn Glu Ser Ile Asp Ala Ala Ile
        195                 200                 205
Gly Asp Val Leu Ser Lys Pro Trp Leu Pro Leu Pro Leu Gly Leu Lys
    210                 215                 220
Pro Pro Ser Leu Gly Ser Val Met Gly Glu Leu Glu Arg Gln Gly Val
225                 230                 235                 240
Ala Asn Val Pro Gln Ala Cys Gly
                245
<210>184
<211>839
<212>DNA
<213>洋葱(Allium cepa)
<400>184
tgcaaatatt gttcaacgta tataaagaca atttagtatg ctaacaatct ctccccttga  60
aagttctaat ccagatgcaa aagacgaggg agattttgta ctagaagaca tcagctttga  120
tgacttgttc gtaggattcg atgaacttcc cgaccttgaa attgaccctt gtgatatatt  180
tgctgatttt tctttcaata gtagcgagga gggagatgga aataacaagg gttcaacatc  240
ggaagaaaat gatgtacagc ataaaagaga cggatactat aaggagcact caggtaaaga  300
agagacggag gttgtgagtg caagaacaag ggaggatgaa aagaagccgc cttcatctaa  360
atcagagaat gttaaaagcc taaagtcatc aggcaaaaag tcatctcagt ctaaaaagaa  420
agctaaggtg gactggactc cggagcttca tcggagattt gttcaggcag tggagcaact  480
tggggtagac aaagcagtac catccaggat tttagagctc atgggaattg attgtctcac  540
aagacataat attgcaagcc atttacagaa atatcggtcg cacagaaagc atttgctagc  600
aagagaagca gaagcagcaa gctggagtca cagacgtcag ttgtacgtga gcagcactaa  660
caatggaaag aggaggagga aaaacaatga acatgaaacc tagttgggcc ccacagtcac  720
agcccattgg tggatttcct cccaacaatg catcatccct caacatcaga acttcagaac  780
ctttgcacgt ctggggccca tccacaggca gtggagcatc ctcagctagt tccagtctg   839
<210>185
<211>221
<212>PRT
<213>洋葱
<400>185
Met Leu Thr Ile Ser Pro Leu Glu Ser Ser Asn Pro Asp Ala Lys Asp
1               5                   10                  15
Glu Gly Asp Phe Val Leu Glu Asp Ile Ser Phe Asp Asp Leu Phe Val
            20                  25                  30
Gly Phe Asp Glu Leu Pro Asp Leu Glu Ile Asp Pro Cys Asp Ile Phe
        35                  40                  45
Ala Asp Phe Ser Phe Asn Ser Ser Glu Glu Gly Asp Gly Asn Asn Lys
    50                  55                  60
Gly Ser Thr Ser Glu Glu Asn Asp Val Gln His Lys Arg Asp Gly Tyr
65                  70                  75                  80
Tyr Lys Glu His Ser Gly Lys Glu Glu Thr Glu Val Val Ser Ala Arg
                85                  90                  95
Thr Arg Glu Asp Glu Lys Lys Pro Pro Ser Ser Lys Ser Glu Asn Val
            100                 105                 110
Lys Ser Leu Lys Ser Ser Gly Lys Lys Ser Ser Gln Ser Lys Lys Lys
        115                 120                 125
Ala Lys Val Asp Trp Thr Pro Glu Leu His Arg Arg Phe Val Gln Ala
    130                 135                 140
Val Glu Gln Leu Gly Val Asp Lys Ala Val Pro Ser Arg Ile Leu Glu
145                 150                 155                 160
Leu Met Gly Ile Asp Cys Leu Thr Arg His Asn Ile Ala Ser His Leu
                165                 170                 175
Gln Lys Tyr Arg Ser His Arg Lys His Leu Leu Ala Arg Glu Ala Glu
            180                 185                 190
Ala Ala Ser Trp Ser His Arg Arg Gln Leu Tyr Val Ser Ser Thr Asn
        195                 200                 205
Asn Gly Lys Arg Arg Arg Lys Asn Asn Glu His Glu Thr
    210                 215                 220
<210>186
<211>454
<212>DNA
<213>大麦(Hordeum vulgare)
<400>186
catcgtgggc gatgaggttt gcagcgcggt gacgacggac gattcttccg ctgcggtcgg  60
gtccgagaac agcaagtcgt cggcgtcggc agagggccac agcaagagga cgtcggcagc  120
cgcagcgacc aagagctccc acggcaggcg gaaggtgaag gtggactgga cgccggagtt  180
gcaccggcgg ttcgtgcagg cgggggagca gctggggctg gacaaggcgg tgccgtcgcg  240
gatcctggag ctcatgggca acgagtaccg tctcacgcgc cacaacatcg ccagccatct  300
ccagaagtac cggtcacaca ggaagcacct gatggcgagg gagggcgagg cgggtagctg  360
gacgccgcag ccgcaaatgt gctggggtgc gaaggtggtg agggtggggc gggctctgac  420
gttgtagggg ttatatagcg gggtggcggc gggg                              454
<210>187
<211>144
<212>PRT
<213>大麦
<400>187
Ser Leu Ser Ile Val Gly Asp Glu Val Cys Ser Ala Val Thr Thr Asp
1               5                   10                  15
Asp Ser Ser Ala Ala Val Gly Ser Glu Asn Ser Lys Ser Ser Ala Ser
            20                  25                  30
Ala Glu Gly His Ser Lys Arg Thr Ser Ala Ala Ala Ala Thr Lys Ser
        35                  40                  45
Ser His Gly Arg Arg Lys Val Lys Val Asp Trp Thr Pro Glu Leu His
    50                  55                  60
Arg Arg Phe Val Gln Ala Gly Glu Gln Leu Gly Leu Asp Lys Ala Val
65                  70                  75                  80
Pro Ser Arg Ile Leu Glu Leu Met Gly Asn Glu Tyr Arg Leu Thr Arg
                85                  90                  95
His Asn Ile Ala Ser His Leu Gln Lys Tyr Arg Ser His Arg Lys His
            100                 105                 110
Leu Met Ala Arg Glu Gly Glu Ala Gly Ser Trp Thr Pro Gln Pro Gln
        115                 120                 125
Met Cys Trp Gly Ala Lys Val Val Arg Val Gly Arg Ala Leu Thr Leu
    130                 135                 140
<210>188
<211>811
<212>DNA
<213>两色蜀黍
<400>188
gcacgaggct tgaaattccc tccgccgccg ccgccgccgc cgcctcctcc tcctccttct  60
cctcatccga tgcagcactt cggaaggccg ctgcatgcct ggggccatcc gacgccaacg  120
gtggagtcac cccgggtgcc aatgtggcct cggcatctcg tcccccgcac cccgccgccg  180
ccgtgggctc ctccgccgcc atctgacccg gcgttctggc accatgctta catgaggggg  240
cctgcacaca tgccgggcca ggtgactccc tgcgtggcag tgccaatgcc agctgcgcgt  300
ttccctgctc cacccgtgag gggtgctttg ccatgtccac ctccaatgta cagacctctc  360
gttcctccaa cactcgatac gcagtttcag ctacagacac agccatcaag tgagagcata  420
gatgcagcaa taggtgatgt tttaacgaaa ccgtggctgc cactgcccct gggactgaag  480
cccccttcag tagacagtgt catgggcgag ctgcagaggc aaggtgtggc aaatgtgcca    540
ccagcttgtg gatgatcccc ggggctccat agctagctgc ttgtccctgc agtccaacaa    600
aaagaatttg tcgacatgcc ttttctgttt caaattttca tgaaccattt atggaccact    660
ctctcttagt taacttgttc agggtcagag agcaaaacag tacatccttt caggtttgag    720
ggaaatcaac ctgagtacat ccaagtacaa tgtgccatga cggaataatg aagtcttggc    780
cttggcccga ataatcagta gctgccatct c                                   811
<210>189
<211>184
<212>PRT
<213>两色蜀黍
<400>189
Ala Arg Gly Leu Lys Phe Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro
1               5                   10                  15
Pro Pro Pro Ser Pro His Pro Met Gln His Phe Gly Arg Pro Leu His
            20                 25                 30
Ala Trp Gly His Pro Thr Pro Thr Val Glu Ser Pro Arg Val Pro Met
        35                 40                 45
Trp Pro Arg His Leu Val Pro Arg Thr Pro Pro Pro Pro Trp Ala Pro
    50                 55                 60
Pro Pro Pro Ser Asp Pro Ala Phe Trp His His Ala Tyr Met Arg Gly
65                 70                 75                 80
Pro Ala His Met Pro Gly Gln Val Thr Pro Cys Val Ala Val Pro Met
                85                 90                 95
Pro Ala Ala Arg Phe Pro Ala Pro Pro Val Arg Gly Ala Leu Pro Cys
            100                105                110
Pro Pro Pro Met Tyr Arg Pro Leu Val Pro Pro Thr Leu Asp Thr Gln
        115                120                125
Phe Gln Leu Gln Thr Gln Pro Ser Ser Glu Ser Ile Asp Ala Ala Ile
    130                135                140
Gly Asp Val Leu Thr Lys Pro Trp Leu Pro Leu Pro Leu Gly Leu Lys
145                150                155                160
Pro Pro Ser Val Asp Ser Val Met Gly Glu Leu Gln Arg Gln Gly Val
                165                170                175
Ala Asn Val Pro Pro Ala Cys Gly
            180
<210>190
<211>593
<212>DNA
<213>甘蔗
<220>
<221>misc_feature
<222>(521)..(521)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(524)..(524)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(534)..(534)
<223>n是a、c、g或t
<400>190
catcgacaag gccgtgccgt cccggatcct cgagataatg ggcatggatt gcctcacaag    60
acacaacatt gccagccacc tccagaagta ccggtcgcac agaaagcacc tgatggcgcg    120
ggaggcggag gccgccacct gggcgcagaa gcggcacatg tacgcggcgg ccggcggagt    180
agccccgagg acggacgcac cacacggcag ccggccgtgg gtggtgccga ccatcgggtt    240
cccgccgccg gcgcccccgc ccttctgccg gccgctgcac gtgtggggcc acccgcccca    300
cgccgccgcc gctgaagccg ctgctgcggt ggcggcgact ccgactccga tgctgcccgt    360
gtggccgcgg cacctggcgc cgccccggcc gctgccgccg tgggcgcacc cgcacccgcc    420
ggccgtggac ccggcgttct ggcaccagca gtacaacgcg gccaggaaat ggggtccaca    480
ggcaaccgca gtgacgcaag ggacgccggc gtgcgtgccg ncgnccgccg ccgncatgct    540
gccgaggttt tcccgggttg gccccggggg ggggggggga aaaaaaattt ttt           593
<210>191
<211>197
<212>PRT
<213>甘蔗
<220>
<221>不确定
<222>(174)..(175)
<223>Xaa可以是任意天然产生的氨基酸
<220>
<221>不确定
<222>(178)..(178)
<223>Xaa可以是任意天然产生的氨基酸
<400>191
Ile Asp Lys Ala Val Pro Ser Arg Ile Leu Glu Ile Met Gly Met Asp
1               5                   10                  15
Cys Leu Thr Arg His Asn Ile Ala Ser His Leu Gln Lys Tyr Arg Ser
            20                  25                  30
His Arg Lys His Leu Met Ala Arg Glu Ala Glu Ala Ala Thr Trp Ala
        35                  40                  45
Gln Lys Arg His Met Tyr Ala Ala Ala Gly Gly Val Ala Pro Arg Thr
    50                  55                  60
Asp Ala Pro His Gly Ser Arg Pro Trp Val Val Pro Thr Ile Gly Phe
65                  70                  75                  80
Pro Pro Pro Ala Pro Pro Pro Phe Cys Arg Pro Leu His Val Trp Gly
                85                  90                  95
His Pro Pro His Ala Ala Ala Ala Glu Ala Ala Ala Ala Val Ala Ala
            100                 105                 110
Thr Pro Thr Pro Met  Leu Pro Val Trp Pro Arg His Leu Ala Pro Pro
        115                 120                 125
Arg Pro Leu Pro Pro Trp Ala His Pro His Pro Pro Ala Val Asp Pro
    130                 135                 140
Ala Phe Trp His Gln Gln Tyr Asn Ala Ala Arg Lys Trp Gly Pro Gln
145                 150                 155                 160
Ala Thr Ala Val Thr Gln Gly Thr Pro Ala Cys Val Pro Xaa Xaa Ala
                165                 170                 175
Ala Xaa Met Leu Pro Arg Phe Ser Arg Val Gly Pro Gly Gly Gly Gly
            180                 185                 190
Gly Lys Lys Ile Phe
        195
<210>192
<211>1816
<212>DNA
<213>稻
<400>192
ggcaactaac aatacctcgc acctagtcac caccgcacca accgcgcgcg accggccccc    60
cgtcagtcga aagctgagcc tgagcgagca actgatgccg ctagctatag ctgctgcctg    120
cagcacgcag cgcccgtaac ctaacgtatc atttacttcc attgcactgc acatcctgtg    180
agttcgttgt ctgagtgaga gctggacgtg ctgcaccgag ctcctggccg agatgcttgc    240
cgtgtcgccg gcgatgtgcc ccgacattga ggaccgcgcc gcggtggccg gcgatgctgg    300
catggaggtc gtcgggatgt cgtcggacga catggatcag ttcgacttct ccgtcgatga    360
catagacttc ggggacttct tcctgaggct ggaggacggt gatgtgctcc cggacctcga    420
ggtcgacccg gccgagatct tcaccgactt cgaggcaatc gcgacgagtg gaggcgaagg    480
tgtgcaggac caggaggtgc ccaccgtcga gctcttggcg cctgcggacg acgtcggtgt    540
gctggatccg tgcggcgatg tcgtcgtcgg ggaggagaac gcggcgtttg ccggggctgg    600
agaggagaag gtagggtgta accaggacga tgatgcgggg gaagcgaatg tcgacgatgg    660
agccgcggcg gttgaggcca agtcttcgtc gccgtcatcg acgacgtcgt cgtcgcagga    720
ggctgagagc cggcacaagt catccagcaa gagctcccat  gggaagaaga aagcgaaggt   780
ggactggacg cctgagcttc accggaggtt cgtgcaggcg gtggagcagc tcggcatcga    840
caaggccgtg ccgtcgagga tacttgagat catggggatc gactctctca cccggcacaa    900
catagccagc catcttcaga agtaccggtc acacagaaaa cacatgattg cgagagaggc    960
ggaggcagcg agttggaccc aacggcggca gatttacgcc gccggtggag gtgctgttgc    1020
gaagaggccg gagtccaacg cgtggaccgt gccaaccatt ggcttccctc ctcctccgcc    1080
accaccacca tcaccggctc cgattcaaca ttttgctcgc ccgttgcatg tttggggcca    1140
cccgacgatg gacccgtccc gagttccagt gtggccaccg cggcacctcg ttccccgtgg    1200
cccggcgcca ccatgggttc caccgccgcc gccgtcggac  cctgctttct ggcaccaccc   1260
ttacatgagg gggccagcac atgtgccaac tcaagggaca ccttgcatgg cgatgcccat    1320
gccagctgcg agatttcctg ctccaccggt gccaggagtt gtcccgtgtc caatgtatag    1380
gccattgact ccaccagcac tggcgagcaa gaatcagcag gacgcacagc ttcaactcca    1440
ggttcaacca tcaagcgaga gcatcgacgc agctatcggt gatgttttat cgaaaccgtg    1500
gttgcctttg cctcttggac tgaagccacc ttcagtggac agtgtgatgg gcgagctgca    1560
gaggcaaggc gtagcaaacg ttcctccagc gtgtggatga tatttgcatg atagattgat    1620
ggttccgtta ctgactgatt gcttatctgg tcagttcacc aaaaaatggg aaaattcgcc    1680
gacatgtcct tttatttttc ttttggccta gcgtttcttg gacatctcgt ttaattttta    1740
acttgtgcag agttcgaaag acatctttgt ttcgactccg ggagaaatta acctgcgtat    1800
tgtaaatgta aaatgt                                                    1816
<210>193
<211>455
<212>PRT
<213>稻
<400>193
Met Leu Ala Val Ser Pro Ala Met Cys Pro Asp Ile Glu Asp Arg Ala
1               5                   10                  15
Ala Val Ala Gly Asp Ala Gly Met Glu Val Val Gly Met Ser Ser Asp
            20                  25                  30
Asp Met Asp Gln Phe Asp Phe Ser Val Asp Asp Ile Asp Phe Gly Asp
        35                  40                  45
Phe Phe Leu Arg Leu Glu Asp Gly Asp Val Leu Pro Asp Leu Glu Val
    50                  55                  60
Asp Pro Ala Glu Ile Phe Thr Asp Phe Glu Ala Ile Ala Thr Ser Gly
65                  70                  75                  80
Gly Glu Gly Val Gln Asp Gln Glu Val Pro Thr Val Glu Leu Leu Ala
                85                  90                  95
Pro Ala Asp Asp Val Gly Val Leu Asp Pro Cys Gly Asp Val Val Val
            100                 105                 110
Gly Glu Glu Asn Ala Ala Phe Ala Gly Ala Gly Glu Glu Lys Val Gly
        115                 120                 125
Cys Asn Gln Asp Asp Asp Ala Gly Glu Ala Asn Val Asp Asp Gly Ala
    130                 135                 140
Ala Ala Val Glu Ala Lys Ser Ser Ser Pro Ser Ser Thr Thr Ser Ser
145                 150                 155                 160
Ser Gln Glu Ala Glu Ser Arg His Lys Ser Ser Ser Lys Ser Ser His
                165                 170                 175
Gly Lys Lys Lys Ala Lys Val Asp Trp Thr Pro Glu Leu His Arg Arg
            180                 185                 190
Phe Val Gln Ala Val Glu Gln Leu Gly Ile Asp Lys Ala Val Pro Ser
        195                 200                 205
Arg Ile Leu Glu Ile Met Gly Ile Asp Ser Leu Thr Arg His Asn Ile
    210                 215                 220
Ala Ser His Leu Gln Lys Tyr Arg Ser His Arg Lys His Met Ile Ala
225                 230                 235                 240
Arg Glu Ala Glu Ala Ala Ser Trp Thr Gln Arg Arg Gln Ile Tyr Ala
                245                 250                 255
Ala Gly Gly Gly Ala Val Ala Lys Arg Pro Glu Ser Asn Ala Trp Thr
            260                 265                 270
Val Pro Thr Ile Gly Phe Pro Pro Pro Pro Pro Pro Pro Pro Ser Pro
        275                 280                 285
Ala Pro Ile Gln His Phe Ala Arg Pro Leu His Val Trp Gly His Pro
    290                 295                 300
Thr Met Asp Pro Ser Arg Val Pro Val Trp Pro Pro Arg His Leu Val
305                 310                 315                 320
Pro Arg Gly Pro Ala Pro Pro Trp Val Pro Pro Pro Pro Pro Ser Asp
                325                 330                 335
Pro Ala Phe Trp His His Pro Tyr Met Arg Gly Pro Ala His Val Pro
            340                 345                 350
Thr Gln Gly Thr Pro Cys Met Ala Met Pro Met Pro Ala Ala Arg Phe
        355                 360                 365
Pro Ala Pro Pro Val Pro Gly Val Val  Pro Cys Pro Met Tyr Arg Pro
    370                 375                 380
Leu Thr Pro Pro Ala Leu Ala Ser Lys Asn Gln Gln Asp Ala Gln Leu
385                 390                 395                 400
Gln Leu Gln Val Gln Pro Ser Ser Glu Ser Ile Asp Ala Ala Ile Gly
                405                 410                 415
Asp Val Leu Ser Lys Pro Trp Leu Pro Leu Pro Leu Gly Leu Lys Pro
            420                 425                 430
Pro Ser Val Asp Ser Val Met Gly Glu Leu Gln Arg Gln Gly Val Ala
        435                 440                 445
Asn Val Pro Pro Ala Cys Gly
    450                 455
<210>194
<211>1096
<212>DNA
<213>稻
<400>194
tgtgctaagg catccatgct actgcagagt gtcccacctg cagttttggt tcgatttttg      60
agggaacatc gttctgaatg ggcggattat aacttcgatg catattcagc ttcatctctg     120
aagacaagct catgttcact tcctgggttg cggcctatga gattttctgg gagccagatc     180
attatgccac ttgctcacac ggtggagaat gaagagattt tagaagttgt ccgtcttgaa     240
ggacaagcac ttacacatga tgatggtctt atgtctagag atattcacct gcttcagctt     300
tgcactggaa tagatgagaa atcaatggga tcctgcttcc agcttgtctt tgcaccaatc     360
gatgagcttt tccctgatga tgctccgtta atatcttcag gctttcgtgt tataccgctg     420
gacatgaaaa cagatggtac acctgctggt agaacattag atttggcatc tagccttgag     480
gttggttcaa ctgcacagcc cacaggggat gcatctatgg atgactgtaa tctacgatca     540
gtgctgacaa ttgcctttca gttcccttat gaaatgcatc tccaagacag cgttgcaact     600
atggcccggc aatatgtccg cagtattgtt ttctctgttc agagagtatc aatggctgtt     660
tctccttctc ggtctggctt gaatgctggg cagaagataa tttcaggctt ccctgaagcc     720
ccaacgctag ctcgttggat ttgccaaagc taccagttcc atttgggggt ggagttactt     780
aggcaggcag atgatgctgg ggaagcacta ttgaaaatgc tatgggatta cgaagacgct     840
attttgtgct gttctttcaa ggaaaagcct gtatttactt ttgccaacga gatgggacta     900
aacatgctag aaacatctct cgtcgctctc caagatctct cactggacaa gatatttgat     960
gaagccggta ggaaggccct atacaacgag atcccgaaat tgatggaaca gggttacgtg    1020
tacctgcctg gtggagtgtg cttgtccggg atggggcgcc atgtttcttt cgagcaagct    1080
gtagcatgga aggtgc                                                    1096
<210>195
<211>365
<212>PRT
<213>稻
<400>195
Cys Ala Lys Ala Ser Met Leu Leu Gln Ser Val Pro Pro Ala Val Leu
1               5                   10                  15
Val Arg Phe Leu Arg Glu His Arg Ser Glu Trp Ala Asp Tyr Asn Phe
            20                  25                  30
Asp Ala Tyr Ser Ala Ser Ser Leu Lys Thr Ser Ser Cys Ser Leu Pro
        35                  40                  45
Gly Leu Arg Pro Met Arg Phe Ser Gly Ser Gln Ile Ile Met Pro Leu
    50                  55                  60
Ala His Thr Val Glu Asn Glu Glu Ile Leu Glu Val Val Arg Leu Glu
65                  70                  75                  80
Gly Gln Ala Leu Thr His Asp Asp Gly Leu Met Ser Arg Asp Ile His
                85                  90                  95
Leu Leu Gln Leu Cys Thr Gly Ile Asp Glu Lys Ser Met Gly Ser Cys
            100                 105                 110
Phe Gln Leu Val Ser Ala Pro Ile Asp Glu Leu Phe Pro Asp Asp Ala
        115                 120                 125
Pro Leu Ile Ser Ser Gly Phe Arg Val Ile Pro Leu Asp Met Lys Thr
    130                 135                 140
Asp Gly Thr Pro Ala Gly Arg Thr Leu Asp Leu Ala Ser Ser Leu Glu
145                 150                 155                 160
Val Gly Ser Thr Ala Gln Pro Thr Gly Asp Ala Ser Met Asp Asp Cys
                165                 170                 175
Asn Leu Arg Ser Val Leu Thr Ile Ala Phe Gln Phe Pro Tyr Glu Met
            180                 185                 190
His Leu Gln Asp Ser Val Ala Thr Met Ala Arg Gln Tyr Val Arg Ser
        195                 200                 205
Ile Val Ser Ser Val Gln Arg Val Ser Met Ala Ile Ser Pro Ser Arg
    210                 215                 220
Ser Gly Leu Asn Ala Gly Gln Lys Ile Ile Ser Gly Phe Pro Glu Ala
225                 230                 235                 240
Pro Thr Leu Ala Arg Trp Ile Cys Gln Ser Tyr Gln Phe His Leu Gly
                245                 250                 255
Val Glu Leu Leu Arg Gln Ala Asp Asp Ala Gly Glu Ala Leu Leu Lys
            260                 265                 270
Met Leu Trp Asp Tyr Glu Asp Ala Ile Leu Cys Cys Ser Phe Lys Glu
        275                 280                 285
Lys Pro Val Phe Thr Phe Ala Asn Glu Met Gly Leu Asn Met Leu Glu
    290                 295                 300
Thr Ser Leu Val Ala Leu Gln Asp Leu Ser Leu Asp Lys Ile Phe Asp
305                 310                 315                 320
Glu Ala Gly Arg Lys Ala Leu Tyr Asn Glu Ile Pro Lys Leu Met Glu
                325                 330                 335
Gln Gly Tyr Val Tyr Leu Pro Gly Gly Val Cys Leu Ser Gly Met Gly
            340                 345                 350
Arg His Val Ser Phe Glu Gln Ala Val Ala Trp Lys Val
        355                 360                 365
<210>196
<211>1395
<212>DNA
<213>稻
<400>196
gctcaagaga caagcgggga ggttgtatac gctttgggga ggcaacctgc tgttttgcgg     60
acatttagtc agaggttgag tagaggcttc aatgatgcta taagtggttt caatgatgat    120
ggttggtctg tcatgggtgg ggatggcatt gaagatgtga tcattgcttg caatgcaaag    180
aaggttagga atactagcac ttcggccaat gcttttgtaa ctccaggagg tgttatatgt    240
gctaaggcat ccatgctact gcagagtgtc ccacctgcag ttttggttcg atttttgagg    300
gaacatcgtt ctgaatgggc ggattataac ttcgatgcat attcagcttc atctctgaag    360
acaagctcat gttcacttcc tgggttgcgg cctatgagat tttctgggag ccagatcatt    420
atgccacttg ctcacacggt ggagaatgag gagattttag aagttgtccg tcttgaagga    480
caagcactta cacatgatga tggtcttatg tctagagata ttcacctgct tcagctttgc    540
actggaatag atgagaaatc aatgggatcc tgcttccagc ttgtctctgc accaatcgat    600
gagcttttcc ctgatgatgc tccgttaata tcttcaggct ttcgtgttat accgctggac    660
atgaaaacag atggtacacc tgctggtaga acattagatt tggcatctag ccttgaagtt    720
ggttcaactg cacagcccac aggggatgca tctatggatg actgtaatct acgatcagtg     780
ctgacaattg cctttcagtt cccttatgaa atgcatctcc aagacagcgt tgcaactatg     840
gcccggcaat atgtccgcag tattgtttcc tctgttcaga gagtatcaat ggctatttct     900
ccttctcggt ctggcttgaa tgctgggcag aagataattt caggcttccc tgaagcccca     960
acgctagctc gttggatttg ccaaagctac cagttccatt tgggggtgga gttacttagg    1020
caggcagatg atgctgggga agcactattg aaaatgctat gggattacga agacgctatt    1080
ttgtgctgtt ctttcaagga aaagcctgtg tttacttttg ccaacgagat gggactaaac    1140
atgctagaaa catctctcgt cgctctccaa gatctctcac tggacaagat atttgatgaa    1200
gccggtagga aggccctata caacgagatc ccgaaattga tggaacaggg ttacgtgtac    1260
ctgcctggtg gagtgtgctt gtccgggatg gggcgccatg tttctttcga gcaagctgta    1320
gcatggaagg tgctcggaga agacaacaat gtgcactgcc tcgccttctg cttcgtcaac    1380
tggtccttcg tgtga                                                     1395
<210>197
<211>464
<212>PRT
<213>稻
<400>197
Ala Gln Glu Thr Ser Gly Glu Val Val Tyr Ala Leu Gly Arg Gln Pro
1               5                   10                  15
Ala Val Leu Arg Thr Phe Ser Gln Arg Leu Ser Arg Gly Phe Asn Asp
            20                  25                  30
Ala Ile Ser Gly Phe Asn Asp Asp Gly Trp Ser Val Met Gly Gly Asp
        35                  40                  45
Gly Ile Glu Asp Val Ile Ile Ala Cys Asn Ala Lys Lys Val Arg Asn
    50                  55                  60
Thr Ser Thr Ser Ala Asn Ala Phe Val Thr Pro Gly Gly Val Ile Cys
65                  70                  75                  80
Ala Lys Ala Ser Met Leu Leu Gln Ser Val Pro Pro Ala Val Leu Val
                85                  90                  95
Arg Phe Leu Arg Glu His Arg Ser Glu Trp Ala Asp Tyr Asn Phe Asp
            100                 105                 110
Ala Tyr Ser Ala Ser Ser Leu Lys Thr Ser Ser Cys Ser Leu Pro Gly
        115                 120                 125
Leu Arg Pro Met Arg Phe Ser Gly Ser Gln Ile Ile Met Pro Leu Ala
    130                 135                 140
His Thr Val Glu Asn Glu Glu Ile Leu Glu Val Val Arg Leu Glu Gly
145                 150                 155                 160
Gln Ala Leu Thr His Asp Asp Gly Leu Met Ser Arg Asp Ile His Leu
                165                 170                 175
Leu Gln Leu Cys Thr Gly Ile Asp Glu Lys Ser Met Gly Ser Cys Phe
            180                 185                 190
Gln Leu Val Ser Ala Pro Ile Asp Glu Leu Phe Pro Asp Asp Ala Pro
        195                 200                 205
Leu Ile Ser Ser Gly Phe Arg Val Ile Pro Leu Asp Met Lys Thr Asp
    210                 215                 220
Gly Thr Pro Ala Gly Arg Thr Leu Asp Leu Ala Ser Ser Leu Glu Val
225                 230                 235                 240
Gly Ser Thr Ala Gln Pro Thr Gly Asp Ala Ser Met Asp Asp Cys Asn
                245                 250                 255
Leu Arg Ser Val Leu Thr Ile Ala Phe Gln Phe Pro Tyr Glu Met His
            260                 265                 270
Leu Gln Asp Ser Val Ala Thr Met Ala Arg Gln Tyr Val Arg Ser Ile
        275                 280                 285
Val Ser Ser Val Gln Arg Val Ser Met Ala Ile Ser Pro Ser Arg Ser
    290                 295                 300
Gly Leu Asn Ala Gly Gln Lys Ile Ile Ser Gly Phe Pro Glu Ala Pro
305                 310                 315                 320
Thr Leu Ala Arg Trp Ile Cys Gln Ser Tyr Gln Phe His Leu Gly Val
                325                 330                 335
Glu Leu Leu Arg Gln Ala Asp Asp Ala Gly Glu Ala Leu Leu Lys Met
            340                 345                 350
Leu Trp Asp Tyr Glu Asp Ala Ile Leu Cys Cys Ser Phe Lys Glu Lys
        355                 360                 365
Pro Val Phe Thr Phe Ala Asn Glu Met Gly Leu Asn Met Leu Glu Thr
    370                 375                 380
Ser Leu Val Ala Leu Gln Asp Leu Ser Leu Asp Lys Ile Phe Asp Glu
385                 390                 395                 400
Ala Gly Arg Lys Ala Leu Tyr Asn Glu Ile Pro Lys Leu Met Glu Gln
                405                 410                 415
Gly Tyr Val Tyr Leu Pro Gly Gly Val Cys Leu Ser Gly Met Gly Arg
            420                 425                 430
His Val Ser Phe Glu Gln Ala Val Ala Trp Lys Val Leu Gly Glu Asp
        435                 440                 445
Asn Asn Val His Cys Leu Ala Phe Cys Phe Val Asn Trp Ser Phe Val
    450                 455                 460
<210>198
<211>3000
<212>DNA
<213>稻
<400>198
gacgtcaggt tatttttttt tctcctcgtc tcctgacgat ttcgcttttg ctcgaaatct      60
cccaggtttg ttgttgttgt gttgaaggcg gagaagaggg gaggctttgg tggtggtgga     120
ggaggaggat ggcggcggcg gtggcgatgc ggagcggcag cggcagcgac ggcggcggcg     180
gcgggtacga caaggccggg atggactccg gcaagtacgt gcggtacacg ccggagcagg     240
tggaggcgct ggagagggtg tacgccgagt gccccaagcc cagctcctcc cgccgccagc     300
agctgctccg cgactgtccc atcctcgcca acatcgagcc caagcagatc aaggtctggt     360
tccagaacag aaggtgccga gataagcagc ggaaggaggc atcaaggctt caggccgtga     420
accgaaaatt gacggcgatg aataagcttc tcatggagga gaatgagcgt cttcagaagc     480
aggtctccca gctggtccat gagaacgcgt acatgaagca gcaacttcag aatccgtcat     540
tgggcaatga tacaagctgt gaatcaaatg tgaccactcc tcagaaccct ctgagagatg     600
caagtaaccc gtctggactc cttacaattg cggaggagac cctgacagag ttcctctcca     660
aggctacagg gactgctgtt gattgggtgc caatgcctgg gatgaagcct ggtccggatt     720
cgtttggtat tgtggccgtt tcacatggtt gccgtggtgt tgctgcccgt gcctgtggtt     780
tggtgaatct agaaccaaca aagatcgtgg agatcttaaa agaccgccca tcttggttcc     840
gtgattgtcg aagtcttgaa gtcttcacaa tgtttccagc tggaaatggt ggcacgatcg     900
aacttgttta catgcagatg tatgctccta ctactttggt tcctgcacga gatttttgga     960
cacttagata cacaactaca atggaggatg gcagccttgt ggtctgtgag agatcattga    1020
gtggttctgg aggtggtcca agtacagcct ccgcacagca atttgtaaga gctgagatgc    1080
ttcctagcgg ctatctagtg cgcccatgcg agggtggtgg ctccatcgtg catattgtgg    1140
accatctgga tcttgaggct tggagtgttc cagaagtgct tcggccactc tacgagtcat    1200
ctagggtagt tgctcagaaa atgactactg cagcactacg gcacatcaga caaattgctc    1260
aagagacaag cggggaggtt gtatacgctt tggggaggca acctgctgtt ttgcggacat    1320
ttagtcagag gttgagtaga ggcttcaatg atgctataag tggtttcagt gatgatggtt    1380
ggtctgtcat gggtggggat ggcattgaag atgtgatcat tgcttgcaat gcaaagaagg    1440
ttaggaatac tagcacttcg gccaatgctt ttgtaactcc aggaggtgtt atatgtgcta    1500
aggcatccat gctactgcag agtgtcccac ctgcagtttt ggttcgattt ttgagggaac    1560
atcgttctga atgggcggat tataacttcg atgcatattc agcttcatct ctgaagacaa    1620
gctcatgttc acttcctggg ttgcggccta tgagattttc tgggagccag atcattatgc    1680
cacttgctca cacggtggag aatgaggaga ttttagaagt tgtccgtctt gaaggacaag    1740
cacttacaca tgatgatggt cttatgtcta gagatattca cctgcttcag ctttgcactg    1800
gaatagatga gaaatcaatg ggatcctgct tccagcttgt ctctgcacca atcgatgagc    1860
ttttccctga tgatgctccg ttaatatctt caggctttcg tgttataccg ctggacatga    1920
aaacagatgg tacacctgct ggtagaacat tagatttggc atctagcctt gaagttggtt    1980
caactgcaca gcccacaggg gatgcatcta tggatgactg taatctacga tcagtgctga    2040
caattgcctt tcagttccct tatgaaatgc atctccaaga cagcgttgca actatggccc    2100
ggcaatatgt ccgcagtatt gtttcctctg ttcagagagt atcaatggct atttctcctt    2160
ctcggtctgg cttgaatgct gggcagaaga taatttcagg cttccctgaa gccccaacgc    2220
tagctcgttg gatttgccaa agctaccagt tccatttggg ggtggagtta cttaggcagg    2280
cagatgatgc tggggaagca ctattgaaaa tgctatggga ttacgaagac gctattttgt    2340
gctgttcttt caaggaaaag cctgtgttta cttttgccaa cgagatggga ctaaacatgc    2400
tagaaacatc tctcgtcgct ctccaagatc tctcactgga caagatattt gatgaagccg    2460
gtaggaaggc cctatacaac gagatcccga aattgatgga acagggttac gtgtacctgc    2520
ctggtggagt gtgcttgtcc gggatggggc gccatgtttc tttcgagcaa gctgtagcat    2580
ggaaggtgct cggagaagac aacaatgtgc actgcctcgc cttctgcttc gtcaactggt    2640
ccttcgtgtg acccaaaatc caatccacca tgctcgcagt catcgtcgtt gtcgtcagat    2700
ctccattttt tgcaatctct gtagaagaga ggacaccaaa ccaaccacaa acctgtcagc    2760
tgttagctaa tgattctact agcttttcta gatctttgaa ggcaaaatgc tgccggtgcc    2820
tgtaaagagt gtgtgcgtgc gtgtgtaaat ttgggcgcgt tttgcactaa tttgatctgg    2880
ggtaaggagg cgctggctgc tgctgtgctg tagtttggta aaagttgagt acgctaacct    2940
tggatggtct cgaactgtat gatgaaattc ctagcagtaa aatttcaact tggatccgcg    3000
<210>199
<211>840
<212>PRT
<213>稻
<400>199
Met Ala Ala Ala Val Ala Met Arg Ser Gly Ser Gly Ser Asp Gly Gly
1               5                   10                  15
Gly Gly Gly Tyr Asp Lys Ala Gly Met Asp Ser Gly Lys Tyr Val Arg
            20                  25                  30
Tyr Thr Pro Glu Gln Val Glu Ala Leu Glu Arg Val Tyr Ala Glu Cys
        35                  40                  45
Pro Lys Pro Ser Ser Ser Arg Arg Gln Gln Leu Leu Arg Asp Cys Pro
    50                  55                  60
Ile Leu Ala Asn Ile Glu Pro Lys Gln Ile Lys Val Trp Phe Gln Asn
65                  70                  75                  80
Arg Arg Cys Arg Asp Lys Gln Arg Lys Glu Ala Ser Arg Leu Gln Ala
                85                  90                  95
Val Asn Arg Lys Leu Thr Ala Met Asn Lys Leu Leu Met Glu Glu Asn
            100                 105                 110
Glu Arg Leu Gln Lys Gln Val Ser Gln Leu Val His Glu Asn Ala Tyr
        115                 120                 125
Met Lys Gln Gln Leu Gln Asn Pro Ser Leu Gly Asn Asp Thr Ser Cys
    130                 135                 140
Glu Ser Asn Val Thr Thr Pro Gln Asn Pro Leu Arg Asp Ala Ser Asn
145                 150                 155                 160
Pro Ser Gly Leu Leu Thr Ile Ala Glu Glu Thr Leu Thr Glu Phe Leu
                165                 170                 175
Ser Lys Ala Thr Gly Thr Ala Val Asp Trp Val Pro Met Pro Gly Met
            180                 185                 190
Lys Pro Gly Pro Asp Ser Phe Gly Ile Val Ala Val Ser His Gly Cys
        195                 200                 205
Arg Gly Val Ala Ala Arg Ala Cys Gly Leu Val Asn Leu Glu Pro Thr
    210                 215                 220
Lys Ile Val Glu Ile Leu Lys Asp Arg Pro Ser Trp Phe Arg Asp Cys
225                 230                 235                 240
Arg Ser Leu Glu Val Phe Thr Met Phe Pro Ala Gly Asn Gly Gly Thr
                245                 250                 255
Ile Glu Leu Val Tyr Met Gln Met Tyr Ala Pro Thr Thr Leu Val Pro
            260                 265                 270
Ala Arg Asp Phe Trp Thr Leu Arg Tyr Thr Thr Thr Met Glu Asp Gly
        275                 280                 285
Ser Leu Val Val Cys Glu Arg Ser Leu Ser Gly Ser Gly Gly Gly Pro
    290                 295                 300
Ser Thr Ala Ser Ala Gln Gln Phe Val Arg Ala Glu Met Leu Pro Ser
305                 310                 315                 320
Gly Tyr Leu Val Arg Pro Cys Glu Gly Gly Gly Ser Ile Val His Ile
                325                 330                 335
Val Asp His Leu Asp Leu Glu Ala Trp Ser Val Pro Glu Val Leu Arg
            340                 345                 350
Pro Leu Tyr Glu Ser Ser Arg Val Val Ala Gln Lys Met Thr Thr Ala
        355                 360                 365
Ala Leu Arg His Ile Arg Gln Ile Ala Gln Glu Thr Ser Gly Glu Val
    370                 375                 380
Val Tyr Ala Leu Gly Arg Gln Pro Ala Val Leu Arg Thr Phe Ser Gln
385                 390                 395                 400
Arg Leu Ser Arg Gly Phe Asn Asp Ala Ile Ser Gly Phe Asn Asp Asp
                405                 410                 415
Gly Trp Ser Val Met Gly Gly Asp Gly Ile Glu Asp Val Ile Ile Ala
            420                 425                 430
Cys Asn Ala Lys Lys Val Arg Asn Thr Ser Thr Ser Ala Asn Ala Phe
        435                 440                 445
Val Thr Pro Gly Gly Val Ile Cys Ala Lys Ala Ser Met Leu Leu Gln
    450                 455                 460
Ser Val Pro Pro Ala Val Leu Val Arg Phe Leu Arg Glu His Arg Ser
465                 470                 475                 480
Glu Trp Ala Asp Tyr Asn Phe Asp Ala Tyr Ser Ala Ser Ser Leu Lys
                485                 490                 495
Thr Ser Ser Cys Ser Leu Pro Gly Leu Arg Pro Met Arg Phe Ser Gly
            500                 505                 510
Ser Gln Ile Ile Met Pro Leu Ala His Thr Val Glu Asn Glu Glu Ile
        515                 520                 525
Leu Glu Val Val Arg Leu Glu Gly Gln Ala Leu Thr His Asp Asp Gly
    530                 535                 540
Leu Met Ser Arg Asp Ile His Leu Leu Gln Leu Cys Thr Gly Ile Asp
545                 550                 555                 560
Glu Lys Ser Met Gly Ser Cys Phe Gln Leu Val Ser Ala Pro Ile Asp
                565                 570                 575
Glu Leu Phe Pro Asp Asp Ala Pro Leu Ile Ser Ser Gly Phe Arg Val
            580                 585                 590
Ile Pro Leu Asp Met Lys Thr Asp Gly Thr Pro Ala Gly Arg Thr Leu
        595                 600                 605
Asp Leu Ala Ser Ser Leu Glu Val Gly Ser Thr Ala Gln Pro Thr Gly
    610                 615                 620
Asp Ala Ser Met Asp Asp Cys Asn Leu Arg Ser Val Leu Thr Ile Ala
625                 630                 635                 640
Phe Gln Phe Pro Tyr Glu Met His Leu Gln Asp Ser Val Ala Thr Met
                645                 650                 655
Ala Arg Gln Tyr Val Arg Ser Ile Val Ser Ser Val Gln Arg Val Ser
            660                 665                 670
Met Ala Ile Ser Pro Ser Arg Ser Gly Leu Asn Ala Gly Gln Lys Ile
        675                 680                 685
Ile Ser Gly Phe Pro Glu Ala Pro Thr Leu Ala Arg Trp Ile Cys Gln
    690                 695                 700
Ser Tyr Gln Phe His Leu Gly Val Glu Leu Leu Arg Gln Ala Asp Asp
705                 710                 715                 720
Ala Gly Glu Ala Leu Leu Lys Met Leu Trp Asp Tyr Glu Asp Ala Ile
                725                 730                 735
Leu Cys Cys Ser Phe Lys Glu Lys Pro Val Phe Thr Phe Ala Asn Glu
            740                 745                 750
Met Gly Leu Asn Met Leu Glu Thr Ser Leu Val Ala Leu Gln Asp Leu
        755                 760                 765
Ser Leu Asp Lys Ile Phe Asp Glu Ala Gly Arg Lys Ala Leu Tyr Asn
    770                 775                 780
Glu Ile Pro Lys Leu Met Glu Gln Gly Tyr Val Tyr Leu Pro Gly Gly
785                 790                 795                 800
Val Cys Leu Ser Gly Met Gly Arg His Val Ser Phe Glu Gln Ala Val
                805                 810                 815
Ala Trp Lys Val Leu Gly Glu Asp Asn Asn Val His cys Leu Ala Phe
            820                 825                 830
Cys Phe Val Asn Trp Ser Phe Val
        835                 840
<210>200
<211>3252
<212>DNA
<213>稻
<400>200
ctctctcccg tgctgctctc ccttctcctc tcctcaatta ccacgccgca gccgcagccc      60
cccaacccta gctagtacgg cgggcgacct gagggggtag ctgcctacct ctatacctgc     120
tatctccgtt cgatccgggt cgggctcgtg ctgctggggg cgggggcaat caatcggcga     180
gctcggtgat ccatggccgt ggctgtgggg tggctgtgag ggtgcccccg gcggcgctcc     240
cctccgcgcc tgccggcgag ggggctcgga ctgaagggat ctaggcgagc tgaaaattga     300
agtgcaggca aggagataag agcagcgtcc aaattgtgag tacttcatta gcaggaggta     360
gtggttgtgc ttgcttggct cctttgcaat ttggctttgg cgaggtagca atggctgcgg     420
cagtggcaat gcgagggagt agcagtgatg gaggtggcta tgataaggtt tccgggatgg     480
actccggtaa atatgtgcgc tacacgcctg agcaggtgga ggcgcttgag cgggtgtacg     540
ccgattgccc caagccaacc tcctcccgca ggcagcaact gctgcgtgag tgccccatac     600
ttgctaacat tgagcccaag cagatcaagg tctggttcca gaacagaagg tgccgggata     660
agcagcggaa ggagtcttca cggcttcagg ctgtcaacag gaaattgacg gcaatgaaca     720
agctacttat ggaagagaat gagcgactcc agaagcaggt ctcccaattg gttcatgaga     780
atgcccacat gcgacagcag ctgcagaata ctccgctggc aaatgataca agctgtgaat     840
caaatgtgac tacccctcaa aaccctttaa gggatgcaag taacccctct gggctccttt     900
caattgcaga ggagaccttg acagagttcc tctcaaaggc tactggtaca gctattgatt     960
gggtccagat gcctgggatg aagcctggtc cggattcggt tggtattgtg gccatttcac    1020
atggttgccg tggtgttgct gcccgtgcct gtggtttggt gaacctagaa ccaacaaaag    1080
tggtagagat attgaaagat cgtccatctt ggttccgtga ttgtcgaaac ctggaagtct    1140
ttacaatgat tccagcagga aatggaggaa cggttgaact tgtctacaca cagttgtatg    1200
ctccaacaac tttagttcct gcacgagatt tttggacgtt acggtacaca accacaatgg    1260
aagatggcag tcttgtggtc tgtgagagat ctttaagtgg ttcagggggc ggtccaagtg    1320
ctgcctctgc tcagcaatat gtgagagcgg aaatgcttcc aagtggatac ctggttcgcc    1380
catgtgaagg tgggggatca attgtgcaca tagtggacca tctggatctt gaggcatgga    1440
gtgttcctga ggtgcttcgg ccactctatg aatcttcaag ggtagtcgct cagaaaatga    1500
ctactgcggc actccggcac atcagacaaa ttgctcaaga aacaagtggg gaagtggtgt    1560
atgccttggg gaggcaacca gcagtgctac ggacttttag tcaaaggctg agcagaggct    1620
ttaacgatgc cattagtggt ttcaatgatg atgggtggtc tataatgggc ggagacggtg    1680
ttgaagatgt agttattgct tgcaactcaa ctaagaaaat taggagtaac agcaatgctg    1740
gcatcgcctt tggagccccc ggaggtatta tatgtgctaa ggcatcaatg ttactgcaga    1800
gtgttcctcc agcagtactg gttcgatttc tgagggagca tagatctgaa tgggccgatt    1860
acaatattga tgcatatttg gcttcaactc tgaaaacaag tgcatgttca cttactgggt    1920
tgcgacccat gagattttct gggagccaaa tcatcattcc acttgctcac acagttgaga    1980
atgaggagat tcttgaagtt gttcgccttg agggtcaacc tcttactcat gatgaagctc    2040
ttctttcaag ggatatccac ctgcttcagc tctgcactgg aatagacgag aagtctgtgg    2100
gatcctcctt tcagcttgtg tttgcaccga ttgatgattt cccagatgaa actccattga    2160
tttcttctgg cttccgtgtt ataccacttg atatgaaaac agatggtgca tcctctggta    2220
ggacattaga tttggcatct agtcttgaag taggttcagc aacagctcaa gcctccggag    2280
atgcatctgc agatgattgt aacttgcgat ctgttctgac gatcgctttt caattccctt    2340
acgagttgca tctccaagac agtgttgcag ctatggctcg ccaatatgtc cgtagcattg    2400
tttctgctgt gcaaagagtg tcaatggcta tctctccctc tcaaactggt ctaaatgccg    2460
gacagaggat aatctctggt ttccctgaag cagcaaccct tgctcgatgg gtttgccaga    2520
gctaccatta ccatctaggg gtagagttac ttagtcaatc agatggagat gcagaacaat    2580
tgttgaagat gctatggcat taccaagatg ctattttgtg ctgctcattc aaggaaaaac    2640
cggtgtttac atttgccaac aaagcaggac tggacatgct agaaacttcc cttgtcgcct    2700
tacaggacct cacattggac aggatctttg atgagcctgg aaaagaagca ttgttctcaa    2760
acattcccaa attgatggag cagggccatg tctacctgcc atcaggcgtg tgcatgtcag    2820
gaatgggtcg gcatgtttct ttcgatcagg ccgtggcttg gaaagtgctt gccgaggata    2880
gcaatgttca ctgcctggcc ttctgtttcg tcaactggtc ctttgtgtga ccatcccaca    2940
tccactgcga agtgaagatt catttttgct tgttcaagac tgttttgcac tagatctaga    3000
cctgagaatc tagtagtatt tgcgaaattt ctcgcttatg taaatgtaat ctcgctccca    3060
ttccatcaag tacccaagta caaggcagtg gccaagtggt tttagttgta gggggatcgg    3120
agcaatcctg acggttgggt acttgggttc cttccagcaa tgtaaaatcg gatcctgtag    3180
ggcgtcgaaa actgcattgg caagattctt cgaaatgcag accaaattta gctagtacat    3240
cgtaactttg gc                                                        3252
<210>201
<211>839
<212>PRT
<213>稻
<400>201
Met Ala Ala Ala Val Ala Met Arg Gly Ser Ser Ser Asp Gly Gly Gly
1               5                   10                  15
Tyr Asp Lys Val Ser Gly Met Asp Ser Gly Lys Tyr Val Arg Tyr Thr
            20                  25                  30
Pro Glu Gln Val Glu Ala Leu Glu Arg Val Tyr Ala Asp Cys Pro Lys
        35                  40                  45
Pro Thr Ser Ser Arg Arg Gln Gln Leu Leu Arg Glu Cys Pro Ile Leu
    50                  55                  60
Ala Asn Ile Glu Pro Lys Gln Ile Lys Val Trp Phe Gln Asn Arg Arg
65                  70                  75                  80
Cys Arg Asp Lys Gln Arg Lys Glu Ser Ser Arg Leu Gln Ala Val Asn
                85                  90                  95
Arg Lys Leu Thr Ala Met Asn Lys Leu Leu Met Glu Glu Asn Glu Arg
            100                 105                 110
Leu Gln Lys Gln Val Ser Gln Leu Val His Glu Asn Ala His Met Arg
        115                 120                 125
Gln Gln Leu Gln Asn Thr Pro Leu Ala Asn Asp Thr Ser Cys Glu Ser
    130                 135                 140
Asn Val Thr Thr Pro Gln Asn Pro Leu Arg Asp Ala Ser Asn Pro Ser
145                 150                 155                 160
Gly Leu Leu Ser Ile Ala Glu Glu Thr Leu Thr Glu Phe Leu Ser Lys
                165                 170                 175
Ala Thr Gly Thr Ala Ile Asp Trp Val Gln Met Pro Gly Met Lys Pro
            180                 185                 190
Gly Pro Asp Ser Val Gly Ile Val Ala Ile Ser His Gly Cys Arg Gly
        195                 200                 205
Val Ala Ala Arg Ala Cys Gly Leu Val Asn Leu Glu Pro Thr Lys Val
    210                 215                 220
Val Glu Ile Leu Lys Asp Arg Pro Ser Trp Phe Arg Asp Cys Arg Asn
225                 230                 235                 240
Leu Glu Val Phe Thr Met Ile Pro Ala Gly Asn Gly Gly Thr Val Glu
                245                 250                 255
Leu Val Tyr Thr Gln Leu Tyr Ala Pro Thr Thr Leu Val Pro Ala Arg
            260                 265                 270
Asp Phe Trp Thr Leu Arg Tyr Thr Thr Thr Met Glu Asp Gly Ser Leu
        275                 280                 285
Val Val Cys Glu Arg Ser Leu Ser Gly Ser Gly Gly Gly Pro Ser Ala
    290                 295                 300
Ala Ser Ala Gln Gln Tyr Val Arg Ala Glu Met Leu Pro Ser Gly Tyr
305                 310                 315                 320
Leu Val Arg Pro Cys Glu Gly Gly Gly Ser Ile Val His Ile Val Asp
                325                 330                 335
His Leu Asp Leu Glu Ala Trp Ser Val Pro Glu Val Leu Arg Pro Leu
            340                 345                 350
Tyr Glu Ser Ser Arg Val Val Ala Gln Lys Met Thr Thr Ala Ala Leu
        355                 360                 365
Arg His Ile Arg Gln Ile Ala Gln Glu Thr Ser Gly Glu Val Val Tyr
    370                 375                 380
Ala Leu Gly Arg Gln Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu
385                 390                 395                 400
Ser Arg Gly Phe Asn Asp Ala Ile Ser Gly Phe Asn Asp Asp Gly Trp
                405                 410                 415
Ser Ile Met Gly Gly Asp Gly Val Glu Asp Val Val Ile Ala Cys Asn
            420                 425                 430
Ser Thr Lys Lys Ile Arg Ser Asn Ser Asn Ala Gly Ile Ala Phe Gly
        435                 440                 445
Ala Pro Gly Gly Ile Ile Cys Ala Lys Ala Ser Met Leu Leu Gln Ser
    450                 455                 460
Val Pro Pro Ala Val Leu Val Arg Phe Leu Arg Glu His Arg Ser Glu
465                 470                 475                 480
Trp Ala Asp Tyr Asn Ile Asp Ala Tyr Leu Ala Ser Thr Leu Lys Thr
                485                 490                 495
Ser Ala Cys Ser Leu Thr Gly Leu Arg Pro Met Arg Phe Ser Gly Ser
            500                 505                 510
Gln Ile Ile Ile Pro Leu Ala His Thr Val Glu Asn Glu Glu Ile Leu
        515                 520                 525
Glu Val Val Arg Leu Glu Gly Gln Pro Leu Thr His Asp Glu Ala Leu
    530                 535                 540
Leu Ser Arg Asp Ile His Leu Leu Gln Leu Cys Thr Gly Ile Asp Glu
545                 550                 555                 560
Lys Ser Val Gly Ser Ser Phe Gln Leu Val Phe Ala Pro Ile Asp Asp
                565                 570                 575
Phe Pro Asp Glu Thr Pro Leu Ile Ser Ser Gly Phe Arg Val Ile Pro
            580                 585                 590
Leu Asp Met Lys Thr Asp Gly Ala Ser Ser Gly Arg Thr Leu Asp Leu
        595                 600                 605
Ala Ser Ser Leu Glu Val Gly Ser Ala Thr Ala Gln Ala Ser Gly Asp
    610                 615                 620
Ala Ser Ala Asp Asp Cys Asn Leu Arg Ser Val Leu Thr Ile Ala Phe
625                 630                 635                 640
Gln Phe Pro Tyr Glu Leu His Leu Gln Asp Ser Val Ala Ala Met Ala
                645                 650                 655
Arg Gln Tyr Val Arg Ser Ile Val Ser Ala Val Gln Arg Val Ser Met
            660                 665                 670
Ala Ile Ser Pro Ser Gln Thr Gly Leu Asn Ala Gly Gln Arg Ile Ile
        675                 680                 685
Ser Gly Phe Pro Glu Ala Ala Thr Leu Ala Arg Trp Val Cys Gln Ser
    690                 695                 700
Tyr His Tyr His Leu Gly Val Glu Leu Leu Ser Gln Ser Asp Gly Asp
705                 710                 715                 720
Ala Glu Gln Leu Leu Lys Met Leu Trp His Tyr Gln Asp Ala Ile Leu
                725                 730                 735
Cys Cys Ser Phe Lys Glu Lys Pro Val Phe Thr Phe Ala Asn Lys Ala
            740                 745                 750
Gly Leu Asp Met Leu Glu Thr Ser Leu Val Ala Leu Gln Asp Leu Thr
        755                 760                 765
Leu Asp Arg Ile Phe Asp Glu Pro Gly Lys Glu Ala Leu Phe Ser Asn
    770                 775                 780
Ile Pro Lys Leu Met Glu Gln Gly His Val Tyr Leu Pro Ser Gly Val
785                 790                 795                 800
Cys Met Ser Gly Met Gly Arg His Val Ser Phe Asp Gln Ala Val Ala
                805                 810                 815
Trp Lys Val Leu Ala Glu Asp Ser Asn Val His Cys Leu Ala Phe Cys
            820                 825                 830
Phe Val Asn Trp Ser Phe Val
        835
<210>202
<211>3169
<212>DNA
<213>拟南芥
<400>202
agagtcttca aaacttttgc agcttcaatt gtacctgggt ttcttcttca ttgttcctaa    60
ggtttctgtg tccttcaatt cttctgatat aatgcttctt taagagagtt gacatcatca   120
ctttcttggg gtactcttct ctgtttctcc ccagaaaatc caactctgta attttgggtc   180
tttattctgt ttttctcttt gaagaatctt taaaattctc agatcttctg aatctctctt   240
ctttaaaact ttttttaact ttattttttg tactcgcttc tttgccttca tttttctcgt   300
atccacatgt cgttggtctt tcgctacaag ccacgaccgt agaatcttct tttgtctgaa   360
aagaattaca atttacgttt ctcttacgat acgacggact ttccgaagaa attaatttaa   420
agagaaaaga agaagaagcc aaagaagaag aagaagctag aagaaacagt aaagtttgag   480
actttttttg agggtcgagc taaaatggag atggcggtgg ctaaccaccg tgagagaagc   540
agtgacagta tgaatagaca tttagatagt agcggtaagt acgttaggta cacagctgag   600
caagtcgagg ctcttgagcg tgtctacgct gagtgtccta agcctagctc tctccgtcga   660
caacaattga tccgtgaatg ttccattttg gccaatattg agcctaagca gatcaaagtc   720
tggtttcaga accgcaggtg tcgagataag cagaggaaag aggcgtcgag gctccagagc   780
gtaaaccgga agctctctgc gatgaataaa ctgttgatgg aggagaatga taggttgcag   840
aagcaggttt ctcagcttgt ctgcgaaaat ggatatatga aacagcagct aactactgtt   900
gttaacgatc caagctgtga atctgtggtc acaactcctc agcattcgct tagagatgcg   960
aatagtcctg ctggattgct ctcaatcgca gaggagactt tggcagagtt cctatccaag  1020
gctacaggaa ctgctgttga ttgggttcag atgcctggga tgaagcctgg tccggattcg  1080
gttggcatct ttgccatttc gcaaagatgc aatggagtgg cagctcgagc ctgtggtctt  1140
gttagcttag aacctatgaa gattgcagag atcctcaaag atcggccatc ttggttccgt  1200
gactgtagga gccttgaagt tttcactatg ttcccggctg gtaatggtgg cacaatcgag  1260
cttgtttata tgcagacgta tgcaccaacg actctggctc ctgcccgcga tttctggacc  1320
ctgagataca caacgagcct cgacaatggg agttttgtgg tttgtgagag gtcgctatct  1380
ggctctggag ctgggcctaa tgctgcttca gcttctcagt ttgtgagagc agaaatgctt  1440
tctagtgggt atttaataag gccttgtgat ggtggtggtt ctattattca cattgtcgat  1500
caccttaatc ttgaggcttg gagtgttccg gatgtgcttc gaccccttta tgagtcatcc  1560
aaagtcgttg cacaaaaaat gaccatttcc gcgttgcggt atatcaggca attagcccaa  1620
gagtctaatg gtgaagtagt gtatggatta ggaaggcagc ctgctgttct tagaaccttt  1680
agccaaagat taagcagggg cttcaatgat gcggttaatg ggtttggtga cgacgggtgg  1740
tctacgatgc attgtgatgg agcggaagat attatcgttg ctattaactc tacaaagcat  1800
ttgaataata tttctaattc tctttcgttc cttggaggcg tgctctgtgc caaggcttca  1860
atgcttctcc aaaatgttcc tcctgcggtt ttgatccggt tccttagaga gcatcgatct  1920
gagtgggctg atttcaatgt tgatgcatat tccgctgcta cacttaaagc tggtagcttt  1980
gcttatccgg gaatgagacc aacaagattc actgggagtc agatcataat gccactagga  2040
catacaattg aacacgaaga aatgctagaa gttgttagac tggaaggtca ttctcttgct  2100
caagaagatg catttatgtc acgggatgtc catctccttc agatttgtac cgggattgac  2160
gagaatgccg ttggagcttg ttctgaactg atatttgctc cgattaatga gatgttcccg  2220
gatgatgctc cacttgttcc ctctggattc cgagtcatac ccgttgatgc taaaacggga  2280
gatgtacaag atctgttaac cgctaatcac cgtacactag acttaacttc tagccttgaa  2340
gtcggtccat cacctgagaa tgcttctgga aactcttttt ctagctcaag ctcgagatgt  2400
attctcacta tcgcgtttca attccctttt gaaaacaact tgcaagaaaa tgttgctggt  2460
atggcttgtc agtatgtgag gagcgtgatc tcatcagttc aacgtgttgc aatggcgatc  2520
tcaccgtctg ggataagccc gagtctgggc tccaaattgt ccccaggatc tcctgaagct  2580
gttactcttg ctcagtggat ctctcaaagt tacagtcatc acttaggctc ggagttgctg  2640
acgattgatt cacttggaag cgacgactcg gtactaaaac ttctatggga tcaccaagat  2700
gccatcctgt gttgctcatt aaagccacag ccagtgttca tgtttgcgaa ccaagctggt  2760
ctagacatgc tagagacaac acttgtagcc ttacaagata taacactcga aaagatattc  2820
gatgaatcgg gtcgtaaggc tatctgttcg gacttcgcca agctaatgca acagggattt  2880
gcttgcttgc cttcaggaat ctgtgtgtca acgatgggaa gacatgtgag ttatgaacaa  2940
gctgttgctt ggaaagtgtt tgctgcatct gaagaaaaca acaacaatct gcattgtctt  3000
gccttctcct ttgtaaactg gtcttttgtg tgattcgatt gacagaaaaa gactaattta  3060
aatttacgtt agagaactca aatttttggt tgttgtttag gtgtctctgt tttgtttttt  3120
aaaattattt tgatcaaatg ttactcactt tcttctttca aaaaaaaaa              3169
<210>203
<211>842
<212>PRT
<213>拟南芥
<400>203
Met Glu Met Ala Val Ala Asn His Arg Glu Arg Ser Ser Asp Ser Met
1               5                   10                  15
Asn Arg His Leu Asp Ser Ser Gly Lys Tyr Val Arg Tyr Thr Ala Glu
            20                  25                  30
Gln Val Glu Ala Leu Glu Arg Val Tyr Ala Glu Cys Pro Lys Pro Ser
        35                  40                  45
Ser Leu Arg Arg Gln Gln Leu Ile Arg Glu Cys Ser Ile Leu Ala Asn
    50                  55                  60
Ile Glu Pro Lys Gln Ile Lys Val Trp Phe Gln Asn Arg Arg Cys Arg
65                  70                  75                  80
Asp Lys Gln Arg Lys Glu Ala Ser Arg Leu Gln Ser Val Asn Arg Lys
                85                  90                  95
Leu Ser Ala Met Asn Lys Leu Leu Met Glu Glu Asn Asp Arg Leu Gln
            100                 105                 110
Lys Gln Val Ser Gln Leu Val Cys Glu Asn Gly Tyr Met Lys Gln Gln
        115                 120                 125
Leu Thr Thr Val Val Asn Asp Pro Ser Cys Glu Ser Val Val Thr Thr
    130                 135                 140
Pro Gln His Ser Leu Arg Asp Ala Asn Ser Pro Ala Gly Leu Leu Ser
145                 150                 155                 160
Ile Ala Glu Glu Thr Leu Ala Glu Phe Leu Ser Lys Ala Thr Gly Thr
                165                 170                 175
Ala Val Asp Trp Val Gln Met Pro Gly Met Lys Pro Gly Pro Asp Ser
            180                 185                 190
Val Gly Ile Phe Ala Ile Ser Gln Arg Cys Asn Gly Val Ala Ala Arg
        195                 200                 205
Ala Cys Gly Leu Val Ser Leu Glu Pro Met Lys Ile Ala Glu Ile Leu
    210                 215                 220
Lys Asp Arg Pro Ser Trp Phe Arg Asp Cys Arg Ser Leu Glu Val Phe
225                 230                 235                 240
Thr Met Phe Pro Ala Gly Asn Gly Gly Thr Ile Glu Leu Val Tyr Met
                245                 250                 255
Gln Thr Tyr Ala Pro Thr Thr Leu Ala Pro Ala Arg Asp Phe Trp Thr
            260                 265                 270
Leu Arg Tyr Thr Thr Ser Leu Asp Asn Gly Ser Phe Val Val Cys Glu
        275                 280                 285
Arg Ser Leu Ser Gly Ser Gly Ala Gly Pro Asn Ala Ala Ser Ala Ser
    290                 295                 300
Gln Phe Val Arg Ala Glu Met Leu Ser Ser Gly Tyr Leu Ile Arg Pro
305                 310                 315                 320
Cys Asp Gly Gly Gly Ser Ile Ile His Ile Val Asp His Leu Asn Leu
                325                 330                 335
Glu Ala Trp Ser Val Pro Asp Val Leu Arg Pro Leu Tyr Glu Ser Ser
            340                 345                 350
Lys Val Val Ala Gln Lys Met Thr Ile Ser Ala Leu Arg Tyr Ile Arg
        355                 360                 365
Gln Leu Ala Gln Glu Ser Asn Gly Glu Val Val Tyr Gly Leu Gly Arg
    370                 375                 380
Gln Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu Ser Arg Gly Phe
385                 390                 395                 400
Asn Asp Ala Val Asn Gly Phe Gly Asp Asp Gly Trp Ser Thr Met His
                405                 410                 415
Cys Asp Gly Ala Glu Asp Ile Ile Val Ala Ile Asn Ser Thr Lys His
            420                 425                 430
Leu Asn Asn Ile Ser Asn Ser Leu Ser Phe Leu Gly Gly Val Leu Cys
        435                 440                 445
Ala Lys Ala Ser Met Leu Leu Gln Asn Val Pro Pro Ala Val Leu Ile
    450                 455                 460
Arg Phe Leu Arg Glu His Arg Ser Glu Trp Ala Asp Phe Asn Val Asp
465                 470                 475                 480
Ala Tyr Ser Ala Ala Thr Leu Lys Ala Gly Ser Phe Ala Tyr Pro Gly
                485                 490                 495
Met Arg Pro Thr Arg Phe Thr Gly Ser Gln Ile Ile Met Pro Leu Gly
            500                 505                 510
His Thr Ile Glu His Glu Glu Met Leu Glu Val Val Arg Leu Glu Gly
        515                 520                 525
His Ser Leu Ala Gln Glu Asp Ala Phe Met Ser Arg Asp Val His Leu
    530                 535                 540
Leu Gln Ile Cys Thr Gly Ile Asp Glu Asn Ala Val Gly Ala Cys Ser
545                 550                 555                 560
Glu Leu Ile Phe Ala Pro Ile Asn Glu Met Phe Pro Asp Asp Ala Pro
                565                 570                 575
Leu Val Pro Ser Gly Phe Arg Val Ile Pro Val Asp Ala Lys Thr Gly
            580                 585                 590
Asp Val Gln Asp Leu Leu Thr Ala Asn His Arg Thr Leu Asp Leu Thr
        595                 600                 605
Ser Ser Leu Glu Val Gly Pro Ser Pro Glu Asn Ala Ser Gly Asn Ser
    610                 615                 620
Phe Ser Ser Ser Ser Ser Arg Cys Ile Leu Thr Ile Ala Phe Gln Phe
625                 630                 635                 640
Pro Phe Glu Asn Asn Leu Gln Glu Asn Val Ala Gly Met Ala Cys Gln
                645                 650                 655
Tyr Val Arg Ser Val Ile Ser Ser Val Gln Arg Val Ala Met Ala Ile
            660                 665                 670
Ser Pro Ser Gly Ile Ser Pro Ser Leu Gly Ser Lys Leu Ser Pro Gly
        675                 680                 685
Ser Pro Glu Ala Val Thr Leu Ala Gln Trp Ile Ser Gln Ser Tyr Ser
    690                 695                 700
His His Leu Gly Ser Glu Leu Leu Thr Ile Asp Ser Leu Gly Ser Asp
705                 710                 715                 720
Asp Ser Val Leu Lys Leu Leu Trp Asp His Gln Asp Ala Ile Leu Cys
                725                 730                 735
Cys Ser Leu Lys Pro Gln Pro Val Phe Met Phe Ala Asn Gln Ala Gly
            740                 745                 750
Leu Asp Met Leu Glu Thr Thr Leu Val Ala Leu Gln Asp Ile Thr Leu
        755                 760                 765
Glu Lys Ile Phe Asp Glu Ser Gly Arg Lys Ala Ile Cys Ser Asp Phe
    770                 775                 780
Ala Lys Leu Met Gln Gln Gly Phe Ala Cys Leu Pro Ser Gly Ile Cys
785                 790                 795                 800
Val Ser Thr Met Gly Arg His Val Ser Tyr Glu Gln Ala Val Ala Trp
                805                 810                 815
Lys Val Phe Ala Ala Ser Glu Glu Asn Asn Asn Asn Leu His Cys Leu
            820                 825                 830
Ala Phe Ser Phe Val Asn Trp Ser Phe Val
        835                 840
<210>204
<211>2700
<212>DNA
<213>玉蜀黍
<400>204
gagagctaag agcaacaagg cgacgagatt tgtgtggcta cgattttgcg ttgccgacgg    60
aacatgggaa caatggttgc agcggtggcg ttgcgagggg gaagcagcga tagcggagga   120
tttgataagg ttcccgggat ggactcggga aaatacgtgc gctacacccc ggagcaagtt   180
gaggtgctcg agcggctcta catagattgc cccaagccaa gctcctcacg gcggcagcaa   240
ctgctgcgcg agtgtcctat actctccaac attgagccaa agcagatcaa ggtctggttc   300
cagaaccgga ggtgccgcga taagcagcgg aaggagtctt cgcggcttca ggctgtgaac   360
agaaagttga cggcaatgaa caagcttcta atggaagaga atgagcggct tcagaagcaa   420
gtctctcagt tggttcatga aaacgcgcac atgcggcagc agctgcagaa tacttcattg   480
gccaatgaca caagctgtga atcaaatgtc actacccctc caaaccctat aagggacgca   540
agtaaccctt ctggactcct tgcgattgca gaggagacct tcacagagtt cctctcaaag   600
gctactggga cagctattga ttgggtccag atgcctggga tgaagcctgg tccggattca   660
gttggtatcg tggccatttc gcatggttgc cgtggcgttg ctgcccgcgc ctgtggtttg   720
gtgaatctag aaccaacaaa aggcatagag atcttgaaag atcgtccctc ttggttccgt   780
gattgccgaa gtcttgaagt gtttacaagg tttccagctg gaaatggggg aacaattgaa   840
cttatttaca tgcagatgta tgccccaaca actttagtcc ctgcacgtga tttttggaca   900
ctacgataca cgacaacaat ggaagatggc agccttgtgg tctgtgagag atccttgagt   960
ggttctggtg gtggtccaaa tgcagcctct acacaacaat ttgttagggc tgagatgctt  1020
ccaagtgggt atttagttcg cccatgcgaa ggtggaggat caattgtgca tatagtggac  1080
catctagatc tcgaagcatg gagtgttcct gaagtgcttc gaccactgta tgagtcttct  1140
agagttgttg ctcagaaaat gactactgtg gcactgcgcc accttagaca aattgctcaa  1200
gaaacaagtg gagaagtagt gtacgccttg ggaaggcaac ctgcagtcct acggaccttt  1260
agtcaaagac taagcagggg gtttaatgat gccattagcg gtttcaatga tgatggctgg  1320
tctgtaatgg ggggagatgg cattgaagac gttgttattg cttgcaactc aaccaagaaa  1380
attaggaata ccagcaatgc tgggattaca tttggagccc caggaggcat tatttgtgcg  1440
aaggcatcca tgttactgca gagcgtccca ccggcagtac tggtacgatt tctgagggag  1500
catagatctg aatgggctga ttacaatatt gatgcgtatt tggcttcatc attgaagacc  1560
agtgcgtgct cacttcctgg gttgcgaccc atgagatttt ctgaggggca gatgatcatg  1620
ccacttgctc acacagttga gaacgaggag attcttgaag ttgtccgcct tgaaggtcag  1680
cctcttactc atgatgaagc tcttctttca agggacatcc accttctcca gctttgcact  1740
ggaatagatg agaaatctgt gggttcctcc ttccagcttg tgtttgcacc aattgatgag  1800
catttcccag atgatgctcc attgatttct tctggctttc gtgtcatacc acttgatgtg  1860
aaaacagatg gtgtatcctc tggtaggacg ctagatttgg catctagtct tgatgtgggc  1920
tctgctgcac cccaagcctc aggggatgca tctccagatg actgcagttt gagatctgtg  1980
ctgacaatcg cctttcaatt cccgtatgag atgcaccttc aggacagcgt tgcagcaatg  2040
gcccgtcaat atgttcgtag tgtcatttct gctgtgcaaa gagtgtcgat ggctatatct  2100
ccctcccaat ctggtctaaa tgctgggcat aggatgcttt ctggcttccc tgaagctgcc  2160
acacttgcta gatgggtttg ccagagttat cactaccatc taggtatgga attacttaat  2220
caatcagatg gagctggtga agcattgttg aaaatgctct ggcatcatcc agatgctgtt  2280
ctgtgctgct cctttaagga gaaacctatg tttacgtttg caaacaaggc agggctggac  2340
atgttagaaa catctcttgt tgccctgcaa gacctgacgc tagacaagat cttcgacgag  2400
tcaggaagga aagcactatt ctcagacatc tcgaaactaa tggaacaggg ctacgcgtac  2460
ctgccgtcag gcgtgtgcat gtcaggaatg ggccgccatg tttctttcga ccaagctgta  2520
gcgtggaagg tgctcggcga ggatagcaac atccactgcc tggcgttctg cttcgtcaac  2580
tggtccttcg tgtgactgac gcccaacccg tcgggtggtt atggcgagct gacccttttt  2640
tgtatggaaa atcatcagct gtgacaaaag gcatatgttg catgcactag ttgaagaaac  2700
<210>205
<211>843
<212>PRT
<213>玉蜀黍
<400>205
Met Gly Thr Met Val Ala Ala Val Ala Leu Arg Gly Gly Ser Ser Asp
1               5                   10                  15
Ser Gly Gly Phe Asp Lys Val Pro Gly Met Asp Ser Gly Lys Tyr Val
            20                  25                  30
Arg Tyr Thr Pro Glu Gln Val Glu Val Leu Glu Arg Leu Tyr Ile Asp
        35                  40                  45
Cys Pro Lys Pro Ser Ser Ser Arg Arg Gln Gln Leu Leu Arg Glu Cys
    50                  55                  60
Pro Ile Leu Ser Asn Ile Glu Pro Lys Gln Ile Lys Val Trp Phe Gln
65                  70                  75                  80
Asn Arg Arg Cys Arg Asp Lys Gln Arg Lys Glu Ser Ser Arg Leu Gln
                85                  90                  95
Ala Val Asn Arg Lys Leu Thr Ala Met Asn Lys Leu Leu Met Glu Glu
            100                 105                 110
Asn Glu Arg Leu Gln Lys Gln Val Ser Gln Leu Val His Glu Asn Ala
        115                 120                 125
His Met Arg Gln Gln Leu Gln Asn Thr Ser Leu Ala Asn Asp Thr Ser
    130                 135                 140
Cys Glu Ser Asn Val Thr Thr Pro Pro Asn Pro Ile Arg Asp Ala Ser
145                 150                 155                 160
Asn Pro Ser Gly Leu Leu Ala Ile Ala Glu Glu Thr Phe Thr Glu Phe
                165                 170                 175
Leu Ser Lys Ala Thr Gly Thr Ala Ile Asp Trp Val Gln Met Pro Gly
            180                 185                 190
Met Lys Pro Gly Pro Asp Ser Val Gly Ile Val Ala Ile Ser His Gly
        195                 200                 205
Cys Arg Gly Val Ala Ala Arg Ala Cys Gly Leu Val Asn Leu Glu Pro
    210                 215                 220
Thr Lys Gly Ile Glu Ile Leu Lys Asp Arg Pro Ser Trp Phe Arg Asp
225                 230                 235                 240
Cys Arg Ser Leu Glu Val Phe Thr Arg Phe Pro Ala Gly Asn Gly Gly
                245                 250                 255
Thr Ile Glu Leu Ile Tyr Met Gln Met Tyr Ala Pro Thr Thr Leu Val
            260                 265                 270
Pro Ala Arg Asp Phe Trp Thr Leu Arg Tyr Thr Thr Thr Met Glu Asp
        275                 280                 285
Gly Ser Leu Val Val Cys Glu Arg Ser Leu Ser Gly Ser Gly Gly Gly
    290                 295                 300
Pro Asn Ala Ala Ser Thr Gln Gln Phe Val Arg Ala Glu Met Leu Pro
305                 310                 315                 320
Ser Gly Tyr Leu Val Arg Pro Cys Glu Gly Gly Gly Ser Ile Val His
                325                 330                 335
Ile Val Asp His Leu Asp Leu Glu Ala Trp Ser Val Pro Glu Val Leu
            340                 345                 350
Arg Pro Leu Tyr Glu Ser Ser Arg Val Val Ala Gln Lys Met Thr Thr
        355                 360                 365
Val Ala Leu Arg His Leu Arg Gln Ile Ala Gln Glu Thr Ser Gly Glu
    370                 375                 380
Val Val Tyr Ala Leu Gly Arg Gln Pro Ala Val Leu Arg Thr Phe Ser
385                 390                 395                 400
Gln Arg Leu Ser Arg Gly Phe Asn Asp Ala Ile Ser Gly Phe Asn Asp
                405                 410                 415
Asp Gly Trp Ser Val Met Gly Gly Asp Gly Ile Glu Asp Val Val Ile
            420                 425                 430
Ala Cys Asn Ser Thr Lys Lys Ile Arg Asn Thr Ser Asn Ala Gly Ile
        435                 440                 445
Thr Phe Gly Ala Pro Gly Gly Ile Ile Cys Ala Lys Ala Ser Met Leu
    450                 455                 460
Leu Gln Ser Val Pro Pro Ala Val Leu Val Arg Phe Leu Arg Glu His
465                 470                 475                 480
Arg Ser Glu Trp Ala Asp Tyr Asn Ile Asp Ala Tyr Leu Ala Ser Ser
                485                 490                 495
Leu Lys Thr Ser Ala Cys Ser Leu Pro Gly Leu Arg Pro Met Arg Phe
            500                 505                 510
Ser Glu Gly Gln Met Ile Met Pro Leu Ala His Thr Val Glu Asn Glu
        515                 520                 525
Glu Ile Leu Glu Val Val Arg Leu Glu Gly Gln Pro Leu Thr His Asp
    530                 535                 540
Glu Ala Leu Leu Ser Arg Asp Ile His Leu Leu Gln Leu Cys Thr Gly
545                 550                 555                 560
Ile Asp Glu Lys Ser Val Gly Ser Ser Phe Gln Leu Val Phe Ala Pro
                565                 570                 575
Ile Asp Glu His Phe Pro Asp Asp Ala Pro Leu Ile Ser Ser Gly Phe
            580                 585                 590
Arg Val Ile Pro Leu Asp Val Lys Thr Asp Gly Val Ser Ser Gly Arg
        595                 600                 605
Thr Leu Asp Leu Ala Ser Ser Leu Asp Val Gly Ser Ala Ala Pro Gln
    610                 615                 620
Ala Ser Gly Asp Ala Ser Pro Asp Asp Cys Ser Leu Arg Ser Val Leu
625                 630                 635                 640
Thr Ile Ala Phe Gln Phe Pro Tyr Glu Met His Leu Gln Asp Ser Val
                645                 650                 655
Ala Ala Met Ala Arg Gln Tyr Val Arg Ser Val Ile Ser Ala Val Gln
            660                 665                 670
Arg Val Ser Met Ala Ile Ser Pro Ser Gln Ser Gly Leu Asn Ala Gly
        675                 680                 685
His Arg Met Leu Ser Gly Phe Pro Glu Ala Ala Thr Leu Ala Arg Trp
    690                 695                 700
Val Cys Gln Ser Tyr His Tyr His Leu Gly Met Glu Leu Leu Asn Gln
705                 710                 715                 720
Ser Asp Gly Ala Gly Glu Ala Leu Leu Lys Met Leu Trp His His Pro
                725                 730                 735
Asp Ala Val Leu Cys Cys Ser Phe Lys Glu Lys Pro Met Phe Thr Phe
            740                 745                 750
Ala Asn Lys Ala Gly Leu Asp Met Leu Glu Thr Ser Leu Val Ala Leu
        755                 760                 765
Gln Asp Leu Thr Leu Asp Lys Ile Phe Asp Glu Ser Gly Arg Lys Ala
    770                 775                 780
Leu Phe Ser Asp Ile Ser Lys Leu Met Glu Gln Gly Tyr Ala Tyr Leu
785                 790                 795                 800
Pro Ser Gly Val Cys Met Ser Gly Met Gly Arg His Val Ser Phe Asp
                805                 810                 815
Gln Ala Val Ala Trp Lys Val Leu Gly Glu Asp Ser Asn Ile His Cys
            820                 825                 830
Leu Ala Phe Cys Phe Val Asn Trp Ser Phe Val
        835                 840
<210>206
<211>2669
<212>DNA
<213>毛果杨(Populus trichocarpa)
<400>206
ctgtgtttga ttatttattt tgtggtggaa atggccatgg aagtggcccc tctgcaccga    60
gagagcagca gtagtgggag cataaacaag caccttactg atgatgggaa gtatgttcgg   120
tacacagcag agcaagtgga ggctcttgaa agagtttatg cggagtgccc taagcccagc   180
tctttgcgta ggcaacaatt gattagagag tgccccattt tagctaatat tgagccgaag   240
cagatcaaag tctggtttca aaatcgcagg tgtagagaga agcagagaaa agagtcctca   300
agactccaga ctgtgaacag gaaattgaca gcaatgaata agctgttgat ggaggagaat   360
gatcgccttc aaaaacaggt gtcccagctg gtgtgcgaaa atggtttcat gcggcaacaa   420
ctgcaaactg caccaacagc aactgatgca agctgtgact ctgtggttgc cactccacaa   480
cattcactaa gagatgccaa taaccctgct ggactcctct caatagctga ggagaccttg   540
tcagagttcc ttgcaaaggc cacaggaact gctcttgagt gggtccagat gcctggaatg   600
aagcctggtc cggattcgat tgggattttt tccatttcac aaaggtgcgg tggagtggca   660
gcaagagcct gcggtcttgt aagtttagag cctaaaaaga ttgcagagat ccttaaagat   720
cgttcatctt ggttccgtga ttgtcggaac cttgaagttt tcactatgtt tcctgctgga   780
aatggtggaa caattgaact agtgtacagt cagatatatg ctccaactac tcttgctcca   840
gcacgggata tgtggactct gagatacact acaagtttag agaatggcag ccttgtggtc   900
tgtgagagat cactttctgg ttatggtgct ggccccgatg cagctgccgc tgcccagttt   960
gtgagggctg aaatgcttcc tagtggctat ttgataaggc catgtgaagg agggtcaatt  1020
atccacatcg tggatcacct gaatcttcag gcatggagtg tgcctgaggt gcttcgacca  1080
ctttatgaat catcaaaagc agtggcacag aaaatgacca ttgcggcact gcgttatgtc  1140
aggcaagtag ctcatgaaac cagtggtgag gtggtgtatg gtttgggcag gcaaccagct  1200
gttctgagaa cctttaacca aagattaagc agaggtttca atgatgccat caatgggttt  1260
aatgatgatg gctggtcact gatgaatgcg gatggagctg aggatgtaat aattgcagtt  1320
aactcaacca agaatttgat tggtgctaat aattctgctc attctctttc gttcttggga  1380
gggattcttt gtgcgaaagc ttccatgcta ctgcaaaatg tgcatcctgc tgtgctggtc  1440
tgtttcctaa gggagcatca cgctgagtgg gctgatttca gtgttgatgc ctattctgct  1500
gcattgtgga aggctggttc atatgcatat ccaggaatga ggcccatgag gtttactggg  1560
agccaaatca ccatgccact gggccacaca attgaacaag aagacttgct tgaagttatt  1620
cgacttgaag gccattcttt tgcacaagaa gatgcttttg tttcacagga catccatctc  1680
ctacagatat gtagtggaat tgatgagaat gctgttggag cctgttctga actagttttt  1740
gctccaattg atgaaacgtt tccagatgat gctccactgc taccttctgg tttccgcatc  1800
atttctctgg aatcaaaagc aaaggataca caggaggtat tgactacaaa ttgtactctg  1860
gatctaacat caagtcttga agcggggctg gcaataaacc acactgcagt ggatggctca  1920
tcgtgtcata gtttgcgatc agtgttgact attgccttcc agttcccttt tgagagcaat  1980
ctacaggata atgttgccac catggcacgt cagtacgtac gtagtgtgat ttcatctgtc  2040
cagagggttg ccatggccat atctccatca ggattgagtc cagttttggg accaaagcta  2100
tctgcaggat ctcctgaagc tctaaccttg gctcactgga tctgccaaag tcacaggcaa  2160
gttctgctta agttttcatc atgttaccat ttaggagcag aattactgag atctgattct  2220
gtgggtggag attctgtcct gaaacatcta tggcatcatc cagatgcaat tttatgttgt  2280
tcattgaagt cgctgccagt tttcatcttt gccaatcagg cagggcttga catgctggag  2340
acaactctag tggctctaca agatattaca ctggataaga tattcaatga atctggacgc  2400
caggcattgt atacagaatt tgcaaagtta atgcaacagg gatttgcatg cttgcctgct  2460
ggaatctgca tgtcaacaat ggggcgtaat gtttcatatg agcaagctgt tgcttggaaa  2520
gtgctatctg cagaagagaa cgctgttcat tgcattgctt tctcttttgt aaactggtct  2580
tttttgtgaa ctccacagtt catttatcca actatgcagt cgaatacgag aacaacggta  2640
tggtagagat ttttgaaaat gaaaagaga                                    2669
<210>207
<211>852
<212>PRT
<213>毛果杨
<400>207
Met Ala Met Glu Val Ala Pro Leu His Arg Glu Ser Ser Ser Ser Gly
1               5                   10                  15
Ser Ile Asn Lys His Leu Thr Asp Asp Gly Lys Tyr Val Arg Tyr Thr
            20                  25                  30
Ala Glu Gln Val Glu Ala Leu Glu Arg Val Tyr Ala Glu Cys Pro Lys
         35                  40                  45
Pro Ser Ser Leu Arg Arg Gln Gln Leu Ile Arg Glu Cys Pro Ile Leu
    50                  55                  60
Ala Asn Ile Glu Pro Lys Gln Ile Lys Val Trp Phe Gln Asn Arg Arg
65                  70                  75                  80
Cys Arg Glu Lys Gln Arg Lys Glu Ser Ser Arg Leu Gln Thr Val Asn
                85                  90                  95
Arg Lys Leu Thr Ala Met Asn Lys Leu Leu Met Glu Glu Asn Asp Arg
            100                 105                 110
Leu Gln Lys Gln Val Ser Gln Leu Val Cys Glu Asn Gly Phe Met Arg
        115                 120                 125
Gln Gln Leu Gln Thr Ala Pro Thr Ala Thr Asp Ala Ser Cys Asp Ser
    130                 135                 140
Val Val Ala Thr Pro Gln His Ser Leu Arg Asp Ala Asn Asn Pro Ala
145                 150                 155                 160
Gly Leu Leu Ser Ile Ala Glu Glu Thr Leu Ser Glu Phe Leu Ala Lys
                165                 170                 175
Ala Thr Gly Thr Ala Leu Glu Trp Val Gln Met Pro Gly Met Lys Pro
            180                 185                 190
Gly Pro Asp Ser Ile Gly Ile Phe Ser Ile Ser Gln Arg Cys Gly Gly
        195                 200                 205
Val Ala Ala Arg Ala Cys Gly Leu Val Ser Leu Glu Pro Lys Lys Ile
    210                 215                 220
Ala Glu Ile Leu Lys Asp Arg Ser Ser Trp Phe Arg Asp Cys Arg Asn
225                 230                 235                 240
Leu Glu Val Phe Thr Met Phe Pro Ala Gly Asn Gly Gly Thr Ile Glu
                245                 250                 255
Leu Val Tyr Ser Gln Ile Tyr Ala Pro Thr Thr Leu Ala Pro Ala Arg
            260                 265                 270
Asp Met Trp Thr Leu Arg Tyr Thr Thr Ser Leu Glu Asn Gly Ser Leu
        275                 280                 285
Val Val Cys Glu Arg Ser Leu Ser Gly Tyr Gly Ala Gly Pro Asp Ala
    290                 295                 300
Ala Ala Ala Ala Gln Phe Val Arg Ala Glu Met Leu Pro Ser Gly Tyr
305                 310                 315                 320
Leu Ile Arg Pro Cys Glu Gly Gly Ser Ile Ile His Ile Val Asp His
                325                 330                 335
Leu Asn Leu Gln Ala Trp Ser Val Pro Glu Val Leu Arg Pro Leu Tyr
            340                 345                 350
Glu Ser Ser Lys Ala Val Ala Gln Lys Met Thr Ile Ala Ala Leu Arg
        355                 360                 365
Tyr Val Arg Gln Val Ala His Glu Thr Ser Gly Glu Val Val Tyr Gly
    370                 375                 380
Leu Gly Arg Gln Pro Ala Val Leu Arg Thr Phe Asn Gln Arg Leu Ser
385                 390                 395                 400
Arg Gly Phe Asn Asp Ala Ile Asn Gly Phe Asn Asp Asp Gly Trp Ser
                405                 410                 415
Leu Met Asn Ala Asp Gly Ala Glu Asp Val Ile Ile Ala Val Asn Ser
            420                 425                 430
Thr Lys Asn Leu Ile Gly Ala Asn Asn Ser Ala His Ser Leu Ser Phe
        435                 440                 445
Leu Gly Gly Ile Leu Cys Ala Lys Ala Ser Met Leu Leu Gln Asn Val
    450                 455                 460
His Pro Ala Val Leu Val Cys Phe Leu Arg Glu His His Ala Glu Trp
465                 470                 475                 480
Ala Asp Phe Ser Val Asp Ala Tyr Ser Ala Ala Leu Trp Lys Ala Gly
                485                 490                 495
Ser Tyr Ala Tyr Pro Gly Met Arg Pro Met Arg Phe Thr Gly Ser Gln
            500                 505                 510
Ile Thr Met Pro Leu Gly His Thr Ile Glu Gln Glu Asp Leu Leu Glu
        515                 520                 525
Val Ile Arg Leu Glu Gly His Ser Phe Ala Gln Glu Asp Ala Phe Val
    530                 535                 540
Ser Gln Asp Ile His Leu Leu Gln Ile Cys Ser Gly Ile Asp Glu Asn
545                 550                 555                 560
Ala Val Gly Ala Cys Ser Glu Leu Val Phe Ala Pro Ile Asp Glu Thr
                565                 570                 575
Phe Pro Asp Asp Ala Pro Leu Leu Pro Ser Gly Phe Arg Ile Ile Ser
            580                 585                 590
Leu Glu Ser Lys Ala Lys Asp Thr Gln Glu Val Leu Thr Thr Asn Cys
        595                 600                 605
Thr Leu Asp Leu Thr Ser Ser Leu Glu Ala Gly Leu Ala Ile Asn His
    610                 615                 620
Thr Ala Val Asp Gly Ser Ser Cys His Ser Leu Arg Ser Val Leu Thr
625                 630                 635                 640
Ile Ala Phe Gln Phe Pro Phe Glu Ser Asn Leu Gln Asp Asn Val Ala
                645                 650                 655
Thr Met Ala Arg Gln Tyr Val Arg Ser Val Ile Ser Ser Val Gln Arg
            660                 665                 670
Val Ala Met Ala Ile Ser Pro Ser Gly Leu Ser Pro Val Leu Gly Pro
        675                 680                 685
Lys Leu Ser Ala Gly Ser Pro Glu Ala Leu Thr Leu Ala His Trp Ile
    690                 695                 700
Cys Gln Ser His Arg Gln Val Leu Leu Lys Phe Ser Ser Cys Tyr His
705                 710                 715                 720
Leu Gly Ala Glu Leu Leu Arg Ser Asp Ser Val Gly Gly Asp Ser Val
                725                 730                 735
Leu Lys His Leu Trp His His Pro Asp Ala Ile Leu Cys Cys Ser Leu
            740                 745                 750
Lys Ser Leu Pro Val Phe Ile Phe Ala Asn Gln Ala Gly Leu Asp Met
        755                 760                 765
Leu Glu Thr Thr Leu Val Ala Leu Gln Asp Ile Thr Leu Asp Lys Ile
    770                 775                 780
Phe Asn Glu Ser Gly Arg Gln Ala Leu Tyr Thr Glu Phe Ala Lys Leu
785                 790                 795                 800
Met Gln Gln Gly Phe Ala Cys Leu Pro Ala Gly Ile Cys Met Ser Thr
                805                 810                 815
Met Gly Arg Asn Val Ser Tyr Glu Gln Ala Val Ala Trp Lys Val Leu
            820                 825                 830
Ser Ala Glu Glu Asn Ala Val His Cys Ile Ala Phe Ser Phe Val Asn
       835                 840                  845
Trp Ser Phe Leu
    850
<210>208
<211>2634
<212>DNA
<213>蒺藜苜蓿
<400>208
agggtgtgat tgtttaagtt aatttgagat taggaagatg gctatggctg ttgcacaaca     60
acaaagagat aacagcattg agagacacct tgattcgtct ggcaaatatg tgaggtacac    120
tgctgaacag attgaagctt tggaaaaggt ttatgtggaa tgccctaagc ctagttcatt    180
gagaaggcaa cagctgattc gggagtgccc ggttctggcc aacattgagc ctaagcagat    240
caaggtttgg tttcagaata ggaggtgtag ggagaagcag agaaaagagg cttctcagct    300
tcagagtgtg aacaggaaac tttctgcgat gaataagctg ttgatggagg aaaatgagag    360
gctgcagaag caggtttcac agctggtgaa tgagaatgga tttatgcgcc agcaactaca    420
ccctacccca gcagctccaa atgctgacgg tagtggcgtt gattccgcgg ctgctgctcc    480
tatgaactca ttgagagatg ctaatagccc tgctggattc ctatcaattg cggaggagac    540
attgacagag ttcctttcaa aggctacagg aactgctgtc gattgggtcc agatgcctgg    600
gatgaagcct ggtccggatt cggttgggat atttgccatt tctcaaggtg gcaacggagt    660
ggcagctcga gcctgtggtc ttgttagttt agaacctact aagattgtgg agatattaaa    720
agatcgccca acttggtacc gtgattgtcg gagttcagaa gttttcacaa tgttcccagc    780
tggaaatgga ggaacaattg aacttgttta cacacagaca tatgctccaa tgacactggc    840
ttctgctcgc gacttctgga ctctaagata cactacaaat ttggaaaacg gaagtgttgt   900
ggtttgtgaa aggtcactgt ctggtactgg tgctggccct aatgctgcag ccgcctcaca   960
gtttgagagg gctgaaatgc tccctagtgg ctatttgatt cgaccatgtg aaggtggagg  1020
atcgatcatc cacattgtag accacctaaa cctgcaggca tggagtgtgc cagaagtgct  1080
gcggccgatc tatgaatcgt cgcaaatggt agctcagaga ctgacaattg cggcacttcg  1140
ctatatcagg caagtagctc aagaaacaag tggtgacgtg gtgtatagca tgggtcggca  1200
acctgcagtt cttagaactt ttagccaacg gttgagcaga ggtttcaatg acgctgtcaa  1260
tggattcaat gataatggtt ggtctgttct gaactgtgat ggtgctgagg gtgttactat  1320
ttcagtaaat tcaatcaaga atttgagtgg cacttctaat ccagcaagtt ccctttcact  1380
ccttggagga attgtctgtg caaaagcttc tatgttactc caaaacacca ctcctgctgt  1440
tttagttcgc tttctgaggg agcatcgctc ggagtgggct gattttagtg ttgatgcctt  1500
ttctgctgca tcacttaaag ctggctccta tggctatcct ggaatgaggt ctacaaagtt  1560
caccggcaat caagcaatca tgcctcttgg acatacaatt gaacatgaag agatgctaga  1620
aattatccgc cttgaaggtc ttgctcaaga tgattctttt gtttctaggg atgttcatct  1680
cttacaggtg cttcctctga cccttgttat gttatgtact ggaattgatg agaatgctgt  1740
gggggcttgt tccgagctca tatttgctcc aattgatgac atgttcccag aagatgctcc  1800
cttagtgcct tctggtttcc gcattgtcct gttgaattct caaccaggtg atacaaagaa  1860
cacaacaaca gcaaatcgaa ccttggattt gacatctggt cttgaagtaa gcccggcaac  1920
agctcatgct aacggagacg catcgtgtcc taacaatcga tgtgtgttga ctgttgcctt  1980
tcagtttcct tttgagagcg gtctgcagga taatgttgca gccatggcac gtcaatatgt  2040
ccggcgtgta gtttctgccg tgcaggcggt tgcaacggct atatctccat ccagtgttaa  2100
cacttctggt ggagcaaagc tctcccctgg cactccagaa gcacttacac tagctcaatg  2160
gatctgccag agttatagtc atcatctggg cgcgcaactg ctgagatctg attctcttat  2220
tggtgatatg ctactgaaac atttgtggca tcatccagat gctattttat gctgctcttt  2280
gaagcaagtg cccgtattca tctttgctaa ccaggctggc cttgacatgt tggaaacaac  2340
tctagtggct ctacaagata tcacactgga caaaatattt gatgagtctg cacgcaagaa  2400
tttgattgca tattttgcga agttaatgca gcaggggttt gcttgtatgc cagctgggat  2460
ctgcatgtca acaatggggc gacatgcttc atatgatcaa gccgtcgcgt ggaaagtgca  2520
tgctgaagac aacagtgttc attgcttggc tttctcattc attaattggt catttatatg  2580
acctattgct ggatttaaac ccccactttt ttttcccact tgttgaatac aaaa        2634
<210>209
<211>847
<212>PRT
<213>蒺藜苜蓿
<400>209
Met Ala Met Ala Val Ala Gln Gln Gln Arg Asp Asn Ser Ile Glu Arg
1               5                   10                  15
His Leu Asp Ser Ser Gly Lys Tyr Val Arg Tyr Thr Ala Glu Gln Ile
            20                  25                  30
Glu Ala Leu Glu Lys Val Tyr Val Glu Cys Pro Lys Pro Ser Ser Leu
        35                  40                  45
Arg Arg Gln Gln Leu Ile Arg Glu Cys Pro Val Leu Ala Asn Ile Glu
    50                  55                  60
Pro Lys Gln Ile Lys Val Trp Phe Gln Asn Arg Arg Cys Arg Glu Lys
65                  70                  75                  80
Gln Arg Lys Glu Ala Ser Gln Leu Gln Ser Val Asn Arg Lys Leu Ser
                85                  90                  95
Ala Met Asn Lys Leu Leu Met Glu Glu Asn Glu Arg Leu Gln Lys Gln
            100                 105                 110
Val Ser Gln Leu Val Asn Glu Asn Gly Phe Met Arg Gln Gln Leu His
        115                 120                 125
Pro Thr Pro Ala Ala Pro Asn Ala Asp Gly Ser Gly Val Asp Ser Ala
    130                 135                 140
Ala Ala Ala Pro Met Asn Ser Leu Arg Asp Ala Asn Ser Pro Ala Gly
145                 150                 155                 160
Phe Leu Ser Ile Ala Glu Glu Thr Leu Thr Glu Phe Leu Ser Lys Ala
                165                 170                 175
Thr Gly Thr Ala Val Asp Trp Val Gln Met Pro Gly Met Lys Pro Gly
            180                 185                 190
Pro Asp Ser Val Gly Ile Phe Ala Ile Ser Gln Gly Gly Asn Gly Val
        195                 200                 205
Ala Ala Arg Ala Cys Gly Leu Val Ser Leu Glu Pro Thr Lys Ile Val
    210                 215                 220
Glu Ile Leu Lys Asp Arg Pro Thr Trp Tyr Arg Asp Cys Arg Ser Ser
225                 230                 235                 240
Glu Val Phe Thr Met Phe Pro Ala Gly Asn Gly Gly Thr Ile Glu Leu
                245                 250                 255
Val Tyr Thr Gln Thr Tyr Ala Pro Met Thr Leu Ala Ser Ala Arg Asp
            260                 265                 270
Phe Trp Thr Leu Arg Tyr Thr Thr Asn Leu Glu Asn Gly Ser Val Val
        275                 280                 285
Val Cys Glu Arg Ser Leu Ser Gly Thr Gly Ala Gly Pro Asn Ala Ala
    290                 295                 300
Ala Ala Ser Gln Phe Glu Arg Ala Glu Met Leu Pro Ser Gly Tyr Leu
305                 310                 315                 320
Ile Arg Pro Cys Glu Gly Gly Gly Ser Ile Ile His Ile Val Asp His
                325                 330                 335
Leu Asn Leu Gln Ala Trp Ser Val Pro Glu Val Leu Arg Pro Ile Tyr
            340                 345                 350
Glu Ser Ser Gln Met Val Ala Gln Arg Leu Thr Ile Ala Ala Leu Arg
        355                 360                 365
Tyr Ile Arg Gln Val Ala Gln Glu Thr Ser Gly Asp Val Val Tyr Ser
    370                 375                 380
Met Gly Arg Gln Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu Ser
385                 390                 395                 400
Arg Gly Phe Asn Asp Ala Val Asn Gly Phe Asn Asp Asn Gly Trp Ser
                405                 410                 415
Val Leu Asn Cys Asp Gly Ala Glu Gly Val Thr Ile Ser Val Asn Ser
            420                 425                 430
Ile Lys Asn Leu Ser Gly Thr Ser Asn Pro Ala Ser Ser Leu Ser Leu
        435                 440                 445
Leu Gly Gly Ile Val Cys Ala Lys Ala Ser Met Leu Leu Gln Asn Thr
    450                 455                 460
Thr Pro Ala Val Leu Val Arg Phe Leu Arg Glu His Arg Ser Glu Trp
465                 470                 475                 480
Ala Asp Phe Ser Val Asp Ala Phe Ser Ala Ala Ser Leu Lys Ala Gly
                485                 490                 495
Ser Tyr Gly Tyr Pro Gly Met Arg Ser Thr Lys Phe Thr Gly Asn Gln
            500                 505                 510
Ala Ile Met Pro Leu Gly His Thr Ile Glu His Glu Glu Met Leu Glu
        515                 520                 525
Ile Ile Arg Leu Glu Gly Leu Ala Gln Asp Asp Ser Phe Val Ser Arg
    530                 535                 540
Asp Val His Leu Leu Gln Val Leu Pro Leu Thr Leu Val Met Leu Cys
545                 550                 555                 560
Thr Gly Ile Asp Glu Asn Ala Val Gly Ala Cys Ser Glu Leu Ile Phe
                565                 570                 575
Ala Pro Ile Asp Asp Met Phe Pro Glu Asp Ala Pro Leu Val Pro Ser
            580                 585                 590
Gly Phe Arg Ile Val Leu Leu Asn Ser Gln Pro Gly Asp Thr Lys Asn
        595                 600                 605
Thr Thr Thr Ala Asn Arg Thr Leu Asp Leu Thr Ser Gly Leu Glu Val
    610                 615                 620
Ser Pro Ala Thr Ala His Ala Asn Gly Asp Ala Ser Cys Pro Asn Asn
625                 630                 635                 640
Arg Cys Val Leu Thr Val Ala Phe Gln Phe Pro Phe Glu Ser Gly Leu
                645                 650                 655
Gln Asp Asn Val Ala Ala Met Ala Arg Gln Tyr Val Arg Arg Val Val
            660                 665                 670
Ser Ala Val Gln Ala Val Ala Thr Ala Ile Ser Pro Ser Ser Val Asn
        675                 680                 685
Thr Ser Gly Gly Ala Lys Leu Ser Pro Gly Thr Pro Glu Ala Leu Thr
    690                 695                 700
Leu Ala Gln Trp Ile Cys Gln Ser Tyr Ser His His Leu Gly Ala Gln
705                 710                 715                 720
Leu Leu Arg Ser Asp Ser Leu Ile Gly Asp Met Leu Leu Lys His Leu
                725                 730                 735
Trp His His Pro Asp Ala Ile Leu Cys Cys Ser Leu Lys Gln Val Pro
            740                 745                 750
Val Phe Ile Phe Ala Asn Gln Ala Gly Leu Asp Met Leu Glu Thr Thr
        755                 760                 765
Leu Val Ala Leu Gln Asp Ile Thr Leu Asp Lys Ile Phe Asp Glu Ser
    770                 775                 780
Ala Arg Lys Asn Leu Ile Ala Tyr Phe Ala Lys Leu Met Gln Gln Gly
785                 790                 795                 800
Phe Ala Cys Met Pro Ala Gly Ile Cys Met Ser Thr Met Gly Arg His
                805                 810                 815
Ala Ser Tyr Asp Gln Ala Val Ala Trp Lys Val His Ala Glu Asp Asn
            820                 825                 830
Ser Val His Cys Leu Ala Phe Ser Phe Ile Asn Trp Ser Phe Ile
        835                 840                 845
<210>210
<211>2211
<212>DNA
<213>甘蔗
<220>
<221>misc_feature
<222>(926)..(926)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(944)..(944)
<223>n是a、c、g或t
<400>210
gattcggttg gtatcgtggc catttcgcat ggttgccgtg gtgttgctgc ccgcgcctgt      60
ggtttggtga atctagaacc aacaagagtc atagagatct tgaaagatcg tccctcttgg     120
ttccgtgatt gtcgaagtct tgaagtgttt acaatgtttc cagctggaaa tgggggaaca     180
gttgaactta tctacatgca gatgtatgcc ccaacaactt tagtccctgc acgtgatttt     240
tggacgttac gatacacgac aacaatggaa gatggtagcc ttgtggtctg tgagagatcc     300
ttgagtggtt ctggaggcgg tccaaatgca gcctctgcac agcaatttgt tagggctgaa     360
atgcttccaa gtgggtattt agttcgccca tgcgaaggtg gaggttcgat tgtgcatata     420
gtggaccatc tagatctcga ggcatggagt gttcctgaag tgcttcgacc gctgtatgag     480
tcttccagag tagttgctca gaaaatgact acggtggcac tgcgccacct tagacaaatt     540
gctcaagaaa caagtggaga agtagtgtac gccttgggaa ggcaacctgc agtactacgg     600
acctttagtc aaagactaag caggggtttt aatgatgcca ttagtggttt caatgatgat     660
ggctggtctg taatgggggg agatggcatt gaagacgttg ctgttgcttg cacctcaacc     720
aagaaaatta ggaataacag caatgcgggg attacatttg gagcccctgg aggcattatt     780
tgtgcgaagg catccatgtt actgcagagt gtcccaccgg cagtactggt ccgatttctg     840
agggagcata gatctgaatg ggctgattac aatattgatg cgtatttggc ttcatcactg     900
aagaccagtg catgctcact tccggngttg caacctatga gatnttctgg ggggcagatg     960
atcatgccac ttgctcacac agtggagaat gaggagattc ttgaagttat ccgccttgaa    1020
ggacatcctc ttactcatga tgaagctctt ctttcaagag acatccacct tctccagctt    1080
tgcactggaa tagatgagaa atctgtgggt tcctccttcc agcttgtgtt tgcaccaatt    1140
gatgagcact ttccagatga tgctccattg atttcttctg gctttcgtgt cataccactt    1200
gatatgaaaa cagatggtgt atcctctggc aggacgctag atttggcatc tagtcttgat    1260
gtgggttctg ctgcacccca agcctcaggg gatgcatctc cagatgactg taatttgaga    1320
tctgtgctga caatcgcctt tcaattccct tacgagatgc accttcagga cagtgttgca    1380
actatggctc gtcaatatgt tcgtagtgtt gtttctgctg tgcaaagagt gtcgatggct    1440
atatctccct cccaatctgg tctaaatgct cagaggacac tttctggctt ccctgaaact    1500
gccacacttg ctagatgggt ttgccagagt tatcactacc atctaggcgt ggaattactt    1560
aatcaatcag atgaagctgg cgaagcattg ttgaaaatgc tctggcatca tccagacgct    1620
gttctgtgct gctcttttaa ggagaaacct atgtttacgt ttgcaaacaa ggcagggctt    1680
gacatgttag aaacatctct tattgccctg caagacctga cactagacaa gattttcgac    1740
gagtcaggaa ggaaagcaat attctcagat atctcaaaac taatggaaca gggctacgca    1800
tacctgccgt caggtgtgtg catgtcagga atgggtcgcc atgtttcttt cgaccaagct    1860
gtggcgtgga aggtgctcgg tgaggacagc aacgtgcact gcctggcttt ctgcttcgtc    1920
aactggtcct tcgtgtaacg cccacccatc cgatggggtg gcgagcctgt cggtctgtgt    1980
gatgagccag cccaattttg tatgatgatc ctgataagga aatcattgac ccgggcaaaa    2040
tgcttatggt gcatgcacta ttttgaggcc ctgaaatccc gggttttatt aaaaaaactg    2100
gagaattttc ccaggttttt tcccactttt cgttggcccc cccacccaca gggtgtttgt    2160
acaatttctt tggcgagggg caccccactc ctgcagtttt tttttccata c             2211
<210>211
<211>645
<212>PRT
<213>甘蔗
<220>
<221>不确定
<222>(309)..(309)
<223>Xaa可以是任意天然产生的氨基酸
<220>
<221>不确定
<222>(315)..(315)
<223>Xaa可以是任意天然产生的氨基酸
<400>211
Asp Ser Val Gly Ile Val Ala Ile Ser His Gly Cys Arg Gly Val Ala
1               5                   10                  15
Ala Arg Ala Cys Gly Leu Val Asn Leu Glu Pro Thr Arg Val Ile Glu
            20                  25                  30
Ile Leu Lys Asp Arg Pro Ser Trp Phe Arg Asp Cys Arg Ser Leu Glu
        35                  40                  45
Val Phe Thr Met Phe Pro Ala Gly Asn Gly Gly Thr Val Glu Leu Ile
    50                  55                  60
Tyr Met Gln Met Tyr Ala Pro Thr Thr Leu Val Pro Ala Arg Asp Phe
65                  70                  75                  80
Trp Thr Leu Arg Tyr Thr Thr Thr Met Glu Asp Gly Ser Leu Val Val
                85                  90                  95
Cys Glu Arg Ser Leu Ser Gly Ser Gly Gly Gly Pro Asn Ala Ala Ser
            100                 105                 110
Ala Gln Gln Phe Val Arg Ala Glu Met Leu Pro Ser Gly Tyr Leu Val
        115                 120                 125
Arg Pro Cys Glu Gly Gly Gly Ser Ile Val His Ile Val Asp His Leu
    130                 135                 140
Asp Leu Glu Ala Trp Ser Val Pro Glu Val Leu Arg Pro Leu Tyr Glu
145                 150                 155                 160
Ser Ser Arg Val Val Ala Gln Lys Met Thr Thr Val Ala Leu Arg His
                165                 170                 175
Leu Arg Gln Ile Ala Gln Glu Thr Ser Gly Glu Val Val Tyr Ala Leu
            180                 185                 190
Gly Arg Gln Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu Ser Arg
        195                 200                 205
Gly Phe Asn Asp Ala Ile Ser Gly Phe Asn Asp Asp Gly Trp Ser Val
    210                 215                 220
Met Gly Gly Asp Gly Ile Glu Asp Val Ala Val Ala Cys Thr Ser Thr
225                 230                 235                 240
Lys Lys Ile Arg Asn Asn Ser Asn Ala Gly Ile Thr Phe Gly Ala Pro
                245                 250                 255
Gly Gly Ile Ile Cys Ala Lys Ala Ser Met Leu Leu Gln Ser Val Pro
            260                 265                 270
Pro Ala Val Leu Val Arg Phe Leu Arg Glu His Arg Ser Glu Trp Ala
        275                 280                 285
Asp Tyr Asn Ile Asp Ala Tyr Leu Ala Ser Ser Leu Lys Thr Ser Ala
    290                 295                 300
Cys Ser Leu Pro Xaa Leu Gln Pro Met Arg Xaa Ser Gly Gly Gln Met
305                 310                 315                 320
Ile Met Pro Leu Ala His Thr Val Glu Asn Glu Glu Ile Leu Glu Val
                325                 330                 335
Ile Arg Leu Glu Gly His Pro Leu Thr His Asp Glu Ala Leu Leu Ser
            340                 345                 350
Arg Asp Ile His Leu Leu Gln Leu Cys Thr Gly Ile Asp Glu Lys Ser
        355                 360                 365
Val Gly Ser Ser Phe Gln Leu Val Phe Ala Pro Ile Asp Glu His Phe
    370                 375                 380
Pro Asp Asp Ala Pro Leu Ile Ser Ser Gly Phe Arg Val Ile Pro Leu
385                 390                 395                 400
Asp Met Lys Thr Asp Gly Val Ser Ser Gly Arg Thr Leu Asp Leu Ala
                405                 410                 415
Ser Ser Leu Asp Val Gly Ser Ala Ala Pro Gln Ala Ser Gly Asp Ala
            420                 425                 430
Ser Pro Asp Asp Cys Asn Leu Arg Ser Val Leu Thr Ile Ala Phe Gln
        435                 440                 445
Phe Pro Tyr Glu Met His Leu Gln Asp Ser Val Ala Thr Met Ala Arg
    450                 455                 460
Gln Tyr Val Arg Ser Val Val Ser Ala Val Gln Arg Val Ser Met Ala
465                 470                 475                 480
Ile Ser Pro Ser Gln Ser Gly Leu Asn Ala Gln Arg Thr Leu Ser Gly
                485                 490                 495
Phe Pro Glu Thr Ala Thr Leu Ala Arg Trp Val Cys Gln Ser Tyr His
            500                 505                 510
Tyr His Leu Gly Val Glu Leu Leu Asn Gln Ser Asp Glu Ala Gly Glu
        515                 520                 525
Ala Leu Leu Lys Met Leu Trp His His Pro Asp Ala Val Leu Cys Cys
    530                 535                 540
Ser Phe Lys Glu Lys Pro Met Phe Thr Phe Ala Asn Lys Ala Gly Leu
545                 550                 555                 560
Asp Met Leu Glu Thr Ser Leu Ile Ala Leu Gln Asp Leu Thr Leu Asp
                565                 570                 575
Lys Ile Phe Asp Glu Ser Gly Arg Lys Ala Ile Phe Ser Asp Ile Ser
            580                 585                 590
Lys Leu Met Glu Gln Gly Tyr Ala Tyr Leu Pro Ser Gly Val Cys Met
        595                 600                 605
Ser Gly Met Gly Arg His Val Ser Phe Asp Gln Ala Val Ala Trp Lys
    610                 615                 620
Val Leu Gly Glu Asp Ser Asn Val His Cys Leu Ala Phe Cys Phe Val
625                 630                 635                 640
Asn Trp Ser Phe Val
                645
<210>212
<211>2076
<212>DNA
<213>普通小麦
<400>212
agggtattgt tgccgtttca catggttgcc gaggtgtcgc tgcccgtgcc tgtggtctgg     60
tgaatctaca accaacaaag attgtggaga tcttgaaaga ccgcccatct tggttccgtg    120
attgtcggag tcttgaattt tttacgatgc ttccagctgg aaacggcggg accattgaac   180
tcgtttacat gcagatgtat gctcctacca ctttagttcc tgcacgtgat ttttggacgc   240
tgagatacac aactacaatg gaagatggaa gtctcgtggt ttgtgagaga tctttgagtg   300
gttcaggagg tggtccaagt actgcctcag cacagcaatt tgtaagggct gagatgcttc   360
ctagtggcta tttagttcgg ccatgcgacg gtgggggttc aattgtgcat atagtggatc   420
atctggacct tgaggcttgg agtgttccag aagtgcttcg cccgctctat gagtcttcta   480
gggtagttgc tcagaaaatg actactgcgg cattacgaca catcagacag attgctcaag   540
aaactagtgg ggaggttgta tatgctctag ggaggcaacc tgctgttctg cggacattta   600
gtcagaggct gagtagagga tttaatgatg ctataagtgg cttcaatgat gatggttggt   660
ctgtaatggc tggagacggc attgaagatg tgattattgc ttgcaactca aaaaagatta   720
gaagcaataa cactgctccc aatgcgttta tagctcctgg aggtgttata tgtgctaaag   780
catcaatgtt actgcagagt gttccaccag cagtactggt tcggtttctg agggaacatc   840
ggtctgaatg ggctgattat aactttgatg catattcggc ttcagcgctg aaatcaagct   900
catgctcact tcctgggttg cgtcccatga gattttctgg gagccagatc atcatgccac   960
ttgctcacac agtggagaat gaggagattc tagaagttgt tcgtcttgaa gggcaagcgc  1020
tcgatgaggg tcttttatca agagatatcc acctgcttca gttttgcact ggactagacg  1080
agaaatcaat gggatcctgc ttccaacttg tctttgcacc aattgatgag cttttccctg  1140
atgatgctcc attaatatct tcaggctttc gtgttatacc actggacatg aaaacagatg  1200
gtgcacccgc cggtagaaca ctagatttgg cctctagcct tgaagctggt tcaactacac  1260
tgcaagcctc aggcggtgcg gatgattgta atctacgatc agtgctgaca attgcctttc  1320
aattccctta cgagatgcat ctccaagata gtgttgcaac tatggcccgg cagtatgtcc  1380
gcagcattgt ctccgccgtt cagagagtgt cgatggctat ctctccctct cgatctggct  1440
tgaatgctga acagaagata atttctggct tccctgaagc tgcaacacta gctcgctgga  1500
tatgccaaag ttaccggttc catctggggg tcgagttatt tagacaggca gatgaagctg  1560
gggaatcttt attgagaatg ctctgggatc atgaagatgc tattttgtgc tgttctttca  1620
aggaaaagcc tgtatttacg tttgcaaacg agatgggaat taacatgttg gaaacatctt  1680
tcgttgccct tcaagatctc tcgttggaca agatatttga tgaagctggt agaaaggcac  1740
tatactccga gatcccaaag ttgatggagc agggctttgt ttacctgcca gggggtgtgt  1800
gcttgtctgg gatgggccgc catgtctcat ttgagagtgc tgtagcatgg aaagtagttg  1860
gtgaggacaa caatgtgcac tgcctcgcct tctgcttcgt caactggtct ttcgtgtgat  1920
catccatcac ccttgcctgt cccatgcagc tccatttttg ctctctctgt aggggagaac  1980
cgccgccact ggaaagtagt tttacgttat ctttaactag tttgtttcta gatttgaaga  2040
gccagcatcg ggaagaattc tgcctagtga aaattg                            2076
<210>213
<211>638
<212>PRT
<213>普通小麦
<400>213
Gly Ile Val Ala Val Ser His Gly Cys Arg Gly Val Ala Ala Arg Ala
1               5                   10                  15
Cys Gly Leu Val Asn Leu Gln Pro Thr Lys Ile Val Glu Ile Leu Lys
            20                  25                  30
Asp Arg Pro Ser Trp Phe Arg Asp Cys Arg Ser Leu Glu Phe Phe Thr
        35                  40                  45
Met Leu Pro Ala Gly Asn Gly Gly Thr Ile Glu Leu Val Tyr Met Gln
    50                  55                  60
Met Tyr Ala Pro Thr Thr Leu Val Pro Ala Arg Asp Phe Trp Thr Leu
65                  70                  75                  80
Arg Tyr Thr Thr Thr Met Glu Asp Gly Ser Leu Val Val Cys Glu Arg
                85                  90                  95
Ser Leu Ser Gly Ser Gly Gly Gly Pro Ser Thr Ala Ser Ala Gln Gln
            100                 105                 110
Phe Val Arg Ala Glu Met Leu Pro Ser Gly Tyr Leu Val Arg Pro Cys
        115                 120                 125
Asp Gly Gly Gly Ser Ile Val His Ile Val Asp His Leu Asp Leu Glu
    130                 135                 140
Ala Trp Ser Val Pro Glu Val Leu Arg Pro Leu Tyr Glu Ser Ser Arg
145                 150                 155                 160
Val Val Ala Gln Lys Met Thr Thr Ala Ala Leu Arg His Ile Arg Gln
                165                 170                 175
Ile Ala Gln Glu Thr Ser Gly Glu Val Val Tyr Ala Leu Gly Arg Gln
            180                 185                 190
Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu Ser Arg Gly Phe Asn
        195                 200                 205
Asp Ala Ile Ser Gly Phe Asn Asp Asp Gly Trp Ser Val Met Ala Gly
    210                 215                 220
Asp Gly Ile Glu Asp Val Ile Ile Ala Cys Asn Ser Lys Lys Ile Arg
225                 230                 235                 240
Ser Asn Asn Thr Ala Pro Asn Ala Phe Ile Ala Pro Gly Gly Val Ile
                245                 250                 255
Cys Ala Lys Ala Ser Met Leu Leu Gln Ser Val Pro Pro Ala Val Leu
            260                 265                 270
Val Arg Phe Leu Arg Glu His Arg Ser Glu Trp Ala Asp Tyr Asn Phe
        275                 280                 285
Asp Ala Tyr Ser Ala Ser Ala Leu Lys Ser Ser Ser Cys Ser Leu Pro
    290                 295                 300
Gly Leu Arg Pro Met Arg Phe Ser Gly Ser Gln Ile Ile Met Pro Leu
305                 310                 315                 320
Ala His Thr Val Glu Asn Glu Glu Ile Leu Glu Val Val Arg Leu Glu
                325                 330                 335
Gly Gln Ala Leu Asp Glu Gly Leu Leu Ser Arg Asp Ile His Leu Leu
            340                 345                 350
Gln Phe Cys Thr Gly Leu Asp Glu Lys Ser Met Gly Ser Cys Phe Gln
        355                 360                 365
Leu Val Phe Ala Pro Ile Asp Glu Leu Phe Pro Asp Asp Ala Pro Leu
    370                 375                 380
Ile Ser Ser Gly Phe Arg Val Ile Pro Leu Asp Met Lys Thr Asp Gly
385                 390                 395                 400
Ala Pro Ala Gly Arg Thr Leu Asp Leu Ala Ser Ser Leu Glu Ala Gly
                405                 410                 415
Ser Thr Thr Leu Gln Ala Ser Gly Gly Ala Asp Asp Cys Asn Leu Arg
            420                 425                 430
Ser Val Leu Thr Ile Ala Phe Gln Phe Pro Tyr Glu Met His Leu Gln
        435                 440                 445
Asp Ser Val Ala Thr Met Ala Arg Gln Tyr Val Arg Ser Ile Val Ser
    450                 455                 460
Ala Val Gln Arg Val Ser Met Ala Ile Ser Pro Ser Arg Ser Gly Leu
465                 470                 475                 480
Asn Ala Glu Gln Lys Ile Ile Ser Gly Phe Pro Glu Ala Ala Thr Leu
                485                 490                 495
Ala Arg Trp Ile Cys Gln Ser Tyr Arg Phe His Leu Gly Val Glu Leu
            500                 505                 510
Phe Arg Gln Ala Asp Glu Ala Gly Glu Ser Leu Leu Arg Met Leu Trp
        515                 520                 525
Asp His Glu Asp Ala Ile Leu Cys Cys Ser Phe Lys Glu Lys Pro Val
    530                 535                 540
Phe Thr Phe Ala Asn Glu Met Gly Ile Asn Met Leu Glu Thr Ser Phe
545                 550                 555                 560
Val Ala Leu Gln Asp Leu Ser Leu Asp Lys Ile Phe Asp Glu Ala Gly
                565                 570                 575
Arg Lys Ala Leu Tyr Ser Glu Ile Pro Lys Leu Met Glu Gln Gly Phe
            580                 585                 590
Val Tyr Leu Pro Gly Gly Val Cys Leu Ser Gly Met Gly Arg His Val
        595                 600                 605
Ser Phe Glu Ser Ala Val Ala Trp Lys Val Val Gly Glu Asp Asn Asn
    610                 615                 620
Val His Cys Leu Ala Phe Cys Phe Val Asn Trp Ser Phe Val
625                 630                 635
<210>214
<211>1554
<212>DNA
<213>大麦
<400>214
gcgctgggga ggcagcctgc tgttctgcgg acatttagtc agaggctgag tagaggattt    60
aatgatgcta taagtggctt caatgatgat ggttggtctg taatggccgg agatggcatt   120
gaagatgtga ttatcgcttg caactcaaag aagattagga gcaataacac tgctcccaat   180
gcttttatag ctcctggagg tgttatatgt gctaaagcat caatgttact gcagagtgtt   240
ccaccagcag tactggttcg atttctaagg gaacatcggt ctgaatgggc tgattataac   300
tttgatgcat attcggcttc agcgctgaaa tcaagttcat gctcacttcc tgggttgcgc   360
cctatgagat tttctgggag ccagatcatc atgccacttg ctcacacggt ggagaatgag   420
gagattctag aagttgttcg tcttgaaggg caagcgctcg atgagggtct tttatcaaga   480
gatatccacc tgcttcagtt ttgcactgga atagacgaga aatcaatggg gtcctgcttc   540
caacttgtct ttgccccaat tgatgagctt ttccctgatg atgctccatt aatatcttca   600
ggcttccgtg ttataccact ggacatgaaa acagatggtg cacccaccgg tagaacacta   660
gatttggcct ctagccttga agctggttca actacactgc aagcctcagg caatgcggac   720
gattgtaatc tacgatcagt gctgacaatt gcctttcaat tcccttacga gatgcatctc   780
caagatagtg ttgcaaccat ggcccggcag tatgtccgca gcattgtctc tgccgttcag   840
agagtgtcga tggctatctc tccctctcga tctggtttga atgctgaaca gaagataatt   900
tctggcttcc ctgaagctgc aacacttgct cgctggatat gccaaagcta ccggttccat   960
ctgggggtcg agttatttag acaggcagat gaagctgggg aatctttatt gagaatgctc  1020
tgggatcatg aagatgctat tttgtgctgt tctttcaagg aaaagcctgt atttacgttt  1080
gcaaacgaga tggggattaa catgttggaa acatctttcg ttgcccttca agacctctcg  1140
ttggacaaga tatttgatga agctggtaga aaggcactat actctgagat cccaaagttg  1200
atggagcagg gctttgttta cctgccaggt ggtgtgtgct tgtctgggat gggccgccat  1260
gtctccttcg agaatgctat agcatggaaa gtagtcggtg aggacaacaa tgtgcactgc  1320
cttgccttct gcttcgtcaa ctggtctttc gtgtgatcat cctcccaagg caatccgtgc  1380
ccgtcgcacg cagctccatt tttgctctct ctctctgtag gagagaaccg ctgccgctgg  1440
aaagtagttt catgctatct ttaactagtt tgtttgtaga tttgaagagc cagcatccgg  1500
aagaattctg ccttgtgtaa atctgctcac atttccacta atttacccag gcaa        1554
<210>215
<211>451
<212>PRT
<213>大麦
<400>215
Ala Leu Gly Arg Gln Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu
1               5                   10                  15
Ser Arg Gly Phe Asn Asp Ala Ile Ser Gly Phe Asn Asp Asp Gly Trp
            20                  25                  30
Ser Val Met Ala Gly Asp Gly Ile Glu Asp Val Ile Ile Ala Cys Asn
        35                  40                  45
Ser Lys Lys Ile Arg Ser Asn Asn Thr Ala Pro Asn Ala Phe Ile Ala
    50                  55                  60
Pro Gly Gly Val Ile Cys Ala Lys Ala Ser Met Leu Leu Gln Ser Val
65                  70                  75                  80
Pro Pro Ala Val Leu Val Arg Phe Leu Arg Glu His Arg Ser Glu Trp
                85                  90                  95
Ala Asp Tyr Asn Phe Asp Ala Tyr Ser Ala Ser Ala Leu Lys Ser Ser
            100                 105                 110
Ser Cys Ser Leu Pro Gly Leu Arg Pro Met Arg Phe Ser Gly Ser Gln
        115                 120                 125
Ile Ile Met Pro Leu Ala His Thr Val Glu Asn Glu Glu Ile Leu Glu
    130                 135                 140
Val Val Arg Leu Glu Gly Gln Ala Leu Asp Glu Gly Leu Leu Ser Arg
145                 150                 155                 160
Asp Ile His Leu Leu Gln Phe Cys Thr Gly Ile Asp Glu Lys Ser Met
                165                 170                 175
Gly Ser Cys Phe Gln Leu Val Phe Ala Pro Ile Asp Glu Leu Phe Pro
            180                 185                 190
Asp Asp Ala Pro Leu Ile Ser Ser Gly Phe Arg Val Ile Pro Leu Asp
        195                 200                 205
Met Lys Thr Asp Gly Ala Pro Thr Gly Arg Thr Leu Asp Leu Ala Ser
    210                 215                 220
Ser Leu Glu Ala Gly Ser Thr Thr Leu Gln Ala Ser Gly Asn Ala Asp
225                 230                 235                 240
Asp Cys Asn Leu Arg Ser Val Leu Thr Ile Ala Phe Gln Phe Pro Tyr
                245                 250                 255
Glu Met His Leu Gln Asp Ser Val Ala Thr Met Ala Arg Gln Tyr Val
            260                 265                 270
Arg Ser Ile Val Ser Ala Val Gln Arg Val Ser Met Ala Ile Ser Pro
        275                 280                 285
Ser Arg Ser Gly Leu Asn Ala Glu Gln Lys Ile Ile Ser Gly Phe Pro
    290                 295                 300
Glu Ala Ala Thr Leu Ala Arg Trp Ile Cys Gln Ser Tyr Arg Phe His
305                 310                 315                 320
Leu Gly Val Glu Leu Phe Arg Gln Ala Asp Glu Ala Gly Glu Ser Leu
                325                 330                 335
Leu Arg Met Leu Trp Asp His Glu Asp Ala Ile Leu Cys Cys Ser Phe
            340                 345                 350
Lys Glu Lys Pro Val Phe Thr Phe Ala Asn Glu Met Gly Ile Asn Met
        355                 360                 365
Leu Glu Thr Ser Phe Val Ala Leu Gln Asp Leu Ser Leu Asp Lys Ile
    370                 375                 380
Phe Asp Glu Ala Gly Arg Lys Ala Leu Tyr Ser Glu Ile Pro Lys Leu
385                 390                 395                 400
Met Glu Gln Gly Phe Val Tyr Leu Pro Gly Gly Val Cys Leu Ser Gly
                405                 410                 415
Met Gly Arg His Val Ser Phe Glu Asn Ala Ile Ala Trp Lys Val Val
            420                 425                 430
Gly Glu Asp Asn Asn Val His Cys Leu Ala Phe Cys Phe Val Asn Trp
        435                 440                 445
Ser Phe Val
    450
<210>216
<211>2622
<212>DNA
<213>黄条早竹(Phyllostachys praecox)
<400>216
cggcgggtac gacaaggccg ggatagactc gggcaagtac gtgcgataca cgccggagca    60
ggtggaggcg ctcgagcgga tgtatgctga gtgccccaag cccagctcca cgcgcaggca   120
gcagctgctg cgcgagtgcc cgattctggc caacatcgag cccaagcaga tcaaggtctg   180
gttccagaac cgaaggtgcc gtgataagca gcggaaggag gcttcccggc ttcaggccgt   240
gaacagaaaa ttgaccgcaa tgaacaagct tctcatggaa gagaatgatc gtctccagaa   300
gcaggtttcc cagctggttc atgagaatgc atacatgaag cagcagctgc agaatccatc   360
attggccaat gatacaagct gtgaatcaaa tgtgaccact caaaaccctc tgaaggatgc   420
aagtaaccct tctggactcc tttcaattgc ggaggagacc ttgacagagt tcctctccaa   480
ggctacaggg actgctgttg attgggttca gatgcctggg atgaagcctg gtccggattc   540
ggttggtatt gtggccattt cacatggttg ccgtggtgtt gctgcccgtg cctgtgattt   600
ggtgaatcta gaaccaacaa aagttgtgga gatcttgaaa gaccgtccat cttggttctg   660
tgatcgtcaa agcctggaag tcttcacaat gtttccagct ggaaatggag gaacaattga   720
acttgtctac acgcagttgt atgctccaac aactttagtc cctgcacgtg atttttggac   780
tctaaggtac acaaccacaa tggaagatgg cagccttgtg gtctgtgaga gatccttgag   840
tggttcaggg ggtggtccaa gtgcagcctc tgcacagcaa tttgtaagag ccgaaatgct   900
tccaagtgga tatttagttc gcccatgcga gggtgggggc tcaattgtgc acatagtgga   960
ccatctggac cttgaggctt ggagtgttcc tgaagtgctt cggccgctct acgagtcgtc  1020
tagggtagtt gcccagaaaa tgactacagc ggcactacgg cacatcagac aaattgctca  1080
agaaactagt ggggaggttg tatatgcttt ggggaggcag cctgccgttc tacggacatt  1140
tagtcagagg ttgagtagag gatttaacga tgctataagt ggtttcaatg atgatggttg  1200
gtctgtcatg ggtggagatg gcattgaaga tgtaatcatt gcttgcaact caaagaagat  1260
taggaacaat agcactgctg ccaatgcttt tggagcccct ggaggcgtta tatgtgctaa  1320
ggcatccatg ttactgcaga gtgttccacc agcagtactg gttcggtttc tgagggaaca  1380
tcggtctgaa tgggctgatt ataactttga tgcatattcg gctttagcac tgaagacgag  1440
ctcatgttca cttcctgggt tgcggcctac gagattttct gggagccaga tcatcatgcc  1500
acttgctcac acagtggaga atgaggagat tctagaagtc attcgtcttg aagggcaggc  1560
acttacacat gatgaaggtc ttttatcaag agatatccac ctgcttcagc tttgcactgg  1620
aatagatgag aaatcaatgg gatcctgctt ccagcttgtc tttgcaccca tcgatgagct  1680
tttccctgat gatgccccat tgatatcttc aggctttcgt gttataccac tggacatgaa  1740
aacagatggt gcacctactg gtagaacatt agatttggcc tctagccttg aagttggttc  1800
aactacacaa caagctacag gggatgcatc tttggatgat tgtaggaatc tgcgatcagt  1860
gctgacaatt gcctttcaat tcccttatga aattcatctc caggatagtg ttgcaactat  1920
ggcccggcaa tacgtccgta gcgttgtttc tgctgtgcag agagtgtcga tggctatttc  1980
tccccctcga tctggtgtga atgctgggca gaagatattt tctggcttcc ctgaagccgc  2040
aacacttgct cgctggattt gccaaagcta ccagttccat ttgggagtgg agttacttag  2100
gcaggcagat gaagccgggg aatcattatt gagaatgctc tgggattacg aagatgctat  2160
cttgtgctgt tctttcaagg aaaagcctgt atttactttt gccaacgaga tgggacttaa  2220
catgttagaa acatctctcg ttgctctaca agacctctca ttggacaaga tatttgatga  2280
aactggtaga aaggcactac attcggagat cccaaaattg atggaacagg gctatgttta  2340
cctgccggct ggtgtgtgct tgtccggaat gggccgccat gtctctttcg agcaagctgt  2400
agcatggaaa gtacttggtg aggacaacaa tgtgcactgc ctggccttct gcttcgtcaa  2460
ctggtctttc gtgtgatcca tccgacgcaa tccatgtccg ttgtgagcag caccattttc  2520
gcattctctg tagaagagaa ccatcgtcgc tgttagttaa tgctgtcttt aactagtttc  2580
tagatttgga aaagccagtc tgcaaaaaaa aaaaaaaaaa aa                     2622
<210>217
<211>824
<212>PRT
<213>黄条早竹
<400>217
Gly Gly Tyr Asp Lys Ala Gly Ile Asp Ser Gly Lys Tyr Val Arg Tyr
1               5                   10                  15
Thr Pro Glu Gln Val Glu Ala Leu Glu Arg Met Tyr Ala Glu Cys Pro
            20                  25                  30
Lys Pro Ser Ser Thr Arg Arg Gln Gln Leu Leu Arg Glu Cys Pro Ile
        35                  40                  45
Leu Ala Asn Ile Glu Pro Lys Gln Ile Lys Val Trp Phe Gln Asn Arg
    50                  55                  60
Arg Cys Arg Asp Lys Gln Arg Lys Glu Ala Ser Arg Leu Gln Ala Val
65                  70                  75                  80
Asn Arg Lys Leu Thr Ala Met Asn Lys Leu Leu Met Glu Glu Asn Asp
                85                  90                  95
Arg Leu Gln Lys Gln Val Ser Gln Leu Val His Glu Asn Ala Tyr Met
            100                 105                 110
Lys Gln Gln Leu Gln Asn Pro Ser Leu Ala Asn Asp Thr Ser Cys Glu
        115                 120                 125
Ser Asn Val Thr Thr Gln Asn Pro Leu Lys Asp Ala Ser Asn Pro Ser
    130                 135                 140
Gly Leu Leu Ser Ile Ala Glu Glu Thr Leu Thr Glu Phe Leu Ser Lys
145                 150                 155                 160
Ala Thr Gly Thr Ala Val Asp Trp Val Gln Met Pro Gly Met Lys Pro
                165                 170                 175
Gly Pro Asp Ser Val Gly Ile Val Ala Ile Ser His Gly Cys Arg Gly
            180                 185                 190
Val Ala Ala Arg Ala Cys Asp Leu Val Asn Leu Glu Pro Thr Lys Val
        195                 200                 205
Val Glu Ile Leu Lys Asp Arg Pro Ser Trp Phe Cys Asp Arg Gln Ser
    210                 215                 220
Leu Glu Val Phe Thr Met Phe Pro Ala Gly Asn Gly Gly Thr Ile Glu
225                 230                 235                 240
Leu Val Tyr Thr Gln Leu Tyr Ala Pro Thr Thr Leu Val Pro Ala Arg
                245                 250                 255
Asp Phe Trp Thr Leu Arg Tyr Thr Thr Thr Met Glu Asp Gly Ser Leu
            260                 265                 270
Val Val Cys Glu Arg Ser Leu Ser Gly Ser Gly Gly Gly Pro Ser Ala
        275                 280                 285
Ala Ser Ala Gln Gln Phe Val Arg Ala Glu Met Leu Pro Ser Gly Tyr
    290                 295                 300
Leu Val Arg Pro Cys Glu Gly Gly Gly Ser Ile Val His Ile Val Asp
305                 310                 315                 320
His Leu Asp Leu Glu Ala Trp Ser Val Pro Glu Val Leu Arg Pro Leu
                325                 330                 335
Tyr Glu Ser Ser Arg Val Val Ala Gln Lys Met Thr Thr Ala Ala Leu
            340                 345                 350
Arg His Ile Arg Gln Ile Ala Gln Glu Thr Ser Gly Glu Val Val Tyr
        355                 360                 365
Ala Leu Gly Arg Gln Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu
    370                 375                 380
Ser Arg Gly Phe Asn Asp Ala Ile Ser Gly Phe Asn Asp Asp Gly Trp
385                 390                 395                 400
Ser Val Met Gly Gly Asp Gly Ile Glu Asp Val Ile Ile Ala Cys Asn
                405                 410                 415
Ser Lys Lys Ile Arg Asn Asn Ser Thr Ala Ala Asn Ala Phe Gly Ala
            420                 425                 430
Pro Gly Gly Val Ile Cys Ala Lys Ala Ser Met Leu Leu Gln Ser Val
        435                 440                 445
Pro Pro Ala Val Leu Val Arg Phe Leu Arg Glu His Arg Ser Glu Trp
    450                 455                 460
Ala Asp Tyr Asn Phe Asp Ala Tyr Ser Ala Leu Ala Leu Lys Thr Ser
465                 470                 475                 480
Ser Cys Ser Leu Pro Gly Leu Arg Pro Thr Arg Phe Ser Gly Ser Gln
                485                 490                 495
Ile Ile Met Pro Leu Ala His Thr Val Glu Asn Glu Glu Ile Leu Glu
            500                 505                 510
Val Ile Arg Leu Glu Gly Gln Ala Leu Thr His Asp Glu Gly Leu Leu
        515                 520                 525
Ser Arg Asp Ile His Leu Leu Gln Leu Cys Thr Gly Ile Asp Glu Lys
    530                 535                 540
Ser Met Gly Ser Cys Phe Gln Leu Val Phe Ala Pro Ile Asp Glu Leu
545                 550                 555                 560
Phe Pro Asp Asp Ala Pro Leu Ile Ser Ser Gly Phe Arg Val Ile Pro
                565                 570                 575
Leu Asp Met Lys Thr Asp Gly Ala Pro Thr Gly Arg Thr Leu Asp Leu
            580                 585                 590
Ala Ser Ser Leu Glu Val Gly Ser Thr Thr Gln Gln Ala Thr Gly Asp
        595                 600                 605
Ala Ser Leu Asp Asp Cys Arg Asn Leu Arg Ser Val Leu Thr Ile Ala
    610                 615                 620
Phe Gln Phe Pro Tyr Glu Ile His Leu Gln Asp Ser Val Ala Thr Met
625                 630                 635                 640
Ala Arg Gln Tyr Val Arg Ser Val Val Ser Ala Val Gln Arg Val Ser
                645                 650                 655
Met Ala Ile Ser Pro Pro Arg Ser Gly Val Asn Ala Gly Gln Lys Ile
            660                 665                 670
Phe Ser Gly Phe Pro Glu Ala Ala Thr Leu Ala Arg Trp Ile Cys Gln
        675                 680                 685
Ser Tyr Gln Phe His Leu Gly Val Glu Leu Leu Arg Gln Ala Asp Glu
    690                 695                 700
Ala Gly Glu Ser Leu Leu Arg Met Leu Trp Asp Tyr Glu Asp Ala Ile
705                 710                 715                 720
Leu Cys Cys Ser Phe Lys Glu Lys Pro Val Phe Thr Phe Ala Asn Glu
                725                 730                 735
Met Gly Leu Asn Met Leu Glu Thr Ser Leu Val Ala Leu Gln Asp Leu
            740                 745                 750
Ser Leu Asp Lys Ile Phe Asp Glu Thr Gly Arg Lys Ala Leu His Ser
        755                 760                 765
Glu Ile Pro Lys Leu Met Glu Gln Gly Tyr Val Tyr Leu Pro Ala Gly
    770                 775                 780
Val Cys Leu Ser Gly Met Gly Arg His Val Ser Phe Glu Gln Ala Val
785                 790                 795                 800
Ala Trp Lys Val Leu Gly Glu Asp Asn Asn Val His Cys Leu Ala Phe
                805                 810                 815
Cys Phe Val Asn Trp Ser Phe Val
            820
<210>218
<211>2193
<212>DNA
<213>稻
<400>218
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct     60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact    120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt    180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc    240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata    300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga    360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt    420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat    480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag    540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt    600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc    660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat    720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa    780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca    840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag   900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa   960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata  1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag  1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc  1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg  1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg  1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat  1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc  1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt  1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag  1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg  1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat  1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc  1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca  1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta  1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga  1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg  1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac  1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta  2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga  2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct  2160
tggtgtagct tgccactttc accagcaaag ttc                               2193
<210>219
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物:prm03263
<400>219
ggggacaagt ttgtacaaaa aagcaggctt gtgctaaggc atccatgcta c             51
<210>220
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物:prm03264
<400>220
ggggaccact ttgtacaaga aagctgggtg caccttccat gctacagctt g             51
<210>221
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm01983
<400>221
ggggacaagt ttgtacaaaa aagcaggctt cacaatggcg gcggcggtgg               50
<210>222
<211>54
<212>DNA
<213>人工序列
<220>
<223>引物:prm01984
<400>222
ggggaccact ttgtacaaga aagctgggtg gattttgggt cacacgaagg acca          54
<210>223
<211>1096
<212>DNA
<213>稻
<400>223
tgtgctaagg catccatgct actgcagagt gtccctcctg cagttttggt tcgatttttg    60
agggaacatc gttctgaatg ggcggattat aacttcgatg catattcagc ttcatctctg   120
aagacaagct catgttcact tcctgggttg cggcctatga gattttctgg gagccagatc   180
attatgccac ttgctcacac ggtggagaat gaagagattt tagaagttgt ccgtcttgaa   240
ggacaagcac ttacacatga tgatggtctt atgtctagag atattcacct gcttcagctt   300
tgcactggaa tagatgagaa atcaatggga tcctgcttcc agcttgtctt tgcaccaatc   360
gatgagcttt tccctgatga tgctccgtta atatcttcag gctttcgtgt tataccgctg   420
gacatgaaaa cagatggtac acctgctggt agaacattag atttggcatc tagccttgag   480
gttggttcaa ctgcacagcc cacaggggat gcatctatgg atgactgtaa tctacgatca   540
gtgctgacaa ttgcctttca gttcccttat gaaatgcatc tccaagacag cgttgcaact   600
atggcccggc aatatgtccg cagtattgtt tcctctgttc agagagtatc aatggctgtt   660
tctccttctc ggtctggctt gaatgctggg cagaagataa tttcaggctt ccctgaagcc   720
ccaacgctag ctcgttggat ttgccaaagc taccagttcc atttgggggt ggagttactt   780
aggcaggcag atgatgctgg ggaagcacta ttgaaaatgc tatgggatta cgaagacgct   840
attttgtgct gttctttcaa ggaaaagcct gtatttactt ttgccaacga gatgggacta   900
aacatgctag aaacatctct cgtcgctctc caagatctct cactggacaa gatatttgat   960
gaagccggta ggaaggccct atacaacgag atcccgaaat tgatggaaca gggttacgtg  1020
tacctgcctg gtggagtgtg cttgtccggg atggggcgcc atgtttcttt cgagcaagct  1080
gtagcatgga aggtgc                                                  1096
<210>224
<211>2553
<212>DNA
<213>芜青
<400>224
atggagatgg cggtggcgaa tcaccgagag agaagcagtg atagcatgaa cagacattta    60
gacagcagcg gcaagtacgt caggtacacc gctgagcaag tcgaggccct cgagcgtgtc   120
tacgccgagt gtcccaagcc tagctcgctc cggagacagc agttgatccg tgaatgttct   180
atcttggcca acatcgagcc taagcagatc aaagtctggt tccaaaaccg gaggtgtcga   240
gataagcaga ggaaagaggc gtcgaggctc cagagcgtaa acaggaagct ttcggctatg   300
aacaagctgt tgatggagga gaacgatagg ttgcagaagc aagtttctca gctcgtctgt   360
gaaaatggat acatgaagca gcagcttact actactgttg tgaatgatcc aagctgtgat   420
tctgtggtga caactcctca gcattcgctt agagacgcta atagtcctgc tgggctgctc   480
tcgatcgcag aggagacatt ggcagagttc ctatccaagg ctacaggaac tgctgttgat   540
tgggttcaga tgcctgggat gaagcctggt ccggattcgg ttgggatctt tgctatatcg   600
caaagatgca gtggggtggc agctcgagcc tgtggtcttg ttagtttaga gcctgtcaag   660
attgcagaga tactcaaaga taggccatct tggttccgtg actgtaggag ccttgaagtc   720
ttcactatgt tcccggctgg taacggcggc accattgagc tcgtctatat gcagacatat   780
gcaccaacga ctctggctcc tgcccgcgat ttctggaccc tgagatacac aacgagccta   840
gacaatggca gttttgtggt ttgtgagagg tcactctctg gttctggtgc tggtcctaac   900
gctgcatcag cttctcagtt tgtaagagca gaaatgcttt ctagtgggta tctaataagg   960
ccttgtgatg gtggcggttc cattattcac attgtcgatc accttaatct tgaggcttgg  1020
agtgttcccg atgtgcttcg acccctttac gagtcatcta aagtcgtagc acagaaaatg  1080
accatttcag cattgaggta tatcaggcaa ctagctcaag agtctaatgg tgaattagtg  1140
tatggattag gaagacagcc tgctgtttta agaacattta gccaaagatt aagcaggggt  1200
tttaatgatg cggttaatgg gtttggtgac gacggatggt ctacaatgca ttgtgatggg  1260
gctgaagaca taatcgttgc tattaactct acaaagcatt tgaataatat gtctaattct  1320
ctttccttcc ttggaggtgt cctttgtgcc aaggcttcta tgcttctcca aaatgttcct  1380
cctgcggttt tgatccggtt tctaagagag catcggtccg agtgggctga cttcaatgtt  1440
gatgcatatt ctgctgcaac gcttaaagcc ggttcttttg cttatccggg tatgaggcct  1500
acaaggttca ccgggagcca aatcataatg cctctaggac ataccatcga acacgaagaa  1560
atgcttgaag ttgttagact agaaggtcat tctcttgcac aagaagatgc gttcatgtcc  1620
cgtgatgtcc atcttcttca ggtatgtact gggattgatg agaacgctgt tggagcatgt  1680
tcagaactaa tatttgctcc catcaatgag atgttcccgg atgatgctcc acttgttcct  1740
tctggattca gagtcatacc cgttgatgct aaaacgggag atgcgcaaga tctgttgacc  1800
gctaaccacc ggacgctaga cttgacttct agccttgagg ttggtccaac accagagaac  1860
gcttctggaa actcttcttc tagctcaagc tcaagatgta tcctcaccat cgcgtttcag  1920
ttcccttttg aaaacaactt gcaagacaat gttgctggta tggcttgtca gtacgtgcgg  1980
agcgtgatct catcggttca acgtgttgca atggccatct caccctctgg gataagccca  2040
agtctgggat ccaaactgtc cccggggtct cctgaagctg ttacacttgc ccaatggatc  2100
tcacaaagtt acagtcacca cttaggctcg gagttgctga cggttgactc gcttggaagc  2160
aacgactcgg tattgaaact tctatgggat caccaagatg ccattttgtg ttgctcttta  2220
aagcctcagc cagtgtttat gttcgcgaac caagctggtt tagacatgtt agagacgacg  2280
cttgtagcct tacaagacat tacactcgaa aagatctttg atgaatctgg tcgaaaggct  2340
ctctgctccg atttcgccaa gctaatgcaa cagggatatg catgcttgcc ttcaggaata  2400
tgtttgtcta cgatgggaag acatgtgact tatgaacaag ctgttgcttg gaaagtgttt  2460
gctcctgctg ctgcatcatc cgaaaacaac gatggcaatg ataatacttt gcactgtctt  2520
gctttctcct ttgtaaactg gtcgtttgtg taa                               2553
<210>225
<211>850
<212>PRT
<213>芜青
<400>225
Met Glu Met Ala Val Ala Asn His Arg Glu Arg Ser Ser Asp Ser Met
1               5                   10                  15
Asn Arg His Leu Asp Ser Ser Gly Lys Tyr Val Arg Tyr Thr Ala Glu
            20                  25                  30
Gln Val Glu Ala Leu Glu Arg Val Tyr Ala Glu Cys Pro Lys Pro Ser
        35                  40                  45
Ser Leu Arg Arg Gln Gln Leu Ile Arg Glu Cys Ser Ile Leu Ala Asn
    50                  55                  60
Ile Glu Pro Lys Gln Ile Lys Val Trp Phe Gln Asn Arg Arg Cys Arg
65                  70                  75                  80
Asp Lys Gln Arg Lys Glu Ala Ser Arg Leu Gln Ser Val Asn Arg Lys
                85                  90                  95
Leu Ser Ala Met Asn Lys Leu Leu Met Glu Glu Asn Asp Arg Leu Gln
            100                 105                 110
Lys Gln Val Ser Gln Leu Val Cys Glu Asn Gly Tyr Met Lys Gln Gln
        115                 120                 125
Leu Thr Thr Thr Val Val Asn Asp Pro Ser Cys Asp Ser Val Val Thr
    130                 135                 140
Thr Pro Gln His Ser Leu Arg Asp Ala Asn Ser Pro Ala Gly Leu Leu
145                 150                 155                 160
Ser Ile Ala Glu Glu Thr Leu Ala Glu Phe Leu Ser Lys Ala Thr Gly
                165                 170                 175
Thr Ala Val Asp Trp Val Gln Met Pro Gly Met Lys Pro Gly Pro Asp
            180                 185                 190
Ser Val Gly Ile Phe Ala Ile Ser Gln Arg Cys Ser Gly Val Ala Ala
        195                 200                 205
Arg Ala Cys Gly Leu Val Ser Leu Glu Pro Val Lys Ile Ala Glu Ile
    210                 215                 220
Leu Lys Asp Arg Pro Ser Trp Phe Arg Asp Cys Arg Ser Leu Glu Val
225                 230                 235                 240
Phe Thr Met Phe Pro Ala Gly Asn Gly Gly Thr Ile Glu Leu Val Tyr
                245                 250                 255
Met Gln Thr Tyr Ala Pro Thr Thr Leu Ala Pro Ala Arg Asp Phe Trp
            260                 265                 270
Thr Leu Arg Tyr Thr Thr Ser Leu Asp Asn Gly Ser Phe Val Val Cys
        275                 280                 285
Glu Arg Ser Leu Ser Gly Ser Gly Ala Gly Pro Asn Ala Ala Ser Ala
    290                 295                 300
Ser Gln Phe Val Arg Ala Glu Met Leu Ser Ser Gly Tyr Leu Ile Arg
305                 310                 315                 320
Pro Cys Asp Gly Gly Gly Ser Ile Ile His Ile Val Asp His Leu Asn
                325                 330                 335
Leu Glu Ala Trp Ser Val Pro Asp Val Leu Arg Pro Leu Tyr Glu Ser
            340                 345                 350
Ser Lys Val Val Ala Gln Lys Met Thr Ile Ser Ala Leu Arg Tyr Ile
        355                 360                 365
Arg Gln Leu Ala Gln Glu Ser Asn Gly Glu Leu Val Tyr Gly Leu Gly
    370                 375                 380
Arg Gln Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu Ser Arg Gly
385                 390                 395                 400
Phe Asn Asp Ala Val Asn Gly Phe Gly Asp Asp Gly Trp Ser Thr Met
                405                 410                 415
His Cys Asp Gly Ala Glu Asp Ile Ile Val Ala Ile Asn Ser Thr Lys
            420                 425                 430
His Leu Asn Asn Met Ser Asn Ser Leu Ser Phe Leu Gly Gly Val Leu
        435                 440                 445
Cys Ala Lys Ala Ser Met Leu Leu Gln Asn Val Pro Pro Ala Val Leu
    450                 455                 460
Ile Arg Phe Leu Arg Glu His Arg Ser Glu Trp Ala Asp Phe Asn Val
465                 470                 475                 480
Asp Ala Tyr Ser Ala Ala Thr Leu Lys Ala Gly Ser Phe Ala Tyr Pro
                485                 490                 495
Gly Met Arg Pro Thr Arg Phe Thr Gly Ser Gln Ile Ile Met Pro Leu
            500                 505                 510
Gly His Thr Ile Glu His Glu Glu Met Leu Glu Val Val Arg Leu Glu
        515                 520                 525
Gly His Ser Leu Ala Gln Glu Asp Ala Phe Met Ser Arg Asp Val His
    530                 535                 540
Leu Leu Gln Val Cys Thr Gly Ile Asp Glu Asn Ala Val Gly Ala Cys
545                 550                 555                 560
Ser Glu Leu Ile Phe Ala Pro Ile Asn Glu Met Phe Pro Asp Asp Ala
                565                 570                 575
Pro Leu Val Pro Ser Gly Phe Arg Val Ile Pro Val Asp Ala Lys Thr
            580                 585                 590
Gly Asp Ala Gln Asp Leu Leu Thr Ala Asn His Arg Thr Leu Asp Leu
        595                 600                 605
Thr Ser Ser Leu Glu Val Gly Pro Thr Pro Glu Asn Ala Ser Gly Asn
    610                 615                 620
Ser Ser Ser Ser Ser Ser Ser Arg Cys Ile Leu Thr Ile Ala Phe Gln
625                 630                 635                 640
Phe Pro Phe Glu Asn Asn Leu Gln Asp Asn Val Ala Gly Met Ala Cys
                645                 650                 655
Gln Tyr Val Arg Ser Val Ile Ser Ser Val Gln Arg Val Ala Met Ala
            660                 665                 670
Ile Ser Pro Ser Gly Ile Ser Pro Ser Leu Gly Ser Lys Leu Ser Pro
        675                 680                 685
Gly Ser Pro Glu Ala Val Thr Leu Ala Gln Trp Ile Ser Gln Ser Tyr
    690                 695                 700
Ser His His Leu Gly Ser Glu Leu Leu Thr Val Asp Ser Leu Gly Ser
705                 710                 715                 720
Asn Asp Ser Val Leu Lys Leu Leu Trp Asp His Gln Asp Ala Ile Leu
                725                 730                 735
Cys Cys Ser Leu Lys Pro Gln Pro Val Phe Met Phe Ala Asn Gln Ala
            740                 745                 750
Gly Leu Asp Met Leu Glu Thr Thr Leu Val Ala Leu Gln Asp Ile Thr
        755                 760                 765
Leu Glu Lys Ile Phe Asp Glu Ser Gly Arg Lys Ala Leu Cys Ser Asp
    770                 775                 780
Phe Ala Lys Leu Met Gln Gln Gly Tyr Ala Cys Leu Pro Ser Gly Ile
785                 790                 795                 800
Cys Leu Ser Thr Met Gly Arg His Val Thr Tyr Glu Gln Ala Val Ala
                805                 810                 815
Trp Lys Val Phe Ala Pro Ala Ala Ala Ser Ser Glu Asn Asn Asp Gly
            820                 825                 830
Asn Asp Asn Thr Leu His Cys Leu Ala Phe Ser Phe Val Asn Trp Ser
        835                 840                 845
Phe Val
    850
<210>226
<211>2529
<212>DNA
<213>银杏(Ginkgo biloba)
<400>226
atggcagtaa tagcacagaa agacgttaaa ggtgccatgg atacgagcaa gtatgttcgc    60
tatacttctg aacaagtcga agctcttgaa cgcgtttaca gcgagtgtcc gaagcctagt   120
tctcttcgtc ggcagcagct tattagagag tgtccaatac tttctaatat tgagcccaag   180
caaatcaaag tttggttcca aaatcgcagg tgtcgagaga aacagaggaa ggaggcatca   240
cgccttcaaa ctgttaacag gaagcttacg gcaatgaaca aattgctgat ggaggaaaat   300
gatcgccttc aaaagcaggt ttcacagttg gtgtacgaga acggttatat gagacagcag   360
ctacagaatg catctgtagc aacaacagac acaagttgtg agtctgttgt gactagtggt   420
cagcaccagc ataatccaac acctcagcat cctccaaggg atgctagccc cgctggactc   480
ctgtctatcg cagaggagac cttggcagag ttcctttcaa aggctacagg aactgctgtt   540
gactgggtcc agatgcctgg gatgaagcct ggtccggatt cgattggtat tgtggctatt   600
tcacacagtt gtagtggagt agctgcacga gcttgcggtc ttgtgggttt agaacctaca   660
aagattgcag aaattctcaa agatcgccca tcttggcttc gtgattgccg ttgccttgat   720
gtgttgactc cctttcctac tggaaatgga gggacaattg agcttttata catgcagaca   780
tatgctccca caactttagc ttctgctaga gatttttgga ctctgagata caccacagta   840
ttggaagatg gtagtcttgt ggtttgtgaa aggtccttaa gtggtgccca gggtggtcca   900
agcatagctc ctgcacagca ctttgtaaga gcagaaatgc ttcccagtgg gtatttgata   960
agaccttgtg aaggtggagg ttctattatc catattgttg accatatgga tttggagcca  1020
tggagtgtgc ctgaggtgtt acgtccacta tatgagtcat ctactgtact cgcccaaaag  1080
atgactattg cagccttgcg ccgcatacgc caaatagcac aggaggttac aggtgaagtg  1140
gtctttggtt ggggtaggca gccagctgtt ctgcggacat ttagccagag actgagcagg  1200
ggtttcaatg aggctgtgaa tggcttcaca gatgatggat ggtctttgat gggtaatgat  1260
ggaatggagg acgtgactat tgcaataaat tcatctccaa gcaaactcct aggttctcag  1320
gttaattctt ctaatgggct tacagctgtt ggtgggggta tactgtgtgc aaaggcatcc  1380
atgcttttac agaatgtgcc tccagcatta cttgttcgct tcttgcggga gcatcgatcg  1440
gagtgggcag attgtaacat tgacgcctat tctgcagctg cattaaaggc aagtccttat  1500
agtgtcccag gttcacgagc aggaggcttt tcaggaagtc aagttatcct ccccctggca  1560
cataccgtgg aacatgaaga gttcttggag gtcattaagc tggagggcca tggcctcaca  1620
caggaagaag ctgtgctatc tagggatatg tttctgttgc agctttgcag tggaattgat  1680
gaaaatgcag ctggtgcttg tgcccaactt gtgtttgcac caattgatga atcatttgct  1740
gatgatgctc ctttgttgcc gtctggtttc cgagttattc ctctggactc tagaacagat  1800
ggtactagtg gtcccaatcg gacattggat ctggcttcag ctcttgaggt tggatcagct  1860
ggaactagaa cttctggcga ttctggagcc aactcgttca atctaagatc tgtgttaact  1920
attgcattcc aattcactta tgagaatcat ttgcgagaaa atgtggcatc catggcccgt  1980
caatatgtac gcagtgttgt agcatctgtg cagagggttg ccatggcatt agccccctct  2040
cgactgagtt cacatgtggg gccaaggcta ccacctggca ctccagaagc acttactctt  2100
gctcggtgga tttgtcaaag ctacagattc cacctaggtg tagagctgct tcgcgctgat  2160
tgtgaggcca gtgaatccgt gctgaaacta ctctggcacc attcagatgc aattgtgtgc  2220
tgttctttga agtcgctacc agttttcaca tttgcaaatc aagcaggcct tgacatgctg  2280
gagacaaccc tggttgcctt gcaagatata tcattggaca aaatactcga tgaaaatgga  2340
cgcaaaagtt tatgctcaga ttttgcacaa attatgcaac agggctatgc ttatctgcct  2400
gcggggatat gtgtctctag tatgggcagg cctgtttcat atgaccgggc tgttgcttgg  2460
aaggtcctaa atgatgcaga cagcacccac tgcatggttt tcatgtttat gaattggtct  2520
ttcatgtga                                                          2529
<210>227
<211>842
<212>PRT
<213>银杏
<400>227
Met Ala Val Ile Ala Gln Lys Asp Val Lys Gly Ala Met Asp Thr Ser
1               5                   10                  15
Lys Tyr Val Arg Tyr Thr Ser Glu Gln Val Glu Ala Leu Glu Arg Val
            20                  25                  30
Tyr Ser Glu Cys Pro Lys Pro Ser Ser Leu Arg Arg Gln Gln Leu Ile
        35                  40                  45
Arg Glu Cys Pro Ile Leu Ser Asn Ile Glu Pro Lys Gln Ile Lys Val
    50                  55                  60
Trp Phe Gln Asn Arg Arg Cys Arg Glu Lys Gln Arg Lys Glu Ala Ser
65                  70                  75                  80
Arg Leu Gln Thr Val Asn Arg Lys Leu Thr Ala Met Asn Lys Leu Leu
                85                  90                  95
Met Glu Glu Asn Asp Arg Leu Gln Lys Gln Val Ser Gln Leu Val Tyr
            100                 105                 110
Glu Asn Gly Tyr Met Arg Gln Gln Leu Gln Asn Ala Ser Val Ala Thr
        115                 120                 125
Thr Asp Thr Ser Cys Glu Ser Val Val Thr Ser Gly Gln His Gln His
    130                 135                 140
Asn Pro Thr Pro Gln His Pro Pro Arg Asp Ala Ser Pro Ala Gly Leu
145                 150                 155                 160
Leu Ser Ile Ala Glu Glu Thr Leu Ala Glu Phe Leu Ser Lys Ala Thr
                165                 170                 175
Gly Thr Ala Val Asp Trp Val Gln Met Pro Gly Met Lys Pro Gly Pro
            180                 185                 190
Asp Ser Ile Gly Ile Val Ala Ile Ser His Ser Cys Ser Gly Val Ala
        195                 200                 205
Ala Arg Ala Cys Gly Leu Val Gly Leu Glu Pro Thr Lys Ile Ala Glu
    210                 215                 220
Ile Leu Lys Asp Arg Pro Ser Trp Leu Arg Asp Cys Arg Cys Leu Asp
225                 230                 235                 240
Val Leu Thr Pro Phe Pro Thr Gly Asn Gly Gly Thr Ile Glu Leu Leu
                245                 250                 255
Tyr Met Gln Thr Tyr Ala Pro Thr Thr Leu Ala Ser Ala Arg Asp Phe
            260                 265                 270
Trp Thr Leu Arg Tyr Thr Thr Val Leu Glu Asp Gly Ser Leu Val Val
        275                 280                 285
Cys Glu Arg Ser Leu Ser Gly Ala Gln Gly Gly Pro Ser Ile Ala Pro
    290                 295                 300
Ala Gln His Phe Val Arg Ala Glu Met Leu Pro Ser Gly Tyr Leu Ile
305                 310                 315                 320
Arg Pro Cys Glu Gly Gly Gly Ser Ile Ile His Ile Val Asp His Met
                325                 330                 335
Asp Leu Glu Pro Trp Ser Val Pro Glu Val Leu Arg Pro Leu Tyr Glu
            340                 345                 350
Ser Ser Thr Val Leu Ala Gln Lys Met Thr Ile Ala Ala Leu Arg Arg
        355                 360                 365
Ile Arg Gln Ile Ala Gln Glu Val Thr Gly Glu Val Val Phe Gly Trp
    370                 375                 380
Gly Arg Gln Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu Ser Arg
385                 390                 395                 400
Gly Phe Asn Glu Ala Val Asn Gly Phe Thr Asp Asp Gly Trp Ser Leu
                405                 410                 415
Met Gly Asn Asp Gly Met Glu Asp Val Thr Ile Ala Ile Asn Ser Ser
            420                 425                 430
Pro Ser Lys Leu Leu Gly Ser Gln Val Asn Ser Ser Asn Gly Leu Thr
        435                 440                 445
Ala Val Gly Gly Gly Ile Leu Cys Ala Lys Ala Ser Met Leu Leu Gln
    450                 455                 460
Asn Val Pro Pro Ala Leu Leu Val Arg Phe Leu Arg Glu His Arg Ser
465                 470                 475                 480
Glu Trp Ala Asp Cys Asn Ile Asp Ala Tyr Ser Ala Ala Ala Leu Lys
                485                 490                 495
Ala Ser Pro Tyr Ser Val Pro Gly Ser Arg Ala Gly Gly Phe Ser Gly
            500                 505                 510
Ser Gln Val Ile Leu Pro Leu Ala His Thr Val Glu His Glu Glu Phe
        515                 520                 525
Leu Glu Val Ile Lys Leu Glu Gly His Gly Leu Thr Gln Glu Glu Ala
    530                 535                 540
Val Leu Ser Arg Asp Met Phe Leu Leu Gln Leu Cys Ser Gly Ile Asp
545                 550                 555                 560
Glu Asn Ala Ala Gly Ala Cys Ala Gln Leu Val Phe Ala Pro Ile Asp
                565                 570                 575
Glu Ser Phe Ala Asp Asp Ala Pro Leu Leu Pro Ser Gly Phe Arg Val
            580                 585                 590
Ile Pro Leu Asp Ser Arg Thr Asp Gly Thr Ser Gly Pro Asn Arg Thr
        595                 600                 605
Leu Asp Leu Ala Ser Ala Leu Glu Val Gly Ser Ala Gly Thr Arg Thr
    610                 615                 620
Ser Gly Asp Ser Gly Ala Asn Ser Phe Asn Leu Arg Ser Val Leu Thr
625v630                 635                 640
Ile Ala Phe Gln Phe Thr Tyr Glu Asn His Leu Arg Glu Asn Val Ala
                645                 650                 655
Ser Met Ala Arg Gln Tyr Val Arg Ser Val Val Ala Ser Val Gln Arg
            660                 665                 670
Val Ala Met Ala Leu Ala Pro Ser Arg Leu Ser Ser His Val Gly Pro
        675                 680                 685
Arg Leu Pro Pro Gly Thr Pro Glu Ala Leu Thr Leu Ala Arg Trp Ile
    690                 695                 700
Cys Gln Ser Tyr Arg Phe His Leu Gly Val Glu Leu Leu Arg Ala Asp
705                 710                 715                 720
Cys Glu Ala Ser Glu Ser Val Leu Lys Leu Leu Trp His His Ser Asp
                725                 730                 735
Ala Ile Val Cys Cys Ser Leu Lys Ser Leu Pro Val Phe Thr Phe Ala
            740                 745                 750
Asn Gln Ala Gly Leu Asp Met Leu Glu Thr Thr Leu Val Ala Leu Gln
        755                 760                 765
Asp Ile Ser Leu Asp Lys Ile Leu Asp Glu Asn Gly Arg Lys Ser Leu
    770                 775                 780
Cys Ser Asp Phe Ala Gln Ile Met Gln Gln Gly Tyr Ala Tyr Leu Pro
785                 790                 795                 800
Ala Gly Ile Cys Val Ser Ser Met Gly Arg Pro Val Ser Tyr Asp Arg
                805                 810                 815
Ala Val Ala Trp Lys Val Leu Asn Asp Ala Asp Ser Thr His Cys Met
            820                 825                 830
Val Phe Met Phe Met Asn Trp Ser Phe Met
        835                 840
<210>228
<211>2511
<212>DNA
<213>海岛棉(Gossypium barbadense)
<400>228
atggctatgg cgatgacaca tcatcacaac agggaaagca gcatagacaa gcatttagat    60
acaggcaagt atgttaggta cacagctgaa caagttgaag ctttggaacg tgtttatgct   120
gaatgtccaa aaccaagttc tttgcgtagg caacagttaa taagggaatg tcctattctt   180
tctaacattg agcctaaaca gttcaaagct ttgttccaaa atcgcaggtg tagagagaaa   240
caaaggaaag aagcttcaag gcttcaaaca gtaaatagaa aattaacagc aatgaataag   300
ctgttaatgg aagagaatga taggttgcaa aaacaggttt ctcagttggt ttgtgagaat   360
gggtacatga gacagcaatt gcatactgta aatgcatcgg cgactgatgc gagctgtgac   420
tctgcggtaa ccactcctca gcattcactg agaaatgcta ataaccctgc tggactcctc   480
tctatcgcgg aggagacctt ggcagagttc ctttctaagg ctacgggaac tgctgtcaat   540
tgggtccaga tgcctgggat gaagcctggt ccagattcag ttgggatatt tgccacttcc   600
caaagttgta gtggaatggc agctcgagct tgtggtcttg taagtttaga acctacaaag   660
attgcagaga ttcttaaaga tcgtccatct tggttccggg actgtcggaa gcttgaagtt   720
ttcaccatgt ttccagctgg caatggtggt acgattgagc ttgtatacac acagatgttt   780
gctcctacta cattggctcc tgcaagggac ttttggactc taaggtacac tacaacttta   840
gagaacggca gtctcgtggt gtgtgagagg tctctttcgg gttccggtgc tggcccgagt   900
gtggcttccg cagctcaatt tgtgagagct gaagtgctcc ctagtggcta tttgattagg   960
ccttgtgagg gtggagggtc gattatccat attgttgacc acttgaatct tgaggcatgg  1020
agtgtgccgg aggtcttgcg ccccctttat gaatcatcca gagtaattgc tcagaaaatg  1080
actattccgg cgctgcgcta tgttaggcag attgctcaag agacaagcgg cgaggtggtt  1140
tacagtttgg gcaggcagcc tgctgtgctt agaacattta gccaaagatt aagcaggggc  1200
ttcaatgagg caataaatgg attcaacgaa gatggctggt cgataatgaa ttgtgatggt  1260
acagaggatg tgataattgc tattaattcc ggcaagagct tgagcaacag ttcgaatttg  1320
accaccggtc tttcattcct cgggggcgtt ctatgtgcaa aggcatccat gctgcttcaa  1380
aatgttcctc ctgctgttct tgtccgattc ttgagggaac atcgtttgga atgggctgat  1440
ttcaatgtcg atgcttattc agctgcatca ttgaaggccg gaacatacac ttatcctgga  1500
atgagaccta caagttttac tgggagtcag atcatcatgc cactcggcca gacggtcgaa  1560
catgaagagc tgctcgaagt tataagactc gaaggccagt ctcttacgca agaagacgcg  1620
cttctatcaa gggacattca tctattacag atatgtagtg gaattgatga caatgcggtt  1680
ggggcctgtt cggagcttgt gtttgcacca atagatgaga tgtttccgga tgatgctgcc  1740
ttactacctt caggattccg cattatcccg ttggagtcaa aaccagattc gttggctaca  1800
aatcggactt tggatcttac ttcgagtctc gaagtggggc ctgcaacaag ccaagctgcc  1860
ggagattctc cgagtcagaa tgcacgatcg gtgttgacaa ttgccttcca gtttcccttc  1920
gatacaaatc ttcgggataa tgttgcgacc atggcacgcc agtatgtccg tagcgtcatt  1980
tcttctgtcc agaggrttgc tatggccata tctccatgyg gatcgagccc aactatagga  2040
ccaaagccat ctccaggttc tcccgaagcg cttacgttgg ctcattggat ctgccagagc  2100
tacagtttcc atttggggga agagttgttg aaatccgaat cacttggtgg cgactcagta  2160
ttgaagaatc tttggcaaca tcaggatgca atattgtgtt gttcgttgaa gtctgtaccg  2220
gttttcatct tcgcaaatca ggccggtcta gacatgcttg agacaactct agtggatcta  2280
ccagacatca cactggacaa aatattcgat gagtcgggac ggaaggcatt gtgctctgat  2340
ttcaccaagt tgatgcagca gggattcact cacttgctgg ccggagtttg catgtcgaca  2400
atgggccgcc acgtctcgta tgaacaagct gttgcttgga aagtacttgc agctgatgca  2460
aacactgtcc actgcttggc attctctttt ataaactggt cttttgtgtg a           2511
<210>229
<211>836
<212>PRT
<213>海岛棉
<220>
<221>不确定
<222>(666)..(666)
<223>Xaa可以是任意天然产生的氨基酸
<400>229
Met Ala Met Ala Met Thr His His His Asn Arg Glu Ser Ser Ile Asp
1               5                   10                  15
Lys His Leu Asp Thr Gly Lys Tyr Val Arg Tyr Thr Ala Glu Gln Val
            20                  25                  30
Glu Ala Leu Glu Arg Val Tyr Ala Glu Cys Pro Lys Pro Ser Ser Leu
        35                  40                  45
Arg Arg Gln Gln Leu Ile Arg Glu Cys Pro Ile Leu Ser Asn Ile Glu
    50                  55                  60
Pro Lys Gln Phe Lys Ala Leu Phe Gln Asn Arg Arg Cys Arg Glu Lys
65                  70                  75                  80
Gln Arg Lys Glu Ala Ser Arg Leu Gln Thr Val Asn Arg Lys Leu Thr
                85                  90                  95
Ala Met Asn Lys Leu Leu Met Glu Glu Asn Asp Arg Leu Gln Lys Gln
            100                 105                 110
Val Ser Gln Leu Val Cys Glu Asn Gly Tyr Met Arg Gln Gln Leu His
        115                 120                 125
Thr Val Asn Ala Ser Ala Thr Asp Ala Ser Cys Asp Ser Ala Val Thr
    130                 135                 140
Thr Pro Gln His Ser Leu Arg Asn Ala Asn Asn Pro Ala Gly Leu Leu
145                 150                 155                 160
Ser Ile Ala Glu Glu Thr Leu Ala Glu Phe Leu Ser Lys Ala Thr Gly
                165                 170                 175
Thr Ala Val Asn Trp Val Gln Met Pro Gly Met Lys Pro Gly Pro Asp
            180                 185                 190
Ser Val Gly Ile Phe Ala Thr Ser Gln Ser Cys Ser Gly Met Ala Ala
        195                 200                 205
Arg Ala Cys Gly Leu Val Ser Leu Glu Pro Thr Lys Ile Ala Glu Ile
    210                 215                 220
Leu Lys Asp Arg Pro Ser Trp Phe Arg Asp Cys Arg Lys Leu Glu Val
225                 230                 235                 240
Phe Thr Met Phe Pro Ala Gly Asn Gly Gly Thr Ile Glu Leu Val Tyr
                245                 250                 255
Thr Gln Met Phe Ala Pro Thr Thr Leu Ala Pro Ala Arg Asp Phe Trp
            260                 265                 270
Thr Leu Arg Tyr Thr Thr Thr Leu Glu Asn Gly Ser Leu Val Val Cys
        275                 280                 285
Glu Arg Ser Leu Ser Gly Ser Gly Ala Gly Pro Ser Val Ala Ser Ala
    290                 295                 300
Ala Gln Phe Val Arg Ala Glu Val Leu Pro Ser Gly Tyr Leu Ile Arg
305                 310                 315                 320
Pro Cys Glu Gly Gly Gly Ser Ile Ile His Ile Val Asp His Leu Asn
                325                 330                 335
Leu Glu Ala Trp Ser Val Pro Glu Val Leu Arg Pro Leu Tyr Glu Ser
            340                 345                 350
Ser Arg Val Ile Ala Gln Lys Met Thr Ile Pro Ala Leu Arg Tyr Val
        355                 360                 365
Arg Gln Ile Ala Gln Glu Thr Ser Gly Glu Val Val Tyr Ser Leu Gly
    370                 375                 380
Arg Gln Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu Ser Arg Gly
385                 390                 395                 400
Phe Asn Glu Ala Ile Asn Gly Phe Asn Glu Asp Gly Trp Ser Ile Met
                405                 410                 415
Asn Cys Asp Gly Thr Glu Asp Val Ile Ile Ala Ile Asn Ser Gly Lys
            420                 425                 430
Ser Leu Ser Asn Ser Ser Asn Leu Thr Thr Gly Leu Ser Phe Leu Gly
        435                 440                 445
Gly Val Leu Cys Ala Lys Ala Ser Met Leu Leu Gln Asn Val Pro Pro
    450                 455                 460
Ala Val Leu Val Arg Phe Leu Arg Glu His Arg Leu Glu Trp Ala Asp
465                 470                 475                 480
Phe Asn Val Asp Ala Tyr Ser Ala Ala Ser Leu Lys Ala Gly Thr Tyr
                485                 490                 495
Thr Tyr Pro Gly Met Arg Pro Thr Ser Phe Thr Gly Ser Gln Ile Ile
            500                 505                 510
Met Pro Leu Gly Gln Thr Val Glu His Glu Glu Leu Leu Glu Val Ile
        515                 520                 525
Arg Leu Glu Gly Gln Ser Leu Thr Gln Glu Asp Ala Leu Leu Ser Arg
    530                 535                 540
Asp Ile His Leu Leu Gln Ile Cys Ser Gly Ile Asp Asp Asn Ala Val
545                 550                 555                 560
Gly Ala Cys Ser Glu Leu Val Phe Ala Pro Ile Asp Glu Met Phe Pro
                565                 570                 575
Asp Asp Ala Ala Leu Leu Pro Ser Gly Phe Arg Ile Ile Pro Leu Glu
            580                 585                 590
Ser Lys Pro Asp Ser Leu Ala Thr Asn Arg Thr Leu Asp Leu Thr Ser
        595                 600                 605
Ser Leu Glu Val Gly Pro Ala Thr Ser Gln Ala Ala Gly Asp Ser Pro
    610                 615                 620
Ser Gln Asn Ala Arg Ser Val Leu Thr Ile Ala Phe Gln Phe Pro Phe
625                 630                 635                 640
Asp Thr Asn Leu Arg Asp Asn Val Ala Thr Met Ala Arg Gln Tyr Val
                645                 650                 655
Arg Ser Val Ile Ser Ser Val Gln Arg Xaa Ala Met Ala Ile Ser Pro
            660                 665                 670
Cys Gly Ser Ser Pro Thr Ile Gly Pro Lys Pro Ser Pro Gly Ser Pro
        675                 680                 685
Glu Ala Leu Thr Leu Ala His Trp Ile Cys Gln Ser Tyr Ser Phe His
    690                 695                 700
Leu Gly Glu Glu Leu Leu Lys Ser Glu Ser Leu Gly Gly Asp Ser Val
705                 710                 715                 720
Leu Lys Asn Leu Trp Gln His Gln Asp Ala Ile Leu Cys Cys Ser Leu
                725                 730                 735
Lys Ser Val Pro Val Phe Ile Phe Ala Asn Gln Ala Gly Leu Asp Met
            740                 745                 750
Leu Glu Thr Thr Leu Val Asp Leu Pro Asp Ile Thr Leu Asp Lys Ile
        755                 760                 765
Phe Asp Glu Ser Gly Arg Lys Ala Leu Cys Ser Asp Phe Thr Lys Leu
    770                 775                 780
Met Gln Gln Gly Phe Thr His Leu Leu Ala Gly Val Cys Met Ser Thr
785                 790                 795                 800
Met Gly Arg His Val Ser Tyr Glu Gln Ala Val Ala Trp Lys Val Leu
                805                 810                 815
Ala Ala Asp Ala Asn Thr Val His Cys Leu Ala Phe Ser Phe Ile Asn
            820                 825                 830
Trp Ser Phe Val
        835
<210>230
<211>2526
<212>DNA
<213>番茄
<400>230
atggctatgg tggctcaaca gcatagggag agtagtagtg gtagtattac taaacatctt    60
gatagtagtg gaaagtatgt tcgatatacg gctgagcaag ttgaggcttt ggagagggtt   120
tatgcagagt gtcctaagcc tagctcgttg cgtcgacagc aattgatccg tgaatgtcat   180
attctgtcga atatcgagcc taagcagatc aaagtttggt ttcagaacag aaggtgtcga   240
gagaagcaaa ggaaagagtc ttctcgattg cagactgtga acagaaagtt gtctgcgatg   300
aataaactgt tgatggagga gaatgaccgc ttgcagaaac aagtctcgca gcttgtatgt   360
gaaaatggct atatgcggca acaattgcaa agtgtatcgg cggccactac tgatgtaagt   420
tgtgaatcag tggtaaccac tcctcagcat tcccttagag atgctaacaa ccctgctgga   480
ctactaccaa ttgcagaaga aaccttggca gagttccttt ctaaggctac aggaactgct   540
gtcgattggg tcccgatgcc tgggatgaag cctggtccgg attcagttgg gatttttgcc   600
atctcacaca gttgcagtgg agtggcagcc cgagcatgtg gtcttgttag tttagagcca   660
acaaagattg ctgatatcct caaagatcga ccttcttggt tccgcgactg ccggaatgtt   720
gaagttatca caatgtttcc tgctggaaat ggtggtacag ttgagctttt gtatacccag   780
atatatgctc ccacaactct ggctcccgcg cgtgattttt ggacgctgag atacacaaca   840
accctagaca atggtagtct cgtggtttgt gaaagatccc tatctggtaa tgggcctggc   900
ccaaatccta ctgctgcttc ccagtttgta agagctcaaa tgcttccatc tggatatctg   960
atccgaccgt gtgatggtgg aggatcaatc atacatattg ttgatcacct gaatcttgag  1020
gcatggagtg cccctgagat tttgcgtcca ctctatgaat cgtcgaaagt tgtggcacag  1080
aaaatgacta ttgcagcact gcgatatgca aggcaactag ctcaagagac tagcgacgag  1140
gtagtatatg gtctaggaag gcaacctgct gttcttcgaa catttagcca gagattatgc  1200
agagggttca atgatgccat caatggattc ggtgacgatg gctggtcaat gttaagttca  1260
gatggtgctg aagatgtcat agttgctgtc aattcaagga agaacctcgc aaccacctcc  1320
attcctcttt ccccgcttgg tggcgtcctt tgtgccaaag catcaatgct actccagaat  1380
gtcccccctg ccgtactggt tcggtttctg agggagcacc gttcagagtg ggcagacttt  1440
aatgttgatg cttttgtagc ttctgcattg aagtcttgtc cgtatacata tcctgggatg  1500
aggcctacca gatttaccgg tagccagata ataatgccac ttggccacac aattgagcat  1560
gaagaaatgc ttgaagttat tagacttgaa gggcactcta ttggacagga agatgctttt  1620
atgccaagag atattcacct tttacagatg tgtagtggca ctgatgagaa tgcagttgga  1680
gcctgttctg aactagtttt tgcccctatt gatgagatgt ttccagatga tgcacctttg  1740
cttccctccg gatttcgcgt tattcctctc gaatcaaaat caggtgatgc ccaggatacg  1800
ttgaacgcac atagaacatt agatctagca tcaagtcttg aagtgggccc agcaacaaac  1860
tcgactactg gagatgcagc ttcttgttac agtgcacgat ctgtactgac aatcgctttc  1920
caatttccat ttgaggacaa tcttcaggac aatgtggcta ccatggcccg acagtatgtt  1980
cgcagtgtgg tttcgtctgt ccaacgagtt gccatggcaa tatctcctac gggaatgaat  2040
cctacactgg gggccaagct ttctccaggc tcaccagaag ctgtaacatt gtcgcattgg  2100
atctgccaga gctatagtta tcacatggga acagagttac ttcgagctga ttctagtggc  2160
gatgaatcag tactaaagaa tctctggcaa caccaggatg caattttgtg ctgctcattg  2220
aagtcgctgc cagttttcat ttttgctaat aaggccggac tcgacatgct ggagacaaca  2280
ttagttgcat tacaggacat ttctctagat aagatatttg atgaatccgg aaggaaagtg  2340
ttgctctcag aatttgccaa gattatggaa cagggtttcg cgtgtttgcc tggtggtatc  2400
tgcatgtcaa caatgggacg acatatttca tatgaacaag ctatcgcgtg gaaagtgttt  2460
gcgtcgtctg aagaaaatgc tgtccactgt ttggcctttt cgtttatcaa ctggtcattc  2520
gtgtaa                                                             2526
<210>231
<211>841
<212>PRT
<213>番茄
<400>231
Met Ala Met Val Ala Gln Gln His Arg Glu Ser Ser Ser Gly Ser Ile
1               5                   10                  15
Thr Lys His Leu Asp Ser Ser Gly Lys Tyr Val Arg Tyr Thr Ala Glu
            20                  25                  30
Gln Val Glu Ala Leu Glu Arg Val Tyr Ala Glu Cys Pro Lys Pro Ser
        35                  40                  45
Ser Leu Arg Arg Gln Gln Leu Ile Arg Glu Cys His Ile Leu Ser Asn
    50                  55                  60
Ile Glu Pro Lys Gln Ile Lys Val Trp Phe Gln Asn Arg Arg Cys Arg
65                  70                  75                  80
Glu Lys Gln Arg Lys Glu Ser Ser Arg Leu Gln Thr Val Asn Arg Lys
                85                  90                  95
Leu Ser Ala Met Asn Lys Leu Leu Met Glu Glu Asn Asp Arg Leu Gln
            100                 105                 110
Lys Gln Val Ser Gln Leu Val Cys Glu Asn Gly Tyr Met Arg Gln Gln
        115                 120                 125
Leu Gln Ser Val Ser Ala Ala Thr Thr Asp Val Ser Cys Glu Ser Val
    130                 135                 140
Val Thr Thr Pro Gln His Ser Leu Arg Asp Ala Asn Asn Pro Ala Gly
145                 150                 155                 160
Leu Leu Pro Ile Ala Glu Glu Thr Leu Ala Glu Phe Leu Ser Lys Ala
                165                 170                 175
Thr Gly Thr Ala Val Asp Trp Val Pro Met Pro Gly Met Lys Pro Gly
            180                 185                 190
Pro Asp Ser Val Gly Ile Phe Ala Ile Ser His Ser Cys Ser Gly Val
        195                 200                 205
Ala Ala Arg Ala Cys Gly Leu Val Ser Leu Glu Pro Thr Lys Ile Ala
    210                 215                 220
Asp Ile Leu Lys Asp Arg Pro Ser Trp Phe Arg Asp Cys Arg Asn Val
225                 230                 235                 240
Glu Val Ile Thr Met Phe Pro Ala Gly Asn Gly Gly Thr Val Glu Leu
                245                 250                 255
Leu Tyr Thr Gln Ile Tyr Ala Pro Thr Thr Leu Ala Pro Ala Arg Asp
            260                 265                 270
Phe Trp Thr Leu Arg Tyr Thr Thr Thr Leu Asp Asn Gly Ser Leu Val
        275                 280                 285
Val Cys Glu Arg Ser Leu Ser Gly Asn Gly Pro Gly Pro Asn Pro Thr
    290                 295                 300
Ala Ala Ser Gln Phe Val Arg Ala Gln Met Leu Pro Ser Gly Tyr Leu
305                 310                 315                 320
Ile Arg Pro Cys Asp Gly Gly Gly Ser Ile Ile His Ile Val Asp His
                325                 330                 335
Leu Asn Leu Glu Ala Trp Ser Ala Pro Glu Ile Leu Arg Pro Leu Tyr
            340                 345                 350
Glu Ser Ser Lys Val Val Ala Gln Lys Met Thr Ile Ala Ala Leu Arg
        355                 360                 365
Tyr Ala Arg Gln Leu Ala Gln Glu Thr Ser Asp Glu Val Val Tyr Gly
    370                 375                 380
Leu Gly Arg Gln Pro Ala Val Leu Arg Thr Phe Ser Gln Arg Leu Cys
385                 390                 395                 400
Arg Gly Phe Asn Asp Ala Ile Asn Gly Phe Gly Asp Asp Gly Trp Ser
                405                 410                 415
Met Leu Ser Ser Asp Gly Ala Glu Asp Val Ile Val Ala Val Asn Ser
            420                 425                 430
Arg Lys Asn Leu Ala Thr Thr Ser Ile Pro Leu Ser Pro Leu Gly Gly
        435                 440                 445
Val Leu Cys Ala Lys Ala Ser Met Leu Leu Gln Asn Val Pro Pro Ala
    450                 455                 460
Val Leu Val Arg Phe Leu Arg Glu His Arg Ser Glu Trp Ala Asp Phe
465                 470                 475                 480
Asn Val Asp Ala Phe Val Ala Ser Ala Leu Lys Ser Cys Pro Tyr Thr
                485                 490                 495
Tyr Pro Gly Met Arg Pro Thr Arg Phe Thr Gly Ser Gln Ile Ile Met
            500                 505                 510
Pro Leu Gly His Thr Ile Glu His Glu Glu Met Leu Glu Val Ile Arg
        515                 520                 525
Leu Glu Gly His Ser Ile Gly Gln Glu Asp Ala Phe Met Pro Arg Asp
    530                 535                 540
Ile His Leu Leu Gln Met Cys Ser Gly Thr Asp Glu Asn Ala Val Gly
545                 550                 555                 560
Ala Cys Ser Glu Leu Val Phe Ala Pro Ile Asp Glu Met Phe Pro Asp
                565                 570                 575
Asp Ala Pro Leu Leu Pro Ser Gly Phe Arg Val Ile Pro Leu Glu Ser
            580                 585                 590
Lys Ser Gly Asp Ala Gln Asp Thr Leu Asn Ala His Arg Thr Leu Asp
        595                 600                 605
Leu Ala Ser Ser Leu Glu Val Gly Pro Ala Thr Asn Ser Thr Thr Gly
    610                 615                 620
Asp Ala Ala Ser Cys Tyr Ser Ala Arg Ser Val Leu Thr Ile Ala Phe
625                 630                 635                 640
Gln Phe Pro Phe Glu Asp Asn Leu Gln Asp Asn Val Ala Thr Met Ala
                645                 650                 655
Arg Gln Tyr Val Arg Ser Val Val Ser Ser Val Gln Arg Val Ala Met
            660                 665                 670
Ala Ile Ser Pro Thr Gly Met Asn Pro Thr Leu Gly Ala Lys Leu Ser
        675                 680                 685
Pro Gly Ser Pro Glu Ala Val Thr Leu Ser His Trp Ile Cys Gln Ser
    690                 695                 700
Tyr Ser Tyr His Met Gly Thr Glu Leu Leu Arg Ala Asp Ser Ser Gly
705                 710                 715                 720
Asp Glu Ser Val Leu Lys Asn Leu Trp Gln His Gln Asp Ala Ile Leu
                725                 730                 735
Cys Cys Ser Leu Lys Ser Leu Pro Val Phe Ile Phe Ala Asn Lys Ala
            740                 745                 750
Gly Leu Asp Met Leu Glu Thr Thr Leu Val Ala Leu Gln Asp Ile Ser
        755                 760                 765
Leu Asp Lys Ile Phe Asp Glu Ser Gly Arg Lys Val Leu Leu Ser Glu
    770                 775                 780
Phe Ala Lys Ile Met Glu Gln Gly Phe Ala Cys Leu Pro Gly Gly Ile
785                 790                 795                 800
Cys Met Ser Thr Met Gly Arg His Ile Ser Tyr Glu Gln Ala Ile Ala
                805                 810                 815
Trp Lys Val Phe Ala Ser Ser Glu Glu Asn Ala Val His Cys Leu Ala
            820                 825                 830
Phe Ser Phe Ile Asn Trp Ser Phe Val
        835                 840
<210>232
<211>258
<212>DNA
<213>甘蔗
<400>232
atgaggatgt tcttccggca cttgctatct tgcatcctcc tgctcttgct aatgtcacac     60
ttgccaagcc cgatcctcgg cttgagaaca ttgagaggag aggaggcgaa gagcgacttg    120
aggcgccatg agcatgagct tccgccagcg gtatctcctt caaaagaggt ggacaacgat    180
gacgctgccg cctccagtaa gttcacagtt tcaagaagaa tggttcctca aggtccaaac    240
cctctccaca acagatga                                                258
<210>233
<211>85
<212>PRT
<213>甘蔗
<400>233
Met Arg Met Phe Phe Arg His Leu Leu Ser Cys Ile Leu Leu Leu Leu
1               5                   10                  15
Leu Met Ser His Leu Pro Ser Pro Ile Leu Gly Leu Arg Thr Leu Arg
            20                  25                  30
Gly Glu Glu Ala Lys Ser Asp Leu Arg Arg His Glu His Glu Leu Pro
        35                  40                  45
Pro Ala Val Ser Pro Ser Lys Glu Val Asp Asn Asp Asp Ala Ala Ala
    50                  55                  60
Ser Ser Lys Phe Thr Val Ser Arg Arg Met Val Pro Gln Gly Pro Asn
65                  70                  75                  80
Pro Leu His Asn Arg
                85
<210>234
<211>53
<212>DNA
<213>人工序列
<220>
<223>引物:prm05843
<400>234
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgag gatgttcttc cgg          53
<210>235
<211>49
<212>DNA
<213>人工序列
<220>
<223>引物:prm05844
<400>235
ggggaccact ttgtacaaga aagctgggtt cctctcatct gttgtggag               49
<210>236
<211>668
<212>DNA
<213>稻
<400>236
ccttctacat cggcttaggt gtagcaacac gactttatta ttattattat tattattatt   60
attattttac aaaaatataa aatagatcag tccctcacca caagtagagc aagttggtga  120
gttattgtaa agttctacaa agctaattta aaagttattg cattaactta tttcatatta  180
caaacaagag tgtcaatgga acaatgaaaa ccatatgaca tactataatt ttgtttttat  240
tattgaaatt atataattca aagagaataa atccacatag ccgtaaagtt ctacatgtgg  300
tgcattacca aaatatatat agcttacaaa acatgacaag cttagtttga aaaattgcaa  360
tccttatcac attgacacat aaagtgagtg atgagtcata atattatttt tcttgctacc  420
catcatgtat atatgatagc cacaaagtta ctttgatgat gatatcaaag aacattttta  480
ggtgcaccta acagaatatc caaataatat gactcactta gatcataata gagcatcaag  540
taaaactaac actctaaagc aaccgatggg aaagcatcta taaatagaca agcacaatga  600
aaatcctcat catccttcac cacaattcaa atattatagt tgaagcatag tagtagaatc    660
caacaaca                                                             668
<210>237
<211>14
<212>PRT
<213>人工序列
<220>
<223>CLE结构域,共有序列
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Glu″/取代=″Arg″/取代=″Met″/取代=″Pro″
     /取代=″Leu
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Glu″/取代=″Asp″/取代=″Arg″/取代=″Ser″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Ile″/取代=″Leu″/取代=″Arg″/取代=″Phe″
     /取代=″Gln″/取代=″Val″/取代=″Met″
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Ile″/取代=″Ser″/取代=″Leu″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Pro″/取代=″Leu″/取代=″Arg″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Thr″/取代=″Gln″/取代=″Cys″/取代=″Asn″
     /取代=″Gly″/取代=″Lys″/取代=″Ser″
<220>
<221>变体
<222>(8)..(8)
<223>/取代=″Gly″
<220>
<221>变体
<222>(9)..(9)
<223>/取代=″Pro″
<220>
<221>变体
<222>(10)..(10)
<223>/取代=″Asn″/取代=″Tyr″
<220>
<221>变体
<222>(12)..(12)
<223>/取代=″Leu″/取代=″Gln″/取代=″Arg″/取代=″Tyr″
     /取代=″His″
<400>237
Ser Lys Arg Lys Val Pro Arg Asn Ser Asp Pro Ile His His
1               5                   10
<210>238
<211>14
<212>PRT
<213>人工序列
<220>
<223>CLE结构域,共有序列
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Pro″
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Glu″/取代=″Lys″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Leu″/取代=″Ile″
<220>
<221>变体
<222>(5)..(5)
<223>/取代=″Ser″/取代=″Ile″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Gly″/取代=″Cys″/取代=″Thr″/取代=″Ser″
<220>
<221>变体
<222>(10)..(10)
<223>/取代=″Asp″
<220>
<221>变体
<222>(12)..(12)
<223>/取代=″Gln″/取代=″His″
<220>
<221>变体
<222>(14)..(14)
<223>/取代=″Asn″
<400>238
Ser Arg Arg Met Val Pro Gln Gly Pro Asn Pro Leu His His
1               5                   10
<210>239
<211>477
<212>DNA
<213>毛果杨x美洲黑杨(Populus deltoides)
<400>239
gcaaattccc cctgctctaa aatccatttt cctatctatc aacctctctg gtctctatat   60
ccccaccatt ttcatcatga ggaataaaaa tcctcagctg ttccttattt tcctgatagt  120
gttcctggta ctcgttcatg gcaccacttg ccgcgatgcc aaaagatcta ctagcaatgg  180
agaaacagta caagggtcga aaaccaaaca ttcttcaatg tttctacaag cgctttcttc  240
catttttaag gcttcagaat ccagcactaa caacatcaag gcacttcaca ccgtctcgcg  300
caggcttgtt ccttgtggac caaacccact ccacaactga tcatcgaatc aacaaaattc  360
caatctgttt ccatttgttg aaatatatat agtgttttta aaatattttt gttgaataat  420
ctatacatat tttccctata catccagttt tgaaaaaaga aaaaaaaaaa aaaaaaa     477
<210>240
<211>87
<212>PRT
<213>毛果杨x美洲黑杨
<400>240
Met Arg Asn Lys Asn Pro Gln Leu Phe Leu Ile Phe Leu Ile Val Phe
1               5                   10                  15
Leu Val Leu Val His Gly Thr Thr Cys Arg Asp Ala Lys Arg Ser Thr
            20                  25                  30
Ser Asn Gly Glu Thr Val Gln Gly Ser Lys Thr Lys His Ser Ser Met
        35                  40                  45
Phe Leu Gln Ala Leu Ser Ser Ile Phe Lys Ala Ser Glu Ser Ser Thr
    50                  55                  60
Asn Asn Ile Lys Ala Leu His Thr Val Ser Arg Arg Leu Val Pro Cys
65                  70                  75                  80
Gly Pro Asn Pro Leu His Asn
                85
<210>241
<211>443
<212>DNA
<213>稻
<400>241
tctctctctc tcacacacac acacacacaa actagagact tatgccatga ggaggttctc   60
caagcagcac ctggtccctt tcattctgct cctgctactt gtcatgtctc acttgccaat  120
ctcaagcctt ggttcaagga gagcattcag agaagaagct gtcagtggtt tcagaagcca  180
tgagcttgct ccaaccatgg ctccttctca agagaaagaa gcaggcgtcg tcgccggcgc  240
cggtagcatc tgtggccaga agtatgctgt ctcaagaaga atggttcctc agggaccaaa  300
ccctctccac aactgatgaa ctcatgcact gcaatctgcc gtgatcatca gcttctccaa  360
tacaggtgaa tggtgcagcc atcattggtt acctttaagt ccgtctgctt aattaactag  420
atatttcata gtattttatc aca                                          443
<210>242
<211>89
<212>PRT
<213>稻
<400>242
Met Arg Arg Phe Ser Lys Gln His Leu Val Pro Phe Ile Leu Leu Leu
1               5                   10                  15
Leu Leu Val Met Ser His Leu Pro Ile Ser Ser Leu Gly Ser Arg Arg
            20                  25                  30
Ala Phe Arg Glu Glu Ala Val Ser Gly Phe Arg Ser His Glu Leu Ala
        35                  40                  45
Pro Thr Met Ala Pro Ser Gln Glu Lys Glu Ala Gly Val Val Ala Gly
    50                  55                  60
Ala Gly Ser Ile Cys Gly Gln Lys Tyr Ala Val Ser Arg Arg Met Val
65                  70                  75                  80
Pro Gln Gly Pro Asn Pro Leu His Asn
                85
<210>243
<211>677
<212>DNA
<213>甘蔗
<400>243
tttgaaactg ttacaactgg ttcgcctgca cctgcctgcc cggaacgacc cacgcgtccg     60
cgctctctct ctccctctcc ctctacctct ctctaacata tgccatgagg atgttcttcc    120
ggcactagct atcttgcatc ctactgctct aggtaatgtc acacttgcca agctcgatcc    180
tcggcttgag aacatcgaga ggagaggagg cgaagagcga cttgaggcgc catgagcatg    240
agcttccgcc agccgtatct ccttcaaaag aggtggacaa cgacgacgct gccgccgcca    300
gtaagttaac agtttcaaga agaatggttc ctcaaggtcc aaaccctctc cacaacagat    360
gagaggatcg gagcagcatg ctgctgctgc ttctggtatg gtcttcagcc aaggtagcag    420
ctagctagct cttctcagtc tcagctaatg gtgtagtgag tggcacgcac tcaacaaagt    480
acccttcctc tctttccttt ttttttaacc cgtcatatga atgatacaaa tggatgcata    540
tataagttga atactacttc ccatgtaatg tgtttttgtt gcattgattt catttatagg    600
cagctttgta catagatttt tatgatatta aggtgtaaaa gttgttgtgc tagatggatc    660
tagattttga atgtttg                                                   677
<210>244
<211>68
<212>PRT
<213>甘蔗
<400>244
Met Ser His Leu Pro Ser Ser Ile Leu Gly Leu Arg Thr Ser Arg Gly
1               5                   10                  15
Glu Glu Ala Lys Ser Asp Leu Arg Arg His Glu His Glu Leu Pro Pro
            20                  25                  30
Ala Val Ser Pro Ser Lys Glu Val Asp Asn Asp Asp Ala Ala Ala Ala
        35                  40                  45
Ser Lys Leu Thr Val Ser Arg Arg Met Val Pro Gln Gly Pro Asn Pro
    50                  55                  60
Leu His Asn Arg
65
<210>245
<211>533
<212>DNA
<213>拟南芥
<400>245
gcaacgagaa aaaccgtcct tggtgacaac tcatgcttgc actcaagcct taagctagct     60
aaacctatct cgcgcactac tagaattcaa ataaaactct ataaatagaa accctcatga    120
gatctcttct ttcctcatat acactcatac acaccacgtg aacaatctat ctctctttct  180
attgcttttc tatatataca gaaactaatt aattgtatct gtaatggcta agttaagctt  240
cactttctgc ttcttgttgt ttcttctgtt atcctcaatc gccgctggaa gccgccctct  300
tgagggggct cgggtcgggg tgaaggtgag aggcctaagc ccttctatcg aggctacgag  360
tccgactgta gaggatgatc aagctgcggg tagccatggg aaatctccag agcggttaag  420
cccaggagga cccgacccac aacatcacta gttattttgt gtttttcaat ttcttcgaca  480
tgtttattac ttatcaataa tttggttgca acgaagctgt ttttcttttt tgt         533
<210>246
<211>75
<212>PRT
<213>拟南芥
<400>246
Met Ala Lys Leu Ser Phe Thr Phe Cys Phe Leu Leu Phe Leu Leu Leu
1               5                   10                  15
Ser Ser Ile Ala Ala Gly Ser Arg Pro Leu Glu Gly Ala Arg Val Gly
            20                  25                  30
Val Lys Val Arg Gly Leu Ser Pro Ser Ile Glu Ala Thr Ser Pro Thr
        35                  40                  45
Val Glu Asp Asp Gln Ala Ala Gly Ser His Gly Lys Ser Pro Glu Arg
    50                  55                  60
Leu Ser Pro Gly Gly Pro Asp Pro Gln His His
65                  70                  75
<210>247
<211>417
<212>DNA
<213>欧洲油菜(Brassica napus)
<400>247
ctttcatatt gtatctcccg cagccaaaca aaaacttttt ttttgacaaa gatagaacat   60
gaagatcaag agtttgatat tggcttcctc ttttctgatt cttgccttca ttcatcactc  120
agaatcagct tcatttcgga gtttgctgat gaagaatgga ttgtacgaag aagaagaagc  180
aaaaattcta ttgggcgact ccaaagaaac gataactaat tctacagctt tggagtctaa  240
acggataatt ccgacgggtc caaatccact tcacaacagg taactttgat catttaagaa  300
caagatatgt tgtgagtatg tctcttcctc tgtttttgtt acaagtatct atcttactgt  360
gtaatgtaat ggtgaatgta taatacattt tctaattaaa ttaccttatt taaaaaa     417
<210>248
<211>74
<212>PRT
<213>欧洲油菜
<400>248
Met Lys Ile Lys Ser Leu Ile Leu Ala Ser Ser Phe Leu Ile Leu Ala
1               5                   10                  15
Phe Ile His His Ser Glu Ser Ala Ser Phe Arg Ser Leu Leu Met Lys
            20                  25                  30
Asn Gly Leu Tyr Glu Glu Glu Glu Ala Lys Ile Leu Leu Gly Asp Ser
        35                  40                  45
Lys Glu Thr Ile Thr Asn Ser Thr Ala Leu Glu Ser Lys Arg Ile Ile
    50                  55                  60
Pro Thr Gly Pro Asn Pro Leu His Asn Arg
65                  70
<210>249
<211>774
<212>DNA
<213>拟南芥
<400>249
aacagtttct atatttctct ctgtatctct ctcactcagt cactttctct ctaaaaaatg   60
gattctaaaa gctttgtgct actactacta ctcttctgct tcttgttcct tcatgatgct  120
tctggtctca ctctctcttt cactcctcta tatgtctata acccatgtaa atggattctt  180
ataagtctca acataacttt tttttgttat ttactatttc accagatctc actcaagctc  240
atgctcacgt tcaaggactt tccaaccgca aggttatctt caacttgtac tcattaaggc  300
ctctcagcat tcatgtgtta tgttcatgta gatgtccggt ccagttcaac aactgtttca  360
ttgctttagt tgtcacgaga aatatttgta tatattatta tggtgtgcaa aacatagtaa  420
aatgttgttc aattggcaga tgatgatgat gaaaatggaa agtgaatggg ttggagcaaa  480
tggagaagca gagaaggcaa agacgaaggg tttaggacta catgaagagt taaggactgt  540
tccttcggga cctgacccgt tgcaccatca tgtgaaccca ccaagacagc caagaaacaa  600
ctttcagctc ccttgaccta atctcttgtt gctttaaatt atttcatatt gtaaattact  660
ttctgcttta tcggttttac catttcggga gtcttttttg tgtgcaatct gtttcgtttg  720
gtgtagtttc atgaaagtga atgtaagata tgcattacgt ttgttgctga agtg        774
<210>250
<211>96
<212>PRT
<213>拟南芥
<400>250
Met Asp Ser Lys Ser Phe Val Leu Leu Leu Leu Leu Phe Cys Phe Leu
1               5                   10                  15
Phe Leu His Asp Ala Ser Asp Leu Thr Gln Ala His Ala His Val Gln
            20                  25                  30
Gly Leu Ser Asn Arg Lys Met Met Met Met Lys Met Glu Ser Glu Trp
        35                  40                  45
Val Gly Ala Asn Gly Glu Ala Glu Lys Ala Lys Thr Lys Gly Leu Gly
    50                  55                  60
Leu His Glu Glu Leu Arg Thr Val Pro Ser Gly Pro Asp Pro Leu His
65                  70                  75                  80
His His Val Asn Pro Pro Arg Gln Pro Arg Asn Asn Phe Gln Leu Pro
                85                  90                  95
<210>251
<211>353
<212>DNA
<213>稻
<400>251
atggaaggtg taggtgctag gcagaggagg aaccctctga tacccagacc aaacggttca   60
aagaggcatc tgcagcatca gcatcagcca aatgctgccg agaagaagac cgccgcgaca  120
tcgaattact tcagtatcga ggcgttcctc gtgctcgtct tcctcaccat gtcattgctc  180
atacttccat tggtgcttcc cccattgcct ccgccgccat cgctgctgct gctgctgcca  240
gtctgcctgc tcatcctgct ggttgtgctg gccttcatgc caacggatgt gcggagcatg  300
gcttcctctt acttgtaaat acatctccta ggggaattta tttttgtttt tga         353
<210>252
<211>105
<212>PRT
<213>稻
<400>252
Met Glu Gly Val Gly Ala Arg Gln Arg Arg Asn Pro Leu Ile Pro Arg
1               5                   10                  15
Pro Asn Gly Ser Lys Arg His Leu Gln His Gln His Gln Pro Asn Ala
            20                  25                  30
Ala Glu Lys Lys Thr Ala Ala Thr Ser Asn Tyr Phe Ser Ile Glu Ala
        35                  40                  45
Phe Leu Val Leu Val Phe Leu Thr Met Ser Leu Leu Ile Leu Pro Leu
    50                  55                  60
Val Leu Pro Pro Leu Pro Pro Pro Pro Ser Leu Leu Leu Leu Leu Pro
65                  70                  75                  80
Val Cys Leu Leu Ile Leu Leu Val Val Leu Ala Phe Met Pro Thr Asp
                85                  90                  95
Val Arg Ser Met Ala Ser Ser Tyr Leu
            100                 105
<210>253
<211>56
<212>DNA
<213>人工序列
<220>
<223>引物:prm08170
<400>253
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgga aggtgtaggt gctagg       56
<210>254
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物:prm08171
<400>254
ggggaccact ttgtacaaga aagctgggtc aaaaacaaaa ataaattccc c            51
<210>255
<211>2193
<212>DNA
<213>稻
<400>255
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct   60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact  120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt  180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc  240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata  300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga  360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt  420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat  480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag  540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt  600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc  660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat  720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa   780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca   840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag   900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa   960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata  1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag  1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc  1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg  1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg  1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat  1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc  1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt  1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag  1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg  1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat  1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc  1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca  1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta  1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga  1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg  1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac  1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta  2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga  2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct  2160
tggtgtagct tgccactttc accagcaaag ttc                               2193
<210>256
<211>3
<212>PRT
<213>人工序列
<220>
<223>保守基序1a
<400>256
Tyr Phe Ser
1
<210>257
<211>3
<212>PRT
<213>人工序列
<220>
<223>保守基序1b
<400>257
Tyr Phe Thr
1
<210>258
<211>3
<212>PRT
<213>人工序列
<220>
<223>保守基序1c
<400>258
Tyr Phe Gly
1
<210>259
<211>3
<212>PRT
<213>人工序列
<220>
<223>保守基序1d
<400>259
Tyr Leu Gly
1
<210>260
<211>7
<212>PRT
<213>人工序列
<220>
<223>保守基序2
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Ala″/取代=″Ile″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Ser″
<400>260
Val Leu Ala Phe Met Pro Thr
1               5
<210>261
<211>3
<212>PRT
<213>人工序列
<220>
<223>保守基序3
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Pro″
<400>261
Ser Tyr Leu
1
<210>262
<211>178
<212>PRT
<213>稻
<400>262
Met Tyr Leu Leu Ser Pro Arg Asn Gly Asp Glu Glu Asp Glu Gln Glu
1               5                   10                  15
Glu Ile Gln Glu Leu Ile Ser Asp Asp Glu Pro Pro Asn Leu Lys Leu
            20                  25                  30
Ala Ser Cys Ala Thr Ala Ala Ser Ser Ser Ser Ser Ser Gly Ser Asp
        35                  40                  45
Met Glu Lys Gly Arg Gly Lys Ala Cys Gly Gly Gly Ser Thr Ala Pro
    50                  55                  60
Pro Pro Pro Pro Pro Ser Ser Ser Gly Lys Ser Gly Gly Gly Gly Gly
65                  70                  75                  80
Ser Asn Ile Arg Glu Ala Ala Ala Ser Gly Gly Gly Gly Gly Val Trp
                85                  90                  95
Gly Lys Tyr Phe Ser Val Glu Ser Leu Leu Leu Leu Val Cys Val Thr
            100                 105                 110
Ala Ser Leu Val Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro
        115                 120                 125
Pro Ser Met Leu Met Leu Val Pro Val Ala Met Leu Val Leu Leu Leu
    130                 135                 140
Ala Leu Ala Phe Met Pro Thr Thr Thr Ser Ser Ser Ser Ser Ala Gly
145                 150                 155                 160
Gly Gly Gly Gly Gly Gly Arg Asn Gly Ala Thr Thr Gly His Ala Pro
                165                 170                 175
Tyr Leu
<210>263
<211>126
<212>PRT
<213>稻
<400>263
Met Leu Leu Glu His Leu Met Ile Thr Met Glu Glu Gln Met Phe Arg
1               5                   10                  15
Glu Gln Gln Met Gln Arg Gly Gly Arg His His Gln His His Thr Thr
            20                  25                  30
Arg Glu Gln Glu Gln Gln Gln Lys Gln Gln Gln Arg Arg Arg Leu Met
        35                  40                  45
Asn Asn Ala Thr Asn Gly Gly Gly Gly Asp Gly Gly Ser Arg Cys Tyr
    50                  55                  60
Phe Ser Thr Glu Ala Ile Leu Val Leu Ala Cys Val Thr Val Ser Leu
65                  70                  75                  80
Leu Val Leu Pro Leu Ile Leu Pro Pro Leu Pro Pro Pro Pro Thr Leu
                85                  90                  95
Leu Leu Leu Leu Pro Val Cys Leu Leu Ala Leu Leu Val Val Leu Ala
            100                 105                 110
Phe Met Pro Thr Asp Met Arg Thr Met Ala Ser Ser Tyr Leu
        115                 120                 125
<210>264
<211>105
<212>PRT
<213>玉蜀黍
<220>
<221>不确定
<222>(65)..(75)
<223>Xaa可以是任意天然产生的氨基酸
<400>264
Met Ala Ser Arg Ser Ser Ala Met Glu Gly Gly Ala Ala Ile Gln Arg
1               5                   10                  15
Arg Asn Ala Val Lys Arg His Leu Gln Gln Arg Gln Gln Glu Ala Asp
            20                  25                  30
Phe Leu Asp Lys Lys Val Ile Ala Ser Thr Tyr Phe Ser Ile Gly Ala
        35                  40                  45
Phe Leu Val Leu Ala Cys Leu Thr Val Ser Leu Leu Ile Leu Pro Leu
    50                  55                  60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Leu Trp Leu Pro
65                  70                  75                  80
Val Cys Leu Leu Val Leu Leu Val Val Leu Ala Phe Met Pro Thr Asp
                85                  90                  95
Val Arg Ser Met Ala Ser Ser Tyr Leu
            100                 105
<210>265
<211>110
<212>PRT
<213>普通小麦
<400>265
Met Asp Ser Gln Phe Gly Ala Leu Glu Arg Gly Gly Ser Arg Gln Arg
1               5                   10                  15
Arg Ser Pro Val Leu Ala Arg Pro Asn Thr Thr Lys Arg His Ile Gln
            20                  25                  30
Gln Gln Arg Ala Asn Ala Ala Asp Lys Lys Val Val Met Pro Asn Tyr
        35                  40                  45
Phe Ser Ile Glu Ala Phe Phe Val Leu Ala Cys Leu Thr Val Ser Leu
    50                  55                  60
Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Ser Leu
65                  70                  75                  80
Leu Leu Phe Val Pro Val Cys Leu Leu Ile Leu Leu Met Val Leu Ala
                85                  90                  95
Phe Met Pro Thr Asp Met Arg Ser Met Ala Thr Ser Tyr Leu
            100                 105                 110
<210>266
<211>110
<212>PRT
<213>大麦
<400>266
Met Asp Ser Gln Phe Gly Ala Met Asp Arg Gly Gly Ser Arg Gln Arg
1               5                   10                  15
Ser Ser Pro Val Leu Ala Arg Pro Asn Thr Ala Lys Arg Gln Met Gln
            20                  25                  30
Gln Gln Arg Ala Asn Ala Ala Asp Lys Lys Val Val Ile Pro Asn Tyr
        35                  40                  45
Phe Gly Val Glu Ala Phe Phe Val Leu Ala Cys Leu Thr Val Ser Leu
    50                  55                  60
Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Ser Leu
65                  70                  75                  80
Leu Leu Leu Leu Pro Val Cys Leu Leu Ile Leu Leu Met Val Leu Ala
                85                  90                  95
Phe Met Pro Thr Asp Val  Arg Ser Met Ala Thr Ser Tyr Leu
            100                  105                 110
<210>267
<211>99
<212>PRT
<213>甘蔗
<220>
<221>不确定
<222>(62)..(62)
<223>Xaa可以是任意天然产生的氨基酸
<400>267
Met Glu Gly Gly Gly Gln Ile Gln Arg Arg Asn Asn Ala Val Lys Arg
1               5                   10                  15
His Leu Gln Gln Arg Gln Gln Glu Ala Asp Phe Leu Asp Lys Lys Val
            20                  25                  30
Ile Ala Ser Thr Tyr Phe Ser Ile Glu Ala Phe Leu Val Leu Ala Cys
        35                  40                  45
Leu Thr Val Ser Leu Leu Ile Leu Pro Leu Val Leu Pro Xaa Leu Pro
    50                  55                  60
Ala Pro Ala Ser Leu Leu Leu Trp Leu Pro Val Trp Leu Leu Glu Leu
65                  70                  75                  80
Leu Ile Val Leu Ala Phe Met Pro Thr Asp Val Arg Ser Met Ala Ser
                85                  90                  95
Ser Tyr Leu
<210>268
<211>99
<212>PRT
<213>甘蔗
<400>268
Met Glu Gly Gly Gly Gln Ile Gln Arg Arg Asn Asn Ala Val Lys Arg
1               5                   10                  15
His Leu Gln Gln Arg Gln Gln Glu Ala Asp Phe Leu Asp Lys Lys Val
            20                  25                  30
Ile Ala Ser Thr Tyr Phe Ser Ile Glu Ala Phe Leu Val Leu Ala Cys
        35                  40                  45
Leu Thr Val Ser Leu Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro
50                  55                  60
Pro Pro Pro Ser Leu Leu Leu Trp Leu Pro Val Cys Leu Leu Ile Leu
65                  70                  75                  80
Leu Ile Val Leu Ala Phe Met Pro Thr Asp Val Arg Ser Met Ala Ser
                85                  90                  95
Ser Tyr Leu
<210>269
<211>107
<212>PRT
<213>两色蜀黍
<400>269
Met Ala Ser Arg Ser Ser Ala Leu Glu Gly Gly Gly Ala Ala Ile Gln
1               5                   10                  15
Arg Arg Asn Asn Ala Val Lys Arg His Leu Gln Gln Arg Gln Gln Glu
            20                  25                  30
Ala Asp Phe His Asp Lys Lys Val Ile Ala Ser Thr Tyr Phe Ser Ile
        35                  40                  45
Gly Ala Phe Leu Val Leu Ala Cys Leu Thr Phe Ser Leu Leu Ile Leu
    50                  55                  60
Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Ser Leu Leu Leu Trp
65                  70                  75                  80
Leu Pro Val Cys Leu Leu Val Leu Leu Val Val Leu Ala Phe Met Pro
                85                  90                  95
Thr Asp Val Arg Ser Val Ala Ala Ser Tyr Leu
            100                 105
<210>270
<211>130
<212>PRT
<213>拟南芥
<400>270
Met Ile Arg Glu Ile Ser Asn Leu Gln Lys Asp Ile Ile Asn Ile Gln
1               5                   10                  15
Asp Ser Tyr Ser Asn Asn Arg Val Met Asp Val Gly Arg Asn Asn Arg
            20                  25                  30
Lys Asn Met Ser Phe Arg Ser Ser Pro Glu Lys Ser Lys Gln Glu Leu
        35                  40                  45
Arg Arg Ser Phe Ser Ala Gln Lys Arg Met Met Ile Pro Ala Asn Tyr
    50                  55                  60
Phe Ser Leu Glu Ser Leu Phe Leu Leu Val Gly Leu Thr Ala Ser Leu
65                  70                  75                  80
Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Phe Met
                85                  90                  95
Leu Leu Leu Val Pro Ile Gly Ile Met Val Leu Leu Val Val Leu Ala
            100                 105                 110
Phe Met Pro Ser Ser His Ser Asn Ala Asn Thr Asp Val Thr Cys Asn
        115                 120                 125
Phe Met
    130
<210>271
<211>135
<212>PRT
<213>拟南芥
<400>271
Met Ile Arg Glu Phe Ser Ser Leu Gln Asn Asp Ile Ile Asn Ile Gln
1               5                   10                  15
Glu His Tyr Ser Leu Asn Asn Asn Met Asp Val Arg Gly Asp His Asn
            20                  25                  30
Arg Lys Asn Thr Ser Phe Arg Gly Ser Ala Pro Ala Pro Ile Met Gly
        35                  40                  45
Lys Gln Glu Leu Phe Arg Thr Leu Ser Ser Gln Asn Ser Pro Arg Arg
    50                  55                  60
Leu Ile Ser Ala Ser Tyr Phe Ser Leu Glu Ser Met Val Val Leu Val
65                  70                  75                  80
Gly Leu Thr Ala Ser Leu Leu Ile Leu Pro Leu Ile Leu Pro Pro Leu
                85                  90                  95
Pro Pro Pro Pro Phe Met Leu Leu Leu Ile Pro Ile Gly Ile Met Val
            100                 105                 110
Leu Leu Met Val Leu Ala Phe Met Pro Ser Ser Asn Ser Lys His Val
        115                 120                 125
Ser Ser Ser Ser Thr Phe Met
    130                 135
<210>272
<211>139
<212>PRT
<213>葡萄
<400>272
Met Ser Ile Glu Gln Pro Glu Ala Asp Ser Arg Leu Ser Glu Gly Pro
1               5                   10                  15
Leu Ile Asn Leu Gln Asp Arg Tyr Leu Ser Gly Ile Met Glu Ala Arg
            20                  25                  30
Gly Arg Arg Asn Ser Ala Pro Leu Gln Val Glu Arg Lys Asn Pro Thr
        35                  40                  45
Pro Pro Met Ala Glu Gly Lys Lys Met Glu Tyr Asn Arg Thr Pro Leu
    50                  55                  60
Ser Arg Glu Asn Ser Arg Arg Leu Ile Pro Ala Ser Tyr Phe Ser Leu
65                  70                  75                  80
Glu Ser Leu Leu Leu Leu Ile Cys Leu Thr Ala Ser Leu Leu Ile Leu
                85                  90                  95
Pro Leu Ile Leu Pro Pro Leu Pro Pro Pro Pro Phe Met Leu Leu Leu
            100                 105                 110
Leu Pro Ile Gly Ile Leu Ala Val Leu Met Ile Leu Ala Phe Met Pro
        115                 120                 125
Ser Asn Val Arg Asp Leu Thr Tyr Thr Tyr Val
    130                 135
<210>273
<211>126
<212>PRT
<213>柑橘属物种(Citrus sp.)
<220>
<221>不确定
<222>(103)..(103)
<223>Xaa可以是任意天然产生的氨基酸
<400>273
Met Asn Ser Asp Asn Ser Glu Ser Arg Gln Arg Leu Ser Lys Gly Ile
1               5                   10                  15
Ile Asn Leu Gln Asp Arg Tyr Pro Thr Ser Ile Met Asp Arg Gly Val
            20                  25                  30
Arg Lys Ile Ala Thr Pro Pro Val Glu Lys Arg Lys Val Glu Tyr His
        35                  40                  45
Arg Ser Tyr Ser Gln Gly Ala Ser Arg Lys Leu Phe Ser Ala Ser Tyr
    50                  55                  60
Phe Thr Leu Glu Ser Leu Leu Leu Leu Val Cys Leu Thr Ala Ser Leu
65                  70                  75                  80
Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Phe Leu
                85                  90                  95
Leu Leu Leu Val Pro Ile Xaa Ile Leu Ala Val Leu Leu Val Leu Ala
            100                 105                 110
Phe Met Pro Ser Asn Val Arg Asp Ile Thr Ser Thr Tyr Val
        115                 120                 125
<210>274
<211>118
<212>PRT
<213>番茄(Lycorpersicon esculentum)
<400>274
Met Asn Met Asp Met Glu Ser Ser Glu Ala Lys Leu Arg Ser Ser Lys
1               5                   10                  15
Gly Phe Ile Asn Leu Glu Glu His Gln Gln Tyr Phe Asn Asn Ile Met
            20                  25                  30
Glu Gly Asn Lys Met Glu His Lys Arg Ser Phe Thr Gln Gly His Gly
        35                  40                  45
Lys Lys Met Leu Ser Met Asn Tyr Phe Ser Leu Glu Ser Ile Ile Leu
    50                  55                  60
Leu Leu Gly Leu Thr Ala Ser Leu Leu Leu Leu Pro Leu Met Leu Pro
65                  70                  75                  80
Pro Leu Pro Pro Pro Pro Phe Met Leu Leu Leu Val Pro Ile Phe Ile
                85                  90                  95
Leu Val Val Leu Met Ile Leu Ala Phe Met Pro Ser Asn Val Arg Asn
            100                 105                 110
Val Thr Cys Ser Tyr Leu
        115
<210>275
<211>87
<212>PRT
<213>番茄
<400>275
Met Glu Gly Asn Lys Met Glu His Lys Arg Ser Phe Thr Gln Gly His
1               5                   10                  15
Gly Lys Lys Met Leu Ser Met Asn Tyr Phe Ser Leu Glu Ser Ile Ile
            20                  25                  30
Leu Leu Leu Gly Leu Thr Ala Ser Leu Leu Leu Leu Pro Leu Met Leu
        35                  40                  45
Pro Pro Leu Pro Pro Pro Pro Phe Met Leu Leu Leu Val Pro Ile Phe
    50                  55                  60
Ile Leu Val Val Leu Met Ile Leu Ala Phe Met Pro Ser Asn Val Arg
65                  70                  75                  80
Asn Val Thr Cys Ser Tyr Leu
                85
<210>276
<211>106
<212>PRT
<213>拟南芥
<400>276
Met Asp Val Gly Arg Asn Asn Arg Lys Asn Met Ser Phe Arg Ser Ser
1               5                   10                  15
Pro Glu Lys Ser Lys Gln Glu Leu Arg Arg Ser Phe Ser Ala Gln Lys
            20                  25                  30
Arg Met Met Ile Pro Ala Asn Tyr Phe Ser Leu Glu Ser Leu Phe Leu
        35                  40                  45
Leu Val Gly Leu Thr Ala Ser Leu Leu Ile Leu Pro Leu Val Leu Pro
    50                  55                  60
Pro Leu Pro Pro Pro Pro Phe Met Leu Leu Leu Val Pro Ile Gly Ile
65                  70                  75                  80
Met Val Leu Leu Val Val Leu Ala Phe Met Pro Ser Ser His Ser Asn
                85                  90                  95
Ala Asn Thr Asp Val Thr Cys Asn Phe Met
            100                 105
<210>277
<211>537
<212>DNA
<213>稻
<400>277
atgtacttgt tgagcccaag aaatggcgac gaggaggacg aacaggagga aatccaggag   60
ctgatcagcg acgacgagcc gcccaatctc aagttggcat cctgcgccac tgcagccagc  120
agcagcagca gcagcggcag cgacatggag aagggaagag gtaaagcctg cggcggcggg  180
agtacggcgc cgccgccgcc gccgccgtcg tcgtcaggta aatccggcgg cggcggcggc  240
agcaatatca gggaggcggc ggctagcggc ggcggcggcg gcgtgtgggg caagtacttc  300
tcggtggagt cgctgctcct gctggtgtgc gtgacggcgt cgctggtgat cctcccgctc  360
gtgctgccgc cgctgccccc gccgccgtcg atgctgatgc tggtgccggt ggcgatgctg  420
gtgctgctgc tggcgctggc gttcatgccg acgacgacgt cgtcgtcgtc gtccgccggc  480
ggcggcggcg gcggcggccg caatggggcg acgacgggac atgctcccta cttgtag     537
<210>278
<211>538
<212>DNA
<213>玉蜀黍
<220>
<221>misc_feature
<222>(177)..(208)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(493)..(493)
<223>n是a、c、g或t
<400>278
ttcacattac actcatgact cgtcttagga cgaatcctgc agctgcaaaa cacagaaaat   60
ctggccaaga cctatttatc tatttacagg taagaggagg ccatgctgcg cacatctgtc  120
ggcatgaagg ccagtacaac cagcaagacg agcaggcaga ccggcagcca cagcagnnnn  180
nnnnnnnnnn nnnnnnnnnn nnnnnnnncc agcggcagta tcagcagcga gacggtgagg  240
caggcgagca cgaggaatgc cccgatgctg aagtaggtgg acgcgatgac cttcttgtcg  300
aggaaatccg cctcctgctg acgctgctgc agatgccgct tcacggcatt cctcctttgt  360
attgccgccc ctccttccat cgcgctagat cggcttgcca tgtgttcttt ggtgtaggcg  420
gaggtggaga ccagtcgcag tgagtggttg ccaaagtaag caagaagtga aaggcggtgt  480
agaaccgcct tgngttttct gaacgttttg taatcagatc tgagctcggg tggtcgaa    538
<210>279
<211>578
<212>DNA
<213>葡萄
<400>279
tttttttttt tttttttaat caagaaataa aataactgat tttcatctga atatcaagac   60
aaataacaaa aattgtatga tgagaagagg tgcacttttg aacaccacca tttacacata  120
tgtataagtc aaatctctga cattagaagg catgaaagcc aagatcataa gcactgctag  180
aatgccaatg gggagcagaa gcagcatgaa aggagggggt ggcaatggtg gtagtatcag  240
gggaaggatc agcaatgaag ccgtgagaca gatgagcaaa agcaatgact ccaagctgaa  300
atagcttgct gggatcagtc tcctgctgtt ctctcgtgag aggggagttc tattatattc  360
catcttcttt ccttcggcca taggaggagt agggtttttc ctctcaactt gcagaggagc  420
agagttcctc cttcctctcg cttccatgat gccactcaaa tatcgatctt gcagattgat  480
caaaggtcct tcagacagtc ttgaatctgc ttcaggctgc tcaatactca tttaaatttc  540
tcctttaccg gtcaccaagt tccaaccggt tcaaagta                          578
<210>280
<211>704
<212>DNA
<213>Citrus reticulata
<220>
<221>misc_feature
<222>(619)..(619)
<223>n是a、c、g或t
<400>280
agggtttctt caaagatagg tagccatttg cacatttgaa tctgcttgtt ggatattgtc   60
aaggaggctg ttggaattag gccacatttc agaatctggt ttcatcctgg atcgctgggc  120
atttgaaggc attttgtgat catcgctgtt taaaatttgg ccgcatatta gaatctgggt  180
tctcatcggt tttccgtaca tttaccttga ccacattttg atatctgggt tgagctgcat  240
tttagccttc gtatttaaaa ggacttgatc taatctgggg tcttggtgag ccggggcaac  300
tgatcatagt aaatgaattc tgataattct gagtcgagac agagactatc aaagggcatt  360
ataaacttgc aagatcgata tccgaccagc attatggatc gtggtgtaag aaaaattgca  420
actcctccgg tcgagaagag gaaagttgag tatcaccgaa gttactcgca aggggcatcc  480
agaaaactgt tttcggcaag ctatttcacc ctggaatcat tgcttttgct cgtatgtctg  540
acggcctcat tgctgatcct gccattggtg cttccgccct tgccgccccc gccattcctg  600
ctgcttctgg ttcctatang tattctagcc gtgcttttgg tcttggcatt catgccttct  660
aatgtaagag atataacttc cacgtacgtg taaatggtgt tgct                   704
<210>281
<211>382
<212>DNA
<213>番茄
<400>281
gaaaaaaatg tatttaatca ttatgtaaaa aacaagtgaa tctactttga tattttcttc   60
taaattaaac cacacaatta aagatatgag caagtcacat tcctaacatt agaaggcata  120
aaagctaaga tcataagaac aacaagaatg aaaattggga ctaacaacaa cataaaaggt  180
ggtggtggca atggtggaag catcaatggc aaaagtaaca aagatgctgt aagaccaagt  240
aacaaaataa ttgactctaa gctaaaataa ttcattgaca acattttctt gccatgtcct  300
tgtgtaaatg atctcttatg ctccatctta ttgccttcca taatgttgtt gaaatattgt  360
tgatgttcct ccaaattaat aa                                           382
<210>282
<211>624
<212>DNA
<213>番茄
<400>282
tttgttaaag attggcacat tttcaagttc agtattcatt cgatttttga tatctacata   60
aaaaaaaagt gtcctggtac tactcaatat tcctcagaac gacttcatat tcaggtctcg  120
aattcaaaac ctcacatcaa gattcttagg aaatttcaag attggttgaa aaactcatat  180
ccttctctaa gtttcaagat tggttccaaa ttaaaactcg agacttctga gtaagagcgt  240
acgactagta atgaacatgg acatggaatc atcagaggca aaattgagat catcaaaagg  300
gtttattaat ttggaggaac atcaacaata tttcaacaac attatggaag gcaataagat  360
ggagcataag agatcattta cacaaggaca tggcaagaaa atgttgtcaa tgaattattt  420
tagcttagag tcaattattt tgttacttgg tcttacagca tctttgttac ttttgccatt  480
gatgcttcca ccattgccac caccaccttt tatgttgttg ttagtcccaa ttttcattct  540
tgttgttctt atgatcttag cttttatgcc ttctaatgtt aggaatgtga cttgctcata  600
tctttaattg tgtggtttaa ttta                                         624
<210>283
<211>1130
<212>DNA
<213>稻
<400>283
catgcggcta atgtagatgc tcactgcgct agtagtaagg tactccagta cattatggaa   60
tatacaaagc tgtaatactc gtatcagcaa gagagaggca cacaagttgt agcagtagca  120
caggattaga aaaacgggac gacaaatagt aatggaaaaa caaaaaaaaa caaggaaaca  180
catggcaata taaatggaga aatcacaaga ggaacagaat ccgggcaata cgctgcgaaa  240
gtactcgtac gtaaaaaaaa gaggcgcatt catgtgtgga cagcgtgcag cagaagcagg  300
gatttgaaac cactcaaatc caccactgca aaccttcaaa cgaggccatg gtttgaagca  360
tagaaagcac aggtaagaag cacaacgccc tcgctctcca ccctcccacc caatcgcgac  420
gcacctcgcg gatcggtgac gtggcctcgc cccccaaaaa tatcccgcgg cgtgaagctg  480
acaccccggg cccacccacc tgtcacgttg gcacatgttg gttatggttc ccggccgcac  540
caaaatatca acgcggcgcg gcccaaaatt tccaaaatcc cgcccaagcc cctggcgcgt  600
gccgctcttc cacccaggtc cctctcgtaa tccataatgg cgtgtgtacc ctcggctggt  660
tgtacgtggg cgggttaccc tgggggtgtg ggtggatgac gggtgggccc ggaggaggtc  720
cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgc gaaaaggagg cgatcggtac  780
gaaaattcaa attaggaggt ggggggcggg gcccttggag aataagcgga atcgcagata  840
tgcccctgac ttggcttggc tcctcttctt cttatccctt gtcctcgcaa ccccgcttcc  900
ttctctcctc tcctcttctc ttctcttctc tggtggtgtg ggtgtgtccc tgtctcccct  960
ctccttcctc ctctcctttc ccctcctctc ttcccccctc tcacaagaga gagagcgcca 1020
gactctcccc aggtgaggtg agaccagtct ttttgctcga ttcgacgcgc ctttcacgcc 1080
gcctcgcgcg gatctgaccg cttccctcgc ccttctcgca ggattcagcc            1130
<210>284
<211>77
<212>PRT
<213>紫苜蓿
<400>284
Met Val Arg Cys Phe Ser Leu Gly Ser Val Leu Ile Leu Ile Ala Leu
1               5                   10                  15
Ala Ala Ser Met Val Val Leu Pro Leu Met Leu Pro Pro Leu Pro Pro
            20                  25                  30
Pro Pro Leu Ala Leu Leu Phe Phe Pro Val Gly Ile Met Ala Ala Leu
        35                  40                  45
Val Val Leu Ala Phe Ser Pro Ser Glu Asn Val Lys Asn Val Val Val
    50                  55                  60
Tyr Ser Ser Ser Ser Ser Gly Ile Ala Asn Ser Lys Arg
65                  70                  75
<210>285
<211>78
<212>PRT
<213>紫苜蓿
<400>285
Met Ile Met Val Ala Ser Lys Glu Lys Thr Asn Ser Gly Gly Cys Met
1               5                   10                  15
Phe Arg Tyr Ser Val Leu Ile Leu Ser Leu Leu Ala Leu Ser Ile Leu
            20                  25                  30
Val Leu Pro Leu Val Met Pro Pro Leu Pro Pro Pro Pro Leu Leu Leu
        35                  40                  45
Leu Leu Val Pro Val Phe Ile Met Leu Leu Leu Phe Phe Ile Ala Phe
    50                  55                  60
Ser Pro Ser Lys Lys Val Pro Asn Lys Ala Ser Phe Val Ser
65                  70                  75
<210>286
<211>613
<212>DNA
<213>大麦
<400>286
cttccgagaa agatgcttca tattgcactc atcttatgcc aacacacaat cagaaacaaa   60
aaccacgcag caagcctatt tacaagtaag aggtggccat gctccgcaca tcagtcggca  120
tgaaggccag caccatcaac aggatgagca agcagaccgg caagagcagc agtagcgatg  180
gcggtggggg caacggaggc agcaccaatg gcagtatgag caatgaaacg gtgaggcagg  240
cgagcacgaa gaacgcttcg acgccgaagt agttcggtat gacaaccttc ttgtcagcag  300
catttgccct ctgctgctgc atttgcctct ttgcagtatt tggtctggct aacacagggc  360
tgctcctctg cctactaccg cctctgtcca ttgcaccgaa ctggctatcc atctattctt  420
tggtgagtgc agatcagcgg ctatccagga actgagatga ataagaactt gtggaatctg  480
aaggttttta acagatctga agtctttgtg agtccgtgac tgaactgcag atcatctgct  540
gtggaagaac tgcaccgcaa gtggcaatac cttcgatcct gaaacttgca ttttggtgat  600
gcccgtacca cgc                                                     613
<210>287
<211>617
<212>DNA
<213>甘蔗
<220>
<221>misc_feature
<222>(451)..(451)
<223>n是a、c、g或t
<400>287
ggagaacgtg cttgttcagg tggttcaaca gtgcggacca gagaacaatg cgaggttcag   60
gattaaaggt attctggctt cagaggcagt tcttccaaag caagtgacag gcgattccat  120
caccggagct aagatcttat tacaacattc agaaacacag gagtcctccc accgcctttc  180
acttcttgct tacttctgca accactcgcc gtgactgatc tccacgcaca ccaaagaaca  240
caacacgtgg caagccgatc tagcgcgatg gaaggagggg ggcaaataca gaggaggaat  300
aatgccgtga agcggcacct gcagcagcgg cagcaggagg cggatttcct cgacaagaag  360
gtcatcgcgt ccacctattt cagcatcgag gcgttcctcg tgctcgcctg cctcaccgtc  420
tcgctgctga tactgccgct tgtgctgccg ncgctgccgg cgccggcgtc gctgctgctg  480
tggctgccgg tctggctgct cgaactgctg attgtgcttg ccttcatgcc gacagatgtg  540
cgcagcatgg cctcctctta cttgtaaaaa aatagataaa taggccacct ttggcaattt  600
tctggggttt ggaggtg                                                 617
<210>288
<211>638
<212>DNA
<213>甘蔗
<400>288
gattttttcc aagccagtga ccggcgattc atcaaccgga gctgagatct tatacaacat   60
tcagaaacac aggagtcctc gcaccgcttt ccactcttgg ctaattttgc aaccactcgc  120
cgtgactgat ctccacgcac accaaagaac acaacacgtg gcaacccgat ctagcgcgat  180
ggaaggaggg gggcaaatac agaggaggaa taatgccgtg aagcggcacc tgcagcagcg  240
gcagcaggag gcggatttcc tcgacaagaa ggtcatcgcg tccacctatt tcagcatcga  300
ggcgttcctc gtgctcgcct gcctcaccgt ctcgctgctg atactgccgc tggtgctgcc  360
gccgctgccg ccgccgccgt cgctgctgct gtggctgccg gtctgcctgc tcatcctgct  420
gattgtgctg gccttcatgc cgacagatgt gcgcagcatg gcctcctctt acttgtaata  480
aatagataaa taggccacct tggtcaatat tctgtgattt ggaggtgatt cgtcctgaga  540
tgagtctcga ttgatgtcag ctactcccaa ggggaaatgc atgtaacact tggtggccga  600
cggtggcaag ataatcatgc taccatgtca gttaaacc                          638
<210>289
<211>778
<212>DNA
<213>两色蜀黍
<400>289
gctgttggtg ttgttcttga gatctctttc ttgatcttgt gtgggattaa agagggattc   60
ttgccttcct acgggagaaa gagaaaaggg gaagaacgtg cttgttccgg tggttcaaca  120
gtgcggagac ccggagaaca atgcgaggtt caggattaaa ggtgttctgg cttcaggtgc  180
agttcttcca aagcaggtga caggcgattc gatcaccgga gctcagatct gacgaaaaca  240
aaacacagtc ctcctcccac cgcctttcag ttcttgctta cttctgcaac cactcactgc  300
gaccgtacac caaagaacac tgcacatggc aagccgatct agcgcgctgg aaggaggggg  360
ggcagcaata cagcggagga ataatgccgt gaagcggcac ctgcagcagc ggcagcagga  420
ggcggatttc cacgacaaga aggtcatcgc gtccacctac ttcagcatcg gcgcgttcct  480
ggtgctcgcc tgcctcacct tctcgctgct catcctgccg ctggtgctgc cgccgctgcc  540
gccgccgccg tcgctgctgc tgtggctgcc ggtctgcctg ctcgtcctgc tggttgtgct  600
ggccttcatg ccgacagatg tgcgcagcgt ggcggcctct tacttgtaaa tagccagata  660
aataggccac cacctttggc cagttttctg tgttttcggg ggtgattcgt cctaagatga  720
gtcatgatcg agtgtaatgt gaagcatctt ttccaggggt agtagatttc aatgaagt    778
<210>290
<211>732
<212>DNA
<213>拟南芥
<400>290
ttgtcttcct catttcccta ctagtacttg tttcacacag tttcttgatc caaccaaaac   60
caatacacaa agcttctcaa actccttcac ctcaaagctt cttcctttac atctgaatcg  120
ttgagttaac tcggatttgt tctgcatcct ctgtttctga atcgtgggcc atccttattt  180
tgtctcgaat tcttcaccaa ttgcttcgat caagctgcat tggttaacca gttgccctaa  240
agatcagatc tttgagcaaa attttgtcac tgatcttcta aatccaaacc agacacagca  300
aaacaacctc tgtagatgat tcgagaaatc tcaaacttac aaaaagatat tataaacatt  360
caagacagtt attcgaacaa ccgagtcatg gacgtcggaa gaaacaaccg gaaaaacatg  420
agctttcgaa gttcgccgga gaaaagcaag caagagttac ggcggagttt ctcggcgcag  480
aaaaggatga tgatcccggc gaattatttc agtttagagt ctctgttcct attggttggt  540
ctaacggcat ctctgttaat acttccgtta gttttgccgc cgttacctcc gcctccgttt  600
atgctgctat tggttcccat tgggattatg gttttactcg tcgttcttgc cttcatgcct  660
tcttctcatt ctaatgctaa tacagatgta acttgcaatt tcatgtaaat ctgaaattta  720
ttatatgatg at                                                      732
<210>291
<211>891
<212>DNA
<213>拟南芥
<400>291
cccactttat ttcttcttct ctggttttct taccaaaaga aactttcttc gtcttcctct   60
gtatttaagc tttaacaccc tgtttttggt ttccaacgtt caatcttcat cttcttctcg  120
ctgaaggtgt gtttggctct aacggtttaa agctttcttg aaacaccaat tgaatctttt  180
ctctctaccg gcaaaaaaaa aagattagtc cttttaggtc tggaaacgcc aagatcactc  240
gttctaaacc ttagattttg tctgcatttc gggataatca tttcatcgtc agggttcttc  300
aaccaaacta catttacaga agaagaagaa gaagaaaagt tcgttacttt ttatgcgttt  360
ggataaacaa actcaagttt cttcttcata catcgatctg attttccaga tcaaacttcg  420
aaaagagaaa aagccttctt taaatgattc gtgagttctc cagtctacaa aacgacatca  480
taaacattca agaacattat tctctcaaca acaacatgga cgtgagagga gatcataacc  540
ggaaaaacac gagttttcgt ggttcagctc cagctccgat tatggggaag caagaattgt  600
ttcggacatt gtcgtcgcag aacagtccaa ggaggctaat atcagcgagt tacttcagtt  660
tagaatcaat ggttgtgctt gttggtctca cagcatctct cttgatctta ccgttgattc  720
ttccaccatt gcctcctcct ccttttatgc tgcttttgat tcctattggg attatggttt  780
tgcttatggt tcttgctttc atgccttctt ctaattccaa acatgtttct tcttcttcca  840
cttttatgta ataaacgttt ctttaattga agaaagaaat ccttaaacaa a           891
<210>292
<211>732
<212>DNA
<213>拟南芥
<400>292
ttgtcttcct catttcccta ctagtacttg tttcacacag tttcttgatc caaccaaaac   60
caatacacaa agcttctcaa actccttcac ctcaaagctt cttcctttac atctgaatcg  120
ttgagttaac tcggatttgt tctgcatcct ctgtttctga atcgtgggcc atccttattt     180
tgtctcgaat tcttcaccaa ttgcttcgat caagctgcat tggttaacca gttgccctaa     240
agatcagatc tttgagcaaa attttgtcac tgatcttcta aatccaaacc agacacagca     300
aaacaacctc tgtagatgat tcgagaaatc tcaaacttac aaaaagatat tataaacatt     360
caagacagtt attcgaacaa ccgagtcatg gacgtcggaa gaaacaaccg gaaaaacatg     420
agctttcgaa gttcgccgga gaaaagcaag caagagttac ggcggagttt ctcggcgcag     480
aaaaggatga tgatcccggc gaattatttc agtttagagt ctctgttcct attggttggt     540
ctaacggcat ctctgttaat acttccgtta gttttgccgc cgttacctcc gcctccgttt     600
atgctgctat tggttcccat tgggattatg gttttactcg tcgttcttgc cttcatgcct     660
tcttctcatt ctaatgctaa tacagatgta acttgcaatt tcatgtaaat ctgaaattta     720
ttatatgatg at                                                         732
<210>293
<211>1130
<212>DNA
<213>稻
<400>293
catgcggcta atgtagatgc tcactgcgct agtagtaagg tactccagta cattatggaa      60
tatacaaagc tgtaatactc gtatcagcaa gagagaggca cacaagttgt agcagtagca     120
caggattaga aaaacgggac gacaaatagt aatggaaaaa caaaaaaaaa caaggaaaca     180
catggcaata taaatggaga aatcacaaga ggaacagaat ccgggcaata cgctgcgaaa     240
gtactcgtac gtaaaaaaaa gaggcgcatt catgtgtgga cagcgtgcag cagaagcagg     300
gatttgaaac cactcaaatc caccactgca aaccttcaaa cgaggccatg gtttgaagca     360
tagaaagcac aggtaagaag cacaacgccc tcgctctcca ccctcccacc caatcgcgac     420
gcacctcgcg gatcggtgac gtggcctcgc cccccaaaaa tatcccgcgg cgtgaagctg     480
acaccccggg cccacccacc tgtcacgttg gcacatgttg gttatggttc ccggccgcac     540
caaaatatca acgcggcgcg gcccaaaatt tccaaaatcc cgcccaagcc cctggcgcgt     600
gccgctcttc cacccaggtc cctctcgtaa tccataatgg cgtgtgtacc ctcggctggt     660
tgtacgtggg cgggttaccc tgggggtgtg ggtggatgac gggtgggccc ggaggaggtc     720
cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgc gaaaaggagg cgatcggtac     780
gaaaattcaa attaggaggt ggggggcggg gcccttggag aataagcgga atcgcagata     840
tgcccctgac ttggcttggc tcctcttctt cttatccctt gtcctcgcaa ccccgcttcc     900
ttctctcctc tcctcttctc ttctcttctc tggtggtgtg ggtgtgtccc  tgtctcccct    960
ctccttcctc ctctcctttc ccctcctctc ttcccccctc tcacaagaga gagagcgcca    1020
gactctcccc aggtgaggtg agaccagtct ttttgctcga ttcgacgcgc ctttcacgcc    1080
gcctcgcgcg gatctgaccg cttccctcgg ccttctcgca ggattcagcc               1130

Claims (156)

1.用于增强植物中产量相关性状的方法,其包括调节编码伸展蛋白受体样激酶(ERLK蛋白质)的核酸或其部分在植物中的表达,所述伸展蛋白受体样激酶由SEQ ID NO:2、SEQ ID NO:12、SEQ ID NO:14中任一个所示,或是前述任意序列的直向同源物或旁系同源物,所述部分编码包含至少跨膜结构域和激酶结构域的多肽。
2.根据权利要求1的方法,其中所述调节表达通过T-DNA激活标签、TILLING和同源重组的任何一种或多种方法实现。
3.根据权利要求1的方法,其中所述调节表达通过在植物引入并表达编码ERLK蛋白质或其部分的核酸来实现,所述ERLK蛋白质由SEQ IDNO:2、SEQ ID NO:12、SEQ ID NO:14中任一个所示,或是前述任意SEQID NO的直向同源物或旁系同源物,所述部分是包含至少跨膜结构域和激酶结构域的那些。
4.根据权利要求1-3中任一项的方法,其中所述增强的产量相关性状是下列一种或多种:增加的生物量、增加的种子产量(种子重量)或增加的饱满种子数。
5.根据权利要求1-3中任一项的方法,其中所述核酸与组成型启动子有效连接,优选与GOS2启动子有效连接,更优选与SEQ ID NO:58所示的GOS2启动子有效连接。
6.根据权利要求3-5中任一项的方法,其中所述核酸是根据SEQ IDNO:1、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQID NO:53和SEQ ID NO:55中的任一个核酸序列的部分、等位变体、剪接变体,或是能够与所述核酸序列杂交的序列,其中所述部分、等位变体、剪接变体,或杂交序列编码ERLK蛋白质的至少跨膜结构域和激酶结构域。
7.根据权利要求1-6中任一项的方法,其中所述编码ERLK蛋白质或其部分的核酸是植物来源的,优选来自双子叶植物,还优选来自十字花科植物,更优选来自拟南芥属,最优选来自拟南芥。
8.通过根据权利要求1-7中任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码ERLK蛋白质或其部分的核酸,所述部分包含至少跨膜结构域和激酶结构域。
9.构建体,其包含:
(i)编码ERLK蛋白质或其部分的核酸,所述ERLK蛋白质由SEQ IDNO:2、SEQ ID NO:12、SEQ ID NO:14中任一个所示,或是前述任意SEQID NO的直向同源物或旁系同源物,所述部分编码包含至少跨膜结构域和激酶结构域的多肽;
(ii)能够驱动(i)的核酸序列表达的一种或多种调控序列;和任选地
(iii)转录终止序列。
10.根据权利要求9的构建体,其中所述一种或多种调控序列至少是组成型启动子,优选是GOS2启动子。
11.根据权利要求9或10的构建体在制备植物中的用途,所述植物相对于对照植物具有增强的产量相关性状,尤其是增加的生物量、增加的种子产量(种子重量)和/或增加的饱满种子数。
12.植物、植物部分或植物细胞,其由权利要求9或10的构建体转化。
13.用于制备相对于对照植物具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(i)在植物引入并表达编码ERLK蛋白质或其部分的核酸,所述ERLK蛋白质由SEQ ID NO:2、SEQ ID NO:12、SEQ ID NO:14中任一个所示,或是前述任意SEQ ID NO的直向同源物或旁系同源物,所述部分是包含至少跨膜结构域和激酶结构域的那些;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
14.相对于对照植物具有增加的产量的转基因植物,所述增加的产量因编码ERLK蛋白质或其部分的核酸的增加的表达而产生,其中所述ERLK蛋白质由SEQ ID NO:2、SEQ ID NO:12、SEQ ID NO:14中任一个所示,或是前述任意SEQ ID NO的直向同源物或旁系同源物,所述部分是包含至少跨膜结构域和激酶结构域的那些。
15.根据权利要求8、12或14中任一项的植物,其中所述植物是作物植物或单子叶植物或谷物,如稻、玉米、小麦、大麦、粟、黑小麦、黑麦、高粱和燕麦。
16.根据权利要求8、12、14或15中任一项的植物的可收获部分,其中所述可收获部分是种子。
17.来自根据权利要求15的植物和/或根据权利要求16的植物的可收获部分的产物。
18.编码ERLK蛋白质或其部分的核酸在增强植物产量相关性状中的用途,其中所述ERLK蛋白质由SEQ ID NO:2、SEQ ID NO:12、SEQ IDNO:14中任一个所示,或是前述任意SEQ ID NO的直向同源物或旁系同源物,所述部分是包含至少跨膜结构域和激酶结构域的那些。
19.根据权利要求18的用途,其中所述增强的产量相关性状是增加的生物量、增加的种子产量(种子重量)和/或增加的饱满种子数。
20.用于相对于对照植物增加植物产量的方法,其包括增加编码F-框WD40(FBXW)多肽的核酸在植物中的表达,和任选地选择具有增加的产量的植物。
21.根据权利要求20的方法,其中所述增加表达通过T-DNA激活标签、TILLING和同源重组的任何一种或多种方法实现。
22.根据权利要求20的方法,其中所述增加的表达通过在植物引入并表达编码FBXW多肽的核酸来实现。
23.根据权利要求20-22中任一项的方法,其中所述核酸是根据SEQID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67或SEQ ID NO:69中的任一个核酸序列的部分、等位变体、剪接变体,或是能够与所述核酸序列杂交的序列,其中所述部分、等位变体、剪接变体,或杂交序列编码FBXW多肽。
24.根据权利要求23的方法,其中所述部分、等位变体、剪接变体,或杂交序列编码FBXW多肽的直向同源物或旁系同源物。
25.根据权利要求20-24中任一项的方法,其中所述编码FBXW多肽的核酸是植物来源的,优选来自双子叶植物,还优选来自十字花科植物,最优选来自拟南芥。
26.根据权利要求20-25中任一项的方法,其中所述核酸与组成型启动子有效连接,优选与GOS2启动子有效连接,更优选与稻GOS2启动子有效连接。
27.根据权利要求26的方法,其中所述组成型启动子由与SEQ IDNO:58基本相似的核酸序列所代表,最优选是SEQ ID NO:58所代表的组成型启动子。
28.根据权利要求20-27中任一项的方法,其中所述增加的产量选自下列一种或多种:a)增加的种子生物量;b))增加的(饱满)种子数;c)增加的千粒重(TKW);d)增加的收获指数;和e)增加的种子饱满率。
29.通过根据权利要求20-28中任一项的方法可获得的植物或包含种子的此类植物的部分或细胞,其中所述植物、其植物部分或植物细胞包含编码FBXW多肽的核酸,所述核酸与组成型启动子有效连接。
30.构建体,其包含:
(i)编码FBXW多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一种或多种调控序列。
31.根据权利要求30的构建体,其中所述一种或多种调控序列至少是组成型启动子,优选是GOS2启动子。
32.根据权利要求30或31的构建体在增加植物产量中的用途。
33.植物、植物部分或植物细胞,其由权利要求30或31的构建体转化。
34.用于制备相对于对照植物具有增加的产量的转基因植物的方法,所述方法包括:
(i)在植物引入并表达编码FBXW多肽的核酸;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
35.相对于对照植物具有增加的产量的转基因植物,所述增加的产量因编码FBXW多肽的核酸的增加的表达而产生。
36.根据权利要求29、33或35中任一项的植物,其中所述植物是作物植物或单子叶植物或谷物,如稻、玉米、小麦、大麦、粟、黑小麦、黑麦、高粱和燕麦。
37.根据权利要求29、33、35或36中任一项的植物的可收获部分,其中所述可收获部分是种子。
38.来自根据权利要求36的植物或根据权利要求37的植物的可收获部分的产物。
39.相对于对照植物的产量,编码FBXW多肽的核酸增加植物产量的用途,其中所述核酸与组成型启动子有效连接。
40.根据权利要求39的用途,其中所述增加的产量选自下列一种或多种:a)增加的种子生物量;b))增加的(饱满)种子数;c)增加的千粒重(TKW);d)增加的收获指数;和e)增加的种子饱满率。
41.用于增强植物中产量相关性状的方法,其包括优先调节编码RAN结合蛋白质(RANBP)的核酸在植物种子或种子部分中的表达,所述RAN结合蛋白质包含基序I:KSC V/L WHAXDF A/S DGELK D/E EXF,其中‘X’是任意氨基酸,允许在任何位置有零个或一个保守性改变,和/或允许在任何位置有零个、一个、两个或三个非保守性改变。
42.根据权利要求41的方法,其中所述优选调节表达通过T-DNA激活标签、TILLING和同源重组的任何一种或多种方法实现。
43.根据权利要求41的方法,其中所述优选调节表达通过在植物种子或种子部分中引入并表达编码包含基序I的RANBP的核酸来实现。
44.根据权利要求41-43中任一项的方法,其中所述RANBP还包含下列基序中的一个或多个:
(a)SEQ ID NO:139或145所示的基序II,或与SEQ ID NO:139或145所示的基序II具有一定序列同一性的基序,所述序列同一性按照增加的优选顺序为至少60%、70%、80%、90%或更高的百分比;
(b)SEQ ID NO:140或146所示的基序III,或与SEQ ID NO:140或146所示的基序III具有一定序列同一性的基序,所述序列同一性按照增加的优选顺序为至少70%、80%、90%或更高的百分比;
(c)SEQ ID NO:141或147所示的基序IV,允许在任何位置有零个或一个保守性改变,和/或允许在任何位置有零个或一个非保守性改变;
(d)SEQ ID NO:142或148所示的基序V,或与SEQ ID NO:142或148所示的基序V具有一定序列同一性的基序,所述序列同一性按照增加的优选顺序为至少70%、80%、90%或更高的百分比;
(e)SEQ ID NO:143或149所示的基序VI,允许在任何位置有零个或一个保守性改变,和/或允许在任何位置有零个或一个非保守性改变;
(f)SEQ ID NO:144或150所示的基序VII,或与SEQ ID NO:144或150所示的基序VII具有一定序列同一性的基序,所述序列同一性按照增加的优选顺序为至少60%、70%、80%、90%或更高的百分比。
45.根据权利要求41-44中任一项的方法,其中所述增强的产量相关性状是增加的种子产量。
46.根据权利要求43的方法,其中所述编码RANBP的核酸在植物种子或种子部分中的表达通过所述核酸与种子特异性启动子有效连接来实现
47.根据权利要求46的方法,其中所述种子特异性启动子是胚乳特异性启动子。
48.根据权利要求47的方法,其中所述胚乳特异性启动子是谷醇溶蛋白启动子。
49.根据权利要求43-48中任一项的方法,其中所述核酸是根据SEQID NO 113、SEQ ID NO 116、SEQ ID NO:119、SEQ ID NO:121、SEQ IDNO 123、SEQ ID NO 125、SEQ ID NO 127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO 133、SEQ ID NO 135和SEQ ID NO 137中的任一个核酸序列的部分、等位变体、剪接变体,或是能够与所述核酸序列杂交的序列,其中所述部分、等位变体、剪接变体,或杂交序列编码包含所述基序I的RANBP。
50.根据权利要求41-49中任一项的方法,其中所述编码RANBP蛋白质的核酸是植物来源的,优选来自单子叶植物,还优选来自禾本科,更优选来自玉蜀黍属,最优选地来自玉蜀黍。
51.根据权利要求41-49中任一项的方法,其中所述编码RANBP蛋白质的核酸是植物来源的,优选来自双子叶植物,还优选来自十字花科植物,更优选所述核酸来自拟南芥。
52.通过根据权利要求41-51中任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码包含所述基序I的RANBP的核酸。
53.构建体,其包含:
(a)编码包含基序I的RANBP的核酸;
(b)与(a)的核酸有效连接的种子特异性启动子;和任选地
(c)转录终止序列。
54.根据权利要求53的构建体,其中所述种子特异性启动子是谷醇溶蛋白启动子。
55.根据权利要求53或54的构建体在制备植物中的用途,所述植物相对于对照植物具有增强的产量相关性状,尤其是增加的种子产量。
56.植物、植物部分或植物细胞,其由权利要求53或54的构建体转化。
57.用于制备相对于对照植物具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(i)在植物引入并表达编码RANB的核酸,所述RANBP包含基序I:KSC V/L WHAXDF A/S DGELK D/E EXF,其中‘X’是任意氨基酸,允许在任何位置有零个或一个保守性改变,和/或允许在任何位置有零个、一个、两个或三个非保守性改变;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
58.相对于对照植物具有增加的产量的转基因植物,所述增加的产量因编码RANBP的核酸的增加的表达而产生,其中所述RANBP包含基序I:KSC V/L WHAXDF A/S DGELK D/E EXF,其中‘X’是任意氨基酸,允许在任何位置有零个或一个保守性改变,和/或允许在任何位置有零个、一个、两个或三个非保守性改变。
59.根据权利要求52、56或58中任一项的植物,其中所述植物是作物植物或单子叶植物或谷物,如稻、玉米、小麦、大麦、粟、黑小麦、黑麦、高粱和燕麦。
60.根据权利要求52、56、58或59中任一项的植物的可收获部分,其中所述可收获部分是种子。
61.来自根据权利要求59的植物和/或根据权利要求60的植物的可收获部分的产物。
62.编码RANBP的核酸在增强植物产量相关性状中的用途,其中所述RANBP包含基序I:KSC V/L WHAXDF A/S DGELK D/E EXF,其中‘X’是任意氨基酸,允许在任何位置有零个或一个保守性改变,和/或允许在任何位置有零个、一个、两个或三个非保守性改变。
63.根据权利要求62的用途,其中所述增强的产量相关性状是增加的种子产量。
64.用于增强植物中产量相关性状的方法,其包括调节编码由SEQ IDNO:157或SEQ ID NO:193所示的金色2-样(GLK)蛋白质的核酸在植物中的表达,或调节编码SEQ ID NO:157或SEQ ID NO:193的直向同源物或旁系同源物的核酸在植物中的表达。
65.根据权利要求64的方法,其中所述调节表达通过T-DNA激活标签、TILLING和同源重组的任何一种或多种方法实现。
66.根据权利要求64的方法,其中所述调节表达通过在植物引入并表达编码由SEQ ID NO:157或SEQ ID NO:193所示的GLK蛋白质的核酸,或编码SEQ ID NO:157或SEQ ID NO:193的直向同源物或旁系同源物的核酸来实现。
67.根据权利要求64-66中任一项的方法,其中所述增强的产量相关性状是下列一种或多种:增加的生物量、增加的种子产量(种子重量)或增加的饱满种子数。
68.根据权利要求64-66中任一项的方法,其中所述核酸与组成型启动子有效连接,优选与GOS2启动子有效连接,更优选与SEQ ID NO:58所示的GOS2启动子有效连接。
69.根据权利要求66-68中任一项的方法,其中所述核酸是根据SEQID NO:156、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQID NO:190和SEQ ID NO:192中的任一个核酸序列的部分、等位变体、剪接变体,或是能够与所述核酸序列杂交的序列,其中所述部分、等位变体、剪接变体,或杂交序列编码GLK蛋白质。
70.根据权利要求64-69中任一项的方法,其中所述编码GLK蛋白质的核酸是植物来源的,优选来自单子叶植物,更优选来自禾本科,最优选地来自稻。
71.通过根据权利要求64-70中任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码GLK蛋白质的核酸。
72.构建体,其包含:
(i)编码由SEQ ID NO:157或SEQ ID NO:193所示的GLK蛋白质的核酸,或编码任意前述SEQ ID NO的直向同源物或旁系同源物的核酸;
(ii)能够驱动(i)的核酸序列表达的一种或多种调控序列;和任选地
(iii)转录终止序列。
73.根据权利要求72的构建体,其中所述一种或多种调控序列至少是组成型启动子,优选是GOS2启动子。
74.根据权利要求72或73的构建体在制备植物中的用途,所述植物相对于对照植物具有增强的产量相关性状,尤其是增加的生物量、增加的种子产量(种子重量)和/或增加的饱满种子数。
75.植物、植物部分或植物细胞,其由权利要求72或73中任一项的构建体转化。
76.用于制备相对于对照植物具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(i)在植物引入并表达编码由SEQ ID NO:157或SEQ ID NO:193所示的GLK蛋白质的核酸,或编码任意前述SEQ ID NO的直向同源物或旁系同源物的核酸;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
77.相对于对照植物具有增加的产量的转基因植物,所述增加的产量因编码由SEQ ID NO:157或SEQ ID NO:193所示的GLK蛋白质的核酸,或编码任意前述SEQ ID NO的直向同源物或旁系同源物的核酸的增加的表达而产生。
78.根据权利要求71、75或77中任一项的植物,其中所述植物是作物植物或单子叶植物或谷物,如稻、玉米、小麦、大麦、粟、黑小麦、黑麦、高粱和燕麦。
79.根据权利要求71、75、77或78中任一项的植物的可收获部分,其中所述可收获部分是种子。
80.来自根据权利要求78的植物和/或根据权利要求79的植物的可收获部分的产物。
81.核酸在增强植物产量相关性状中的用途,其中所述核酸编码由SEQ ID NO:157或SEQ ID NO:193所示的GLK蛋白质的核酸,或编码任意前述SEQ ID NO的直向同源物或旁系同源物。
82.根据权利要求81的用途,其中所述增强的产量相关性状是增加的生物量、增加的种子产量(种子重量)和/或增加的饱满种子数。
83.用于相对于对照植物增加植物产量的方法,其通过使用REVδ(Δ)同源域亮氨酸拉链结构域(HDZip)/类固醇生成急性调节(STAR)相关脂质转化结构域(START)核酸序列来降低植物中内源REVOLUTA(REV)基因的表达来实现,和任选地选择具有增加的产量的植物。
84.根据权利要求83的方法,其中所述降低的表达通过RNA介导的基因表达的沉默实现。
85.根据权利要求84的方法,其中所述RNA介导的沉默通过共抑制实现。
86.根据权利要求84的方法,其中所述RNA介导的沉默通过使用反义REV ΔHDZip/START核酸序列实现。
87.根据权利要求83或84的方法,其中所述降低的表达通过使用REV HDZip/START核酸序列的反向重复序列实现,所述反向重复序列优选能够形成发夹结构。
88.根据权利要求83-87中任一项的方法,其中所述REVΔHDZip/START核酸序列来自植物来源或人工来源。
89.根据权利要求83-88中任一项的方法,其中所述REVΔHDZip/START核酸序列来自单子叶植物,并用于转化单子叶植物,或来自双子叶植物,并用于转化双子叶植物。
90.根据权利要求83-89中任一项的方法,其中所述REVΔHDZip/START核酸序列来自禾本科,并用于转化至禾本科植物,更优选其中稻REV ΔHDZip/START核酸序列用于转化稻植物。
91.根据权利要求83-90中任一项的方法,其中所述REVΔHDZip/START核酸序列包含SEQ ID NO:194或SEQ ID NO:196的足够长度的基本上连续的核苷酸。
92.根据权利要求83-91中任一项的方法,其中包含足够长度的基本上连续的核苷酸的所述REV ΔHDZip/START核酸序列是来自编码REV多肽直向同源物或旁系同源物的核酸序列。
93.根据权利要求92的方法,其中所述编码REV多肽直向同源物或旁系同源物的核酸序列由SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228和SEQ ID NO:230所示。
94.根据权利要求83-93中任一项的方法,其中所述增加的产量是增加的种子产量和/或增加的生物量。
95.根据权利要求94的方法,其中所述增加的种子产量选自下列一种或多种:(i)增加的种子重量;(ii)增加的饱满种子数;(iii)增加的种子饱满率;(iv)增加的收获指数;和(v)增加的各种子长度。
96.根据权利要求94的方法,其中所述增加的生物量是根生物量。
97.通过根据权利要求83-96中任一项的方法可获得的植物、其植物部分或植物细胞,其中所述植物、其植物部分或植物细胞使用REVΔHDZip/START核酸序列具有降低的内源REV基因的表达,且相对于对照植物具有增加的产量。
98.构建体,其用于降低植物中内源REV基因的表达,包含一种或多种调控序列、REV ΔHDZip/START核酸序列和任选的转录终止序列。
99.根据权利要求98的构建体,其中所述REV ΔHDZip/START核酸序列是在组成型启动子控制下的反向重复序列,所述反向重复序列优选能够形成发夹结构。
100.根据权利要求98的构建体,其中所述调控序列是组成型启动子。
101.根据权利要求99或100的构建体,其中所述组成型启动子是GOS2启动子。
102.根据权利要求101的构建体,其中所述GOS2启动子基本由SEQID NO:58所示。
103.植物、植物部分或植物细胞,其由权利要求98-102中任一项的构建体转化。
104.用于制备相对于对照植物具有增加的产量的转基因植物的方法,所述方法包括:
(i)在植物、植物部分或植物细胞中引入并表达遗传构建体,所述遗传构建体包含一种或多种调控序列,用于使用REV ΔHDZip/START核酸序列来降低植物中内源REV基因的表达;和
(ii)在促进植物生长和发育的条件下培育植物、植物部分或植物细胞。
105.相对于对照植物具有增加的产量的转基因植物,其特征在于所述植物使用REV ΔHDZip/START核酸序列而具有降低的内源REV基因的表达
106.根据权利要求97、103或105中任一项的植物,其中所述植物是作物植物,或诸如甘蔗的单子叶植物,其中所述植物是谷物,如稻、玉米、小麦、大麦、粟、黑小麦、黑麦、高粱或燕麦。
107.根据权利要求97、103、105或106中任一项的转基因植物的可收获部分。
108.根据权利要求107的可收获部分,其中所述可收获部分是种子。
109.来自根据权利要求97、103、105或106中任一项的植物,和/或根据权利要求107或108的植物的可收获部分的产物。
110.相对于对照植物的产量,REV ΔHDZip/START核酸序列增加所述植物的产量的用途,其中所述REV ΔHDZip/START核酸序列用于在植物中降低内源REV基因的表达。
111.根据权利要求110的用途,其中所述增加的产量是增加的种子产量和/或增加的生物量。
112.根据权利要求111的用途,其中所述增加的种子产量选自下列一种或多种:(i)增加的种子重量;(ii)增加的饱满种子数;(iii)增加的种子饱满率;(iv)增加的收获指数;和(v)增加的各种子长度。
113.根据权利要求111的用途,其中所述增加的生物量是增加的根生物量。
114.用于相对于对照植物增加植物产量的方法,其通过使用CLE-样核酸序列降低植物中内源CLE-样基因的表达来实现,和任选地选择具有增加的产量的植物。
115.根据权利要求114的方法,其中所述降低的表达通过RNA介导的基因表达的沉默实现。
116.根据权利要求115的方法,其中所述RNA介导的沉默通过共抑制实现。
117.根据权利要求115的方法,其中所述RNA介导的沉默通过使用反义CLE-样核酸序列实现。
118.根据权利要求114或115的方法,其中所述降低的表达通过使用CLE-样核酸序列的反向重复序列实现,所述反向重复序列优选能够形成发夹结构。
119.根据权利要求114-119中任一项的方法,其中所述CLE-样核酸序列来自植物来源或人工来源。
120.根据权利要求114-119中任一项的方法,其中所述CLE-样核酸序列来自单子叶植物,并用于转化单子叶植物,或来自双子叶植物,并用于转化双子叶植物。
121.根据权利要求114-120中任一项的方法,其中所述CLE-样核酸序列来自禾本科,并用于转化至禾本科植物,更优选其中甘蔗CLE-样核酸序列用于转化稻植物。
122.根据权利要求114-121中任一项的方法,其中所述CLE-样核酸序列包含SEQ ID NO:232的足够长度的基本上连续的核苷酸。
123根据权利要求114-122中任一项的方法,其中包含足够长度的基本上连续的核苷酸的所述CLE-样核酸序列是来自编码CLE-样多肽直向同源物或旁系同源物的核酸序列。
124.根据权利要求114-123中任一项的方法,其中所述增加的产量是增加的种子产量。
125.根据权利要求124的方法,其中增加的种子产量包含至少增加的种子重量。
126.通过根据权利要求114-125中任一项的方法可获得的植物、其植物部分或植物细胞,其中所述植物、其植物部分或植物细胞使用CLE-样核酸序列具有降低的内源CLE-样基因的表达,且相对于对照植物具有增加的产量。
127.构建体,其用于降低植物中内源CLE-样基因的表达,包含一种或多种调控序列、CLE-样核酸序列和任选的转录终止序列。
128.根据权利要求127的构建体,其中所述CLE-样核酸序列是在种子特异性启动子控制下的反向重复序列,所述反向重复序列优选能够形成发夹结构。
129.根据权利要求127的构建体,其中所述调控序列是种子特异性启动子。
130.根据权利要求128或129的构建体,其中所述种子特异性启动子是胚乳特异性启动子。
131.根据权利要求130的构建体,其中所述胚乳特异性启动子基本由SEQ ID NO:236所示。
132.植物、植物部分或植物细胞,其由权利要求127-131中任一项的构建体转化。
133.用于制备相对于对照植物具有增加的产量的转基因植物的方法,所述方法包括:
(i)在植物、植物部分或植物细胞中引入并表达遗传构建体,所达遗传构建体包含一种或多种调控序列,用于使用CLE-样核酸序列来降低植物中内源CLE-样基因的表达;和
(ii)在促进植物生长和发育的条件下培育植物、植物部分或植物细胞。
134.相对于对照植物具有增加的产量的转基因植物,其特征在于所述植物使用CLE-样核酸序列而具有降低的内源CLE-样基因的表达
135.根据权利要求126、132或134中任一项的植物,其中所述植物是作物植物,或诸如甘蔗的单子叶植物,其中所述植物是谷物,如稻、玉米、小麦、大麦、粟、黑小麦、黑麦、高粱或燕麦。
136.根据权利要求126、132、134或135中任一项的转基因植物的可收获部分。
137.根据权利要求136的可收获部分,其中所述可收获部分是种子。
138.来自根据权利要求126、132、134或135中任一项的植物,和/或根据权利要求136或137的植物的可收获部分的产物。
139.相对于对照植物的产量,CLE-样核酸序列增加所述植物的产量的用途,其中所述CLE-样核酸序列用于在植物中降低内源REV基因的表达。
140.根据权利要求139的用途,其中所述增加的产量是增加的种子产量。
141.根据权利要求140的用途,其中所述增加的种子产量包含至少增加的种子重量。
142.用于相对于对照植物增加植物中非生物胁迫抗性的方法,其包括调节编码SYR多肽的核酸在植物中的表达,所述SYR多肽包含富含亮氨酸结构域,所述富含亮氨酸结构域的前面是保守的三肽基序1(SEQ ID NO:256、257、258或259中的一个),后面是保守基序2(SEQ ID NO:260),其中所述增加的非生物胁迫抗性是相对于对照植物增加的营养摄取效率。
143.根据权利要求142的方法,其中所述SYR多肽与SEQ ID NO:252所示的SYR多肽具有一定序列同一性,所述序列同一性按照增加的优选顺序为至少27%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性。
144.根据权利要求142或143的方法,其中所述编码SYR多肽的核酸由表II中给出的任一核酸SEQ ID NO或其部分所代表,或是能够与在表II中给出的任一核酸SEQ ID NO杂交的序列。
145.根据权利要求142-144中任一项的方法,其中所述核酸序列编码表II中给出的任意SEQ ID NO的直向同源物或旁系同源物。
146.根据前述任一项权利要求的方法,其中所述SYR蛋白质还包含保守基序3(SEQ ID NO:261)。
147.根据前述任一项权利要求的方法,其中所述营养摄取效率导致增加的种子产量和/或增加的生物量。
148.根据权利要求147的方法,其中所述增加的种子产量包含至少增加的种子总重量;千粒重和/或增加的饱满种子数。
149.根据权利要求147的方法,其中所述增加的生物量是增加的茎生物量和/或增加的根生物量。
150.根据前述任一项权利要求的方法,其中所述增加的营养摄取效率在轻度干旱条件下发生。
151.根据前述任一项权利要求的方法,其中所述调节表达通过在植物引入并表达编码SYR多肽的核酸来实现。
152.根据权利要求151的方法,其中所述核酸与组成型启动子有效连接,优选与GOS2启动子有效连接。
153.根据前述任一项权利要求的方法,其中所述编码SYR多肽的核酸是植物来源的,优选来自单子叶植物,还优选来自禾本科,更优选来自稻属,最优选地来自稻。
154.构建体在制备具有增加的非生物胁迫抗性的植物的方法中的用途,所述构建体包含:
(a)编码如权利要求142-146中任一项所定义的SYR多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一种或多种调控序列;和任选地
(c)转录终止序列,
其中所述调控序列中的一种是组成型启动子,优选是GOS2启动子,并且其中增加的非生物胁迫抗性是相对于对照植物增加的营养摄取效率。
155.编码SYR多肽的核酸在用于相对于对照植物,增加植物中非生物胁迫抗性的方法中的用途,其中增加的非生物胁迫抗性是相对于对照植物增加的营养摄取效率。
156.根据权利要求155的用途,其中所述增加的营养摄取效率导致增加的种子产量和/或增加的生物量。
CN200780028066XA 2006-05-30 2007-05-30 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法 Expired - Fee Related CN101495640B (zh)

Applications Claiming Priority (29)

Application Number Priority Date Filing Date Title
EP06114726 2006-05-30
EP06114726.0 2006-05-30
EP06114735.1 2006-05-30
EP06114735 2006-05-30
EP06114758 2006-05-31
EP06114758.3 2006-05-31
US81074906P 2006-06-02 2006-06-02
US81057206P 2006-06-02 2006-06-02
US81075906P 2006-06-02 2006-06-02
US60/810,749 2006-06-02
US60/810,759 2006-06-02
US60/810,572 2006-06-02
EP06115142.9 2006-06-08
EP06115142 2006-06-08
US81351406P 2006-06-14 2006-06-14
US60/813,514 2006-06-14
EP06116490 2006-06-30
EP06116490.1 2006-06-30
EP06117060.1 2006-07-12
EP06117060 2006-07-12
US83055106P 2006-07-13 2006-07-13
US60/830,551 2006-07-13
US83164206P 2006-07-18 2006-07-18
US60/831,642 2006-07-18
EP06118060.0 2006-07-28
EP06118060 2006-07-28
US83530306P 2006-08-03 2006-08-03
US60/835,303 2006-08-03
PCT/EP2007/055238 WO2007138070A2 (en) 2006-05-30 2007-05-30 Plants with modulated expression of extensin receptor-like kinase having enhanced yield-related traits and a method for making the same

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN2013100269314A Division CN103103199A (zh) 2006-05-30 2007-05-30 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
CN2013100262620A Division CN103103198A (zh) 2006-05-30 2007-05-30 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法

Publications (2)

Publication Number Publication Date
CN101495640A true CN101495640A (zh) 2009-07-29
CN101495640B CN101495640B (zh) 2013-03-06

Family

ID=45509151

Family Applications (3)

Application Number Title Priority Date Filing Date
CN2013100262620A Pending CN103103198A (zh) 2006-05-30 2007-05-30 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
CN200780028066XA Expired - Fee Related CN101495640B (zh) 2006-05-30 2007-05-30 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
CN2013100269314A Pending CN103103199A (zh) 2006-05-30 2007-05-30 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2013100262620A Pending CN103103198A (zh) 2006-05-30 2007-05-30 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2013100269314A Pending CN103103199A (zh) 2006-05-30 2007-05-30 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法

Country Status (8)

Country Link
US (1) US20090241218A1 (zh)
EP (7) EP2423317A3 (zh)
CN (3) CN103103198A (zh)
AR (1) AR061787A1 (zh)
BR (1) BRPI0712449A2 (zh)
CA (2) CA2652446C (zh)
MX (1) MX2008015093A (zh)
WO (1) WO2007138070A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102892890A (zh) * 2010-03-18 2013-01-23 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物和用于制备该植物的方法
CN105177019A (zh) * 2015-09-01 2015-12-23 天津师范大学 OsHox10基因在水稻株型建成控制叶片形态方面的应用
CN111018959A (zh) * 2019-12-31 2020-04-17 中国农业大学 Bmdr蛋白及其编码基因在调控植物抗旱性中的应用
CN112626086A (zh) * 2021-01-20 2021-04-09 山东大学 蒺藜苜蓿基因MtREVOLUTA在提高豆科近缘饲草紫花苜蓿耐盐性中的应用
CN113912686A (zh) * 2020-06-24 2022-01-11 中国农业科学院生物技术研究所 OsRBP2蛋白及其编码基因和应用

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007064724A2 (en) 2005-12-01 2007-06-07 Cropdesign N.V. Plants having improved growth characteristics and methods for making the same
CN101969759A (zh) * 2007-12-20 2011-02-09 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物及其制备方法
BRPI0911501A2 (pt) * 2008-04-29 2015-07-28 Monsanto Technology Llc Genes e usos para melhoramento de plantas.
WO2010060099A2 (en) 2008-11-24 2010-05-27 The Regents Of The University Of California Wall-associated kinase-like polypeptide mediates nutritional status perception and response
US8168861B2 (en) 2008-11-24 2012-05-01 The Regents Of The University Of California Compositions and methods for increasing cellulose production
US20100170006A1 (en) * 2008-12-18 2010-07-01 The Regents Of The University Of California Methods for screening of novel functions of receptor like kinases
WO2011025840A1 (en) * 2009-08-25 2011-03-03 Targeted Growth, Inc. Modified transgene encoding a growth and/or development related protein in plants
US8299479B2 (en) * 2010-03-09 2012-10-30 Tsmc Solid State Lighting Ltd. Light-emitting devices with textured active layer
BR112012032996A2 (pt) * 2010-06-24 2019-09-24 Basf Plant Science Co Gmbh método para acentuar os traços relacionados a rendimento em plantas em relação a plantas de controle, planta, construto, uso de contruto, método para a produção de uma planta transgênica, planta transgênica, partes colhíveis de uma planta, produtos derivados de uma planta, uso de um ácido nucleíco, ácido nucleíco isolado, polipeptídeo isolado e molécula nucleíca isolada
WO2012018489A2 (en) * 2010-08-06 2012-02-09 The Curators Of The University Of Missouri Nematode resistant crops
US10246722B2 (en) 2011-07-13 2019-04-02 The Curators Of The University Of Missouri Crop resistance to nematodes
US9549509B2 (en) 2011-10-13 2017-01-24 The Regents Of The University Of California GLK genes for improved fruit quality
CA2868068A1 (en) * 2012-04-02 2013-10-10 Basf Plant Science Company Gmbh Plants having one or more enhanced yield-related traits and method for making same
WO2014076659A1 (en) * 2012-11-15 2014-05-22 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
WO2014164668A1 (en) * 2013-03-13 2014-10-09 Targeted Growth, Inc. Compositions of methods for increasing seed number, seed weight and/or yield in plants
CN104823741B (zh) * 2015-05-05 2017-11-24 湖北省农业科学院果树茶叶研究所 一种甜柿树篱形整形方法
SG11201809744YA (en) * 2016-06-17 2019-01-30 Sekisui Chemical Co Ltd Method for improving salt tolerance of plant
CN107964548B (zh) * 2016-10-20 2021-03-23 中南林业科技大学 一种水稻OsFLRs基因及其应用
CN107903311B (zh) * 2017-09-22 2021-07-13 湖南大学 水稻卷叶控制基因lrrk1及其应用
CN109355291B (zh) * 2018-11-22 2022-01-18 深圳市作物分子设计育种研究院 一种植物胚乳特异性表达启动子pOsEnS93的鉴定和应用
CN110029106B (zh) * 2019-04-04 2021-10-19 中国计量大学 MSL1的RNAi片段及其在提高植物镉胁迫敏感性中的应用
CN111172188B (zh) * 2019-08-16 2022-02-11 中国农业科学院作物科学研究所 ZmGLK1在提高植物强光胁迫抗性和产量中的应用
US20230203521A1 (en) * 2020-05-04 2023-06-29 Academia Sinica Approaches to dramatically increase rice productivity
CN111808866A (zh) * 2020-07-23 2020-10-23 南京林业大学 一种石榴PgWUS基因及其应用
CN114058626B (zh) * 2020-07-29 2023-05-02 青岛农业大学 一种Nup50A基因在提高植物抵抗灰霉菌侵染中的应用
KR102603683B1 (ko) * 2020-10-30 2023-11-21 대한민국(농촌진흥청장) 종자 식물 특이 익스텐신 모티브를 포함하는 단백질을 코딩하는 식물 생장조절 유전자 및 이의 용도
CN116622764B (zh) * 2023-05-25 2024-01-09 中国农业科学院烟草研究所(中国烟草总公司青州烟草研究所) 烟草NtCLE9基因在提高烟草抗旱能力中的应用

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5504200A (en) 1983-04-15 1996-04-02 Mycogen Plant Science, Inc. Plant gene expression
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
WO1989012102A1 (en) 1988-06-01 1989-12-14 The Texas A&M University System Method for transforming plants via the shoot apex
CA1341467C (en) 1988-07-29 2004-12-07 John C. Rogers Producing commercially valuable polypeptides with genetically transformed endosperm tissue
WO1991013980A1 (en) 1990-03-16 1991-09-19 Calgene, Inc. Novel sequences preferentially expressed in early seed development and methods related thereto
DE4208050A1 (de) 1992-03-13 1993-09-23 Bayer Ag Azolylmethyl-fluorcyclopropyl-derivate
CA2092069A1 (en) 1992-03-27 1993-09-28 Asako Iida An expression plasmid for seeds
WO1993022443A1 (en) 1992-04-24 1993-11-11 Sri International In vivo homologous sequence targeting in eukaryotic cells
HUT71929A (en) 1992-06-29 1996-02-28 Gene Shears Pty Ltd Nucleic acids and methods of use thereof for controlling viral pathogens
JPH0662870A (ja) 1992-08-18 1994-03-08 Mitsui Giyousai Shokubutsu Bio Kenkyusho:Kk 大豆ホスホエノールピルビン酸カルボキシラーゼ遺伝子のプロモーター領域及び5’非翻訳領域
JPH09505461A (ja) 1993-07-22 1997-06-03 ジーン シェアーズ プロプライアタリー リミティド Dnaウィルスリボザイム
GB9324707D0 (en) 1993-12-02 1994-01-19 Olsen Odd Arne Promoter
DE69425903T2 (de) 1993-12-09 2001-02-15 Thomas Jefferson University Ph Verbindungen und verfahren zur ortsspezifischen mutation in eukaryotischen zellen
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
GB9403512D0 (en) 1994-02-24 1994-04-13 Olsen Odd Arne Promoter
US5689040A (en) 1995-02-23 1997-11-18 The Regents Of The University Of California Plant promoter sequences useful for gene expression in seeds and seedlings
JP4424756B2 (ja) 1995-07-05 2010-03-03 サッポロビール株式会社 組織特異的プロモーターを用いたトランスジェニック植物およびその作出方法
EP0853676B1 (en) 1995-10-06 2006-06-21 Bayer BioScience N.V. Seed shattering
GB9607517D0 (en) 1996-04-11 1996-06-12 Gene Shears Pty Ltd The use of DNA Sequences
US5981841A (en) 1996-08-30 1999-11-09 Monsanto Company Early seed 5' regulatory sequence
DE19644478A1 (de) 1996-10-25 1998-04-30 Basf Ag Blattspezifische Expression von Genen in transgenen Pflanzen
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
US5977436A (en) 1997-04-09 1999-11-02 Rhone Poulenc Agrochimie Oleosin 5' regulatory region for the modification of plant seed lipid composition
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
GB9720148D0 (en) 1997-09-22 1997-11-26 Innes John Centre Innov Ltd Gene silencing materials and methods
ES2276475T5 (es) 1997-09-30 2014-07-11 The Regents Of The University Of California Producción de proteínas en semillas de plantas
ATE507299T1 (de) 1998-04-08 2011-05-15 Commw Scient Ind Res Org Verfahren und mittel zum erhalt von veränderten phänotypen
US20030237110A9 (en) * 1998-05-12 2003-12-25 Incyte Pharmaceuticals, Inc. Polynucleotides and polypeptides derived from corn seedling
WO2000000619A2 (en) 1998-06-26 2000-01-06 Iowa State University Research Foundation, Inc. MATERIALS AND METHODS FOR THE ALTERATION OF ENZYME AND ACETYL CoA LEVELS IN PLANTS
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
DE19852195C2 (de) 1998-11-04 2000-11-02 Inst Pflanzengenetik & Kultur Neue Expressionskassette zur Expression von beliebigen Genen in Pflanzensamen
EP1033405A3 (en) 1999-02-25 2001-08-01 Ceres Incorporated Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
US20100293669A2 (en) * 1999-05-06 2010-11-18 Jingdong Liu Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US6608240B1 (en) * 1999-06-24 2003-08-19 Pioneer Hi-Bred International, Inc. Sunflower disease resistance genes
WO2001006844A1 (fr) 1999-07-22 2001-02-01 Japan As Represented By Director General Of National Institute Of Agrobiological Resources Ministry Of Agriculture, Forestry And Fisheries Procede de transformation ultrarapide de monocotyledon
NZ518530A (en) 1999-11-10 2004-10-29 Univ Washington Compositions and methods for modulation of plant cell division using the revoluta protein
US7056739B1 (en) 1999-11-10 2006-06-06 University Of Washington Compositions and methods for modulation of plant cell division
US20110131679A2 (en) * 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US7834146B2 (en) * 2000-05-08 2010-11-16 Monsanto Technology Llc Recombinant polypeptides associated with plants
EP1164193A1 (en) 2000-06-16 2001-12-19 Plant Research International B.V. Plant-signalling ligand like proteins
US20030126644A1 (en) * 2000-08-28 2003-07-03 Soo-Hwan Kim Protocols for the generation of high yield, super productive transgenic plants disturbed in ran/ran-binding protein mediated cellular process
US7214786B2 (en) * 2000-12-14 2007-05-08 Kovalic David K Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement
US20040016025A1 (en) * 2001-09-26 2004-01-22 Paul Budworth Rice promoters for regulation of plant expression
US20050108791A1 (en) * 2001-12-04 2005-05-19 Edgerton Michael D. Transgenic plants with improved phenotypes
EP1523491A4 (en) 2002-05-06 2006-02-22 Pioneer Hi Bred Int CLAVATA3-SIMILAR POLYNUCLEOTIDE SEQUENCES FROM MAIZE AND METHOD OF USE
JP2005185101A (ja) * 2002-05-30 2005-07-14 National Institute Of Agrobiological Sciences 植物の全長cDNAおよびその利用
WO2004063379A1 (en) 2003-01-06 2004-07-29 Pioneer Hi-Bred International, Inc. Zea mays revoluta/if1 homolog genes and uses thereof
JP2004242631A (ja) * 2003-02-17 2004-09-02 Japan Science & Technology Agency 植物の活性窒素ストレス耐性能の増強方法
US20040216190A1 (en) * 2003-04-28 2004-10-28 Kovalic David K. Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement
US20060048240A1 (en) * 2004-04-01 2006-03-02 Nickolai Alexandrov Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
US7151206B2 (en) 2003-11-18 2006-12-19 Temasek Life Sciences Laboratory Arabidopsis argos, a novel gene involved in organ development
US20080301839A1 (en) * 2005-08-30 2008-12-04 Ravanello Monica P Transgenic plants with enhanced agronomic traits
WO2007064724A2 (en) * 2005-12-01 2007-06-07 Cropdesign N.V. Plants having improved growth characteristics and methods for making the same
WO2007115064A2 (en) * 2006-03-31 2007-10-11 Pioneer Hi-Bred International, Inc. Maize genes for controlling plant growth and organ size and their use in improving crop plants
EP2392662A3 (en) * 2007-04-23 2012-03-14 Basf Se Plant productivity enhancement by combining chemical agents with transgenic modifications
DE112008002458T5 (de) * 2007-09-14 2011-06-01 Basf Plant Science Gmbh Pflanzen mit erhöhten ertragsbezogenen Eigenschaften und Verfahren zur Herstellung derselben

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102892890A (zh) * 2010-03-18 2013-01-23 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物和用于制备该植物的方法
CN105177019A (zh) * 2015-09-01 2015-12-23 天津师范大学 OsHox10基因在水稻株型建成控制叶片形态方面的应用
CN111018959A (zh) * 2019-12-31 2020-04-17 中国农业大学 Bmdr蛋白及其编码基因在调控植物抗旱性中的应用
CN111018959B (zh) * 2019-12-31 2021-06-25 中国农业大学 Bmdr蛋白及其编码基因在调控植物抗旱性中的应用
CN113912686A (zh) * 2020-06-24 2022-01-11 中国农业科学院生物技术研究所 OsRBP2蛋白及其编码基因和应用
CN113912686B (zh) * 2020-06-24 2023-05-16 中国农业科学院生物技术研究所 OsRBP2蛋白及其编码基因和应用
CN112626086A (zh) * 2021-01-20 2021-04-09 山东大学 蒺藜苜蓿基因MtREVOLUTA在提高豆科近缘饲草紫花苜蓿耐盐性中的应用
CN112626086B (zh) * 2021-01-20 2022-05-06 山东大学 蒺藜苜蓿基因MtREVOLUTA在提高豆科近缘饲草紫花苜蓿耐盐性中的应用

Also Published As

Publication number Publication date
CA2652446C (en) 2016-02-09
CA2911267A1 (en) 2007-12-06
US20090241218A1 (en) 2009-09-24
EP2423317A2 (en) 2012-02-29
EP2377937A1 (en) 2011-10-19
EP2410059A3 (en) 2012-05-02
CN103103199A (zh) 2013-05-15
EP2035562A2 (en) 2009-03-18
EP2410059A2 (en) 2012-01-25
EP2371965A1 (en) 2011-10-05
EP2441839A1 (en) 2012-04-18
MX2008015093A (es) 2009-02-25
CN103103198A (zh) 2013-05-15
EP2439277A1 (en) 2012-04-11
EP2439277B1 (en) 2015-09-02
BRPI0712449A2 (pt) 2012-03-13
CA2652446A1 (en) 2007-12-06
AR061787A1 (es) 2008-09-24
EP2423317A3 (en) 2012-05-30
CN101495640B (zh) 2013-03-06
WO2007138070A3 (en) 2008-03-06
WO2007138070A2 (en) 2007-12-06

Similar Documents

Publication Publication Date Title
CN101495640B (zh) 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
KR101662483B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101365786B (zh) 具有改良的生长特征的植物及其生产方法
CN101842489B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN101415829B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
KR101754083B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
US20140033366A1 (en) Plants Having Improved Growth Characteristics and Methods for Making the Same
CN101952441B (zh) 具有增强的产量相关性状的植物及其制备方法
CN102027120A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN101583720A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101883783A (zh) 具有增强的产量相关性状的植物及其制备方法
KR20120126061A (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
BRPI0718977A2 (pt) Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico
CN101605902A (zh) 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法
CN101868544A (zh) 具有提高的产量相关性状的植物和用于制备该植物的方法
CN101688214A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
MX2011001475A (es) Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas.
CN101351556B (zh) 具有改良生长特性的植物及其制备方法
KR101429469B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101563461A (zh) 具有改良特征的植物及其制备方法
CN101969759A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101778942A (zh) 产率相关性状增强的植物及制备其的方法
CN101595222B (zh) 具有改良的种子产量相关性状的植物及其制备方法
CN101668859A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101874116A (zh) 具有增强的产量相关性状的植物及其生产方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130306

Termination date: 20170530