CN101849009A - 具有增强的产率相关性状的植物及其制备方法 - Google Patents

具有增强的产率相关性状的植物及其制备方法 Download PDF

Info

Publication number
CN101849009A
CN101849009A CN200880025418A CN200880025418A CN101849009A CN 101849009 A CN101849009 A CN 101849009A CN 200880025418 A CN200880025418 A CN 200880025418A CN 200880025418 A CN200880025418 A CN 200880025418A CN 101849009 A CN101849009 A CN 101849009A
Authority
CN
China
Prior art keywords
plant
polypeptide
sequence
nucleotide sequence
aat
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880025418A
Other languages
English (en)
Inventor
Y·海茨费尔德
V·弗兰卡德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science Co GmbH
BASF Plant Science GmbH
Original Assignee
BASF Plant Science Co GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science Co GmbH filed Critical BASF Plant Science Co GmbH
Publication of CN101849009A publication Critical patent/CN101849009A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明总体上涉及分子生物学领域,并且涉及通过调节植物中编码产率增加性多肽的核酸序列的表达来增强多种植物产率相关性状的方法,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白)(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽、和丙氨酸氨基转移酶(AAT)多肽。本发明还涉及具有调节的产率增加性多肽编码核酸序列表达的植物,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白)(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽、和丙氨酸氨基转移酶(AAT)多肽,该植物相对于对照植物具有增强的产率相关性状。本发明还提供了可以用于本发明方法的构建体。

Description

具有增强的产率相关性状的植物及其制备方法
发明领域
本发明一般涉及分子生物学领域,并且涉及通过增加植物中产率增加性多肽的编码核酸序列的表达来增强多种植物产率相关性状的方法,所述产率增加性多肽选自:
核定位AT-hook基序蛋白19/20(AHL19/20)、
GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽,和
丙氨酸氨基转移酶(AAT)多肽。本发明还涉及具有增加的编码所述产率增加性多肽的核酸序列的表达的植物,该植物相对于对照植物具有增强的产率相关性状。本发明还提供了用于本发明方法的构建体。
背景技术
不断增长的世界人口和逐渐减少的农业可用耕地助长了提高农业效率研究之势。传统的作物和园艺学改良方法利用选育技术来鉴定具有期望特性的植物。然而,此类选育技术有若干缺陷,即这些技术一般为劳动密集型的,而且产生的植物通常含有异质的遗传组分,这些异质的遗传组分不一定总是导致期望性状自亲本植物的传递。分子生物学的进展已经使人类能够修饰动物和植物的种质。植物遗传工程需要分离和操作遗传物质(一般为DNA或RNA的形式)以及随后将遗传物质引入植物。这类技术能够产生具多种改良的经济、农艺或园艺性状的作物或植物。
具有特别经济意义的一种性状是增加的产率。产率通常定义为作物可测量经济价值的产出。这可以以数量和/或质量的方式进行定义。产率直接取决于若干因素,例如器官的数量和大小、植物构造(例如,分枝的数量)、种子产量、叶子衰老等等。根的发育、营养吸收、胁迫耐受性和早期活力也是决定产率的重要因素。因此优化一个或多个上述因素也可以促进作物产率的增加。
种子产率是特别重要的性状,这是因为许多植物的种子对于人类和动物营养而言至关重要。通过对种子本身的直接消耗,或是通过消耗由加工的种子所饲养的肉类产品,作物诸如玉米、稻、小麦、芸苔(canola)和大豆等占人类总卡路里摄取量的一半以上。它们也是工业加工所用的糖类、油类和多类代谢物的来源。种子含有胚(新的枝条和根的来源)和胚乳(萌发过程和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因,并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳,同化糖类、油类和蛋白质的代谢前体,将其合成为贮存性高分子,以充盈籽粒。
收获指数为种子产率与地上干重之间的比值,其在许多环境条件下相对稳定,因此在植物大小和粮谷(grain)产率之间通常能够获得比较稳靠的相关性(如Rebetzke等人(2002)Crop Science 42:739)。这些方法存在固有的联系,原因是大多数粮谷生物量取决于植物叶和茎的当前的或贮存的光合产率(Gardener等人(1985)Physiology of Crop Plants.Iowa StateUniversity Press,68-73页)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产率的指标(如Tittonell等人(2005)Agric Ecosys&Environ 105:213)。当检查遗传差异对胁迫耐受性的影响时,温室或植物生长室环境与田间相比具有固有的优势,即,能够使土壤性能、温度、水和养分可利用度以及光强度标准化。不过,由于因缺乏风力或昆虫导致的不良授粉,或由于空间不足以让成熟根或冠层生长等等,而对产率造成的人为局限性,会限制这些受控环境在测试产率差异中的应用。因此,在生长室或温室中在标准化条件下测量早期发育阶段的植物大小,是提供潜在遗传产率优势指标的标准作法。
另一重要的性状为增加的非生物胁迫耐受性。非生物胁迫是导致全世界作物损失的首要原因,使大多数主要作物植物的平均产率下降超过50%(Wang等人,Planta(2003)218:1-14)。非生物胁迫可以因干旱、盐度、极端温度、化学毒性、养分(大量元素和/或微量元素)过量或不足、辐射和氧化胁迫而引起。提高植物非生物胁迫耐受性的能力将对全世界的农场主带来重大的经济利益,并将使得能够在不利条件下以及在原本不可能栽培作物的地域中栽培作物。
对于许多作物而言,另一重要的性状是早期活力(early vigour)。改良早期活力是温带和热带稻类栽培种的现代稻类育种项目的重要目标。长根对于水栽稻的恰当土壤锚固至关重要。在直接向涝地里播种稻米的情况下,以及在植物必须迅速穿过水出苗的情况下,较长的枝条与活力有关。在进行条播的情况下,较长的中胚轴和胚芽鞘对于优良的出苗至关重要。改造植物早期活力的能力在农业上将具有极其重要的意义。例如,一直以来早期活力弱限制了在欧洲大西洋地区引入基于玉米带种质的玉米(玉蜀黍,Zea mays L.)杂交种。
另一重要的性状是在非生物胁迫条件下生长的植物的增强的产率相关性状。非生物胁迫是导致全世界作物损失的首要原因,使大多数主要作物植物的平均产率下降超过50%(Wang等人,Planta(2003)218:1-14)。非生物胁迫可以因干旱、盐度、极端温度、化学毒性、养分(大量元素和/或微量元素)过量或不足、辐射和氧化胁迫而引起。增强在非生物胁迫条件下生长的植物的产率相关性状的能力将对全世界的农场主带来重大的经济利益,并将使得能够在不利条件下以及在原本不可能栽培作物的地域中栽培作物。
因此通过优化上述因素之一可以增加作物产率。
视最终用途而定,可能更优选修饰某些产率性状。例如,对于诸如饲料或木材生产或者生物燃料资源等应用,可能期望植物营养部分的增长,而对于诸如面粉、淀粉或油料生产等应用,可能特别期望种子参数的增长。即便是在种子参数之中,视用途而定,一些参数也可能比另一些更优。多种机制可促成增加的种子产率,无论形式是增加的种子大小、还是增加的种子数量。
增加植物产率相关性状(种子产率和/或生物量)的一种方法可以是修饰植物的内在生长机制,如细胞周期或者参与植物生长或防御机制的各种信号传递路径。
发明内容
现已发现,通过在植物中增加编码核定位AT-hook基序蛋白19/20(AHL19/20)多肽的核酸序列的表达,可以相对于对照植物增强植物的多种种子产率相关性状,而无延迟的开花。增强的种子产率性状相关性状包括一个或多个下列性状:增加的每圆锥花序的花数、增加的每株植物的种子总产率、增加的饱满种子数和增加的收获指数。
此外,现已发现,增加编码GRP多肽(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)的核酸序列的表达,可以产生在非生物胁迫条件下生长时相对于在相当条件下生长的对照植物具有增强的产率相关性状的植物。
此外,现还发现,调节ATT样多肽编码核酸在地上植物部分中的表达,可以产生相对于对照植物具有增强的产率相关性状,特别是增加的产率,的植物。
此外,现已发现,在非限氮条件下生长的植物的产率相关性状可通过调节ATT多肽编码核酸在这样的植物中的表达来增强。
发明背景
DNA结合蛋白是包含任何DNA结合结构域并因此对DNA具有特定的或一般的亲和力的蛋白质。DNA结合蛋白包括例如调节转录过程的转录因子、切割DNA分子的核酸酶以及参与细胞核中DNA包装的组蛋白。
AT-hook基序是首先在高迁移率组非组蛋白染色体蛋白质HMG-I/Y中描述的短DNA结合蛋白基序(Reeves和Nissen(1990)J Biol Chem 265:8573-8582)。已知AT-hook与富含AT的核酸序列的小沟相互作用(Huth等(1997)Nat Struc Biol 4:657-665)。已在广泛的来自动物、植物和微生物的DNA结合蛋白中鉴定到AT-hook基序。与几种已良好表征的DNA结合基序不同,AT-hook基序短,不超过13个氨基酸残基,并且在其中心具有典型的三肽序列甘氨酸-精氨酸-脯氨酸(Gly-Arg-Pro或GRP)。
在拟南芥(Arabidopsis thaliana)中,大约30种包含至少一个AT-hook基序的多肽还包含植物及原核生物保守(plant and prokaryotes conserved,PPC)结构域,该结构域在欧洲生物信息学研究所(EuropeanBioinformatics Institute)(EBI)的InterPro结构域数据库中被描述为DUF296(未知功能结构域296)(Fujimoto等(2004)Plant Molec Biol 56:225-239)。这些蛋白质之一被发现定位于核质中,从而被称为核定位AT-hook基序蛋白1(AHL1;Fujimoto等,同上)。类似地命名了旁系同源多肽,即AHL,并顺序编号。
在美国专利7,193,129和美国专利申请2005/0097638中,将拟南芥AHL多肽AHL19(根据Fujimoto等,同上)(标识为G2153)转化入拟南芥,并且使用35S CaMV启动子进行表达。转基因植物显示出改良的性状,例如增加的盐胁迫耐受性、增加的渗透胁迫耐受性、增加的干旱耐受性、增加的对冷冻的耐受性和增加的对糖的植物应答。在美国专利申请2005/0097638中,与对照植物相比较,AHL19多肽以及几种旁系同源AHL多肽的过量表达(在35S CaMV启动子的控制下)显著延迟了转基因植物的开花,从而增加产率。
发明概述
根据一个实施方案,提供了相对于对照植物增强植物的种子产率相关性状的方法,该方法包括增加编码AHL19/20多肽的核酸序列在植物中的表达。增强的种子产率相关性状包括一个或多个下列性状:增加的每圆锥花序的花数、增加的每株植物的种子总产率、增加的饱满种子数和增加的收获指数。
根据一个实施方案,提供了相对于对照植物增强在非生物胁迫条件下生长的植物的产率相关性状的方法,该方法包括增加GRP多肽编码核酸序列在植物中的表达,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽,增强的产率相关性状是一个或多个下列性状:增加的地上生物量、增加的每株植物的种子总产率、增加的饱满种子数、增加的种子总数、增加的一级圆锥花序(primary panicles)数、和增加的种子饱满率。
根据本发明的一个实施方案,提供了相对于对照植物增强植物的产率相关性状的方法,该方法包括调节编码AAT-样多肽的核酸在地上植物部分中的表达。在优选实施方案中,编码AAT-样多肽的核酸的表达通过将所述核酸有效连接至在地上植物部分中具有活性的启动子来进行调节(优选增加)。
根据一个实施方案,提供了增强在非限氮条件下生长的植物的产率相关性状的方法,该方法包括调节ATT多肽编码核酸在植物中的表达。
定义
多肽/蛋白质
术语“多肽”和“蛋白质”在文中互换使用,是指通过肽键连接起来的、任意长度的氨基酸多聚体。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”在文中互换使用,是指任何长度的无支链形式的多聚核苷酸,所述核苷酸或者为核糖核苷酸或者为脱氧核糖核苷酸或者为两者的组合。
对照植物
选择合适的对照植物是实验设置的常规部分,并且可以包括相应的野生型植物或不含目的基因的相应植物。对照植物通常与待评估植物为相同的植物物种,或者甚至为同一品种。对照植物还可以是待评估植物的无效合子(nullizygote)。如本文所用的“对照植物”不仅指完整植物,而且指植物部分,包括种子和种子部分。
同源物
蛋白质的“同源物”包括肽、寡肽、多肽、蛋白质和酶,其相对于所讨论的未修饰蛋白质具有氨基酸取代、缺失和/或插入,并且具有与其源自的未修饰蛋白质相似的生物活性和功能活性。
缺失是指从蛋白质中除去一个或多个氨基酸。
插入是指在蛋白质的预定位置引入一个或多个氨基酸残基。插入可以包括单个或多个氨基酸的N-末端和/或C-末端融合以及序列内插入。一般氨基酸序列内部的插入将小于N-或C-末端的融合,数量级约1到10个残基。N-或C-末端融合蛋白质或肽的实例包括如在酵母双杂交系统中应用的转录激活因子的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶标签、蛋白质A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、
Figure G2008800254180D00071
表位、lacz、CMP(钙调蛋白结合肽)、HA表位、蛋白质C表位和VSV表位。
取代是指蛋白质中的氨基酸用具有相似性质(如相似的疏水性、亲水性、抗原性、形成或打破α螺旋结构或β片层结构的倾向性)的其他氨基酸替换。氨基酸取代通常是单个残基的取代,但是视施加于多肽上的功能性限制而定也可以发生成簇取代;取代通常在大约1到10个氨基酸残基数量级。氨基酸取代优选为保守氨基酸取代。保守取代表在本领域众所周知(参见例如Creighton(1984)Proteins.W.H.Freeman and Company(编辑)和下表1)。
表1:保守氨基酸取代的实例
  残基     保守取代   残基     保守取代
  Ala     Ser   Leu     Ile;Val
  Arg     Lys   Lys     Arg;Gln
  Asn     Gln;His   Met     Leu;Ile
  Asp     Glu   Phe     Met;Leu;Tyr
  Gln     Asn   Ser     Thr;Gly
  Cys     Ser   Thr     Ser;Val
  Glu     Asp   Trp     Tyr
  Gly     Pro   Tyr     Trp;Phe
  His     Asn;Gln   Val     Ile;Leu
  Ile     Leu;Val
可通过本领域众所周知的肽合成技术,如固相肽合成法等,或通过重组DNA操作,容易地进行氨基酸取代、缺失和/或插入。用于产生蛋白质的取代、插入或缺失变体的DNA序列操作方法是本领域众所周知的。例如,本领域的技术人员熟知在DNA预定位置进行取代突变的技术,包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、QuickChange定点诱变(Stratagene,San Diego,CA)、PCR介导的定点诱变或其他定点诱变方案。
衍生物
“衍生物”包括肽、寡肽、多肽,与蛋白质如目的蛋白质的天然形式的氨基酸序列相比,其可以包括用非天然氨基酸残基进行的氨基酸取代、或者添加非天然氨基酸残基。蛋白质的“衍生物”还包括肽、寡肽、多肽,与多肽天然形式的氨基酸序列相比,其可以包括天然改变的(糖基化、酰基化、异戊二烯化、磷酸化、豆蔻酰化、硫酸化等)或非天然改变的氨基酸残基。衍生物与其源自的氨基酸序列相比,还可以包括一个或多个非氨基酸替代或添加,例如共价或非共价地结合于氨基酸序列的报告分子或其他配体,如与之结合有利于衍生物检测的报告分子,以及相对于天然蛋白质的氨基酸序列而言的非天然氨基酸残基。
此外,“衍生物”还包括天然形式的蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白的融合物(关于标签肽的综述请参见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)。
直系同源物/旁系同源物
直系同源物和旁系同源物涵盖用于描述基因祖先关系的进化概念。旁系同源物为相同物种内的基因,其源自于祖先基因的复制;而直系同源物为来自不同生物体的基因,其起源于物种形成,并且也源自于共同的祖先基因。
结构域
术语“结构域”是指在进化相关蛋白质序列的比对中,在特定位置上保守的一组氨基酸。尽管其他位置上的氨基酸可能因同源物不同而改变,但是在特定位置上高度保守的氨基酸则意味着对于蛋白质结构、稳定性或功能而言很可能是必不可少的氨基酸。“结构域”因其在所比对的家族蛋白质同源物序列中高度保守而得以鉴定,故能够用作为标识符以确定任何所讨论的多肽是否属于先前鉴定到的多肽家族。
基序/共有序列/标签序列
术语“基序”或“共有序列”或“标签序列”(signature)是指进化相关蛋白质序列中短的保守区域。基序常常是高度保守的结构域部分,但也可能仅仅包括部分结构域,或者位于保守结构域之外(若基序的所有氨基酸都落在所定义的结构域之外的话)。
杂交
本文定义的术语“杂交”指其中基本同源互补的核苷酸序列彼此退火的过程。杂交过程能够完全在溶液中发生,即互补的两核酸分子都处在溶液中。杂交过程也能够这样进行,即互补核酸分子之一固定于基质上,如磁珠、琼脂糖珠或任何其它树脂上。此外,杂交过程也能够这样进行,即其中互补核酸分子之一固定在固相支持物如硝酸纤维素或尼龙膜上,或者通过例如照相平板印刷术固定在例如硅质玻璃支持物上(后者称为核酸序列阵列或微阵列,或称为核酸序列芯片)。为了使杂交发生,通常使核酸分子热变性或化学变性,以使双链解链成两条单链,和/或除去单链核酸分子中的发夹结构或其它二级结构。
术语“严格性”是指发生杂交的条件。杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。通常,对于特定序列而言,在确定的离子强度和pH值下,低严格条件选择为比热解链温度(Tm)低大约30℃。中等严格条件为温度比Tm低20℃,而高严格条件为温度比Tm低10℃。高严格杂交条件通常用于分离与靶核酸序列具有高序列相似性的杂交序列。不过,由于遗传密码的简并性,核酸序列可以在序列上有偏差而依然编码基本上相同的多肽。因此有时可能需要中等严格杂交条件来鉴定这样的核酸序列分子。
Tm是在确定的离子强度和pH值下,50%的靶序列与完全匹配的探针杂交的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性杂交。在低于Tm值大约16℃到32℃获得最大杂交速率。在杂交溶液中存在一价阳离子会减少两核酸序列链之间的静电排斥作用,从而促进杂交体形成;当钠浓度高达0.4M时,这一作用可见(对于更高的浓度,此效应可以忽略不计)。每个百分点的甲酰胺可使DNA-DNA和DNA-RNA双链体的解链温度降低0.6到0.7℃,加入50%甲酰胺能够使杂交在30到45℃完成,尽管这将降低杂交速率。碱基对错配降低杂交速率和双链体的热稳定性。平均而言,对于大的探针,每个百分点碱基错配使Tm值下降约1℃。依赖于杂交体类型,Tm值可以利用下列公式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]-500×[Lc]-1-0.61×%甲酰胺
2)DNA-RNA或RNA-RNA杂交体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交体:
<20个核苷酸:Tm=2(ln)
20-35个核苷酸:Tm=22+1.46(ln)
a或对于其它一价阳离子,但是仅在0.01-0.4M范围内精确。
b仅对于在30%到75%范围内的%GC精确。
cL=双链体的碱基对长度。
d寡,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
非特异性结合可以通过许多已知技术中的任一来控制,例如用含蛋白质的溶液封闭膜,在杂交缓冲液中添加异源RNA、DNA和SDS,以及用RNA酶处理。对于非同源探针,可以通过改变如下条件之一来进行系列杂交:(i)逐渐降低退火温度(例如从68℃降至42℃),或(ii)逐渐降低甲酰胺浓度(例如从50%降至0%)。熟练技术人员知晓可以在杂交过程中改变的多种参数,从而保持或者改变严格条件。
除杂交条件外,杂交特异性通常还是杂交后洗涤的函数。为了除去非特异杂交产生的背景,用稀释的盐溶液洗涤样品。这类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低、洗涤温度越高,洗涤的严格性就越高。洗涤条件通常在等于或低于杂交严格性的条件下进行。阳性杂交给出至少为背景两倍的信号。一般按如上来设置适用于核酸序列杂交试验或基因扩增检测操作的适宜严格条件。也可以选择更高或更低的严格条件。熟练技术人员知晓可以在洗涤过程中改变的多种参数,从而保持或者改变严格条件。
例如,长于50个核苷酸的DNA杂交体的典型的高严格杂交条件包括在1×SSC中于65℃杂交或者在1×SSC和50%甲酰胺中于42℃杂交,接着在0.3×SSC中于65℃洗涤。长于50个核苷酸的DNA杂交体的中等严格杂交条件的实例包括在4×SSC中于50℃杂交或者在6×SSC和50%甲酰胺中于40℃杂交,接着在2×SSC中于50℃洗涤。杂交体的长度是针对杂交的核酸预期的长度。当已知序列的核酸分子进行杂交时,杂交体的长度可以通过比对序列并鉴定本文所述的保守区域进行确定。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以另外地包括5×Denhardt’s试剂、0.5-1.0%SDS、100μg/ml片段化的变性鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平,可以参考Sambrook等(2001)的《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约,或者CurrentProtocols in Molecular Biology,John Wiley&Sons,N.Y.(1989及年度更新资料)。
剪接变体
本文所用的术语“剪接变体”包括这样的核酸序列变体,其中选择的内含子和/或外显子已被切除、替换、置换或添加,或者其中内含子已被缩短或增长。这样的变体可以基本上保持蛋白质的生物活性;这可以通过选择性地保留蛋白质的功能性区段来实现。这样的剪接变体可以是天然的或人造的。预测和分离这类剪接变体的方法是本领域众所周知的(参见例如Foissac和Schiex(2005)BMC Bioinformatics 6:25)。
等位基因变体
等位基因或等位基因变体为处于相同的染色体位置上的给定基因的可选形式。等位基因变体包括单核苷酸多态性(SNP),以及小的插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL在大多数生物体的天然存在的多态性品系中形成最大的一组序列变体。
基因改组/定向进化
基因改组或定向进化包括重复实施DNA改组,继之适当筛选和/或选择,以产生编码具有修饰生物活性的蛋白质的核酸序列变体或其部分(Castle等(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
调控元件/控制序列/启动子
术语“调控元件”、“控制序列”和“启动子”在文中均可互换使用,按广义来理解,指能够实现与之相连的序列表达的调控核酸序列。术语“启动子”通常是指位于基因转录起始位点上游的核酸控制序列,其参与RNA聚合酶和其他蛋白质的识别和结合,由此指导有效连接的核酸进行转录。上述术语包括源自经典真核生物基因组基因的转录调控序列(包括精确转录起始所必需的TATA盒,以及具有或没有CCAAT盒序列),以及另外的调控元件(即上游激活序列、增强子和沉默子)——它们通过应答发育刺激和/或外部刺激或以组织特异的方式改变基因表达。所述术语还包括经典原核生物基因的转录调控序列,在此情况下其可以包括-35盒序列和/或-10盒转录调控序列。术语“调控元件”也包括合成的融合分子或衍生物,其赋予、激活或增加细胞、组织或器官中核酸序列分子的表达。
“植物启动子”包含能够介导编码序列区段在植物细胞中表达的调控元件。“植物启动子”优选来源于植物细胞,例如,来源于待被欲在本发明方法中表达的以及本文所述的核酸序列转化的植物。这对于其他“植物”调控信号同样适用,例如“植物”终止子的情况。位于可用于本发明方法的核苷酸序列上游的启动子可以通过一个或多个核苷酸取代、插入和/或缺失进行修饰,而不会干扰启动子、开放读框(ORF)或者3’调控区如终止子或远离ORF的其他3’调控区的功能或活性。此外还有可能通过修饰启动子的序列而增强其活性,或者将其完全替换为活性更强的启动子、甚至是来自异源生物体的启动子。为在植物中表达,核酸序列分子必须如上文所述的那样,有效连接于或者包含适宜的启动子,其中所述启动子将在正确的时间点以所需的空间表达模式表达所述基因。
为鉴定功能上等同的启动子,可以例如通过将启动子与报告基因有效连接、测定所述报告基因在植物多种组织中的表达水平和模式,来分析候选启动子的启动子强度和/或表达模式。众所周知的适宜报告基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性可以确定启动子活性。然后可以将该启动子强度和/或表达模式与参照启动子(如本发明方法中所用的启动子)相比较。可选地,可以利用本领域公知的方法,如Northern印迹(RNA分析)结合放射自显影图的光密度测量分析、定量实时PCR或RT-PCR(Heid等,1996 Genome Methods 6:986-994),通过定量本发明方法所用核酸序列的mRNA水平或者将该mRNA水平与持家基因如18S rRNA的mRNA水平进行比较,来测定启动子强度。通常,“弱启动子”旨在表示驱动编码序列低水平表达的启动子。“低水平”旨在表示每个细胞大约1/10,000个转录物到大约1/100,000个转录物、到大约1/500,0000个转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者说以每个细胞大约1/10个转录物到大约1/100个转录物、到大约1/1000个转录物的水平表达。通常,“中等强度启动子”旨在表示以在所有情况下都低于在35S CaMV启动子控制下获得的水平的水平驱动编码序列表达的启动子。
有效连接
本文所用的术语“有效连接”是指启动子序列和目的基因之间的功能性连接,从而启动子序列能够起始目的基因的转录。
组成型启动子
“组成型启动子”是指在生长和发育的大多数但不必是所有阶段,并且在大多数环境条件下在至少一种细胞、组织或器官中转录激活的启动子。下表2a给出了组成型启动子的实例。
表2a:植物组成型启动子的实例
  基因来源   参考文献
  肌动蛋白   McElroy等,Plant Cell,2:163-171,1990
  HMGB   WO 2004/070039
  GOS2   de Pater等,Plant J Nov;2(6):837-44,1992,WO2004/065596
  泛素   Christensen等,Plant Mol.Biol.18:675-689,1992
  稻亲环蛋白   Buchholz等,Plant Mol Biol.25(5):837-43,1994
  玉米H3组蛋白   Lepetit等,Mol.Gen.Genet.231:276-285,1992
  苜蓿H3组蛋白   Wu等,Plant Mol.Biol.11:641-649,1988
  肌动蛋白2   An等,Plant J.10(1);107-121,1996
  核酮糖二磷酸羧化/加氧酶小亚基   US 4,962,028
  OCS   Leisner(1988)Proc Natl Acad Sci USA 85(5):2553
  SAD1   Jain等,Crop Science,39(6),1999:1696
  SAD2   Jain等,Crop Science,39(6),1999:1696
  V-ATP酶   WO 01/14572
  G-盒蛋白质   WO 94/12015
遍在启动子
遍在启动子在生物体的基本上所有组织或细胞中都有活性。
发育调控型启动子
发育调控型启动子在某些发育阶段或在经历发育改变的植物部分中有活性。
诱导型启动子
诱导型启动子响应于化学(有关综述请参见Gatz 1997,Annu.Rev.Plant Physiol.Plant Mol.Biol.,48:89-108)、环境或物理刺激而具有诱导的或增加的转录起始;或者可以是“胁迫诱导型”,即在植物接触各种胁迫条件时激活;或者是“病原体诱导型”,即在植物接触各种病原体时激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性的启动子是能够在某些器官或组织,如在叶、根、种子等组织中优先起始转录的启动子。例如,“根特异性启动子”是主要在植物根中转录激活的启动子,基本上排除了在任何其他植物部分的激活,但仍允许在这些其他植物部分中的任何渗漏表达。能够仅在某些细胞中起始转录的启动子在文中称为“细胞特异性”启动子。
根特异性启动子的实例列于下面的表2b中。
表2b:根特异性启动子的实例
  基因来源   参考文献
  RCc3   Plant Mol Biol.1995 Jan;27(2):237-48
  拟南芥PHT1   Kovama等,2005;Mudge等(2002,Plant J.31:341)
  苜蓿(Medicago)磷酸转运蛋白   Xiao等,2006
  拟南芥Pyk10   Nitz等(2001)Plant Sci 161(2):337-346
  根可表达基因   Tingey等,EMBO J.6:1,1987.
  烟草生长素可诱导基因   Van der Zaal等,Plant Mol.Biol.16,983,1991.
  β-微管蛋白   Oppenheimer,等,Gene 63:87,1988.
  烟草根特异性基因   Conkling,等,Plant Physiol.93:1203,1990.
  欧洲油菜(B.napus)G1-3b基因   美国专利No.5,401,836
  SbPRP1   Suzuki等,Plant Mol.Biol.21:109-119,1993.
  LRX1   Baumberger等2001,Genes&Dev.15:1128
  BTG-26欧洲油菜   US 20050044585
  基因来源   参考文献
  LeAMT1(番茄)   Lauter等(1996,PNAS 3:8139)
  The LeNRT1-1(番茄)   Lauter等(1996,PNAS 3:8139)
  I型patatin基因(马铃薯)   Liu等,Plant Mol.Biol.153:386-395,1991.
  KDC1(胡萝卜(Daucuscarota))   Downey等(2000,J.Biol.Chem.275:39420)
TobRB7基因   W Song(1997)PhD Thesis,North CarolinaState University,Raleigh,NC USA
  OsRAB5a(稻)   Wang等2002,Plant Sci.163:273
  ALF5(拟南芥)   Diener等(2001,Plant Cell 13:1625)
  NRT2;1Np(白花丹叶烟草(N.plumbaginifolia))   Quesada等(1997,Plant Mol.Biol.34:265)
  大麦根特异性凝集素   Lerner&Raikhel(1989)Plant Phys 91:124-129
  根特异性富羟脯氨酸蛋白质   Keller&Lamb(1989)Genes&Dev 3:1639-1646
  拟南芥CDC27B/hobbit   Blilou等(2002)Genes&Dev 16:2566-2575
种子特异性启动子主要在种子组织中,但不必仅在种子组织中(渗漏表达的情况)转录激活。种子特异性启动可以在种子发育和/或萌发期间激活。种子特异性启动子的实例示于下面的表2c中。种子特异性启动子的其他实例可参见Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004),其中揭示的内容在此纳入本文作为参考就如同陈述了其全部内容那样。
表2c:种子特异性启动子的实例
 基因来源  参考文献
 种子特异性基因  Simon等,Plant Mol.Biol.5:191,1985;
 Scofield等,J.Biol.Chem.262:12202,1987.;
 基因来源  参考文献
 Baszczynski等,Plant Mol.Biol.14:633,1990.
 巴西坚果白蛋白  Pearson等,Plant Mol.Biol.18:235-245,1992.
 豆球蛋白  Ellis等,Plant Mol.Biol.10:203-214,1988.
 谷蛋白(稻)  Takaiwa等,Mol.Gen.Genet.208:15-22,1986;
 Takaiwa等,FEBS Letts.221:43-47,1987.
 玉米醇溶蛋白  Matzke等Plant Mol Biol,14(3):323-321990
 napA  Stalberg等,Planta 199:515-519,1996.
 小麦LMW和HMW麦谷蛋白-1 Mol Gen Genet 216:81-90,1989;NAR 17:461-2,1989
 小麦SPA  Albani等,Plant Cell,9:171-184,1997
 小麦α,β,γ-麦醇溶蛋白 EMBO J.3:1409-15,1984
 大麦Itr1启动子  Diaz等(1995)Mol Gen Genet 248(5):592-8
 大麦B1,C,D,大麦醇溶蛋白  Theor Appl Gen 98:1253-62,1999;Plant J 4:343-55,1993;Mol Gen Genet 250:750-60,1996
 大麦DOF  Mena等,The Plant Journal,116(1):53-62,1998
 blz2  EP99106056.7
 合成启动子  Vicente-Carbajosa等,Plant J.13:629-640,1998.
 稻的谷醇溶蛋白NRP33  Wu等,Plant Cell Physiology 39(8)885-889,1998
 稻a-球蛋白Glb-1  Wu等,Plant Cell Physiology 39(8)885-889,1998
 稻OSH1  Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996
 基因来源  参考文献
 稻α-球蛋白REB/OHP-1  Nakase等Plant Mol.Biol.33:513-522,1997
 稻ADP-葡萄糖焦磷酸化酶 Trans Res 6:157-68,1997
 玉米ESR基因家族  Plant J 12:235-46,1997
 高粱α-高粱醇溶蛋白 DeRose等,Plant Mol.Biol 32:1029-35,1996
 KNOX  Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
 稻油质蛋白  Wu et al,J.Biochem.123:386,1998
 向日葵油质蛋白  Cummins等,Plant Mol. Biol.19:873-876,1992
 PRO0117,推定的稻40S核糖体蛋白质 WO 2004/070039
 PRO0136,稻丙氨酸氨基转移酶  未出版
 PRO0147,胰蛋白酶抑制剂ITR1(大麦)  未出版
 PRO0151,稻WSI18  WO 2004/070039
 PRO0175,稻RAB21  WO 2004/070039
 PRO005  WO 2004/070039
 PRO0095  WO 2004/070039
α-淀粉酶(Amy32b)  Lanahan等,Plant Cell 4:203-211,1992;Skriver et al,Proc Natl Acad Sci USA 88:7266-7270,1991
 基因来源  参考文献
 组织蛋白酶β-样基因 Cejudo等,Plant Mol Biol 20:849-856,1992
 大麦Ltp2  Kalla等,Plant J.6:849-60,1994
 Chi26  Leah等,Plant J.4:579-89,1994
 玉米B-Peru  Selinger等,Genetics 149;1125-38,1998
“在地上部分中具有活性的启动子”是指能够优先地在植物的地上部分中起始转录的启动子,基本上排除了在任何其他植物部分(特别是地下部分)的激活,但仍允许在这些其他植物部分中的任何渗漏表达。下面的表2d显示主要在绿色组织中具有转录活性的此类启动子的实例。
如文中所定义的绿色组织特异性启动子是主要在绿色组织中转录激活的启动子,基本上排除了在任何其他植物部分的激活,但仍允许有在这些其他植物部分中的任何渗漏表达。
可用于本发明方法的绿色组织特异性启动子的实例示于下面的表2d中。
表2d:绿色组织特异性启动子的实例
  基因   表达   参考文献
  玉米正磷酸二激酶   叶特异性   Fukavama等,2001
  玉米磷酸烯醇丙酮酸羧化酶   叶特异性   Kausch等,2001
  稻磷酸烯醇丙酮酸羧化酶   叶特异性   Liu等,2003
  稻Rubisco小亚基   叶特异性   Nomura等,2000
  稻β扩展蛋白EXBP9   枝条特异性   WO 2004/070039
  木豆(Pigeonpea)Rubisco小亚基   叶特异性   Panguluri等,2005
  豌豆(Pea)RBCS3A   叶特异性
组织特异性启动子的另一实例是分生组织特异性启动子,其主要在分生组织中转录激活,基本上排除了在任何其他植物部分的激活,但仍允许有在这些其他植物部分中的任何渗漏表达。可用于进行本发明方法的分生组织特异性启动子的实例示于下面的表2e中。
表2e:分生组织特异性启动子的实例
  基因来源   表达模式   参考文献
稻OSH1   枝条顶端分生组织,从胚球形期到幼苗期   Sato等(1996)Proc.Natl.Acad.Sci.USA,93:8117-8122
  稻金属硫蛋白   分生组织特异性  BAD87835.1
WAK1&WAK 2   枝条和根顶端分生组织,及在扩展的叶和萼片中  Wagner&Kohorn(2001)Plant Cell 13(2):303-318
表2f:胚乳组织特异性启动子的实例
  基因来源   参考文献
谷蛋白(稻)   Takaiwa等(1986)Mol Gen Genet 208:15-22;Takaiwa等(1987)FEBS Letts.221:43-47
  玉米醇溶蛋白   Matzke等,(1990)Plant Mol Biol 14(3):323-32
  小麦LMW和HMW麦谷蛋白-1   Colot等(1989)Mol Gen Genet 216:81-90,Anderson等(1989)NAR 17:461-2
  小麦SPA   Albani等(1997)Plant Cell 9:171-184
  小麦的麦醇溶蛋白   Rafalski等(1984)EMBO 3:1409-15
  大麦Itr1启动子   Diaz等(1995)Mol Gen Genet 248(5):592-8
  大麦B1,C,D大麦醇溶蛋白   Cho等(1999)Theor Appl Genet 98:1253-62;Muller等(1993)Plant J 4:343-55;Sorenson等(1996)Mol Gen Genet 250:750-60
  大麦DOF   Mena等,(1998)Plant J 116(1):53-62
  基因来源   参考文献
  blz2   Onate等(1999)J Biol Chem 274(14):9175-82
  合成启动子   Vicente-Carbajosa等(1998)Plant J 13:629-640
  稻的谷醇溶蛋白NRP33 Wu等,(1998)Plant Cell Physiol 39(8)885-889
  稻球蛋白Glb-1   Wu等(1998)Plant Cell Physiol 39(8)885-889
  稻球蛋白REB/OHP-1 Nakase等(1997)Plant Molec Biol 33:513-522
  稻ADP-葡萄糖焦磷酸化酶 Russell等(1997)Trans Res 6:157-68
  玉米ESR基因家族   Opsahl-Ferstad等(1997)Plant J 12:235-46
  高粱的高粱醇溶蛋白   DeRose等(1996)Plant Mol Biol 32:1029-35
表2g:胚特异性启动子的实例
  基因来源   参考文献
  稻OSH1   Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996
  KNOX   Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
  PRO0151   WO 2004/070039
  PRO0175   WO 2004/070039
  PRO005   WO 2004/070039
  PRO0095   WO 2004/070039
表2h:糊粉特异性启动子的实例
 基因来源  参考文献
α-淀粉酶(Amy32b)  Lanahan等,Plant Cell 4:203-211,1992;Skriver等,Proc Natl Acad Sci USA 88:7266-7270,1991
 组织蛋白酶β-样基因  Cejudo等,Plant Mol Biol 20:849-856,1992
 大麦Ltp2  Kalla等,Plant J.6:849-60,1994
 Chi26  Leah等,Plant J.4:579-89,1994
 玉米B-Peru  Selinger等,Genetics 149;1125-38,1998
终止子
术语“终止子”包括如下控制序列,其为位于转录单位末端的DNA序列,发送对初级转录物进行3’加工和多聚腺苷酸化以及终止转录的信号。终止子可以源自天然基因、多种其他植物基因、或T-DNA。例如,待加入的终止子可以源自例如胭脂碱合酶或章鱼碱合酶基因、或可选地源自其它植物基因、或次优选地源自任何其它真核基因。
调节
与表达或基因表达相关联时,术语“调节”是指与对照植物相比,所述基因表达的表达水平被改变的过程,优选使所述表达水平增加。原始未调节的表达可以是结构RNA(rRNA、tRNA)或随后进行翻译的mRNA的任何类型的表达。术语“调节活性”应理解为对本发明核酸序列或编码蛋白质的表达的如下任何改变,所述改变导致植物产率增加和/或生长增加。
表达
术语“表达”或“基因表达”是指一种或多种特定基因或特定遗传构建体的转录。术语“表达”或“基因表达”特别指一种或多种基因或遗传构建体转录为结构RNA(rRNA、tRNA)或mRNA,并随后翻译或不翻译为蛋白质。该过程包括DNA的转录、以及所产生mRNA产物的加工。
增加的表达/过表达
如本文所用的术语“增加的表达”或“过表达”表示超出原始野生型表达水平的任何形式的表达。
增加基因或基因产物表达的方法在本领域有充分的记载,这包括,例如通过适当的启动子驱动的过表达、转录增增强子或翻译增强子的使用。可以将用作启动子或增强子元件的分离的核酸序列引入非异源形式多核苷酸的适当位置(一般是上游),从而上调目的多肽编码核酸序列的表达。例如,可以通过突变、缺失和/或取代,体内地改变内源启动子(见Kmiec,US5,565,350;Zarling等,WO9322443),或者将分离的启动子引入植物细胞中使其相对于本发明基因具有恰当的方向和距离,从而控制基因的表达。
如果期望多肽表达,通常期望在多核苷酸编码区的3’末端纳入多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、多种其它植物基因或T-DNA。例如,待加入的3’末端序列可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其他植物基因、或次优选地源自任何其它真核基因。
也可以在5’非翻译区(UTR)或部分编码区的编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。已显示,在植物和动物表达构建体的转录单位中纳入可剪接内含子可以在mRNA和蛋白质水平使基因表达增加高达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Genes Dev.1:1183-1200)。通常这类内含子被放置在转录单位5’末端附近时,其增加基因表达的作用最大。玉米内含子Adh1-S内含子1、2和6以及Bronze-1内含子的使用是本领域公知的。一般信息请参见TheMaize Handbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
内源基因
本文述及的“内源”基因不仅指见于植物之中的天然形式的所讨论基因(即未经人为干预),而且指随后(重新)引入到植物中的分离形式的相同基因(或基本上同源的核酸/基因)(转基因)。例如,含有这样的转基因的转基因植物可以发生转基因表达的实质性下降和/或内源基因表达的实质性下降。
分离的基因可以从生物体中分离,或者可以是人造例如通过化学合成制备的。
降低的表达
本文述及的“降低的表达”或者表达“下降或基本上消除”应理解为表示内源基因表达和/或多肽水平和/或多肽活性相对于对照植物降低。所述下降或基本上消除按照递增的优选顺序是与对照植物相比,下降至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多。
为了降低或者基本上消除植物中内源基因的表达,需要一段足够长度的基本上连续核苷酸的核酸序列。为了实施基因沉默,这可以少到20,19,18,17,16,15,14,13,12,11,10或更少个核苷酸,备选地可以多到整个基因(包括5’和/或3’UTR,部分地或全部地)。该基本上连续的核苷酸链可以来自编码目的蛋白质(靶基因)的核酸序列,或者来自任何能编码目的蛋白质的直系同源物、旁系同源物或同源物的核酸序列。优选地,该基本连续的核苷酸链能与靶基因(有义或反义链)形成氢键,更优选地,该基本连续的核苷酸链按递增的优选顺序与靶基因(有义或反义链)具有50%,60%,70%,80%,85%,90%,95%,96%,97%,98%,99%,100%序列同一性。编码(功能性)多肽的核酸序列对于本文所讨论的多种用于降低或基本上消除内源基因表达的方法不是必需的。
降低或基本上消除表达可利用常规工具和技术实现。降低或基本消除内源基因表达的一个方法是RNA-介导的沉默,其中使用核酸序列或其部分(在这种情况下,一段基本上连续的核苷酸链,其来自目的基因,或者来自任何能编码目的蛋白质的直系同源物、旁系同源物或同源物的核酸序列)的反向重复——优选能形成发夹结构。RNA沉默方法的另一个实例涉及向植物中以有义方向导入核酸序列或者其部分(在这种情况下,一段基本连续的核苷酸链,其来自目的基因,或者来自任何能编码目的蛋白质的直系同源物,旁系同源物或同源物的核酸序列)。RNA沉默方法的另一个实例涉及反义核酸序列的使用。基因沉默还可通过插入诱变(例如,T-DNA插入或转座子插入)或通过例如Angell和Baulcombe((1999)Plant J 20(3):357-62),(Amplicon VIGS WO 98/36083)或Baulcombe(WO 99/15682)描述的策略来实现。其他方法,例如使用抗内源多肽的抗体在植物中抑制其功能或干扰其中牵涉多肽的信号传递路径,对于本领域技术人员来说是熟知的。可使用人造和/或天然microRNA(miRNA)敲除基因表达和/或mRNA翻译。内源miRNA是长度通常为19至24个核苷酸的单链小RNA。可以特异地对长度通常为21个核苷酸的人造microRNA(amiRNA)进行遗传工程改造以使之负调节单个或多个目的基因的基因表达。植物microRNA靶的选择的决定因素是本领域众所周知的。用于靶识别的经验参数已经确定并且可以用来辅助设计特定的amiRNA(Schwab等,Dev.Cell 8(4),517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,Plant Cell,18,1121-1133,2006)。
更详细的:
降低或基本上消除表达可利用常规工具和技术实现。降低或基本消除内源基因表达的一个优选方法是在植物中引入和表达遗传构建体,在该遗传构建体中核酸(在这种情况下,一段基本连续的核苷酸链,其来自目的基因,或者来自任何能编码任何目的蛋白质的直系同源物、旁系同源物或同源物的核酸)被克隆为由间隔序列(非编码DNA)分隔开的反向重复序列(部分地或者全部地)。
在这种优选的方法中,内源基因的表达通过RNA-介导的沉默,被降低或基本消除,在该RNA-介导的沉默中使用核酸或其部分(在这种情况下,一段基本上连续的核苷酸链,其来自目的基因,或者来自任何能编码目的蛋白质的直系同源物、旁系同源物或同源物的核酸)的反向重复——优选能形成发夹结构——来实现。该反向重复被克隆在含有控制序列的表达载体上。非编码DNA核酸序列(间隔序列,例如基质附着区片段(MAR),内含子,多接头等)被放置在形成该反向重复的两个反向核酸之间。该反向重复序列转录后,形成具有(部分或者全部)自互补结构的嵌合RNA。该双链RNA结构称为发夹RNA(hpRNA)。发夹RNA被植物加工为siRNAs,siRNAs整合进入RNA诱导的沉默复合物(RISC)中。RISC进一步断裂mRNA转录物,由此实质性地降低待翻译成多肽的mRNA转录物的数量。有关其它一般细节,敬请参见例如,Grierson等(1998)WO98/53083;Waterhouse等(1999)WO 99/53050)。
本发明方法的实施并不依赖于在植物中引入和表达其中以反向重复形式克隆核酸的遗传构建体;而是可以使用几种众所周知的“基因沉默”方法中的任何一种或多种来获得相同的效果。
用于降低内源基因表达的一种此类方法是RNA介导的基因表达沉默(下调)。这种情况下的沉默在植物中由与靶内源基因基本相似的双链RNA序列(dsRNA)触发。该dsRNA进一步被植物加工成大约20到大约26个核苷酸,称为小干扰RNA(siRNAs)。siRNAs整合进RNA诱导的沉默复合物(RISC)中,该沉默复合物断裂内源靶基因的mRNA转录物,由此实质性地降低待翻译成多肽的mRNA转录物的数量。优选地,该双链RNA序列对应于靶基因。
RNA沉默方法的另一个实例涉及向植物中以有义方向导入核酸序列或者其部分(在这种情况下,一段基本连续的核苷酸链,其来自目的基因,或者来自任何能编码目的蛋白质的直系同源物,旁系同源物或同源物的核酸)。“有义方向”指DNA序列与其mRNA转录物是同源的。因此导入植物中的将是核酸序列的至少一个拷贝。该额外的核酸序列将降低此内源基因的表达,造成被称为共抑制(co-suppression)的现象。如果在植物中导入核酸序列的几个额外拷贝,基因表达的降低将会更加明显,原因是高转录水平和共抑制的触发之间存在正相关。
RNA沉默方法的另一个实例涉及反义核酸序列的使用。反义核酸序列包括与编码蛋白质的“有义”核酸序列互补,即,与双链cDNA分子的编码链互补,或者与mRNA转录序列互补,的核苷酸序列。反义核酸序列优选与要沉默的内源基因互补。互补可位于基因的“编码区”和/或“非编码区”。术语“编码区”指包含可翻译成氨基酸残基的密码子的核苷酸序列区域。术语“非编码区”指位于编码区两侧的5′和3′序列,该区可转录但不翻译成氨基酸(也称为5′和3′非翻译区)。
反义核酸序列可以根据Watson和Crick碱基配对规则设计。反义核酸序列可以与整个核酸序列(在此情况下,一段基本上连续的核苷酸链,其来自目的基因、或来自任何能够编码目的蛋白的直向同源物、旁系同源物或同源物的核酸)互补,不过也可以是仅与核酸序列的一部分(包括mRNA 5’和3’UTR)反义的寡核苷酸。例如,反义寡核苷酸序列可以与围绕编码多肽的mRNA转录物的翻译起始位点的区域互补。合适的反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或更少的核苷酸开始。本发明的反义核酸序列可以利用本领域已知方法,使用化学合成和酶连接反应而构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在的核苷酸或多种修饰的核苷酸化学地合成,其中所述修饰的核苷酸被设计旨在增加分子的生物学稳定性或增加反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的实例是本领域众所周知的。已知的核苷酸修饰包括甲基化、环化和′加帽′及用类似物(如肌苷)取代一个或多个天然存在的核苷酸。其它的核苷酸修饰是本领域众所周知的。
这种反义核酸序列可以使用核酸序列已经以反义方向亚克隆入其中(即从插入的核酸转录的RNA将与目的靶核酸呈反义方向)的表达载体,以生物学方式产生。优选地,反义核酸序列在植物中的产生借助稳定整合的核酸构建体进行,其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。
用于本发明方法中实现沉默的核酸分子(无论向植物中导入或在原位(in situ)产生)将与编码多肽的mRNA转录物和/或基因组DNA杂交或结合,由此通过例如抑制转录和/或翻译而抑制蛋白质表达。杂交可以是常规核苷酸互补以形成稳定双链体,或在结合DNA双链体的反义核酸序列的情况下,为在双螺旋大沟内的特异相互作用。反义核酸序列可以通过转化或在特定组织部位直接注射而导入植物。备选地,可以对反义核酸序列进行靶向选定细胞的修饰,并且随后系统性施用。例如,对于系统性施用,反义核酸序列可以被修饰以便它们能够特异结合表达在所选择的细胞表面上的受体或抗原,例如使反义核酸序列与可以和细胞表面受体或抗原结合的肽或抗体连接。反义核酸序列也可以使用本文中所述的载体送递至细胞内。
根据又一个方面,反义核酸序列是α-异头核酸序列。α异头核酸序列与互补性RNA形成特异的双链杂交分子,其中与惯常b-单元相反,所述链走向相互平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可以包含2′-o-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
内源基因表达的降低或基本消除也可以使用核酶而进行。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸序列,如mRNA。因此,核酶(例如锤头核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可以用来催化性地切割编码多肽的mRNA转录物,由此实质性地降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列具特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。备选地,可以使用对应于核酸序列的mRNA转录物,从RNA分子库中选出具有特异性核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其它人描述的策略而实现。
当在内源基因上存在突变和/或在随后导入植物的分离的基因/核酸上存在突变时,基因沉默也可发生。降低或基本消除可以由无功能的多肽引起。例如,多肽可以与多种相互作用性蛋白质结合;由此通过一个或多个突变和/或截短可以提供仍能够结合相互作用性蛋白质(如受体蛋白质)但不能表现其正常功能(如起信号作用的配体)的多肽。
另一种基因沉默的方法是靶定与基因调节区(例如启动子和/或增强子)互补的核酸序列以形成阻止基因在靶细胞中转录的三螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992和Maher,L.J.Bioassays 14,807-15,1992。
其它方法,如使用针对内源性多肽的抗体以抑制此多肽在植物中的功能,或干扰所述多肽参与的信号途径,对于技术人员将是众所周知的。尤其可以构思的是,人造分子可以用于抑制靶多肽的生物学功能,或用于干扰靶多肽参与的信号途径。
备选地,可以建立筛选程序以在植物群体中鉴定基因的天然变体,所述变体编码具有降低活性的多肽。此类天然变体也可以用于例如进行同源重组。
人工和/或天然的microRNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常19-24个核苷酸长度的单链小RNA。它们的主要功能是调节基因表达和/或mRNA翻译。大多数的植物microRNA(miRNA)与其靶序列具有完全的或接近完全的互补性。然而,存在具有多达5个错配的天然靶标。它们由切酶家族的双链特异性RNA酶从具有特征性折回结构的较长非编码性RNA中加工而来。加工后,它们通过与RNA诱导的沉默复合物(RISC)的主要成分Argonaute蛋白质结合而掺入该复合体。MiRNA充当RISC的特异性成分,因为它们可以与细胞质中的靶核酸(大多是mRNA)碱基配对。后续的调节事件包括靶mRNA的切割和破坏和/或翻译抑制。因此,miRNA过表达的效应常常反映为靶基因降低的mRNA水平。
可以特异地遗传构建通常21个核苷酸长度的人工microRNA(amiRNAs),以负调节单个或多个目的基因的基因表达。植物microRNA靶的选择的决定因素是本领域众所周知的。用于靶识别的经验参数已经确定并且可以用来辅助设计特定的amiRNA(Schwab等,Dev.Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,Plant Cell,18,1121-1133,2006)。
为最佳性能,用于在植物中降低内源基因表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,将来自任何给定植物物种的核酸序列导入同一个物种内。例如,将来自稻的核酸序列转化至稻植物。然而,并非绝对要求待导入的核酸序列起源于与该核酸序列将要导入的植物相同的植物物种。只要内源性靶基因与待导入的核酸序列之间存在相当大的同源性就足够了。
上文描述了用于降低或基本消除内源基因在植物中表达的多种方法的实例。本领域技术人员能够容易地适应性调整前述用于沉默的方法,以例如通过利用合适启动子而降低内源基因在整株植物或在其部分中的表达。
选择标记(基因)/报告基因
“选择标记”、“可选择标记基因”或“报告基因”包括赋予细胞表型的任何基因,该基因在细胞中的表达有利于鉴定和/或选择被本发明的核酸序列构建体转染或转化了的细胞。这些标记基因通过各种不同的原理使得能够鉴定核酸序列分子的成功转移。适宜的标记可以选自赋予抗生素或除草剂抗性的标记,其引入新的代谢性状或允许可视选择。可选择标记基因的实例包括赋予抗生素抗性的基因(例如磷酸化新霉素和卡那霉素的nptII,或磷酸化潮霉素的hpt,或赋予例如对博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(G418)、壮观霉素或杀稻瘟素抗性的基因)、赋予除草剂抗性的基因(例如提供抗抗性的bar;提供抗草甘膦抗性的aroA或gox,或赋予例如对咪唑啉酮、膦丝菌素或磺酰脲抗性的基因)、或者提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或导致木糖利用的木糖异构酶,或抗营养标记如对2-脱氧葡萄糖的抗性)。可视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶GUS,或β-半乳糖苷酶及其有色底物,例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这里仅仅是列出了一小部分可用的标记。技术人员对这类标记极为熟悉。取决于生物体和选择方法,优选不同的标记。
已知,取决于所用的表达载体和所用的转染技术,当核酸序列向植物细胞进行稳定或瞬时整合时,仅少数细胞能摄入外来DNA,并将其整合入基因组(如果期望的话)。为鉴定并选择这些整合体,通常将编码选择标记(如上文所述的那些)的基因与目的基因一起引入宿主细胞中。这些标记能够例如在如下突变体中使用,在所述突变体中这些基因例如通过常规方法缺失而没有功能。此外,编码选择标记的核酸序列分子与编码本发明多肽或用于本发明方法的序列可以在同一个载体中引入宿主细胞,或者在分开的载体中引入。已由所引入的核酸序列稳定转染的细胞可以例如通过选择(例如,整合有选择标记的细胞存活而其他细胞死去)予以鉴定。
由于一旦成功引入核酸序列后,将不再需要或不期望转基因宿主细胞中存在标记基因,特别是抗生素和除草剂抗性基因,所以根据本发明引入核酸序列的方法有利地采用能够除去或切除这些标记基因的技术。一种这样的方法是称为共转化的方法。共转化法采用两个载体同时进行转化,一个载体携带根据本发明的核酸序列,而第二个携带标记基因。很大比例的转化体将接收或者对于植物而言(高达40%或以上的转化体)含有两个载体。对于农杆菌转化,转化体通常只接收载体的一部分,即被T-DNA侧翼包围的序列,其通常是表达盒。随后可通过杂交(cross)从转化植物中除去标记基因。在另一种方法中,利用整合进转座子的标记基因与期望的核酸序列一起进行转化(称为Ac/Ds技术)。转化体可与转座酶来源杂交,或者用赋予转座酶表达的核酸序列构建体瞬时或稳定转化转化体。一旦成功进行了转化,在有些情况下(约10%),转座子将跳离宿主细胞基因组并丢失。在另一些情况下,转座子跳至不同的位置。在这些情况下,必须通过杂交消除标记基因。微生物学中,已经研发了可以或便于检测此类事件的技术。另一有利的方法有赖于称为重组系统的方法,其优势在于可以免除杂交消除步骤。最著名的这类系统称为Cre/lox系统。Cre1为重组酶,且切除位于loxP序列之间的序列。如果标记基因整合在loxP序列之间,一旦成功进行了转化,将因重组酶的表达而得以切除。其他重组系统有HIN/HIX、FLP/FRT及REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。根据本发明的核酸序列可以位点特异性地整合进植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。
转基因的/转基因/重组
出于本发明的目的,“转基因的”、“转基因”或“重组”当与例如,核酸序列,含有所述核酸序列的表达盒、基因构建体或载体,或用根据本发明的核酸序列、表达盒或载体转化的生物体相关时,是指所有这些构建体通过重组方法产生,其中:
(a)编码可用于本发明方法的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的遗传控制序列,例如启动子,或
(c)(a)和(b)
不位于其天然遗传环境中,或者已通过重组方法修饰,该修饰可以为例如一个或多个核苷酸残基的取代、添加、缺失、倒位或插入。天然遗传环境应理解为指在起始植物中的天然基因组或染色体座位或存在于基因组文库之中。在基因组文库的情况下,优选至少部分地保持核酸序列的天然遗传环境。该环境至少位于核酸序列一侧,且具有至少为50bp、优选至少500bp、特别优选至少1000bp、最优选至少5000bp序列长度。当天然存在的表达盒——例如编码可用于本发明方法的多肽的相应核酸序列与该核酸序列的天然启动子之间天然存在着的组合——经非天然的合成(“人造”)方法如诱变处理而被修饰时,此表达盒成为转基因表达盒。例如,合适的方法描述在US 5,565,350或WO 00/15815中。
因此,如上文所述,为了本发明目的,转基因植物应理解为表示:在所述植物的基因组中,本发明方法中所用的核酸序列不在其天然基因座上,该核酸可以为同源或异源表达。不过,正如所提到的那样,转基因也表示:当在植物基因组中,根据本发明的核酸序列或本发明方法中所用的核酸序列位于其天然位置上时,所述序列已相对于天然序列被修饰,和/或该天然序列的调控序列已被修饰。转基因优选指:根据本发明的核酸序列在基因组中于非天然的座位上表达,即同源表达,或者优选发生核酸的异源表达。优选的转基因植物在文中述及。
转化
本文述及的术语“引入”或“转化”包括将外源多核苷酸转移进宿主细胞,不考虑转移所用的方法。可以使用本发明的遗传构建体转化能够通过器官发生或者胚胎发生随后进行克隆繁殖的植物组织,并从其再生整个植物。具体选择的组织将因可得的和最适于待转化的具体物种的克隆繁殖系统而变。示例性的组织靶标包括叶盘、花粉、胚、子叶、下胚轴、雌配子、愈伤组织、既有的分生组织(例如顶端分生组织、腋芽和根分生组织),以及诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。可将多核苷酸瞬时或稳定地导入宿主细胞,其可保持非整合状态例如作为质粒。可选择地,可将其整合入宿主基因组。然后以本领域技术人员已知的方法将所得的转化的植物细胞用于再生转化的植物。
外来基因转移进入植物基因组中称为转化。植物物种的转化现在是相当常规的技术。有利地,可使用几种转化方法中的任一方法将目的基因导入适宜的祖先细胞。可以利用转化方法以及由植物组织或植物细胞再生植物的方法来进行瞬时或稳定转化。转化方法包括脂质体的使用、电穿孔、增加游离DNA摄取的化学物质、DNA至植物的直接注射、基因枪轰击(particle gun bombardment)、使用病毒或花粉的转化以及显微注射。方法可选自用于原生质体的钙/聚乙二醇方法(Krens,F.A.等人,(1982)Nature296,72-74;Negrutiu I等人(1987)Plant Mol Biol 8:363-373)、原生质体的电穿孔(Shillito R.D.等人(1985)Bio/Technol 3,1099-1102)、至植物材料内的显微注射(Crossway A等人,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的微粒轰击(Klein TM等人,(1987)Nature 327:70);使用(非整合型)病毒的感染等。优选通过农杆菌介导的转化产生转基因植物,包括转基因作物植物。一种有利的转化法是植物原位(in planta)转化。为此,可以例如使农杆菌作用于植物种子,或用农杆菌接种植物分生组织。已经证明,根据本发明尤为有利的是,使转化了的农杆菌悬液作用于完整植株或至少花原基。随后培养植物,直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。农杆菌介导的稻转化方法包括众所周知的稻转化方法,例如在任一如下文献中描述的方法:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta,199:612-617,1996);Chan等(Plant Mol.Biol.22(3)491-506,1993),Hiei等(Plant J.6(2):271-282,1994),其公开的内容在此并入本文作为参考就如同陈述了其全部内容那样。至于玉米转化,优选的方法如Ishida等(Nat.Biotechnol.14(6):745-50,1996)或Frame等(Plant Physiol.129(1):13-22,2002)中所述,其公开的内容全部地并入本文作为参考。作为举例说明,所述方法还由B.Jenes等,Techniques for GeneTransfer,在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press(1993)128-143以及Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中进一步描述。优选将待表达的核酸或构建体克隆到载体中,所述载体适用于转化根癌农杆菌(Agrobacterium tumefaciens),例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。然后以已知的方式利用由这样的载体转化的农杆菌来转化植物,例如用作模式植物的植物,像拟南芥(Arabidopsis thaliana,其在本发明范围内不视为作物植物);或者作物植物,例如作为举例的烟草植物,例如通过在农杆菌溶液中浸没擦伤的叶子或切碎的叶子,然后在合适的培养基中培养之。通过根癌农杆菌的植物转化例如已由
Figure G2008800254180D00341
和Willmitzer在Nucl.Acid Res.(1988)16,9877描述,或者尤其是可从F.F.White,Vectors for Gene Transfer in Higher Plants在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press,1993,第15-38页获知。
除了体细胞(其随后必须再生为完整植株)转化以外,还可以转化植物分生组织的细胞,特别是可以发育成配子的那些细胞。在这种情况下,转化的配子循着天然植物的发育而产生转基因植物。因此,例如,可以用农杆菌处理拟南芥的种子,并从一定比例经转化因而是转基因的发育植物收获种子[Feldman,KA和Marks MD(1987).Mol Gen Genet 208:274-289;Feldmann K(1992).在C Koncz,N-H Chua和J Shell编辑Methods inArabidopsis Research.Word Scientific,Singapore,第274-289页]。可选的方法基于反复去除花序以及使莲座中心切割部位与转化的农杆菌一起孵育,由此在随后的时间点同样能够获得转化的种子(Chang(1994).Plant J.5:551-558;Katavic(1994).Mol Gen Genet,245:363-370)。然而,一种特别有效的方法是真空渗入法,及其改良方法如“花器浸蘸法”(floral dip)。对于拟南芥的真空渗入,用农杆菌悬液在减压下处理完整植株[Bechthold,N(1993).C R Acad Sci Paris Life Sci,316:1194-1199],而对于“花器浸蘸法”,将发育中的花组织与表面活性剂处理的农杆菌悬液短暂孵育[Clough,SJ和Bent,AF(1998).The Plant J.16,735-743]。在两种情况下均收获一定比例的转基因种子,这些种子可通过在上述选择性条件下培养而与非转基因种子区分开来。另外,质体的稳定转化是有利的,因为质体在多数作物中为母系遗传,从而降低或消除了转基因通过花粉传播的风险。叶绿体基因组的转化通常通过Klaus等,2004[Nature Biotechnology 22(2),225-229]中系统性展示的方法实现。简言之,将待转化的序列与可选择标记基因一起克隆到同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导转基因位点特异性整合到质体基因组中。质体转化已在许多不同的植物物种中描述,且综述由Bock(2001)Transgenic plastids in basic research and plantbiotechnology.J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)Progress towards commercialization of plastid transformationtechnology.Trends Biotechnol.21,20-28给出。最近报道了形式为无标记的质体转化体的其他生物技术方法,所述转化体可以利用瞬时共整合的标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
T-DNA激活标签
T-DNA激活标签(Hayashi等Science(1992)1350-1353)包括将通常含有启动子(也可以是翻译增强子或内含子)的T-DNA插入在目的基因的基因组区或基因编码区上游或下游10kb处,从而在构型上使启动子能够指导被靶向基因的表达。通常天然启动子对被靶向基因表达的调控被破坏,基因落入新引入的启动子控制。启动子一般包含于T-DNA中。可以例如,通过农杆菌感染将此T-DNA随机插入植物基因组中,并导致插入T-DNA附近的基因的表达被修饰。得到的转基因植物将由于紧靠引入的启动子的基因的表达改变而表现出显性表型。
TILLING
术语“TILLING”为“靶向诱导的基因组局部损伤”(Targeted InducedLocal Lesions In Genomes)的缩写,是一种用于产生和/或鉴定编码具有修饰的表达和/或活性的蛋白质的核酸序列的诱变技术。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以在强度、位置或时间(例如,如果突变影响启动子的话)上呈现出修饰的表达。这些突变变体可以比其天然形式基因呈现更高的活性。TILLING将高密度诱变和高通量筛选方法结合在一起。TILLING一般遵循的步骤有:(a)EMS诱变(Redei GP和Koncz C,(1992)In Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J编辑,新加坡,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)In Meyerowitz EM,Somerville CR编辑,Arabidopsis.冷泉港实验室出版社,冷泉港,纽约,第137-172页;Lightner J和CasparT,(1998)In J Martinez-Zapater,J Salinas编辑,Methods on MolecularBiology,82卷Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和合并(pooling);(c)目的区域的PCR扩增;(d)变性和退火以使异源双链体能够形成;(e)DHPLC,其中合并物中异源双链体的存在在色谱图中检测为额外的峰;(f)突变个体的鉴定;和(g)突变PCR产物的测序。用于TILLING的方法在本领域内是众所周知的(McCallum等,(2000)NatBiotechnol 18:455-457;由Stemple(2004)Nat Rev Genet 5(2):145-50进行综述)。
同源重组
同源重组允许向基因组中的指定选择位置引入所选的核酸序列。同源重组是生物科学中常规用于低等生物体如酵母或苔藓剑叶藓属(physcomitrella)的标准技术。在植物中进行同源重组的方法已经不仅在模式植物中描述(Offringa等(1990)EMBO J.9(10):3077-84),而且也在作物植物,如稻中描述(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotechnol 15(2):132-8)。
产率
术语“产率”通常表示具有经济价值的可测量产出,其一般是与特定的作物、面积和时期相关的。各植物部分基于其数量、大小和/或重量对产率直接做出贡献,或者实际产率是每英亩作物的年产率,用总产量(包括收获的产量和估定的产量)除以种植的英亩数来确定。术语植物的“产率”可以与该植物的营养性生物量、繁殖器官、和/或繁殖体(如种子)相关。
术语植物的“产率”可以与该植物的营养性生物量(根和/或枝条生物量)、繁殖器官、和/或繁殖体(如种子)相关。
早期活力
“早期活力”是指活跃健康且很好均衡的生长,特别是在植物生长的早期阶段,其可以由增强的植物适度(fitness)引起,例如,由植物更好地适应其环境(即优化能源资源的利用以及在枝条和根之间的分配)引起。具有早期活力的植物也可以显示出增加的幼苗存活和更佳的作物齐苗(establisment),这往往产生高度均一的田地(作物以齐整的方式生长,即大多数植物基本上同时达到发育的各阶段),以及常常更优更高的产率。因此,早期活力可以通过测量多种因素来确定,如千粒重、萌发率、出苗率、幼苗生长、幼苗高度、根长度、根和枝条生物量,等等。
增加/提高/增强
术语“增加”、“提高”或“增强”可互换,且在本发明意义上表示与文中所定义的对照植物相比,产率和/或生长多出至少5%、6%、7%、8%、9%或10%,优选至少15%或20%,更优选25%、30%、35%或40%。
种子产率
增加的种子产率可表现为如下一个或多个方面:a)种子生物量(种子总重量)的增加,这可以是以单粒种子和/或每植株和/或每公顷或英亩为基础的增加;b)每圆锥花序和/或每植株的花数的增加;c)增加的(饱满)种子数;d)增加的种子饱满率(其表达为饱满种子数与种子总数的比率);e)增加的收获指数,其表达为可收获部分如种子的产率除以总生物量的比率;f)增加的一级圆锥花序数;g)增加的千粒重(TKW),这通过计数饱满种子数和它们的总重量外推得到。TKW增加可来自于种子大小和/或种子重量的增加,并且也可来自胚和/或胚乳大小的增加。
种子产率的增加也可表现为种子大小和/或种子体积的增加。此外,种子产率的增加也可表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产率也可以导致改变的构造,或可以因改变的构造而发生。
绿度指数(greenness index)
如本文所用的“绿度指数”根据植物的数字图像计算。对于图像中属于植物目标的每一个像素,计算绿色值相对于红色值(在用于编码颜色的RGB模型中)之比。绿度指数表达为绿红比超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下、在养分可利用度下降的生长条件下,在开花前末次成像中测量植物的绿度指数。相反,在干旱胁迫生长条件下,在干旱后的首次成像中测量植物的绿度指数。
植物
本文所用术语“植物”涵盖整株植物、植物的祖先和后代以及植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花以及组织和器官,其中上述每一种都包含目的基因/核酸序列。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样其中上述每一种都包含目的基因/核酸序列。
尤其可用于本发明方法的植物包括属于植物界(Viridiplantae)超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或豆科牧草、观赏植物、粮食作物、乔木或灌木,选自:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agavesisalana)、冰草属物种(Agropyron spp.)、匍茎剪股颖(Agrostis stolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、滨草(Ammophilaarenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpusspp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avena spp.)(如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avenafatua var.sativa、杂种燕麦(Avena hybrida))、阳桃(Averrhoa carambola)、簕竹属物种(Bambusa sp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletiaexcelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(如欧洲油菜(Brassica napus)、芜青(Brassica rapa ssp.)[芸苔、油菜籽油菜、芜菁])、Cadaba farinosa、大叶茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、苔草(Carex elata)、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Caryaspp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、爪哇木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomumspp.)、西瓜(Citrullus lanatus)、柑橘属物种(Citrus spp.)、椰子属物种(Cocosspp.)、咖啡属物种(Coffea spp.)、芋(Colocasia esculenta)、可拉属(Colaspp.)、黄麻属物种(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynaraspp.)、胡萝卜(Daucus carota)、山马蟥属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyrosspp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(如非洲油棕(Elaeisguineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusine coracana)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptu sp)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、山毛榉属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属物种(Glycine spp.)(如大豆(Glycine max)、黄豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirsutum)、向日葵属物种(Helianthusspp.)(如向日葵(Helianthus annus))、萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeum spp.)(如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linumusitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、地杨梅(Luzulasylvatica)、番茄属物种(Lycopersicon spp.)(如番茄(Lycopersiconesculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme)、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、西印度樱桃(Malpighiaemarginata)、曼密苹果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、紫花苜蓿(Medicagosativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Oleaspp.)、仙人掌属物种(Opuntia spp.)、Ornithopus spp.、稻属物种(Oryzaspp.)(如稻(Oryza sativa),阔叶稻(Oryza latifolia))、黍糜(Panicummiliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属(Pennisetum sp.)、鳄梨属物种(Persea spp.)、香芹(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、梯牧草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinusspp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poaspp.)、杨属物种(Populus spp.)、牧豆树属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinuscommunis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanumspp.)(如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番柿(Solanum lycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinaciaspp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifoliumspp.)、黑小麦属(Triticale sp.)、小黑麦(Triticosecale rimpaui)、小麦属物种(Triticum spp.)(如小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆锥小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticummacha)、面包小麦(Triticum sativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、旱金莲(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野豌豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇菜(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、北美洲野生稻(Zizania palustris)、枣属物种(Ziziphus spp.)等等。
发明详述
现已令人惊讶地发现,增加植物中编码AHL19/20多肽的核酸序列的表达,可以产生相对于对照植物具有增强的种子产率相关性状、无延迟开花的植物。根据第一种实施方案,本发明提供了相对于对照植物增强植物的种子产率相关性状的方法,包括增加植物中编码AHL19/20多肽的核酸序列的表达。
增加编码AHL19/20多肽的核酸序列的表达的优选方法是在植物中引入和表达编码AHL19/20多肽的核酸序列。
在一个实施方案中,下文述及的任何“可用于本发明方法的蛋白质”应理解为表示如本文所定义的AHL19/20多肽。下文述及的任何“可用于本发明方法的核酸序列”应理解为表示能够编码这样的AHL19/20多肽的核酸序列。待引入植物(从而可用于实施本发明方法)的核酸序列是编码现在将要描述的此类多肽的任何核酸序列,下文也称为“AHL19/20核酸序列”或“AHL19/20基因”。
如本文定义的“AHL19/20多肽”指包含与SEQ ID NO:36所示的保守结构域(CD)(包括在SEQ ID NO:2中)具有至少70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的结构域的任何多肽。
备选地或另外地,如本文定义的“AHL19/20多肽”指如下任何多肽,所述多肽包含:(i)与SEQ ID NO:37所示的AT-hook基序具有至少75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的基序;和(ii)与SEQ ID NO:38所示的植物及原核生物保守(PPC)结构域具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的结构域。
备选地或另外地,如本文定义的“AHL19/20多肽”指如下任何多肽,所述多肽包含:(i)核定位信号;(ii)具有InterPro登录号IPR014476的AT-hook DNA结合基序;和(iii)具有InterPro登录号IPR005175的植物及原核生物保守(PPC)结构域。
备选地或另外地,如本文定义的“AHL19/20多肽”指如下任何多肽序列,所述多肽序列,当用于构建AHL系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ ID NO:2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。
备选地或另外地,如本文定义的“AHL19/20多肽”指如下任何多肽,所述多肽按照递增的优选顺序与SEQ ID NO:2所示的AHL19/20多肽或与本文表A中所示的任何全长多肽序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
现还发现,增加植物中编码GRP多肽(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)的核酸序列的表达,产生在非生物胁迫条件下生长时相对于对照植物相具有增强的产率相关性状的植物。根据第一种实施方案,本发明提供了相对于对照植物增强在非生物胁迫条件下生长的植物的产率相关性状的方法,包括增加植物中GRP多肽编码核酸序列的表达,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽。
用于增加GRP多肽编码核酸序列的表达的优选方法是在植物中引入和表达GRP多肽编码核酸序列。
在一个实施方案中,下文述及的任何“可用于本发明方法的蛋白质”应理解为表示如本文所定义的GRP多肽。下文述及的任何“可用于本发明方法的核酸序列”应理解为表示能够编码这样的GRP多肽的核酸序列。待引入植物(从而可用于实施本发明金属硫蛋白2a(MT2a)多肽方法)的核酸序列是编码现在将要描述的此类蛋白质的任何核酸序列,下文也称为“GRP核酸序列”或“GRP基因”。
本文中定义的“GRP多肽”是指SEQ ID NO:46所示的蛋白质以及其直系同源物、旁系同源物和同源物。
优选,SEQ ID NO:46的直系同源物、旁系同源物和同源物具有InterPro登录号IPR000347,描述为植物金属硫蛋白,家族15。
备选地或另外地,本文中所定义的“GRP多肽”是指按照递增的优选顺序与SEQ ID NO:46所示的GRP多肽具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性的任何多肽。
金属硫蛋白在本领域内是熟知的,关于最近的综述和分类,参见Cobbett和Goldsbrough(2002)。金属硫蛋白是具有哑铃构型的小蛋白质,其源于彼此通过具有可变长度和氨基酸组成的区域分隔开的保守N末端和C末端富半胱氨酸结构域。基于一级结构,可区分4种类型的金属硫蛋白。SEQ ID NO:46的金属硫蛋白包含Cobbett和Goldsbrough(2002)所定义的2型金属硫蛋白典型的保守N末端结构域,该结构域包含共有序列“MSCCGG(N/S)CGCG(T/S/A)(G/A/S)C(K/Q/S)C”,因此,用于本发明方法的优选同源物是包含该保守结构域的金属硫蛋白。
此外,现已发现,优先调节ATT样多肽编码核酸在地上植物部分中的表达,可以产生相对于对照植物具有增强的产率相关性状的植物。根据优选实施方案,优先在地上植物部分中调节表达可以通过使用在地上植物部分中具有活性的启动子来进行。术语“在地上部分中具有活性的启动子”在本文“定义”部分进行了定义。
此外,现已发现,调节AAT多肽编码核酸的表达可以产生当在非限氮条件下生长时相对于对照植物具有增强的产率相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产率相关性状的方法,包括调节AAT多肽编码核酸在非限氮条件下生长的植物中的表达。
在于地上植物部分中具有活性的启动子控制下调节(优选增加)AAT样多肽编码核酸的表达的一个优选方法是,在植物中引入和表达在于地上植物部分中具有活性的启动子控制下的AAT样多肽编码核酸。
调节(优选增加)AAT多肽编码核酸的表达的一个优选方法是,在植物中引入和表达AAT多肽编码核酸。
在一个实施方案中,下文述及的任何“可用于本发明方法的蛋白质”应理解为表示如本文所定义的AAT样多肽。下文述及的任何“可用于本发明方法的核酸”应理解为表示能够编码这样的AAT样多肽的核酸。待引入植物(从而可用于实施本发明方法)的核酸是编码现在将要描述的此类蛋白质的任何核酸,下文也称为“AAT样核酸”或“AAT样基因”。
在一个实施方案中,下文述及的任何“可用于本发明方法的蛋白质”应理解为表示如本文所定义的AAT多肽。下文述及的任何“可用于本发明方法的核酸”应理解为表示能够编码这样的AAT多肽的核酸。待引入植物(从而可用于实施本发明方法)的核酸是编码现在将要描述的此类蛋白质的任何核酸,下文也称为“AAT核酸”或“AAT基因”。
本文定义的“AAT样多肽”或“AAT多肽”是指具有一个或多个下列特征的任何多肽:
(a)催化下列反应的能力:
L-丙氨酸+2-酮戊二酸  丙酮酸+L-谷氨酸
(b)属于酶分类编号:EC 2.6.1.2.
(c)具有氨基转移酶结构域(在InterPro中称为IPR004839;以及在PFAM中称为PF00155)
(d)具有1-氨基环丙烷-1-羧酸合酶结构域(在InterPro中称为IPR001176)
(e)靶向线粒体
(f)当用于构建包含AAT序列的系统发生树时,与包含SEQ ID NO:51或SEQ ID NO:56的AAT样多肽或AAT多肽群而非任何其他AAT或AAT样序列群聚类。
术语“结构域”和“基序”在本文“定义”部分进行了定义。存在用于鉴定结构域的专家数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation.(In)ISMB-94;第二届分子生物学智能系统国际会议记录(Proceedings 2nd InternationalConference on Intelligent Systems for Molecular Biology)Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,53-61页,AAAI Press,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002)。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute of Bioinformatics)(Gasteiger等ExPASy:the proteomics server for in-depth protein knowledge andanalysis.Nucleic Acids Res 31:3784-3788(2003))。SEQ ID NO:2多肽序列的分析在下面示于本文实施例2和4。例如,SEQ ID NO:2所示的AHL19/20肽包含具有InterPro登录号IPR014476的AT-hook DNA结合基序和在InterPro数据库中具有InterPro登录号IPR005175并被描述为DUF296(未知功能结构域296)的植物及原核生物保守(PPC)结构域。还可使用常规技术,例如利用序列比对来鉴定结构域。一个这样的结构域是如SEQ ID NO:36所示的SEQ ID NO:2的保守结构域(CD)。所述CD包含预测的NLS、AT-hook DNA结合基序和PCC结构域,如图3中示意性显示的和图4中所示的。
为比较而进行序列比对的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453)来寻找可以使匹配数最大化且空位数最小化的两序列间的全局(即跨越全序列)比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分比,并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心(NCBI)公开地获得。例如,同源物可以使用ClustalW多重序列比对算法(1.83版),采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等,(2003)BMC Bioinformatics.10:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences)的方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序列进行同源物鉴定以外,还可以利用特定的结构域。可以利用上述程序采用默认参数,针对完整核酸序列或多肽序列或者针对选择的结构域或保守基序,确定序列同一性值。本文中实施例3在表B中描述了SEQ ID NO:2所示的AHL19/20多肽与表A中所列的AHL19/20多肽之间的同一性百分比,其范围在50%至99%氨基酸序列同一性之间。在表B1中,显示了SEQ ID NO:36(包含于SEQ ID NO:2中)所示的CD与实施例1表A中所列的AHL19/20多肽的CD之间的同一性百分比,其范围在70%至99%氨基酸序列同一性之间。
蛋白质亚细胞定位预测任务是重要的且得到充分研究的。已知蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法从免疫定位至使用绿色荧光蛋白(GFP)来标记蛋白质。这些方法是精确的,但是与计算机方法相比非常费劳力。最近在根据序列数据计算机预测蛋白质定位方面取得了许多进展。其中本领域技术人员公知的算法可在Swiss Institute forBioinformatics托管的ExPASy Proteomics tools上获得,例如,PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP等。本发明多肽的亚细胞定位的鉴定示于实施例6。在SEQID NO:2的AHL19/20多肽中发现了预测的核定位信号(NLS)。NLS是具有带正电荷的赖氨酸或精氨酸的一个或多个短序列。特别地,本发明的SEQ ID NO:2经预测定位在真核细胞的核区室。
此外,用于本发明方法的AHL19/20多肽(至少以其天然形式)通常,但不是必需地,具有转录调控活性并能够与其他蛋白质相互作用。因此,具有降低的转录调控活性、无转录调控活性、具有降低的蛋白质-蛋白质相互作用能力或不具有蛋白质-蛋白质相互作用能力的AHL19/20多肽都可同等地用于本发明的方法。可使用本领域中熟知的技术(例如CurrentProtocols in Molecular Biology,第1和2卷,Ausubel等(1994),CurrentProtocols)容易地体外或体内确定DNA结合活性和蛋白质-蛋白质相互作用。为了确定AHL19/20多肽的DNA结合活性,几种测定法是可用的,例如DNA结合凝胶-迁移测定法(或凝胶阻滞试验;Korfhage等(1994)Plant C 6:695-708),体外DNA结合测定法(Schindler等(1993)Plant J4(1):137-150),或酵母、动物和植物细胞中AHL19/20多肽的转录激活(Halbach等(2000)Nucleic Acid Res 28(18):3542-3550)。可使用随机寡核苷酸选择技术(Viola&Gonzalez(May 26,2007)Biochemistry)确定特定的DNA结合序列。
在一个实施方案中,本发明以SEQ ID NO:1所示的核酸序列转化植物来进行举例说明,其编码SEQ ID NO:2的ALH19/20多肽序列。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用任何编码本文所定义的AHL19/20多肽的核酸序列来实施。
编码AHL19/20多肽的核酸序列的实例在本文实施例1表A中给出。这样的核酸序列可用于实施本发明的方法。实施例1表A中给出的多肽序列为SEQ ID NO:2所示AHL19/20多肽的直系同源物和旁系同源物的示例序列,其中术语“直系同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互BLAST搜索,容易地找到其它直系同源物和旁系同源物。通常,这包括第一BLAST,即,以查询序列(例如,利用实施例1表A中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(第二BLAST)(在查询序列为SEQ ID NO:1或SEQ ID NO:2的情况下,第二BLAST将针对拟南芥序列进行)。然后比较第一和第二BLAST的结果。如果第一BLAST中高排序的命中事件(high-ranking hit)与查询序列源自相同的物种,然后反向BLAST理想地导致查询序列处于最高命中事件之列,则找到了旁系同源物;如果第一BLAST中高排序的命中事件与查询序列不源自相同的物种,且优选地在反向BLAST时导致查询序列处于最高命中事件之列,则找到了直系同源物。
此外,GRP多肽,就SEQ ID NO:46和其直系同源物、旁系同源物和同源物而言,通常具有可在金属饱和试验(Scheuhammer等,Toxicol.Appl Pharmacol.82,417-425,1986)中测量的金属结合活性和/或可用作氧化还原传感器(Fabisiak等,Methods Enzymol.353,268-281(2002))。
在一个实施方案中,本发明以SEQ ID NO:45所示的核酸序列转化植物来进行举例说明,其编码SEQ ID NO:46的多肽序列。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何GRP编码核酸序列或GRP多肽来实施。
GRP多肽编码核酸序列的实例可在本领域已知的数据库中找到。这样的核酸序列可用于实施本发明的方法。直系同源物和旁系同源物(术语“直系同源物”和“直系同源物”如本文所定义)可通过实施所谓的交互BLAST搜索而容易地找到。通常,这包括第一BLAST,以查询序列(例如,利用SEQ ID NO:46)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(第二BLAST)(在查询序列为SEQ ID NO:45或SEQ ID NO:46的情况下,第二BLAST将会针对拟南芥序列进行)。然后比较第一和第二BLAST的结果。如果第一BLAST中高排序的命中事件与查询序列源自相同的物种,然后反向BLAST理想地导致查询序列处于最高命中事件之列,则找到了旁系同源物;如果第一BLAST中高排序的命中事件与查询序列源自不同物种,且优选地在反向BLAST时导致查询序列处于最高命中事件之列,则找到了直系同源物。
在一个实施方案中,本发明以SEQ ID NO:50所示的核酸序列转化植物来进行举例说明,其编码SEQ ID NO:51的多肽序列。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何AAT样核酸或AAT样多肽来实施。
可用于实施本发明方法的核酸的实例包括SEQ ID NO:51所示的ATT样多肽的直系同源物和旁系同源物,其中术语“直系同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互BLAST搜索,容易地找到直系同源物和旁系同源物。通常,这包括第一BLAST,以查询序列(例如SEQ ID NO:50或SEQ ID NO:51)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(第二BLAST)(在查询序列为SEQ ID NO:50或SEQ ID NO:51的情况下,第二BLAST将会针对衣藻(Chlamydomonas)序列进行)。然后比较第一和第二BLAST的结果。如果第一BLAST中高排序的命中事件与查询序列源自相同的物种,然后反向BLAST理想地导致查询序列处于最高命中事件之列,则找到了旁系同源物;如果第一BLAST中高排序的命中事件与查询序列源自不同物种,且优选地在反向BLAST时导致查询序列处于最高命中事件之列,则找到了直系同源物。
在一个实施方案中,本发明以SEQ ID NO:55所示的核酸序列转化植物来进行举例说明,其编码SEQ ID NO:56的多肽序列。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何AAT编码核酸或AAT多肽来实施。
本文实施例1中给出了寻找AAT多肽或其直系同源物或旁系同源物的编码核酸的方法实例。这样的核酸可用于本发明的方法。直系同源物和旁系同源物可以通过进行所谓的交互BLAST搜索容易地找到。通常,这包括第一BLAST,以查询序列(例如利用SEQ ID NO:55或SEQ ID NO:56)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(第二BLAST)(在查询序列为SEQ ID NO:55或SEQ ID NO:56的情况下,第二BLAST将针对稻序列进行)。然后比较第一和第二BLAST的结果。如果第一BLAST中高排序的命中事件与查询序列源自相同的物种,然后反向BLAST理想地导致查询序列处于最高命中事件之列,则找到了旁系同源物;如果第一BLAST中高排序的命中事件与查询序列源自不同物种,且优选地在反向BLAST时导致查询序列处于最高命中事件之列,则找到了直系同源物。
高排序的命中事件是E值低的命中事件。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树,来辅助对相关基因聚类的可视化和鉴定直系同源物和旁系同源物。在含有SEQ ID NO:2的群内聚类的任何序列(AHL19多肽;图1和2中用圆圈标示的)可被认为落在上述AHL19/20多肽定义内,并且可被认为适合用于本发明的方法。
核酸变体也可用于实施本发明的方法。这类核酸变体的实例包括编码实施例1表A中所示任一多肽序列的同源物和衍生物的核酸序列,其中“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的同源物和衍生物的核酸序列。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。
可用于实施本发明方法的其他核酸变体包括编码ALH19/20多肽的核酸序列的部分、与编码ALH19/20多肽的核酸序列杂交的核酸序列、编码ALH19/20多肽的核酸序列的剪接变体、编码ALH19/20多肽的核酸序列的等位基因变体,以及通过基因改组获得的ALH19/20多肽编码核酸序列的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。
编码ALH19/20多肽的核酸序列无需是全长核酸序列,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物的种子产率相关性状的方法,包括在植物中引入和表达实施例1表A所示任一核酸序列的部分、或者编码实施例1表A所示任一多肽序列的直系同源物、旁系同源物或同源物的核酸序列的部分。
编码SEQ ID NO:46的同源物和衍生物的核酸序列变体也可用于实施本发明的方法,术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法是编码SEQ ID NO:46的直系同源物或旁系同源物的同源物和衍生物的核酸序列。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。
可用于实施本发明方法的其他核酸序列变体包括GRP多肽编码核酸序列的部分、与GRP多肽编码核酸序列杂交的核酸序列、GRP多肽编码核酸序列的剪接变体、GRP多肽编码核酸序列的等位基因变体,以及通过基因改组获得的GRP多肽编码核酸序列的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。
GRP多肽编码核酸序列无需是全长核酸序列,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强在非生物胁迫条件下生长的植物的产率相关性状的方法,包括在植物中引入和表达SEQ IDNO:45的部分或编码SEQ ID NO:46的直系同源物、旁系同源物或同源物的核酸序列的部分。
核酸变体也可用于实施本发明的方法。这类核酸变体的实例包括编码SEQ ID NO:51的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码SEQ ID NO:51所示AAT样多肽或SEQ ID NO:56所示AAT多肽的直系同源物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。
可用于实施本发明方法的其他核酸变体包括AAT样多肽或AAT多肽编码核酸的部分、与AAT样多肽或AAT多肽编码核酸杂交的核酸、AAT样多肽或AAT多肽编码核酸的剪接变体、AAT样多肽或AAT多肽编码核酸的等位基因变体,以及通过基因改组获得的AAT样多肽或AAT多肽编码核酸的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。
AAT样多肽或AAT多肽编码核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物的产率相关性状的方法,包括在植物中引入和表达SEQ ID NO:50或SEQ ID NO:55的部分或编码SEQ ID NO:51或SEQ ID NO:56的直系同源物、旁系同源物或同源物的核酸的部分。
核酸序列的“部分”可以例如,通过对核酸序列进行一个或多个缺失来制备。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,产生组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分所预测到的要大。
可用于本发明方法的“部分”编码如本文所定义的AHL19/20多肽,并与实施例1表A所示多肽序列具有基本上相同的生物活性。优选“部分”是实施例1表A所示任一核酸序列的部分,或是编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的核酸序列的部分。优选“部分”按照递增的优选顺序是至少400、450、500、550、600、650、700、750、800、850、900、940个连续核苷酸长,所述连续核苷酸来自实施例1表A所示任一核酸序列或者编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的核酸序列。优选,所述部分是编码多肽序列的核酸序列的部分,其中所述多肽序列当用于构建AHL系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ ID NO:2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。最优选“部分”是核酸序列SEQ ID NO:1的部分。
可用于本发明方法的“部分”编码如本文所定义的GRP多肽,并与SEQID NO:46所示多肽序列具有基本上相同的生物活性。优选部分是SEQ IDNO:45所示核酸序列的部分,或是编码SEQ ID NO:46所示多肽序列的直系同源物或旁系同源物的核酸序列的部分。优选“部分”长度是至少50、75、100、125、150、175、200、210、220、230、240或更多个连续核苷酸,所述连续核苷酸来自SEQ ID NO:45或者编码SEQ ID NO:46的直系同源物或旁系同源物的核酸序列。最优选,所述部分是SEQ ID NO:45的核酸序列的部分。
可用于本发明方法的“部分”编码如本文所定义的AAT样多肽,并与SEQ ID NO:51的氨基酸序列具有基本上相同的生物活性。优选“部分”长度是至少500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550个连续核苷酸,所述连续核苷酸来自SEQ ID NO:50或者编码SEQ ID NO:51的直系同源物或旁系同源物的核酸序列。
优选“部分”编码这样的氨基酸序列的片段,当用于构建包含AAT序列的系统发生树时,所述氨基酸序列与包含SEQ ID NO:51的AAT样多肽群而非任何其他AAT或AAT样序列群聚类。
可用于本发明方法的“部分”编码如本文所定义的AAT多肽,并与SEQID NO:56的氨基酸序列具有基本上相同的生物活性。优选“部分”长度是至少500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450个连续核苷酸,所述连续核苷酸来自SEQ ID NO:55或者编码SEQ ID NO:56的直系同源物或旁系同源物的核酸序列。
优选,所述部分编码氨基酸序列的片段,所述氨基酸序列,当用于构建包含AAT序列的系统发生树时,与包含SEQ ID NO:56的AAT多肽群而非任何其他AAT序列群聚类。
可用于本发明方法的另一核酸序列变体为在降低的严格条件下、优选在严格条件下,能够与本文所定义的产率增加性多肽的编码核酸序列或者本文所定义的“部分”杂交的核酸序列,其中所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。
根据本发明,在一个实施方案中提供了增加植物的种子产率相关性状的方法,包括在植物中引入和表达能够与实施例1表A所示任一核酸序列杂交的核酸序列,或者包括在植物中引入和表达能够与编码实施例1表A所示任一核酸序列的直系同源物、旁系同源物或同源物的核酸序列杂交的核酸序列。
可用于本发明方法的杂交序列编码如本文所定义的AHL19/20多肽,与实施例1表A所示多肽序列具有基本上相同的生物活性。优选杂交序列能够与实施例1表A所示任一核酸序列杂交、或与任一前述序列的部分杂交,其中部分如上文所定义;或者其中杂交序列能够与编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的核酸序列杂交。优选,所述杂交序列能够与编码多肽序列的核酸序列杂交,所述多肽序列,当用于构建AHL系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ ID NO:2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。最优选杂交序列能够与SEQ ID NO:1所示的核酸序列或其部分杂交。
根据本发明,在一个实施方案中提供了强在非生物胁迫条件下生长的的包括SEQ ID NO:45杂交的核酸序列,或包括在植物中引入和表达能够与编码SEQ ID NO:46的直系同源物、旁系同源物或同源物的核酸杂交的核酸。
可用于本发明方法的杂交序列编码如本文所定义的GRP多肽,与SEQID NO:46所示多肽序列具有基本上相同的生物活性。优选杂交序列能够与SEQ ID NO:45杂交、或与该序列的部分杂交,其中部分如上文所定义;或者杂交序列能够与编码SEQ ID NO:46的直系同源物或旁系同源物的核酸序列或其部分杂交。
根据本发明,在一个实施方案中提供了增强植物的产率相关性状的方法,包括在植物中引入和表达能够与SEQ ID NO:50杂交或者能够与编码SEQ ID NO:51的直系同源物、旁系同源物或同源物的核酸杂交的核酸。
可用于本发明方法的杂交序列编码如本文所定义的AAT样多肽,与SEQ ID NO:51所示氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与编码SEQ ID NO:51的直系同源物、旁系同源物或同源物的核酸杂交、或与这样的核酸的部分杂交,部分如上文所定义。最优选,杂交序列能够与SEQ ID NO:50所示核酸杂交或与其部分杂交。
根据本发明,提供了增强植物的产率相关性状的方法,包括在植物中引入和表达能够与SEQ ID NO:55杂交或者能够与编码SEQ ID NO:56的直系同源物、旁系同源物或同源物的核酸杂交的核酸。
可用于本发明方法的杂交序列编码如本文所定义的AAT多肽,与SEQID NO:56的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与编码SEQ ID NO:56的直系同源物、旁系同源物或同源物的核酸杂交、或与这样的核酸的部分杂交,部分如上文所定义。最优选,杂交序列能够与SEQ ID NO:55所示核酸杂交或与其部分杂交。
优选杂交序列编码具有这样的氨基酸序列的多肽,该氨基酸序列当全长且用于构建包含AAT序列的系统发生树时,与包含SEQ ID NO:51的AAT样多肽群或与包含SEQ ID NO:56的AAT多肽群而非任何其他AAT或AAT样序列群聚类。
可用于本发明方法的另一类核酸序列变体为编码前文所定义的产率增加性多肽的剪接变体,其中剪接变体如本文所定义,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。
根据本发明,提供了增强种子产率相关性状的方法,包括在植物中引入和表达实施例1表A所示任一核酸序列的剪接变体、或编码实施例1表A所示任一多肽序列的直系同源物、旁系同源物或同源物的核酸序列的剪接变体。
在一个实施方案中,剪接变体是SEQ ID NO:1所示核酸序列的剪接变体,或编码SEQ ID NO:2的直系同源物或旁系同源物的核酸序列的剪接变体。优选剪接变体是编码这样的多肽序列的核酸序列的剪接变体,所述多肽序列,当用于构建AHL系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ ID NO:2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。
在一个根据本发明的实施方案中,提供了相对于对照植物增强在非生物胁迫条件下生长的植物的产率相关性状的方法,包括在植物中引入和表达SEQ ID NO:45的剪接变体、或编码SEQ ID NO:46的直系同源物、旁系同源物或同源物的核酸序列的剪接变体。
在一个根据本发明的实施方案中,提供了增强植物的产率相关性状的方法,包括在植物中引入和表达SEQ ID NO:50或SEQ ID NO:55的剪接变体、或编码SEQ ID NO:51或SEQ ID NO:56的直系同源物、旁系同源物或同源物的核酸的剪接变体。
优选由剪接变体编码的氨基酸序列,当用于构建包含AAT序列的系统发生树时,与包含SEQ ID NO:51的AAT样多肽群或与包含SEQ ID NO:56的AAT多肽群而非任何其他AAT或AAT样序列群聚类。
可用于实施本发明方法的另一类核酸序列变体为编码前文所定义的产率增加性多肽的核酸序列的等位基因变体,其中等位基因变体如本文所定义,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。
在一个根据本发明的实施方案中,提供了增强种子产率相关性状的方法,包括在植物中引入和表达实施例1表A所示任一核酸序列的等位基因变体,或者包括在植物中引入和表达编码实施例1表A所示任一多肽序列的直系同源物、旁系同源物或同源物的核酸序列的等位基因变体。
可用于本发明方法的等位基因变体与SEQ ID NO:2的AHL19/20多肽及实施例1表A所示的任一多肽序列具有基本上相同的生物活性。等位基因变体天然存在,并且这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO:1的等位基因变体,或编码SEQ ID NO:2的直系同源物或旁系同源物的核酸序列的等位基因变体。优选等位基因变体是这样的多肽序列的等位基因变体,所述多肽序列当用于构建AHL系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ ID NO:2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。
在一个根据本发明的实施方案中,提供了增强在非生物胁迫条件下生长的植物的产率相关性状的方法,包括在植物中引入和表达SEQ ID NO:45的等位基因变体、或包括在植物中引入和表达编码SEQ ID NO:46所示多肽序列的直系同源物、旁系同源物或同源物的核酸序列的等位基因变体。
可用于本发明方法的等位基因变体与SEQ ID NO:46的GRP多肽具有基本上相同的生物活性。等位基因变体天然存在,并且这些天然等位基因的应用包含于本发明的方法中。
在一个根据本发明的实施方案中,提供了增强植物的产率相关性状的方法,包括在植物中引入和表达SEQ ID NO:50或SEQ ID NO:55的等位基因变体、或编码SEQ ID NO:51或SEQ ID NO:56的氨基酸序列的直系同源物、旁系同源物或同源物的核酸的等位基因变体。
可用于本发明方法的等位基因变体与SEQ ID NO:51的AAT样多肽或SEQ ID NO:56的AAT多肽具有基本上相同的生物活性。等位基因变体天然存在,并且这些天然等位基因的应用包含于本发明的方法中。优选由等位基因变体编码的氨基酸序列,当用于构建包含AAT序列的系统发生树时,与包含SEQ ID NO:51的AAT样多肽群或与包含SEQ ID NL:56的AAT多肽群而非任何其他AAT或AAT样序列群聚类。
基因改组或定向进化也可用于产生上文所定义的产率增加性多肽的编码核酸序列的变体;其中术语“基因改组”如本文所定义,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。
在一个根据本发明的实施方案中,提供了增强种子产率相关性状的方法,包括在植物中引入和表达实施例1表A所示任一核酸序列的变体,或者包括在植物中引入和表达编码实施例1表A所示任一多肽序列的直系同源物、旁系同源物或同源物的核酸序列的变体,该变体核酸序列通过基因改组获得。
优选,通过基因改组获得的核酸序列编码多肽序列,所述多肽序列,当用于构建AHL系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ ID NO:2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。
在一个根据本发明的实施方案中,提供了增强在非生物胁迫条件下生长的植物的产率相关性状的方法,包括在植物中引入和表达SEQ ID NO:45的变体核酸序列,或者包括在植物中引入和表达编码SEQ ID NO:46的直系同源物、旁系同源物或同源物的核酸序列的变体,该变体核酸序列通过基因改组获得。
在一个根据本发明的实施方案中,提供了增强植物的产率相关性状的方法,包括在植物中引入和表达SEQ ID NO:50或SEQ ID NO:55的变体,或编码SEQ ID NO:51或SEQ ID NO:56的直系同源物、旁系同源物或同源物的核酸的变体,该变体核酸通过基因改组获得。
优选,通过基因改组获得的变体核酸编码这样的氨基酸序列,当用于构建包含AAT序列的系统发生树时,其与包含SEQ ID NO:51的AAT样多肽群或与包含SEQ ID NO:56的AAT多肽群而非任何其他AAT或AAT样序列群聚类。
此外,还可利用定点诱变获得核酸序列变体。若干方法可用来实现定点诱变,最常见的是基于PCR的方法(Current Protocols in MolecularBiology.Wiley编辑)。
AHL19/20多肽编码核酸序列可以来自任何天然或人造的来源。可以通过有意的人为操作在组成和/或基因组环境上修饰核酸序列,使之不同于天然形式。优选AHL19/20多肽编码核酸序列来自植物,还优选来自双子叶植物,更优选来自十字花科(Brassicaceae),最优选所述核酸序列来自拟南芥。
GRP多肽编码核酸序列可以来自任何天然或人造的来源。可以通过有意的人为操作在组成和/或基因组环境上修饰核酸序列,使之不同于天然形式。优选GRP多肽编码核酸序列来自植物。在SEQ ID NO:45的情况下,GRP多肽编码核酸序列优选来自双子叶植物,更优选来自十字花科,最优选所述核酸序列来自拟南芥。
实施本发明的方法产生相对于对照植物具有增强的种子产率相关性状的植物。术语“产率”和“种子产率”在本文“定义”部分有更详细的说明。
实施本发明的方法产生在非生物胁迫条件下生长时相对于对照植物具有增强的产率相关性状的植物。特别地,实施本发明的方法产生当在非生物胁迫条件下生长时相对于对照植物具有增加的早期活力和增加的产率,特别地增加的生物量和增加的种子产率,的植物。术语“产率”和“种子产率”在本文“定义”部分有更详细的说明。
此处所述及的增强的产率相关性状应理解为表示植物的一个或多个部分的早期活力和/或生物量(重量)的增加,所述部分可以包括地上(可收获)部分和/或地下(可收获)部分。特别地,这样的可收获部分为生物量和/或种子,并且实施本发明的方法使得在非生物胁迫条件下生长的植物,相对于在相当条件下生长的对照植物的早期活力、生物量或种子产率,具有增加的早期活力、生物量和/或种子产率。
AAT样多肽编码核酸可以来自任何天然或人造的来源。可以通过有意的人为操作在组成和/或基因组环境上修饰核酸,使之不同于天然形式。优选AAT样核酸来自藻类,还优选来自衣藻属(Chlamydomonas),更优选来自物种雷氏衣藻(Chlamydomonas reinhardtii)。
实施本发明的方法产生具有增强的产率相关性状的植物。特别地,实施本发明的方法产生相对于对照植物具有增加的产率,尤其是具有增加的种子产率,的植物。术语“产率”和“种子产率”在本文“定义”部分有更详细的说明。
此处所述及的增强的产率相关性状应理解为表示植物的一个或多个部分的生物量(重量)的增加,所述部分可以包括地上(可收获)部分和/或地下(可收获)部分。特别地,这样的可收获部分为种子。
AAT多肽编码核酸可以来自任何天然或人造的来源。可以通过有意的人为操作在组成和/或基因组环境上修饰核酸,使之不同于天然形式。优选POI多肽编码核酸来自植物。还优选来自单子叶植物,更优选来自禾本科(Poaceae),最优选所述核酸来自稻(Oryza sativa)。
此处所述及的增强的产率相关性状应理解为表示植物的一个或多个部分的生物量(重量)的增加,所述部分可以包括地上(可收获)部分和/或地下(可收获)部分。特别地,这样的可收获部分为种子。并且实施本发明的方法使得植物相对于对照植物的种子产率具有增加的种子产率。
以玉米为例,产率增加可以表现为如下一个或多个方面:每公顷或英亩建植(established))的植物数的增加;每株植物的穗数的增加;行数、行粒数、粒重、千粒重、穗长度/直径的增加;种子饱满率(其为饱满种子数除以种子总数并乘以100)的增加,等等。以稻为例,产率增加可以表现为如下一个或多个方面的增加:每公顷或英亩的植物数、每株植物的圆锥花序数、每个圆锥花序的小穗数、每个圆锥花序的花朵(小花)数(其表达为饱满种子数占一级圆锥花序(primary panicles)数的比率)、种子饱满率(其为饱满种子数除以种子总数并乘以100)的增加、千粒重的增加,等等。
在一个实施方案中,本发明提供了相对于对照植物增强植物的种子产率相关性状的方法,所述方法包括增加植物中编码本文所定义的AHL19/20多肽的核酸序列的表达。
由于根据本发明的转基因植物具有增加的种产率相关性状,这些植物可呈现出,相对于对照植物在其生命周期相应阶段的生长速率而言,增加的生长速率(至少在其部分生命周期中)。
在一个实施方案中,本发明提供了相对于在相当的条件下生长的对照植物,增强在非生物胁迫生长条件下的植物的产率相关性状,特别地植物的生物量和/或种子产率的方法,所述方法包括增加植物中编码本文所定义的GRP多肽的核酸序列的表达。
由于在非生物胁迫条件下生长的本发明转基因植物具有增强的种子产率相关性状,这些植物可呈现出,相对于在相当生长条件下的对照植物在其生命周期的相应阶段上的生长速率而言,增加的生长速率(至少在其部分生命周期中)。
在一个根据本发明的实施方案中,提供了相对于对照植物增加植物的产率、特别是种子产率的方法,所述方法包括调节植物中编码本文所定义的AA样多肽或AAT多肽的核酸的表达,优选增加表达。
由于本发明的转基因植物具有增加的产率,这些植物可呈现出,相对于对照植物在其生命周期相应阶段的生长速率而言,增加的生长速率(至少在其部分生命周期中)。
增加的生长速率可以是对植物的一个或多个部分(包括种子)特异的,或者可以基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周期可以理解为表示从成熟干种子生长至植物产生类似于起始材料的成熟干种子的阶段所需的时间。此生命周期可以受到诸如早期活力、生长速率、绿度指数、开花时间和种子成熟速度等因素的影响。生长速率的增加可以出现在植物生命周期的一个或多个阶段,或者出现在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段,生长速率的增加可以反映出增加的(早期)活力。生长速率的增加可以改变植物的收获周期,使植物能够比原来可能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得;在作物中延迟的开花通常不是期望的性状)。如果生长速率充分增加,可以允许再播种同种植物物种的种子(例如完全在一个常规的生长期内,播种和收获稻类植物、接着再播种和收获稻类植物)。与此类似,如果生长速率充分地增加,可以允许再播种不同植物物种的种子(例如播种和收获玉米植物,随后,例如,播种和任选地收获大豆、马铃薯或任何其他适合的植物)。在一些作物植物的情况下,也可能可以从同一砧木得到额外次数的收获。改变植物的收获周期可以导致每英亩年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生长和收获的次数的增加)。与野生型对应物相比,生长速率的增加还可能允许在更广阔的地域栽培转基因植物,这是因为种植作物的地域限制通常由种植时(早季)或收获时(晚季)不利的环境条件所决定。如果缩短收获周期,就可以避免这类不利条件。可以通过从生长曲线获得多种参数来确定生长速率,这类参数可以是:T-Mid(植物达到其最大大小的50%所需的时间)和T-90(植物达到其最大大小90%所需的时间)等等。本文所定义的生长速率不用于表示延迟的开花。
根据本发明的一个实施方案,实施本发明的方法产生了相对于对照植物具有增加的生长速率的植物。因此,根据本发明的该实施方案,提供了增加植物生长速率的方法,所述方法包括增加植物中编码本文所定义的AHL19/20多肽的核酸序列的表达。
根据本发明的一个实施方案,实施本发明的方法产生了在非生物胁迫条件下生长时相对于对照植物具有增加的生长速率的植物。因此,根据本发明的该实施方案,提供了增加在非生物胁迫条件下生长的植物生长速率的方法,所述方法包括增加植物中编码本文所定义的GRP多肽的核酸序列的表达。
根据本发明的一个实施方案,实施本发明的方法产生了相对于对照植物具有增加的生长速率的植物。因此,根据本发明的该实施方案,提供了增加植物生长速率的方法,所述方法包括调节,优选增加,地上植物部分中编码本文所定义的ATT样多肽或ATT多肽的核酸的表达。
与在相当条件下生长的对照植物相比,增强的种子产率相关性状可以发生在植物处于非胁迫条件下或暴露于多种胁迫时。与对照植物相比,产率相关性状的增强(种子产率和/或生长速率的增加)可以发生在植物处于非胁迫条件下或暴露于多种胁迫时。
在特别优选实施方案中,在非胁迫条件下实施本发明的方法。然而,无论植物处于非胁迫条件下还是暴露于不同的胁迫,都可以发生与对照植物相比,产率和/或生长速率的增加。
植物通常通过更缓慢地生长来对暴露于胁迫作出反应。在重度的胁迫条件下,植物甚至可能完全停止生长。另一方面,轻度的胁迫在此处定义为植物暴露于该胁迫后、不导致植物出现无重新生长能力的完全停止生长的任何胁迫。在本发明的意义上,轻度胁迫导致受胁迫的植物与在非胁迫条件下的对照植物相比,生长减少不足40%、35%或30%,优选不足25%、20%或15%,更优选不足14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、农药处理)的进步,在栽培的作物植物中通常不会遇到重度胁迫。因此,由轻度胁迫诱导的减弱的生长通常是农业上不期望的特征。轻度胁迫可以是植物接触到的日常生物和/或非生物(环境)胁迫。非生物胁迫可以由干旱或过多的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、冷或冰冻温度引起。非生物胁迫可以是由水胁迫(特别由于干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫通常是由病原体例如细菌、病毒、真菌、线虫和昆虫引起的胁迫。本文所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员知晓给定区域的正常土壤条件和气候条件。
如Wang等(Planta(2003)218:1-14)所报道的那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化,对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫和高盐度胁迫之间特别高程度的“对话(cross-talk)”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递路径和细胞应答,如应激蛋白的产生、抗氧化剂的上调、相容溶质的累积以及生长阻抑。如本文所用的术语“非胁迫”条件为那些允许植物最佳生长的环境条件。本领域技术人员知晓给定区域的正常土壤条件和气候条件。
在一个实施方案中,实施本发明的方法产生在非胁迫条件下或在轻度胁迫条件下生长时相对于在相当条件下生长的对照植物具有增强的种子产率相关性状的植物。因此,根据本发明的一个实施方案,提供了增强在非胁迫条件下或在轻度胁迫条件下生长的植物的种子产率相关性状的方法,所述方法包括增加植物中AHL19/20多肽编码核酸序列的表达。
在一个实施方案中,实施本发明的方法产生在轻度胁迫条件下生长时相对于在相当条件下生长的对照植物具有增强的产率相关性状的植物。因此,根据本发明的一个实施方案,提供了增强在轻度胁迫条件下生长的植物的产率相关性状的方法,所述方法包括增加植物中GRP多肽编码核酸序列的表达。
实施本发明的方法产生在非生物胁迫条件下生长时相对于在相当条件下生长的对照植物具有增强的产率相关性状的植物。如Wang等(Planta(2003)218:1-14)所报道的那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化,对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫和高盐度胁迫之间存在着的一种特别高程度的“对话(cross-talk)”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递路径和细胞应答,如应激蛋白的产生、抗氧化剂的上调、相容溶质的累积以及生长阻抑。因为多种多样的环境胁迫激活相似的路径,因此本发明以干旱胁迫进行的举例说明不应当被看作局限于干旱胁迫,而是应该看作为一个筛选,其显示了如本文所定义的AHL19/20多肽可以参与在一般的非生物胁迫条件下增加产率相关性状(相对于在相当的胁迫条件生长的对照植物而言)。
因为多种多样的环境胁迫激活相似的路径,因此本发明以干旱胁迫和盐胁迫进行的举例不应当被看作局限于干旱胁迫或盐胁迫,而是应该看作是一个筛选,其显示了如本文所定义的GRP多肽可以参与在一般的非生物胁迫条件下增强产率相关性状(相对于在相当的胁迫条件生长的对照植物而言)。
如本文所定义的术语“非生物胁迫”应当理解为表示任何一个或多个下列胁迫:水胁迫(由干旱或过多的水引起的)、缺氧胁迫、盐胁迫、温度胁迫(由热、冷或冰冻温度引起的)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面,非生物胁迫是渗透胁迫,其选自水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选,水胁迫是干旱胁迫。术语盐胁迫不限于食用盐(NaCl),而可以是由NaCl、KCl、LiCl、MgCl2、CaCl2等中的一种或多种引起的任何胁迫。
优选,非生物胁迫是干旱胁迫。备选地,非生物胁迫是盐胁迫。
在一个实施方案中,实施本发明的方法产生了在非生物胁迫条件下生长时相对于在相当的胁迫条件下生长的对照植物具有增强的种子产率相关性状的植物。因此,根据本发明,提供了增强在非生物胁迫条件下生长的植物的种子产率相关性状的方法,所述方法包括增加植物中AHL19/20多肽编码核酸序列的表达。根据本发明的一个方面,非生物胁迫是渗透胁迫,其选自一个或多个下列胁迫:水胁迫、盐胁迫、氧化胁迫和离子胁迫。
在一个实施方案中,实施本发明的方法产生了在非生物胁迫条件下生长时相对于在相当的胁迫条件下生长的对照植物具有增强的产率相关性状的植物。因此,根据本发明,提供了增强在非生物胁迫条件下生长的植物的产率相关性状的方法,所述方法包括增加植物中GRP多肽编码核酸序列的表达。根据本发明的一个方面,非生物胁迫是渗透胁迫,其选自一个或多个下列胁迫:水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选,非生物胁迫是干旱胁迫。备选地或另外地,非生物胁迫是盐胁迫。
非生物环境胁迫的另一实例是植物为生长和发育需要同化吸收的一种或多种养分的可利用度减小。由于养分利用效率对植物产率和产品质量的强烈影响,有大量化肥倾倒在田间以优化植物生长和品质。植物生产力一般受限于三种主要养分:磷、钾和氮,而这三者中的氮通常是植物生长的限速元素。因此,植物生长所需的主要营养素是氮(N)。氮是见于活细胞中的众多重要化合物(包括氨基酸、蛋白质(酶)、核酸和叶绿素)的组成成分。1.5%-2%的植物干物质是氮,约合植物总蛋白质的16%。因而,氮可利用度是作物植物生长和产量的主要限制因素(Frink等人(1999)Proc NatlAcad Sci USA 96(4):1175-1180),而且对蛋白质累积和氨基酸组成也具有重大影响。因此,在限氮条件下生长时具有增强的种子产率相关性状的作物植物具有重大意义。
在一个实施方案中,实施本发明的方法产生了在养分可利用度下降的条件下,特别是在氮可利用度下降的条件下生长时,相对于在相当条件下生长的对照植物,具有增强的种子产率相关性状的植物。因此,根据本发明,提供了增强在养分可利用度下降,优选氮可利用度下降的条件下生长的植物的种子产率相关性状的方法,所述方法包括增加植物中AHL19/20多肽编码核酸序列的表达。养分可利用度下降可以因养分,诸如氮、磷及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等,缺乏或过量所致。优选,养分可利用度下降是氮可利用度的下降。
在一个实施方案中,实施本发明的方法产生了在养分可利用度下降的条件下,特别是在氮可利用度下降的条件下,生长时,相对于在相当条件下生长的对照植物,具有增强的产率相关性状的植物。因此,根据本发明,提供了增强在养分可利用度下降的条件下生长的植物的产率相关性状的方法,所述方法包括增加植物中GRP多肽编码核酸序列的表达。养分可利用度下降可包括养分,诸如氮、磷及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等,的可利用度下降。
实施本发明的方法产生了在非胁迫条件下生长时相对于对照植物具有增加的产率的植物。因此,根据本发明,提供了增加在非胁迫条件下生长的植物的产率的方法,所述方法包括增加地上植物部分中AAT样多肽编码核酸的表达。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)或其细胞。所述植物或其部分或其细胞含有编码如上文所定义的产率增加性多肽的核酸转基因,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。
本发明还提供遗传构建体和载体,以利于在植物中引入和/或增加表达编码产率增加性多肽的核酸序列,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体中,该载体可以是可商购的载体。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供这样的构建体,其含有:
(a)编码如上文所定义的产率增加性多肽的核酸序列,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。
(b)一个或多个能够增加(a)中核酸序列表达的控制序列;和任选的
(c)转录终止序列。
在一个实施方案中,编码AHL19/20多肽的核酸序列如上文所定义。术语“控制序列”和“终止序列”如本文所定义。
优选,构建体的控制序列之一是从植物基因组分离的组成型启动子。植物组成型启动子的实例是GOS2启动子,优选稻GOS2启动子,更优选由SEQ ID NO:35所示的GOS2启动子。
在一个实施方案中,编码GRP多肽的核酸序列如上文所定义。术语“控制序列”和“终止序列”如本文所定义。
优选,编码AAT样多肽或AAT多肽的核酸如上文所定义。术语“控制序列”和“终止序列”如本文所定义。
可以使用含有任何上述核酸序列的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。可以将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,可以使用任何类型的天然或合成启动子增加核酸序列的表达。组成型启动子,优选从植物基因组分离的组成型启动子,在所述方法中特别有用。植物组成型启动子驱动编码序列以在所有情况下均低于在35SCaMV病毒启动子控制下获得的水平的水平表达。
其他器官特异性启动子,例如用于在叶、茎、块茎、分生组织、种子(胚和/或胚乳)中优先表达的器官特异性启动子,在实施本发明的方法中是有用的。关于各种启动子类型的定义,敬请参见本文“定义”部分。
应当清楚本发明的可实施性并不受限于SEQ ID NO:1所示的AHL19/20多肽编码核酸序列,而且本发明的可实施性也不受限于由组成型启动子所驱动的AHL19/20多肽编码核酸序列的表达。
应当清楚本发明的可实施性并不受限于SEQ ID NO:45所示的GRP多肽编码核酸序列,而且本发明的可实施性也不受限于由组成型启动子所驱动的GRP多肽编码核酸序列的表达。
组成型启动子优选为GOS2启动子,优选来自稻的GOS2启动子。还优选GOS2启动子为基本上类似于SEQ ID NO:47的核酸序列,最优选GOS2启动子如SEQ ID NO:47所示。有关组成型启动子的更多实例,敬请参见本文“定义”部分表2。
应当清楚本发明的可实施性并不局限于SEQ ID NO:50所示的AAT样核酸,而且本发明的可实施性也不局限于由原叶绿素酸酯还原酶启动子所驱动的AAT样多肽编码核酸的表达。
有关各种启动子类型的定义,敬请参见“定义”部分。特别可用于本发明方法的是根特异性启动子,特别是根表皮特异性启动子。根特异性启动子优选是硝酸转运蛋白启动子,还优选来自稻(如由Lin,2000描述的OsNRT1启动子)。该启动子由SEQ ID NO:59显示。还可将与SEQ ID NO:59基本上相似的核酸序列用于本发明的方法。还可用于实施本发明方法的其他根特异性启动子的实例示于上述“定义”部分的表2b中。
应当清楚本发明的可实施性并不局限于SEQ ID NO:55所示的AAT核酸,而且本发明的可实施性也不局限于由稻硝酸转运蛋白启动子OsNRT1所驱动的AAT核酸的表达。
任选的,还可以在引入植物的构建体中使用一个或多个终止子序列。另外的调控元件可以包括转录和翻译增强子。本领域技术人员会知道适合用于进行本发明的终止子和增强子的序列。如“定义”部分所说明的那样,也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外)可以是蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。
本发明的遗传构建体可以还包括对于在特定细胞类型中维持和/或复制所必需的复制起点序列。一个实例是需要将遗传构建体作为附加型遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸序列的转基因植物,有利的是使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有选择标记基因。选择标记在本文“定义”部分有更详细的说明。
标记基因一旦不再需要,可以从转基因细胞中除去或切除之。进行标记去除的技术在本领域公知,有用的技术在上文“定义”部分有说明。
已知,取决于所用的表达载体和所用的转染技术,当核酸序列向植物细胞进行稳定或瞬时整合时,仅少数细胞能摄入外来DNA,并将其整合入基因组(如果期望的话)。为鉴定并选择这些整合体,通常将编码可选择标记(如上文所述的那些)的基因与目的基因一起引入宿主细胞中。这些标记能够例如在如下突变体中使用,在所述突变体中这些基因例如通过常规方法缺失而没有功能。此外,编码可选择标记的核酸序列分子可以与编码本发明多肽或用于本发明方法的序列在同一个载体中引入宿主细胞,或者在分开的载体中引入。已由所引入的核酸序列稳定转染的细胞可以例如通过选择(例如,整合有可选择标记的细胞存活而其他细胞死去)予以鉴定。标记基因一旦不再需要,可以从转基因细胞中除去或切除之。进行标记去除的技术在本领域公知,有用的技术在上文“定义”部分有说明。
在一个实施方案中,本发明还提供了产生相对于对照植物具有增强的种子产率相关性状的转基因植物的方法,包括在植物中引入和表达编码如前文所定义的AHL19/20多肽的任何核酸序列。
更具体地,本发明提供了产生相对于对照植物具有增加的种子产率相关性状的转基因植物的方法,所述方法包括:
(i)在植物、植物部分或植物细胞中引入和表达在植物组成型启动子控制下的AHL19/20多肽编码核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞、植物部分或植物。
(i)中的核酸序列可以是任何能够编码如本文所述的AHL19/20多肽的核酸序列。
在一个实施方案中,本发明还提供了产生在非生物胁迫条件下生长时相对于对照植物具有增强的产率相关性状的转基因植物的方法,包括在植物中引入和表达任何编码如前文所定义的GRP多肽的核酸序列。
更具体地,本发明提供了产生在非生物胁迫条件下生长时相对于对照植物具有增强的产率相关性状的转基因植物的方法,所述方法包括:
1.在植物、植物部分或植物细胞中引入和表达GRP多肽编码核酸序列;和
2.在促进植物生长和发育的条件下培养植物、植物部分或植物细胞。
(1)中的核酸序列可以是任何能够编码如本文所述的GRP多肽的核酸序列。
在一个实施方案中,本发明还提供了产生相对于对照植物具有增强的产率相关性状的转基因植物的方法,包括在地上植物部分中引入和表达任何编码如前文所定义的AAT样多肽的核酸。
更具体地,本发明提供了产生具有增强的产率相关性状的转基因植物的方法,所述方法包括:
(i)在地上植物部分或在植物细胞中引入和表达在于地上植物部分中具有活性的启动子的控制下的AAT样核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)中的核酸可以是任何如本文所述的ATT样核酸。
更具体地,本发明提供了产生具有增强的产率相关性状,特别是增加的(种子)产率的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中引入和表达AAT核酸;和
(ii)在非限氮条件下培养植物细胞。
(i)中的核酸可以是任何能够编码本文所定义的AAT多肽的核酸。
可以将核酸序列直接引入植物细胞或植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明优选的方面,优选通过转化将核酸序列引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者
Figure G2008800254180D00711
和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是将种子,酌情在消毒之后,种在使用合适的选择剂的琼脂板上,从而仅转化的种子能够长成植物。可选地,针对转化的植物筛选选择标记如上文所述标记的存在。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析(DNA印迹),评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析(蛋白质印迹)监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,然后T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的砧木嫁接到非转化的接穗上)。
本发明显然延及由本文所述方法产生的任何植物细胞或植物,以及所有的植物部分及繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,唯一的要求是所述后代呈现出与在本发明方法中产生的亲本相同的基因型和/或表型特征。
在一个实施方案中,本发明也包括含有与植物组成型启动子有效连接的、编码上文所定义的AHL19/20多肽的分离核酸序列的宿主细胞。
在一个实施方案中,本发明也包括含有编码上文所定义的GRP多肽的分离核酸序列的宿主细胞。
在一个实施方案中,本发明也包括含有编码上文所定义的AAT样多肽或AAT多肽的分离核酸的宿主细胞。
根据本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸或载体、表达盒或构建体或载体,其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的所有植物。
本发明的方法有利地适用于任何植物。尤其可用于本发明方法的植物包括属于植物界超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或豆科牧草、观赏植物、粮食作物、乔木或灌木。根据本发明优选的实施方案,植物为作物植物。作物植物的实例包括大豆、向日葵、芸苔(canola)、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。还优选植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选植物是谷类。谷类的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
本发明也延及含有与植物组成型启动子有效连接的编码AHL19/20(如上文所定义的)的分离核酸序列的植物的可收获部分,例如但不限于:种子、叶、果实、花、茎、根茎、块茎和球茎。本发明还涉及由这样的植物的可收获部分衍生的、优选直接衍生的产品,如干丸(pellet)或干粉、油类、脂肪和脂肪酸、淀粉或蛋白质。
增加核酸序列或基因或基因产物表达的方法在本领域有充分的记录,并且实例在“定义”部分提供。
如上文所述,增加AHL19/20多肽编码核酸序列表达的优选方法是在植物中引入和表达AHL19/20多肽编码核酸序列;然而,实施所述方法的效果,即增强种子产率相关性状,也可以利用其他众所周知的技术实现,包括但不限于:T-DNA激活标签、TILLING、同源重组。这些技术的说明在“定义”部分提供。
如上文所述,增加GRP多肽编码核酸序列表达的优选方法是在植物中引入和表达GRP多肽编码核酸序列;然而,实施所述方法的效果,即增强在非生物胁迫条件下生长的植物的产率相关性状,也可以利用其他众所周知的技术实现,包括但不限于:T-DNA激活标签、TILLING、同源重组现。这些技术的说明在“定义”部分提供。
如上文所述,调节(优选,增加)AAT样多肽或AAT多肽编码核酸的表达的优选方法是在植物中引入和表达编码AAT样多肽或AAT多肽的核酸;然而,实施所述方法的效果,即增强产率相关性状,也可以利用其他众所周知的技术实现,包括但不限于:T-DNA激活标签、TILLING、同源重组现。这些技术的说明在“定义”部分提供。
本发明还包括编码如本文所述的AHL19/20多肽的核酸序列的用途以及这些AHL19/20多肽的用途,用于在正常生长条件下和养分可利用度下降的条件下,优选氮可利用度下降的条件下,增强植物的任何上述种子产率相关性状。
本发明还包括编码如本文所述的GRP多肽的核酸序列的用途以及这些GRP多肽的用途,用于增强在非生物胁迫条件下生长的植物的任何上述产率相关性状。
本发明还包括编码如本文所述的AAT样多肽或AAT多肽的核酸的用途以及这些AAT样多肽或AAT多肽的用途,用于增强植物的任何上述产率相关性状。
可以在育种程序中使用编码本文所述产率增加性多肽的核酸或所述产率增加性多肽本身,其中鉴定可能与产率增加性多肽编码基因遗传连锁的DNA标记。可以使用所述核酸/基因或所述AAT样多肽本身定义分子标记。接着可以将此DNA或蛋白质标记在育种程序中使用,以在本发明的方法中选择具有如上文所定义的增强的产率相关性状的植物。
产率增加性多肽编码核酸/基因的等位基因变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变异;可选的,此类程序可以以一组无意产生的所谓“天然”起源的等位基因变体开始。然后通过例如PCR进行等位基因变体的鉴定。随后是选择步骤,用以选择所讨论序列的、提供增加的产率的、优良等位基因变体。一般通过监测含有所讨论序列的不同等位基因变体的植物的生长行为来进行选择。可以在温室或田地中监测生长行为。其它任选的步骤包括将经鉴定含有优良等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
产率增加性多肽编码核酸还可以作为探针,用于对包含其的基因进行遗传和物理作图以及用作与那些基因连锁的性状的标志物。这样的信息可以在植物育种中使用,以培育具有所期望表型的株系。产率增加性多肽编码核酸的这类应用仅需要长度至少15个核苷酸的核酸序列。产率增加性多肽编码核酸可以用作限制性片段长度多态性(RFLP)标记。可用AAT样核酸探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。另外,可以使用核酸探测含有一组个体的限制性内切酶处理的基因组DNA的Southern印迹,所述一组个体为一个确定的遗传杂交的亲本和子代。记录DNA多态性的分离,并用于计算产率增加性多肽编码核酸在先前用此群体获得的遗传图谱中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
用于遗传作图的植物基因衍生探针的产生和应用描述于Bematzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆的遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近等基因系和其它个体组作图。这类方法是本领域技术人员众所周知的。
核酸序列探针也可以用来进行物理作图(即在物理图谱上安置序列;参见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academic press 1996,第319-346页,及其中引用的参考文献)。
在另一个实施方案中,核酸序列探针可用于进行直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向使用大的克隆(几个kb到几百个kb;参见Laan等(1995)GenomeRes.5:13-20),但是灵敏性的提高可以允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。采用基于PCR的遗传作图的方法中,可能需要鉴定用于作图杂交的亲本之间在相应于本发明核酸序列的区域中的DNA序列差异。但是,通常这对作图方法不是必要的。
根据本发明的方法得到如前文所述具有增加的种子产率相关性状的植物。这些性状还可以组合其它经济上有利的性状,如其它产率增加性状、对其他非生物和生物胁迫的耐受性、改变多种构造特征和/或生物化学和/或生理学特征的性状。
根据本发明的方法得到如前文所述在非生物胁迫条件下生长时具有增强的产率相关性状的植物。这些性状还可以组合其它经济上有利的性状,如其它产率增强性状、对其他非生物和生物胁迫的耐受性、改变多种构造特征和/或生物化学和/或生理学特征的性状。
在一个实施方案中,本发明涉及概述如下的主题:
第1项:相对于对照植物增强植物的种子产率相关性状的方法,包括增加植物中编码核定位AT-hook基序蛋白19/20(AHL19/20)多肽的核酸序列的表达,该AHL19/20多肽包含与SEQ ID NO:36所示保守结构域(CD)具有至少70%、75%、80%、85%、90%、95%、98%、99%或更大氨基酸序列同一性的结构域,以及任选地选择具有增强的种子产率相关性状的植物。
第2项:根据第1项的方法,其中所述AHL19/20多肽包含:i)与SEQ IDNO:37所示AT-hook基序具有至少75%、80%、85%、90%、95%、98%、99%或更大的氨基酸序列同一性的基序;和(ii)与SEQ ID NO:38所示植物及原核生物保守(PPC)结构域具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更大的氨基酸序列同一性的结构域。
第3项:根据第1或2项的方法,其中所述AHL19/20多肽包含:(i)核定位信号;(ii)具有InterPro登录号IPR014476的AT-hook DNA结合基序;和(iii)具有InterPro登录号IPR005175的植物及原核生物保守(PPC)结构域。
第4项:根据任何前述项的方法,其中所述AHL19/20多肽,当用于构建AHL系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ IDNO:2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。
第5项:根据任何前述项的方法,其中所述AHL19/20多肽按照递增的优选顺序与SEQ ID NO:2所示的AHL19/20多肽、或本文表A中所示的任何多肽序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
第6项:根据任何前述项的方法,其中所述编码AHL19/20多肽的核酸序列为表A中所示的任一SEQ ID NO核酸序列或其部分、或能够与表A中所示的任一SEQ ID NO核酸序列杂交的序列。
第7项:根据任何前述项的方法,其中所述核酸序列编码表A中所示的任何SEQ ID NO多肽序列的直系同源物或旁系同源物。
第8项:根据任何前述项的方法,其中所述增加的表达通过任何一个或多个下列技术实现:T-DNA激活标签、TILLING、或同源重组。
第9项:根据任何前述项的方法,其中所述增加的表达通过在植物中引入和表达编码AHL19/20多肽的核酸序列来实现。
第10项:根据任何前述项的方法,其中所述增强的种子产率相关性状是一个或多个下列性状:(i)增加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加的饱满种子数;或(iv)增加的收获指数。
第11项:根据任何前述项的方法,其中相对于对照植物,所述增强的种子产率相关性状发生在于养分可利用度下降的条件下,优选在氮可利用度下降的条件下生长的植物中。
第12项:根据第11项的方法,其中所述增强的种子产率相关性状是一个或多个下列性状:(i)增加的每植物的种子总产率;(ii)增加的饱满种子数;或(iii)增加的收获指数。
第13项:根据任何前述项的方法,其中所述核酸序列与组成型启动子,优选与植物组成型启动子,更优选与GOS2启动子,最优选与SEQ ID NO:35所示的稻GOS2启动子有效连接。
第14项:根据任何前述项的方法,其中所述编码AHL19/20多肽的核酸序列是植物来源的,优选来自双子叶植物,还优选来自十字花科,最优选来自拟南芥。
第15项:可通过任何前述项的方法获得的植物、其部分(包括种子)或植物细胞,其中所述植物、其部分或细胞包含与植物组成型启动子有效连接的编码AHL19/20多肽的分离核酸转基因。
第16项:构建体,包含:
(a)编码第1至5项的任一项中所定义的AHL19/20多肽的核酸序列;
(b)一个或多个能够驱动(a)中的核酸序列表达的控制序列;和任选地
(c)转录终止序列。
第17项:根据第16项的构建体,其中所述控制序列是植物组成型启动子,优选GOS2启动子,更优选SEQ ID NO:35所示的GOS2启动子。
第18项:根据第16或17项的构建体在产生相对于对照植物具有增强的种子产率相关性状的植物的方法中的用途,所述增强的种子产率相关性状是一个或多个下列性状:(i)增加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加的饱满种子数;或(iv)增加的收获指数。
第19项:用根据第16或17项的构建体转化的植物、植物部分或植物细胞。
第20项:产生相对于对照植物具有增强的种子产率相关性状的转基因植物的方法,包括:
(i)在植物、植物部分或植物细胞中引入和表达处于植物组成型启动子控制之下的编码第1至6之任一项中定义的AHL19/20多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞、植物部分或植物。
第21项:由于与植物组成型启动子有效连接的编码第1至5项之任一项中定义的AHL19/20多肽的核酸序列的表达增加而相对于对照植物具有增强的种子产率相关性状的转基因植物、或源自所述转基因植物的转基因植物细胞或转基因植物部分。
第22项:根据第15、19或21项的转基因植物或源自所述转基因植物的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
第23项:根据第22项的植物的包含AHL19/20多肽编码核酸序列的可收获部分,其中所述可收获部分优选是种子。
第24项:来源于根据第22项的植物和/或来源于根据第23项的植物的可收获部分的产品。
第25项:编码第1至6之任一项中所定义的AHL19/20多肽的核酸序列在增强种子产率相关性状中的用途,所述增强的种子产率相关性状包括一个或多个下列性状:i)增加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加的饱满种子数;或(iv)增加的收获指数。
第26项:根据第25项的用途,其中所述增强的种子产率相关性状在养分可利用度下降的条件下,优选在氮可利用度下降的条件下发生。
在一个实施方案中,本发明涉及概述如下的主题:
第27项:相对于对照植物增强在非生物胁迫条件下生长的植物的产率相关性状的方法,包括增加植物中编码GRP多肽的核酸序列的表达,其中所述GRP多肽是SEQ ID NO:46所示的金属硫蛋白2a(MT2a)多肽或其直系同源物、旁系同源物或同源物,以及任选地选择在非生物胁迫条件下生长时具有增强的产率相关性状的植物。
第28项:根据第27项的方法,其中所述SEQ ID NO:46所示的GRP多肽和其直系同源物、旁系同源物或同源物具有InterPro登录号IPR000347,被描述为植物金属硫蛋白家族15。
第29项:根据第27或28项的方法,其中所述GRP多肽按照递增的优选顺序与SEQ ID NO:46所示的GRP多肽具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
第30项:根据前述第27至29之任一项的方法,其中所述编码GRP多肽的核酸序列为SEQ ID NO:45的核酸序列或其部分、或能够与SEQ ID NO:45的核酸序列或其部分杂交的序列。
第31项:根据前述第27至30之任一项的方法,其中所述增加的表达通在植物中引入和表达编码所述GRP多肽的核酸序列来实现。
第32项:根据前述第27至31之任一项的方法,其中所述非生物胁迫是选自一个或多个下列胁迫的渗透胁迫:水胁迫、盐胁迫、氧化胁迫和离子胁迫。
第33项:根据第32项的方法,其中所述水胁迫是干旱胁迫。
第34项:根据第32项的方法,其中所述离子胁迫是盐胁迫。
第35项:根据前述第27至34之任一项的方法,其中所述增强的产率相关性状是一个或多个下列性状:相对于对照植物,增加的地上生物量、增加的每植物的种子总产率、增加的饱满种子数、增加的饱满种子总数、增加的一级圆锥花序数和增加的种子饱满率。
第36项:根据前述第27至35之任一项的方法,其中所述核酸序列与组成型启动子,优选与GOS2启动子,最优选与稻GOS2启动子有效连接。
第37项:根据前述第27至36之任一项的方法,其中所述编码GRP多肽的核酸序列是植物来源的,优选来自双子叶植物,还优选来自十字花科,最优选来自拟南芥。
第38项:GRP多肽编码核酸序列在增强在非生物胁迫条件下生长的植物的产率相关性状中的用途。
第39项:根据第38项的编码GRP多肽的核酸序列的用途,其中所述增强的产率相关性状选自一个或多个下列性状:与对照植物相比,增加的地上生物量、增加的每植物的种子总产率、增加的饱满种子数、增加的饱满种子总数、增加的一级圆锥花序数和增加的种子饱满率。
第40项:根据第39项的编码GRP多肽的核酸序列的用途,其中所述非生物胁迫是选自一个或多个下列胁迫的渗透胁迫:水胁迫、盐胁迫、氧化胁迫和离子胁迫。
第41项:根据第40项的编码GRP多肽的核酸序列的用途,所述水胁迫是干旱胁迫。
第42项:根据第40项的编码GRP多肽的核酸序列的用途,所述离子胁迫是盐胁迫。
在一个实施方案中,本发明涉及概述如下的主题:
第43项:相对于对照植物增强植物的产率相关性状的方法,包括调节地上植物部分中编码丙氨酸氨基转移酶(AAT)样多肽的核酸的表达。
第44项:根据第43项的方法,其中所述AAT样多肽包括一个或多个下列特征:
(i)催化下列反应的能力:
Figure G2008800254180D00811
(ii)属于酶分类编号:EC 2.6.1.2.
(iii)具有氨基转移酶结构域(在InterPro中称为IPR004839;以及在PFAM中称为PF00155)
(iv)具有1-氨基环丙烷-1-羧酸合酶结构域(在InterPro中称为IPR001176)
(v)靶向线粒体
(vi)当用于构建包含AAT序列的系统发生树时,与包含SEQ ID NO:51的AAT样多肽群而非任何其他AAT或AAT样序列群聚类。
第45项:根据第43或44项的方法,其中所述调节表达通过在植物中引入和表达处于在地上植物部分中具有活性的启动子控制之下的AAT样多肽编码核酸来实现。
第46项:根据前述第43至45之任一项的方法,其中所述AAT样多肽编码核酸能够与SEQ ID NO:50所示的核酸杂交。
第47项:根据前述第43至46之任一项的方法,其中所述核酸序列编码SEQ ID NO:51所示蛋白质的直系同源物或旁系同源物。
第48项:根据前述第43至47之任一项的方法,其中所述增强的产率相关性状包括与对照植物相比,增加的产率,优选增加的种子产率。
第49项:根据前述第43至48之任一项的方法,其中在非胁迫条件下获得所述增强的产率相关性状。
第50项:根据第45至49之任一项的方法,其中所述在地上部分中具有活性的启动子是枝条特异性和/或叶特异性启动子。
第51项:根据第43至50之任一项的方法,其中所述AAT样多肽编码核酸是藻类来源的,优选来自衣藻属,还优选来自物种雷氏衣藻。
第52项:可通过前述第43至51之任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码AAT样多肽的重组核酸。
第53项:构建体,包含:
(a)编码第44、46或47项之任一中定义的AAT样多肽的核酸;
(b)能够驱动(a)中的核酸序列在地上部分中表达的启动子序列;和任选地
(c)转录终止序列。
第54项:根据第53项的构建体在用于产生相对于对照植物具有增加的产率,特别地增加的种子产率的植物的方法中的用途。
第55项:用根据第53项的购建体转化的植物、植物部分或植物细胞。.
第56项:产生与对照植物相比具有增加的产率,特别地增加的种子产率的转基因植物的方法,包括:
(i)在植物中引入和表达编码第44、46或47之任一项中所定义的AAT样多肽的核酸,该核酸处于在地上部分中具有活性的启动子的控制之下;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
第57项:由于编码第44、46或47之任一项中定义的AAT样多肽的核酸的表达增加而与对照植物相比具有增加的产率,特别是增加的种子产率的转基因植物、或源自所述转基因植物的转基因植物细胞,其中所述核酸处于在地上部分中具有活性的启动子的控制之下。
第58项:根据第52、55或57项的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦(triticale)、高粱和燕麦。
第59项:根据第58项的植物的可收获部分,其中所述可收获部分是种子。
第60项:来源于根据第58项的植物和/或来源于根据第59项的植物的可收获部分的产品。
第61项:AAT样多肽编码核酸用于相对于对照植物增加植物的产率,特别是增加种子产率的用途,其中该核酸处于在地上部分中具有活性的启动子的控制之下。
在一个实施方案中,本发明涉及概述如下的主题:
第62项:相对于对照植物增强植物的产率相关性状的方法,包括调节植物中编码丙氨酸氨基转移酶(AAT)的核酸的表达,该植物在氮可利用度未限制的条件下生长。
第63项:根据第62项的方法,其中所述AAT样多肽包含一个或多个下列特征:
(i)催化下列反应的能力:
Figure G2008800254180D00831
(ii)属于酶分类编号:EC 2.6.1.2.
(iii)具有氨基转移酶结构域(在InterPro中称为IPR004839;以及在PFAM中称为PF00155)
(iv)具有1-氨基环丙烷-1-羧酸合酶结构域(在InterPro中称为IPR001176)
(v)当用于构建包含AAT序列的系统发生树时,与包含SEQ ID NO:56的AAT样多肽群而非任何其他AAT或AAT样序列群聚类。
第64项:根据第62或63项的方法,其中所述调节表达通过在植物中引入和表达编码AAT样多肽的核酸来实现。
第65项:根据前述第62至64之任一项的方法,其中所述AAT样多肽编码核酸能够与SEQ ID NO:55所示的核酸杂交。
第66项:根据前述第62至65之任一项的方法,其中所述核酸序列编码SEQ ID NO:56所示蛋白质的直系同源物或旁系同源物。
第67项:根据前述第62至66之任一项的方法,其中所述增强的产率相关性状包括与对照植物相比,增加的产率,优选增加的生物量和/或增加的种子产率。
第68项:根据第64至67之任一项的方法,其中所述核酸与组织特异性启动子,优选根特异性启动子,最优选根-表皮-特异性启动子有效连接。
第69项:根据第68项的方法,其中所述根-表皮-特异性启动子是硝酸转运蛋白启动子,优选来自稻。
第70项:根据前述第62至69之任一项的方法,其中所述AAT编码核酸是植物来源的,优选来自单子叶植物,优选来自禾本科,更优选来自稻属,最优选来自稻。
第71项:可通过根据前述第62至70之任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码AAT的重组核酸。
第72项:构建体,包括:
(a)编码第63项中所定义的AAT的核酸;
(b)硝酸转运蛋白启动子,优选来自稻;和任选地
(c)转录终止序列。
第73项:根据第72项的构建体的用途,其用于产生相对于对照植物在非限氮条件下具有增加的产率,特别是增加的生物量和/或增加的种子产率,的植物的方法。
第74项:用根据第71项的构建体转化的植物、植物部分或植物细胞。
第75项:产生与对照植物相比在非限氮条件下具有增加的产率,特别地增加的生物量和/或增加的种子产率的转基因植物的方法,包括:
(i)在植物中引入和表达编码第63项中所定义的AAT的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
第76项:由于编码第63项中所定义的AAT的核酸的表达增加而与对照植物相比在非限氮条件下具有增加的产率,特别地增加的生物量和/或增加的种子产率,的转基因植物、或源自所述转基因植物的转基因植物细胞。
第77项:根据第71、74或76项的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
第78项:根据第77项的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
第79项:来源于根据第77项的植物和/或来源于根据第78项的植物的可收获部分的产品。
第80项:AAT编码核酸用于相对于对照植物增加在非限氮条件下植物的产率,特别地增加种子产率和/或枝条生物量,的用途。
附图说明
现参考以下附图描述本发明,其中:
图1显示在使用渐进式比对Clustal算法(1.83),利用默认值对属于AHL家族的所有多肽(描述于Fujimoto等,(2004)Plant Molec Biol,56:225-239)进行比对后构建的邻接树(neighbour-joining tree)。包含两个拟南芥旁系同源物,即AHL19(SEQ ID NO:2或AT3G04570)和AHL20(SEQ ID NO:4或AT4G14465),的目的群已被圈出。
图2显示在使用渐进式比对Clustal算法(1.83),利用默认值对属于AHL家族的所有多肽(描述在Fujimoto等,(2004)Plant Molec Biol,56:225-239中)以及本文实施例1表A的所有AHL19/20直系同源物和旁系同源物进行比对后构建的邻接树。
图3以卡通形式显示SEQ ID NO:2所示的AHL19/20多肽,其包含下列特征:预测的NLS、AT-hook DNA结合基序(其核心是三肽GRP;包含于InterPro登录号IPR014476(预测的AT-hook DNA-结合)中)、PPC结构域(植物及原核生物保守结构域;包含于InterPro登录号IPR005175(未知功能蛋白质DUF296)中)、和包含AT-hook DNA结合基序和PPC结构域的保守结构域(CD)。
图4显示表A的AHL19/20多肽的保守结构域(如对于SEQ ID NO:2由SEQ ID NO:38显示)的CLUSTAL W(1;83)多重序列比对,其中鉴定了多个特征。从多肽的N端至C端,它们是:(i)预测的核定位信号(NLS);(ii)AT-hook DNA结合基序,具有核心三肽GRP;和(iii)PPC结构域(DUF296)。
图5显示双元载体(binary vector),其用于稻中于稻GOS2启动子(pGOS2)控制之下的AHL19/20多肽编码核酸序列的增加表达。
图6详述了可用于实施本发明方法的序列的实例。
图7显示双元载体,其用于稻中处于稻GOS2启动子控制之下的GRP编码核酸序列(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)(pGOS2::GRP)的增加表达。
图8详述了可用于实施本发明方法的序列的实例。
图9显示了双元载体,其用于稻中处于稻的原叶绿素酸酯启动子控制之下的AAT样核酸的增加表达。
图10详述了可用于实施本发明方法的序列的实例。
图11显示双元载体,其用于稻中处于稻OsNRT1启动子控制之下的AAT核酸的增加表达。
图12详述了可用于实施本发明方法的序列的实例。
实施例
现参考以下实施例描述本发明,所述实施例仅意在举例说明。如下实施例并非旨在完全界定或以其他方式限制本发明的范围。
DNA操作除非另外说明,重组DNA技术根据描述于(Sambrook(2001)《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约)或者Ausubel等(1994),Current Protocols in Molecular Biology,CurrentProtocols第一卷和第二卷的标准方法进行。植物分子操作的标准材料和方法由R.D.D.Croy描述于Plant Molecular Biology Labfase(1993),由BIOSScientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版。
实施例1:与本发明方法所用核酸序列相关的序列的鉴定
利用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),在美国国家生物技术信息中心(NCBI)Entrez核苷酸数据库维护的序列中,鉴定了与本发明方法所用的核酸序列相关的序列(全长cDNA、EST或基因组序列)。BLAST程序通过将核酸序列或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间具有局部相似性的区域。例如,对本发明核酸序列所编码的多肽运用了TBLASTN算法,使用默认设置,开启过滤器以滤过低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行了同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在有些情况下,可以调整默认参数以更改搜索的严格度。例如,可以增加E值以显示严格度较低的匹配。以此方式,可鉴定短的几乎精确的匹配。
表A提供了与本发明方法所用的核酸序列相关的核酸序列的列表。
表A:AHL19/20多肽的实例
  名称   来源生物   核酸SEQID NO:   多肽SEQID NO:   数据库登录号   状态
  Arath_AHL19   拟南芥(Arabidopsis thaliana)   1   2   AT3G04570NP_566232   全长(FL)
  Arath_AHL20   拟南芥   3   4   AT4G14465NP_567432   FL
  Aqufo_AHL19/20   Aquilegia formosa xAquilegia pubescens   5   6   DT758489,DT758488.1的重叠群   FL
  Brana_AHL19/20   欧洲油菜(Brassica napus)   7   8   CS226287   FL
  Brara_AHL19/20   甘蓝型油菜(Brassica napus)   9   10   AC189468   FL
  Glyma_AHL19/20   大豆(Glycine max)   11   12   CS137412   FL
  Goshi_AHL19/20   陆地棉(Gossypium hirsutum)   13   14   DW519458   FL
  名称   来源生物   核酸SEQID NO:   多肽SEQID NO:   数据库登录号   状态
  Lacsa_AHL19/20   莴苣(Lactuca sativa)   15   16   DW047323   FL
  Lotja_AHL19/20   日本百脉根(Lotus japonicus)   17   18   AP004971   FL
  Orysa_AHL19/20   稻(Oryza sativa)   19   20   AK110263Os08g0563200   FL
  Orysa_AHL19/20II   稻   21   22   CT837915Os02g0820800   FL
  名称   来源生物   核酸SEQID NO:   多肽SEQID NO:   数据库登录号   状态
  Poptr_AHL19/20   似欧洲山杨(Populus tremuloides)   23   24   scaff_XIII.441   FL
  Soltu_AHL19/20   马铃薯(Solanum tuberosum)   25   26   CN215397.1CK276075.1的重叠群   FL
  名称   来源生物   核酸SEQID NO:   多肽SEQID NO:   数据库登录号   状态
  Thlca_AHL19/20   天蓝遏蓝菜(Thlaspi caerulescens)   27   28   DQ022564   FL
  Vitvi_AHL19/20   葡萄(Vitis vinifera)   29   30   AM463589   FL
  Vitvi_AHL19/20II   葡萄   31   32   AM429692   FL
  Zeama_AHL19/20   玉蜀黍(Zea mays)   33   34   AC190270   FL
在一些情况下,相关序列已经由研究机构如基因组研究所(Institute forGenomic Research,TIGR)实验性地进行了装配并向公众公开。可以利用真核基因直系同源物(Eukaryotic Gene Orthologs,EGO)数据库,通过关键词搜索,或是采用BLAST算法运用目的核酸序列或多肽序列,鉴定这样的相关序列。在其他情况下,已由例如Joint Genome Institute,针对特定生物例如白杨和Ostreococcus tauri,建立了专门的核酸序列数据库。
实施例2:本发明多肽序列的比对
使用基于流行的渐进式比对ClustalW算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003)Nucleic Acids Res31:3497-3500)的Vector NTI软件包(Invitrogen)AlignX程序,实施多肽序列的比对。默认值为空位开放罚分10,空位延伸罚分0.1,而选择的权重矩阵为Blosum 62(如果比对多肽的话)。可以进行微小的人造编辑以进一步优化比对。利用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建多肽的系统发生树。
使用渐进式比对Clustal算法(1.83),利用默认值(Thompson等,(1997)Nucleic Acids Res 25:4876-4882;Chenna等,(2003).Nucleic Acids Res31:3497-3500),对Fujimoto等(2004;下面表A1)中鉴定的所有拟南芥AHL多肽序列进行了比对。然后构建了邻接树,并且示于本申请的图1中。包含两个拟南芥旁系同源物,AHL19(SEQ ID NO:2或AT3G04570)和AHL20(SEQ ID NO:4或AT4G14465),的目的群已被圈出。(在上文所述的新多重序列比对步骤后)落在该AHL19/20群中的任何多肽被认为可用于实施如本文所述的本发明方法。
表A1:在拟南芥中鉴定的AHL多肽
 AHL编号   Tair登录号   NCBI登录号
 AHL1   At4g12080   NP_192945
 AHL2   At4g22770   NP_194008
 AHL3   At4g25320   NP_194262
 AHL4   At5g51590   NP_199972
 AHL5   At1g63470   NP_176536
 AHL6   At5g62260   NP_201032
 AHL7   At4g00200   NP_191931
 AHL8   At5g46640   NP_199476
 AHL9   At2g45850   NP_182109
 AHL10   At2g33620   NP_565769
 AHL11   At3g61310   NP_191690
 AHL12   At1g63480   NP_176537
 AHL编号   Tair登录号   NCBI登录号
 AHL13   At4g17950   NP_567546
 AHL14   At3g04590   NP_187109
 AHL15   At3g55560   NP_191115
 AHL16   At2g42940   NP_181822
 AHL17   At5g49700   NP_199781
 AHL18   At3g60870   NP_191646
 AHL19   At3g04570   NP_566232
 AHL20   At4g14465   NP_567432
 AHL21   At2g35270   NP_181070
 AHL22   At2g45430   NP_182067
  AHL编号   Tair登录号   NCBI登录号
  AHL23   At4g17800   NP_193515
  AHL24   At4g22810   NP_194012
  AHL25   At4g35390   NP_195265
  AHL26   At4g12050   NP_192942
  AHL27   At1g20900   NP_173514
  AHL28   At1g14490   NP_172901
  AHL29   At1g76500   NP_177776
进行了第二多重序列比对,包括表A中的所有AHL19/20直系同源物多肽和表A1中的所有AHL序列。之后构建邻接树,并且示于本申请的图2中。包含两个拟南芥旁系同源物,AHL19(SEQ ID NO:2或AT3G04570)和AHL20(SEQ ID NO:4或AT4G14465),的目的群已被圈出。落在该AHL19/20群中的任何多肽被认为可用于实施如本文所述的本发明方法。
在表A的AHL19/20多肽的多重序列比对后鉴定了SEQ ID NO:36所示的SEQ ID NO:2的保守结构域(CD)。在第二步骤中,使用渐进式比对Clustal算法(1.83),利用默认值,选择(从全长多肽序列中)和比对了表A的AHL19/20多肽的CD。许多特征可被鉴定,并且标示于图4中。从多肽的N端至C端,它们是:(i)预测的核定位信号(NLS);(ii)AT-hookDNA结合基序,具有核心三肽GRP;和(iii)PPC结构域(DUF 296)。
利用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建AAT样多肽和AAT多肽的系统发生树。
实施例3:可用于实施本发明方法的多肽序列之间的全局同一性百分比计算
可用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一,即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J;由Ledion Bitincka托管的软件),进行了确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数有:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
还可以产生针对特定结构域的局部比对的MATGAT表或有关特定结构域之间的同一性/相似性百分比的数据。
对于多肽序列全长上的全局相似性和同一性(将部分多肽序列排除在外),软件分析的结果示于表B。对角线上方给出同一性百分比,而对角线下方给出相似性百分比。
与SEQ ID NO:2相比,可用于实施本发明方法的多肽序列之间的同一性百分比可低至52%氨基酸同一性。
表B:多肽序列全长上的全局相似性和同一性的MatGAT结果
  1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17
  1.Aqufo_AHL19_20   63   64   61   61   60   73   66   71   59   61   66   70   63   73   71   58
  2.Arath_AHL19   72   56   94   94   56   59   61   59   48   55   61   63   97   61   57   52
  3.Arath_AHL20   76   70   54   54   56   63   63   61   54   58   59   61   57   61   63   54
  4.Brana_AHL19_20   70   96   67   100   56   59   61   58   49   55   60   61   94   60   56   52
  5.Brara_AHL19_20   70   96   67   100   56   59   61   58   49   55   60   61   94   60   56   52
  6.Glyma_AHL19_20   75   68   73   68   68   60   64   59   52   58   66   63   58   67   59   55
  7.Goshi_AHL19_20   82   69   75   67   67   77   64   70   61   66   64   67   59   71   79   61
  8.Lacsa_AHL19_20   79   72   77   72   72   81   80   63   56   59   69   73   61   72   64   56
  9.Lotja_AHL19_20   82   72   75   71   71   74   80   77   59   61   63   69   58   71   72   62
  10.Orysa_AHL19_20   67   58   65   58   58   65   68   69   66   66   52   55   48   56   62   70
  11.Orysa_AHL19_20\II   71   64   69   63   63   73   76   73   72   70   59   60   56   60   66   67
  12.Poptr_AHL19_20   81   71   73   71   71   80   80   81   80   64   74   72   61   75   62   54
  13.Soltu_AHL19_20   82   75   76   75   75   79   77   81   80   61   70   87   63   78   66   58
  14.Thlca_AHL19_20   73   98   69   95   95   70   68   72   73   58   66   72   75   61   58   52
  15.Vitvi_AHL19_20   85   72   74   71   71   81   79   82   82   65   70   85   90   71   69   57
  16.Vitvi_AHL19_20\II   80   66   74   66   66   73   84   78   79   70   76   75   76   66   78   63
如果在SEQ ID NO:2的保守结构域(CD)(SEQ ID NO:36所示)与可用于实施本发明的多肽的CD之间进行同一性计算的话,则同一性百分比可显著增加。CD包含AT-hook DNA结合基序(对于SEQ ID NO:2,如SEQ IDNO:37所示)和PPC结构域(对于SEQ ID NO:2,如SEQ ID NO:38所示)。可用于实施本发明方法的多肽序列在CD上的同一性百分比为75%至99%氨基酸同一性,见表B1。这显著高于在全长AHL19/20多肽序列之间计算的氨基酸同一性百分比。
表B1:多肽序列间在CD结构域上的全局相似性和同一性的MatGAT结果。
  1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17
  1.CD_Aqufo_AHL19_20   81   81   80   80   77   92   83   87   86   87   81   84   81   84   92   86
  2.CD_Arath_AHL19   91   78   98   98   75   82   77   78   76   80   78   80   99   81   81   77
  3.CD_Arath_AHL20   93   88   77   77   73   84   80   79   77   81   76   79   78   79   82   78
  4.CD_Brana_AHL19_20   91   99   88   100   75   82   77   78   76   79   78   79   98   80   80   78
  5.CD_Brara_AHL19_20   91   99   88   100   75   82   77   78   76   79   78   79   98   80   80   78
  6.CD_Glyma_AHL19_20   92   88   89   88   88   80   78   80   74   79   81   78   75   82   80   78
  7.CD_Goshi_AHL19_20   98   91   93   91   91   93   86   92   87   89   85   88   82   90   94   88
  8.CD_Lacsa_AHL19_20   96   90   92   90   90   92   96   81   78   83   86   87   77   88   83   78
  9.CD_Lotja_AHL19_20   96   90   93   90   90   94   98   95   86   86   81   86   78   86   94   89
  10.CD_Orysa_AHL19_20   94   87   89   87   87   89   92   92   93   89   78   84   76   81   86   95
  11.CD_Orysa_AHL19_20\II   94   88   89   88   88   93   95   93   96   95   81   87   80   86   89   90
  12.CD_Poptr_AHL19_20   96   88   91   88   88   93   97   95   96   92   93   86   78   87   84   78
  13.CD_Soltu_AHL19_20   94   89   91   89   89   93   96   95   96   90   93   96   80   90   89   83
  14.CD_Thlca_AHL19_20   91   100   88   99   99   88   91   90   90   87   88   89   89   81   81   77
  15.CD_Vitvi_AHL19_20   94   90   91   90   90   94   96   96   96   90   93   95   96   90   88   81
  16.CD_Vitvi_AHL19_20\II   96   90   92   90   90   93   98   94   99   92   95   95   95   90   95   87
  17.CD_Zeama_AHL19_20   94   88   90   88   88   91   94   93   95   96   96   92   90   88   90   93
实施例4:可用于实施本发明方法的多肽序列中所含结构域的鉴定
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是用于基于文本以及序列的搜索的常用标签数据库的整合界面。InterPro数据库将这些数据库结合起来,它们利用不同的方法学和有关已充分表征的蛋白质的不同角度生物学信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
SEQ ID NO:2所示多肽序列的InterPro扫描结果示于表C
表C:SEQ ID NO:2所示多肽序列的InterPro扫描结果
  InterPro登录号和登录名   整合数据库名称   整合数据库登录号   整合数据库登录名   SEQ ID NO:2上氨基酸坐标
  IPR005175结构域:未知功能蛋白质DUF296   PFAM   PF03479   DUF 296   107-232
  InterProIPR014476家族:预测的AT-hook DNA结合基序   PIR   PIRSF016021   ESCAROLA   1-315
将GRP多肽序列用作查询序列搜索InterPro数据库。可用于实施本发明方法的GRP多肽匹配一个InterPro登录号,如在下面表中所示的:
  InterPro登录号   整合数据库名称   整合数据库登录号   整合数据库登录名
  InterProIPR000347植物金属硫蛋白,家族15   ProDom   PD001611   Metallthion_15p
  Pfam   PF01439   Metallothio_2
SEQ ID NO:51和SEQ ID NO:56所示的多肽序列的InterPro扫描结果示于下面:
InterPro:
IPR001176:结构域1-氨基环丙烷-1-羧酸合酶,区域[203-224][256-280][292-315]
IPR004839:结构域氨基转移酶,I类和II类,区域[145-314]
PFAM:
PF00155结构域氨基转移酶I类和II类,评分为8.4e-19,区域[108-509]
实施例5:用于实施本发明方法的多肽序列的亚细胞定位预测
TargetP 1.1预测真核蛋白质的亚细胞定位。基于如下任一N-端前序列的预测性存在,进行定位确定:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且它们加起来不一定为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
对于经预测含有N-端前序列的序列,还可以预测潜在的切割位点。
选择了多种参数,例如生物体类型(非植物或植物)、截断值设置(无、预先规定的截断值设置或者用户指定的截断值设置)以及切割位点的预测计算(是或否)。
SEQ ID NO:2所示多肽序列的TargetP 1.1分析结果示于表D7。选择的是“植物”生物体类型,并且未规定截断值。SEQ ID NO:2所示多肽序列的预测的亚细胞定位不是叶绿体,不是线粒体,也不是分泌途径,而最可能是细胞核。
在SEQ ID NO:2的AHL19/20多肽中发现(例如通过多重序列比对,然后目检)预测的核定位信号(NLS)。NLS是一个或多个具有带正电荷的赖氨酸或精氨酸的短序列。本发明的SEQ ID NO:2经预测定位在真核细胞的细胞核区室。
表D:SEQ ID NO:2所示多肽序列的TargetP 1.1分析
  长度(AA)   315
  叶绿体转运肽   0.100
  线粒体转运肽   0.278
  分泌路径信号肽   0.033
  其他亚细胞靶向   0.703
  预测的定位   其他
  可靠性级别   3
SEQ ID NO:51所示多肽序列的TargetP 1.1分析结果如下。
TargetP预测:线粒体(0.837,质量2)
可以利用许多算法进行亚细胞定位预测分析,包括:
·ChloroP 1.1,由丹麦技术大学服务器托管;
·蛋白质寻觅亚细胞定位预测软件(Protein Prowler SubcellularLocalisation Predictor),1.2版,由澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute for Molecular Bioscience,University of Queensland,Brisbane,Australia)的服务器托管;
·PENCE Proteome Analyst PA-GOSUB 2.5,由加拿大大阿尔贝塔埃德蒙顿阿尔贝塔大学(University of Alberta,Edmonton,Alberta,Canada)的服务器托管;
·TMHMM,由丹麦技术大学服务器托管。
实施例6:与可用于本发明方法的多肽序列相关的分析
AAT样多肽可具有催化下列反应的能力:
Figure G2008800254180D00961
本领域技术人员将能够容易地检查该活性。
实施例7:本发明核酸序列的克隆
除非另外指出,否则按照(Sambrook(2001)Molecular Cloning:alaboratory manual,第3版Cold Spring Harbor Laboratory Press,CSH,New York)或Ausubel等,(1994),Current Protocols in Molecular Biology,Current Protocols的第1和2卷中所述标准方案进行重组DNA技术。用于植物分子工作的标准材料和方法描述于由BIOS Scientific PublicationsLtd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy编著的Plant Molecular Biology Labfax(1993)中。
使用从混合植物组织提取的mRNA合成的拟南芥cDNA文库作为模板,通过PCR,扩增编码AHL19多肽的拟南芥cDNA。PCR扩增使用引物prm8135(SEQ ID NO:41;有义:5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgaatccatggtg-3’)和引物prm08136(SEQ ID NO:42;反义,互补:5’-ggggaccactttgtacaagaaagctgggttaaaaaccattttaacgcacg-3’),包含用于Gateway重组的AttB位点。在标准条件下使用Hifi Taq DNA聚合酶进行PCR。同样利用标准方法扩增和纯化预期长度(包括attB位点)的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组,产生Gateway术语所称的“进入(entry)克隆”。作为
Figure G2008800254180D00962
技术一部分的质粒pDONR201购自Invitrogen。
SEQ ID NO:45的克隆:
使用定制的拟南芥混合组织cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR,扩增本发明方法所用的核酸序列SEQ ID NO:45。在50μl PCR混合物中使用200ng的模板,在标准条件下利用Hifi Taq DNA聚合酶进行PCR。使用的引物是prm03240(SEQ ID NO:48;有义:5’ggggacaagtttgtacaaaaaagcaggcttcacaatgtcttgctgtggaggaa 3’)和prm03241(SEQ ID NO:49;反义,互补:5’-ggggaccactttgtacaagaaagctgggtttcacttgcaggtgcaag 3’),其包括进行Gateway重组的AttB位点。同样利用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入克隆”。作为
Figure G2008800254180D00971
技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
在50μl PCR混合物中使用200ng的模板,在标准条件下利用HifiTaq DNA聚合酶通过PCR扩增本发明方法所用的核酸序列SEQ ID NO:50。使用的引物是prm08408(SEQ ID NO:53;有义,起始密码子为粗体):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgcggaaggaagcgac-3’和prm08409(SEQ ID NO:54;反义,互补):5’-ggggaccactttgtacaagaaagctgggtcgaattgctaagctgttacga-3’,其包括进行Gateway重组的AttB位点。同样利用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入克隆”,即pAAT-like。作为技术一部分的质粒pDONR201购自Invitrogen。
使用稻cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR,扩增本发明方法所用的核酸序列SEQ ID NO:55。在50μl PCR混合物中使用200ng的模板,在标准条件下利用Hifi Taq DNA聚合酶进行PCR。使用的引物是prm001646(SEQ ID NO:58;有义,起始密码子为粗体):5’-ggggacaagtttgtacaaaaaagcaggcttcacaatggctgctcccagc-3’和prm001647(SEQ ID NO:59;反义,互补):5’-ggggaccactttgtacaagaaagctgggtaattcagtcgcggtacg-3’,其包括进行Gateway重组的AttB位点。同样利用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入克隆”,即pAAT。作为
Figure G2008800254180D00981
技术一部分的质粒pDONR201购自Invitrogen。
实施例8:使用公开的核酸序列构建表达载体
随后将包含SEQ ID NO:1的进入克隆与用于稻转化的目的载体(destination vector)一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物选择标记;可筛选标记表达盒;旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ ID NO:35)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域众所周知的方法将所产生的表达载体pGOS2::AHL19/20(图5)转化进农杆菌菌株LBA4044。
随后将包含SEQ ID NO:45的进入克隆与用于稻转化的目的载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物选择标记;可筛选标记表达盒;旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型表达的稻HMGB启动子(SEQ IDNO:47)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域众所周知的方法将所产生的表达载体pGOS2::GRP(图7)转化进农杆菌菌株LBA4044。
随后将包含SEQ ID NO:50的进入克隆与用于稻转化的目的载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物选择标记;可筛选标记表达盒;旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于枝条和叶特异性表达的稻推定原叶绿素酸酯还原酶启动子(SEQ ID NO:52)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域众所周知的方法将所产生的表达载体(图9)转化进农杆菌菌株LBA4044。
随后将包含SEQ ID NO:55的进入克隆与用于稻转化的目的载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物选择标记;可筛选标记表达盒;旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于根表皮和根毛特异性表达的稻NRT1启动子(SEQ ID NO:57)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域众所周知的方法将所产生的表达载体pNRT1::ATT(图11)转化进农杆菌菌株LBA4044。
实施例9:植物转化
稻转化
独立地使用包含表达载体的这些农杆菌转化稻植物。使梗稻栽培种日本晴(rice japonica cultivar Nipponbare)的成熟干种子脱壳。通过在70%的乙醇中孵育1分钟,然后在0.2%HgCl2中孵育30分钟,之后用无菌蒸馏水洗涤6次,每次15分钟来进行消毒。然后在包含2,4-D的培养基(愈伤组织诱导培养基)中萌发无菌种子。在黑暗中孵育4周后,切取盾片来源的胚发生愈伤组织,然后在相同的培养基上进行繁殖。2周后,通过在相同的培养基上传代培养再另外2周来繁殖或增殖愈伤组织。在共培养前3天在新鲜培养基上传代培养胚发生愈伤组织块(以增强细胞分裂活性)。
包含各表达载体的农杆菌株LBA4404独立地用于共培养。将农杆菌接种在具有适宜的抗生素的AB培养基上,在28℃培养3天。然后收集细菌,将其悬浮在液体共培养培养基中至大约为1的密度(OD600)。然后将悬浮液转移至培养皿(Petri dish),将愈伤组织浸渍在悬浮液中15分钟。然后将愈伤组织在滤纸上吸干,之后转移至固化的共培养培养基,在25℃黑暗中孵育3天。然后在选择剂存在的情况下在28℃黑暗中,在包含2,4-D的培养基上生长共培养的愈伤组织4周。在此期间,产生了快速生长的抗性愈伤组织岛。在将该物质转移至再生培养基和在光照下孵育后,胚发生潜力被释放,在接下来的4至5周中发育出芽。将芽从愈伤组织切下,然后在包含生长素的培养基上孵育2至3周,然后将它们从所述培养基转移至土壤中。在温室中在高湿度和短日照下生长出变硬的芽(shoot)。
对于每个构建体产生了大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室。在进行确认T-DNA插入物的拷贝数的定量PCR分析后,只保留展示对选择剂具抗性的单拷贝转基因植物用于T1种子的收获。然后在移植后3至5个月收获种子。该方法以50%多的比率产生了单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例10:表型评估方法
10.1评估设置
产生了大约35个独立的T0稻转化体。原代转化体由组织培养室转移到温室生长并收获T1种子。保留了6个事件,这些事件中T1后代发生转基因存在/缺乏的3∶1分离。通过监测可视标记的表达,对于这些事件之每一个,各选出大约10个含转基因的T1幼苗(杂合子和纯合子),以及大约10个缺少转基因的T1幼苗(无效合子)。转基因植物和相应的无效合子在随机位置上并排生长。温室条件为短日照(12小时光照),日间28℃,夜间22℃,相对湿度70%。
从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色素)。
减少的养分(氮)可利用度筛选
在除营养液以外正常的条件下在花盆土中培养来自6个事件(T2种子)的植物。从植物移植到成熟,用特定的营养液对花盆进行浇灌,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样,记录生长和产率参数。
10.2统计分析:F检验
利用双因素ANOVA(方差分析)作为统计模型,对植物表型特征进行总体评估。对用本发明基因转化的所有事件的所有植株的测量到的所有参数进行F检验。进行F检验以在所有转化事件上检查基因的效应,并检验基因的总体效应,亦称为“整体基因效应”(global gene effect)。真实的整体基因效应的显著性阈值设置为F检验的5%概率水平。显著性F检验值指向基因效应,意味着不仅仅只是基因的存在或位置引起表型差异。
按照用于T1代相同的评估方法但是每个事件评估更多个体,对4个T1事件的T2代进行进一步的评估。
当进行了具有重叠事件的两个实验时,进行组合分析。这可用于检查效应在两个实验中的一致性,并且如果情况果真如此,其可用于将来自两个实验的证据集合起来以增加结论的可信度。使用的方法是考虑到数据的多层结构(即实验-事件-分离子)的混合模型方法。通过比较似然比检验与卡方分布,获得P值。
从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色素)。
在GRP多肽的情况下的干旱筛选
在正常条件下在花盆土中培养来自T1、T2或更后代的稻植物,直到它们进入抽穗期。然后将其转移到限制灌溉的“干燥”区域。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样,记录生长和产率参数。
在GRP多肽的情况下的盐胁迫筛选
将来自T1、T2或更后代的稻植物生长在椰子纤维和argex(3∶1的比率)制造的基质上。在将小植株移植入温室后前两周中使用正常的营养液。在前两周后,向营养液中加入25mM盐(NaCl),直至收获植物。如针对正常条件下的生长所详述的那样,记录生长和产率参数。
在AAT样多肽和AAT多肽的情况下的干旱筛选
在正常条件下在花盆土中培养来自T2种子的植物,直到它们进入抽穗期。然后将其转移到限制灌溉的“干燥”区域。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样,记录生长和产率参数。
在AAT样多肽和AAT多肽的情况下的氮利用效率筛选
在除营养液以外正常的条件下在花盆土中培养来自T2种子的稻植物。从植物移植到成熟,用特定的营养液对花盆进行浇灌,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样,记录生长和产率参数。
10.3测量的参数
生物量相关参数测量
从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色素)。
植物地上面积(或者说叶生物量)通过计数数码图像上区别于背景的来自于地上植物部分的像素的总数而确定。此值为同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值(physical surface value)。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。所述地上面积为在植物达到其最大叶生物量的时间点测量的面积。早期活力是萌发后3周植物(幼苗)的地上面积。根生物量的增加表示为总根生物量的增加(测量为在植物生命期中观察到的根的最大生物量);或表示为根/条指数的增加(测量为在根和枝条活跃生长期中根质量与枝条质量之间的比率)。
早期活力通过计数区别于背景的来自地上植物部分的像数的总数来确定。此值为同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值。下面所述的关于早期活力的结果是萌发后3周的植物的结果。
种子相关参数测量
收获成熟的一级圆锥花序、计数、装袋、贴上条形码标记,然后在烤箱中于37℃干燥三天。随后将圆锥花序脱粒,收集并计数所有的种子。使用鼓风装置将饱满谷壳和空壳分开。弃去空壳,再次计数剩下的部分。在分析天平上称重饱满的谷壳。通过计数在分离步骤之后剩下的饱满谷壳数确定饱满种子数。通过称量从一株植物收获的所有饱满谷壳来测量每植物的种子总重量。通过计数从植物收获的谷壳数来测量每株植物的种子总数。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为每植物的种子总重量和地上面积(mm2)之间的比值再乘以因子106。每圆锥花序的花总数在本发明中定义为种子总数与成熟的一级圆锥花序数之间的比值。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以%表示)。
实施例11:在正常生长条件下的转基因稻植物的表型评估结果
对在用于组成型表达的GOS2启动子控制之下表达编码SEQ ID NO:2所示AHL19/20多肽的核酸序列的转基因稻植物,在生长于正常生长条件下时进行了评估,评估结果如下所示。
与相应的无效合子(对照植物)相比,转基因植物的每圆锥花序的花数、每植物的种子总产率、饱满种子总数和收获指数均有显著增加,如表E中所示。
表E:在正常生长条件下,对在用于组成型表达的GOS2启动子控制之下表达编码SEQ ID NO:2所示AHL19/20多肽的核酸序列的转基因稻植物的评估结果。
  性状  T1代中6个事件的平均增加%
  每圆锥花序的花数  14%
  每植物的种子总产率  17%
  饱满种子总数  17%
  收获指数  17%
对在非胁迫条件下生长的并且在稻的原叶绿素酸酯还原酶启动子控制之下表达AAT样核酸的转基因稻植物的评估,显示出与对照植物相比转基因植物的收获指数(HI)显著增加。还观察到与对照植物相比,转基因植物的早期活力、种子总重量和饱满种子数增加。
对在非限氮条件下生长的并且在稻NRT1启动子控制之下表达AAT核酸的转基因稻植物的评估,显示出与对照植物相比,地上面积、植物重量、早期活力增加。
实施例12:在养分(氮)可利用度降低的生长条件下的转基因稻植物的表型评估结果
对在养分(氮)可利用度降低的生长条件下生长的并且在用于组成型表达的GOS2启动子控制之下表达编码SEQ ID NO:2所示AHL19/20多肽的核酸序列的转基因稻植物的评估结果示于下面。
与相应的无效合子(对照植物)相比,转基因植物的每植物的种子总产率、饱满种子总数和收获指数均显著增加,如表F中所示。
表F:对在养分(氮)可利用度降低的生长条件下,对在用于组成型表达的GOS2启动子控制之下表达编码SEQ ID NO:2所示AHL19/20多肽的核酸序列的转基因稻植物的评估结果。
  性状  T1代中2个事件的平均增加%
  早期活力  18%
  每植物的种子总产率  26%
  饱满种子总数  27%
  种子总数  24%
实施例13:在盐和/或干旱胁迫生长条件下的转基因稻植物的表型评估结果
盐胁迫条件下生长时于GOS2启动子控制之下表达SEQ ID NO:45所示的GRP核酸序列的转基因稻植物,显示出与在相当条件下生长的对照植物相比,地上生物量、每植物的种子总产率、饱满种子数、种子总数和一级圆锥花序(first panicles)数的5%以上增加,如下表中所示。
  T2代中的总体平均增加%
  地上生物量   20%
  每植物的种子总产率   32%
  饱满种子数   29%
  种子总数   19%
  一级圆锥花序数   23%
干旱胁迫条件下生长的、于GOS2启动子控制之下表达SEQ ID NO:45所示GRP核酸序列的转基因稻植物,显示出与在相当条件下生长的对照植物相比,地上生物量、每植物的种子总产率、饱满种子数、种子总数和种子饱满率的5%以上增加,如下表中所示。
  T1代中最佳事件的平均增加%
  每植物的种子总产率   39%
  饱满种子数   38%
  种子总数   19%
  种子饱满率   12%
实施例14:其他作物的转化实例
玉米的转化
使用由Ishida等(1996)Nature Biotech 14(6):745-50描述的方法的改进方法进行玉米(Zea mays)的转化。在玉米中转化是基因型依赖性的,只有特定的基因型易于进行转化和再生。近交系A188(University ofMinnesota)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但也可成功地使用其他基因型。在授粉后大约11天(DAP)当未成熟的胚的长度为大约1至1.2mm时,从玉米植物收获穗子。将未成熟的胚与包含表达载体的根癌农杆菌共培养,通过器官发生再生转基因植物。将切离的胚培养在包含选择剂(例如咪唑啉酮,但可使用不同的选择标记)的愈伤组织诱导培养基,然后是玉米再生培养基上。在光照的情况下在25℃孵育培养皿2至3周,或直至芽产生。将绿色的芽从各胚转移至玉米生根培养基,在25℃孵育2-3周,直至根产生。然后将生根的芽移植至温室土壤中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
使用由Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行小麦的转化。通常将栽培品种Bobwhite(可从CIMMYT,Mexico获得)用于转化。将未成熟的胚与包含表达载体的根癌农杆菌共培养,通过器官发生再生转基因植物。在与农杆菌孵育后,将胚体外培养在包含选择剂(例如咪唑啉酮,但可使用不同的选择标记)的愈伤组织诱导培养基,然后是再生培养基上。在光照的情况下在25℃孵育培养皿2至3周,或直至芽产生。将绿色的芽从各胚转移至生根培养基,在25℃孵育2-3周,直至根产生。将生根的芽移植至温室土壤中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
按照Texas A&M专利US 5,164,310中描述的方法的改进方法转化大豆。几种商品化大豆品种易于通过该方法进行转化。通常将栽培品种Jack(可从Illinois Seed foundation获得)用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗切取下胚轴、胚根和一片子叶。让上胚轴和剩下的子叶进一步生长产生腋节(axillary node)。切取这些腋节,将其与包含表达载体的根癌农杆菌一起孵育。在共培养处理后,洗涤外植体,然后转移至选择培养基。切取再生的芽,将其置于芽伸长培养基上。将长度不超过1cm的芽置于生根培养基上直至根产生。将生根的芽转移至温室的土壤中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生T1种子。
油菜(rapeseed)/芸苔(Canola)的转化
5-6日龄的幼苗的子叶柄和下胚轴用作组织培养的外植体,按照Babic等(1998,Plant Cell Rep 17:183-188)对其进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但也可使用其他品种。对Canola种子进行表面消毒以进行体外播种。从体外幼苗切取具有附着的子叶的子叶柄外植体,然后通过将子叶柄外植体的切口末端浸入细菌悬浮液中接种农杆菌(包含表达载体)。然后将外植体在23℃、16小时光照下,在包含3mg/l BAP、3%蔗糖、0.7%Phytagar的MSBAP-3培养基上培养2天。在与农杆菌共培养2天后,将子叶柄外植体转移至包含3mg/l BAP、头孢氨噻肟、羧苄青霉素或替卡西林-克拉维酸(timentin)(300mg/l)的MSBAP-3培养基上培养7天,然后在具有头孢氨噻肟(cefotaxime)、羧苄青霉素或替卡西林-克拉维酸和选择剂的MSBAP-3培养基上培养直至芽再生。当芽的长度为5-10mm时,将其切离,然后转移至芽伸长培养基(MSBAP-0.5,包含0.5mg/l BAP)。将长度大约2cm的芽转移至生根培养基(MS0)以进行根诱导。将生根的芽移植至温室的土壤中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生T1种子。
苜蓿的转化
使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿(Medicago sativa)的再生克隆。苜蓿的再生和转化是基因型依赖性的,因而需要再生的植物。已描述了用于获得再生植物的方法。例如,这些再生植物可选自栽培品种Rangelander(Agriculture Canada)或由Brown DCW和A Atanassov(1985.Plant Cell Tissue Organ Culture 4:111-112)描述的任何其他商业苜蓿品种。可选择地,RA3品种(University of Wisconsin)已选择用于组织培养(Walker等,1978 Am J Bot 65:654-659)。将子叶柄外植体与包含表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 PlantPhysiol 119:839-847)或LBA4404的过夜培养物共培养。将外植体在黑暗中在包含288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培养3天。在一半浓度的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤外植体,然后将其种在不含乙酰丁香酮但具有适宜的选择剂和适宜的抗生素(以抑制农杆菌的生长)的相同SH诱导培养基上。在几周后,将体细胞胚转移至不含生长调节剂、无抗生素但含有50g/L蔗糖的BOi2Y发育培养基中。随后在一半浓度的Murashige-Skoog培养基上萌发体细胞胚。将生根的幼苗移植入花盆和生长在温室中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌在下胚轴外植体上转化棉花(Gossypium hirsutum L.)。商业品种例如Coker 130或Coker 312(SeedCo,Lubbock,TX)是用于转化的标准品种,但也可使用其他品种。对种子进行表面消毒,然后在黑暗处萌发。从萌发的幼苗切取长度大约1-1.5厘米的下胚轴外植体。将下胚轴外植体浸没在含有表达载体的根癌农杆菌接种物中5分钟,然后在黑暗处在24℃在MS+1.8mg/l KNO3+2%葡萄糖上共培养大约48小时。将外植体转移至含有适当的细菌和植物选择标记(更换数次)的相同培养基中,直至看到胚发生愈伤组织。分离愈伤组织,然后进行传代培养直至体细胞胚出现。将来源于体细胞胚的小植株在生根培养基上成熟直至根发育。将生根的幼苗移植至温室中的花盆土中。从展示对选择剂具有抗性的并且包含单拷贝T-DNA插入物的植物产生T1种子。
实施例13:非生物胁迫筛选的实例
干旱筛选
在正常条件下在花盆土中培养来自所选数目的事件的植物,直到它们进入抽穗期。然后将其转移到限制灌溉的“干燥”区域。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样,记录生长和产率参数。
盐胁迫筛选
将植物生长在椰子纤维和argex(3∶1的比率)制造的基质上。在将小植株移植入温室后前2两周中使用正常的营养液。在前两周后,向营养液中加入25mM盐(NaCl),直至收获植物。如针对正常条件下的生长所详述的那样,记录生长和产率参数。
实施例14:非生物胁迫筛选
氮利用效率筛选
在除营养液以外正常的条件下在花盆土中培养来自T1、T2或更后代的稻植物。从植物移植到成熟一直用特定的营养液对花盆进行浇灌,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样,记录生长和产率参数。
序列表
<110>巴斯福植物科学(BASF Plant Science GmbH)
 
<120>具有增强的产率相关性状的植物及其制备方法
 
<130>PF59353
 
<160>59
 
<170>PatentIn version 3.3
 
<210>1
<211>948
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
 
<400>1
atggcgaatc catggtggac aggacaagtg aacctatccg gcctcgaaac gacgccgcct    60
ggttcctctc agttaaagaa accagatctc cacatctcca tgaacatggc catggactca   120
ggtcacaata atcatcacca tcaccaagaa gtcgataaca acaacaacga cgacgataga   180
gacaacttga gtggagacga ccacgagcca cgtgaaggag ccgtagaagc ccccacgcgc   240
cgtccacgtg gacgtcctgc tggttccaag aacaaaccaa agccaccgat cttcgtcact   300
cgcgattctc caaatgctct caagagccat gtcatggaga tcgctagtgg gactgacgtc   360
atcgaaaccc tagctacttt tgctaggcgg cgtcaacgtg gcatctgcat cttgagcgga   420
aatggcacag tggctaacgt caccctccgt caaccctcga ccgctgccgt tgcggcggct   480
cctggtggtg cggctgtttt ggctttacaa gggaggtttg agattctttc tttaaccggt   540
tctttcttgc caggaccggc tccacctggt tccaccggtt taacgattta cttagccggt   600
ggtcaaggtc aggttgttgg aggaagcgtg gtgggcccat tgatggcagc aggtccggtg   660
atgctgatcg ccgccacgtt ctctaacgcg acttacgaga gattgccatt ggaggaggaa   720
gaggcagcag agagaggcgg tggtggaggc agcggaggag tggttccggg gcagctcgga   780
ggcggaggtt cgccactaag cagcggtgct ggtggaggcg acggtaacca aggacttccg   840
gtgtataata tgccgggaaa tcttgtttct aatggtggca gtggtggagg aggacagatg   900
agcggccaag aagcttatgg ttgggctcaa gctaggtcag gattttaa                948
 
<210>2
<211>315
<212>PRT
<213>拟南芥
 
<400>2
Met Ala Asn Pro Trp Trp Thr Gly Gln Val Asn Leu Ser Gly Leu Glu
1               5                   10                  15
Thr Thr Pro Pro Gly Ser Ser Gln Leu Lys Lys Pro Asp Leu His Ile
            20                  25                  30
Ser Met Asn Met Ala Met Asp Ser Gly His Asn Asn His His His His
        35                  40                  45
Gln Glu Val Asp Asn Asn Asn Asn Asp Asp Asp Arg Asp Asn Leu Ser
    50                  55                  60
Gly Asp Asp His Glu Pro Arg Glu Gly Ala Val Glu Ala Pro Thr Arg
65                  70                  75                  80
Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro Pro
                85                  90                  95
Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Lys Ser His Val Met
            100                 105                 110
Glu Ile Ala Ser Gly Thr Asp Val Ile Glu Thr Leu Ala Thr Phe Ala
        115                 120                 125
Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu Ser Gly Asn Gly Thr Val
    130                 135                 140
Ala Asn Val Thr Leu Arg Gln Pro Ser Thr Ala Ala Val Ala Ala Ala
145                 150                 155                 160
Pro Gly Gly Ala Ala Val Leu Ala Leu Gln Gl y Arg Phe Glu Il e Leu
                165                 170                 175
Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr
            180                 185                 190
Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly
        195                 200                 205
Ser Val Val Gly Pro Leu Met Ala Ala Gly Pro Val Met Leu Ile Ala
    210                 215                 220
Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Glu Glu
225                 230                 235                 240
Glu Ala Ala Glu Arg Gly Gly Gly Gly Gly Ser Gly Gly Val Val Pro
                245                 250                 255
Gly Gln Leu Gly Gly Gly Gly Ser Pro Leu Ser Ser GlyAla Gly Gly
            260                 265                 270
Gly Asp Gly Asn Gln Gly Leu Pro Val Tyr Asn Met Pro Gly Asn Leu
        275                 280                 285
Val Ser Asn Gly Gly Ser Gly Gly Gly Gly Gln Met Ser Gly Gln Glu
    290                 295                 300
Ala Tyr Gly Trp Ala Gln Ala Arg Ser Gly Phe
305                 310                 315
 
<210>3
<211>846
<212>DNA
<213>拟南芥
 
<400>3
atggcaaacc cttggtggac gaaccagagt ggtttagcgg gcatggtgga ccattcggtc     60
tcctcaggcc atcaccaaaa ccatcaccac caaagtcttc ttaccaaagg agatcttgga    120
atagccatga atcagagcca agacaacgac caagacgaag aagatgatcc tagagaagga    180
gccgttgagg tggtcaaccg tagaccaaga ggtagaccac caggatccaa aaacaaaccc    240
aaagctccaa tctttgtgac aagagacagc cccaacgcac tccgtagcca tgtcttggag    300
atctccgacg gcagtgacgt cgccgacaca atcgctcact tctcaagacg caggcaacgc    360
ggcgtttgcg ttctcagcgg gacaggctca gtcgctaacg tcaccctccg ccaagccgcc    420
gcaccaggag gtgtggtctc tctccaaggc aggtttgaaa tcttatcttt aaccggtgct    480
ttcctccctg gaccttcccc acccgggtca accggtttaa cggtttactt agccggggtc    540
cagggtcagg tcgttggagg tagcgttgta ggcccactct tagccatagg gtcggtcatg    600
gtgattgctg ctactttctc taacgctact tatgagagat tgcccatgga agaagaggaa    660
gacggtggcg gctcaagaca gattcacgga ggcggtgact caccgcccag aatcggtagt    720
aacctgcctg atctatcagg gatggccggg ccaggctaca atatgccgcc gcatctgatt    780
ccaaatgggg ctggtcagct agggcacgaa ccatatacat gggtccacgc aagaccacct    840
tactga                                                               846
 
<210>4
<211>281
<212>PRT
<213>拟南芥
 
<400>4
Met Ala Asn Pro Trp Trp Thr Asn Gln Ser Gly Leu Ala Gly Met Val
1               5                   10                  15
Asp His Ser Val Ser Ser Gly His His Gln Asn His His His Gln Ser
            20                  25                  30
Leu Leu Thr Lys Gly Asp Leu Gly IleAla Met Asn Gln Ser Gln Asp
        35                  40                  45
Asn Asp Gln Asp Glu Glu Asp Asp Pro Arg Glu Gly Ala Val Glu Val
    50                  55                  60
Val Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro
65                  70                  75                  80
Lys Ala Pro Ile Phe ValThr Arg Asp Ser Pro Asn Ala Leu Arg Ser
                85                  90                  95
His ValLeu Glu Ile Ser Asp Gly Ser Asp Val Ala Asp Thr Ile Ala
           100                 105                 110
His Phe Ser Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Thr
        115                 120                 125
Gly Ser Val Ala Asn Val Thr Leu Arg Gln Ala Ala Ala Pro Gly Gly
    130                 135                 140
Val Val Ser Leu Gln Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Ala
145                 150                 155                 160
Phe Leu Pro Gly Pro Ser Pro Pro Gly Ser Thr Gly Leu Thr Val Tyr
                165                 170                 175
Leu Ala Gly Val Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Pro
            180                 185                 190
Leu Leu Ala Ile Gly Ser Val Met Val Ile Ala Ala Thr Phe Ser Asn
        195                 200                 205
Ala Thr Tyr Glu Arg Leu Pro Met Glu Glu Glu Glu Asp Gly Gly Gly
    210                 215                 220
Ser Arg Gln Ile His Gly Gly Gly Asp Ser Pro Pro Arg Ile Gly Ser
225                 230                 235                 240
Asn Leu Pro Asp Leu Ser Gly Met Ala Gly Pro Gly Tyr Asn Met Pro
                245                 250                 255
Pro His Leu Ile Pro Asn Gly Ala Gly Gln Leu Gly His Glu Pro Tyr
            260                 265                 270
Thr Trp Val His Ala Arg Pro Pro Tyr
        275                 280
 
<210>5
<211>867
<212>DNA
<213>Aquilegia formosa x Aquilegia pubescens
 
<400>5
atggcaaatc catggtggac tgggcaggtg ggactgcctg gtggtttaga aacaggagcg     60
ggttcacctg cgtttagaaa acgcgatcga gatttatcga tgaatgaaag tgtaagtggt    120
ggtagaggag gtgaggatga cgatgaaaga gataacggtg atgagcctaa agaaggtgcg    180
gtagagatag gtaaccgccg tccaaggggc cgaccacctg ggtcaaagaa caagccaaaa    240
ccaccgattt ttgtgactcg cgatagccca aacgcgctta ggagccatgt gatggaggtc    300
tcaagtggga ctgatgtagc cgaaagtgta gcccaatttg ctaggaggcg acaaagaggt    360
gtttgtgtac ttagtggtag tggcgtagtg gccaatgtaa cattgcgaca accttcagct    420
ccaagtgcag ttgtggctct gcaaggtcga ttcgaaatat tgtctctaac tggttcattc    480
ttgcctgggc cggcaccccc aggatcaact gggctgacgg tctacttggc aggcggtcag    540
gggcaagtgg taggcggtag cgtggttggt actcttattg cagctggtcc agttattgtg    600
attgcagcaa catttgcaaa tgcaacatat gagagactac caattgagga ggaggaggat    660
gcaggaagtg gaggtcaggg acaactccag ggcggtgcag gaagctcacc accaccaatt    720
ggaagcagta ccgggcaaca gcaaccaggg atgccagacc tatcctcttt gccagtgtat    780
aatatgccac caaacctact ccaaaatgga gggcagatga accagcaaga agcatatgct    840
tgggctcatg ctcggccacc gtattga                                        867
 
<210>6
<211>288
<212>PRT
<213>Aquilegia formosa x Aquilegia pubescens
 
<400>6
Met Ala Asn Pro Trp Trp Thr Gly Gln Val Gly Leu Pro Gly Gly Leu
1               5                   10                  15
Glu Thr Gly Ala Gly Ser Pro Ala Phe Arg Lys Arg Asp Arg Asp Leu
            20                  25                  30
Ser Met Asn Glu Ser Val Ser Gly Gly Arg Gly Gly Glu Asp Asp Asp
        35                  40                  45
Glu Arg Asp Asn Gly Asp Glu Pro Lys Glu Gly Ala Val Glu Ile Gly
    50                  55                  60
Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro Lys
65                  70                  75                  80
Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser His
                85                  90                  95
Val Met Glu Val Ser Ser Gly Thr Asp Val Ala Glu Ser Val Ala Gln
            100                 105                 110
Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Ser Gly
        115                 120                 125
Val Val Ala Asn Val Thr Leu Arg Gln Pro Ser Ala Pro Ser Ala Val
    130                 135                 140
Val Ala Leu Gln Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Ser Phe
145                 150                 155                 160
Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Val Tyr Leu
                165                 170                 175
Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Thr Leu
            180                 185                 190
Ile Ala Ala Gly Pro Val Ile Val Ile Ala Ala Thr Phe Ala Asn Ala
        195                 200                 205
Thr Tyr Glu Arg Leu Pro Ile Glu Glu Glu Glu Asp Ala Gly Ser Gly
    210                 215                 220
Gly Gln Gly Gln Leu Gln Gly Gly Ala Gly Ser Ser Pro Pro Pro Ile
225                 230                 235                 240
Gly Ser Ser Thr Gly Gln Gln Gln Pro Gly Met Pro Asp Leu Ser Ser
                245                 250                 255
Leu Pro Val Tyr Asn Met Pro Pro Asn Leu Leu Gln Asn Gly Gly Gln
            260                 265                 270
Met Asn Gln Gln Glu Ala Tyr Ala Trp Ala His Ala Arg Pro Pro Tyr
        275                 280                 285
 
<210>7
<211>948
<212>DNA
<213>欧洲油菜(Brassica napus)
 
<400>7
atggcgaatc catggtggac aggacaagtg aatctctccg gcctcgaaac gacgccgccg   60
agttcctctc agttaaagac accagatctc cacatctcca tgaatatggc catggactca  120
ggtcataaca accaccacca tcatcaccaa gaagtcaaca ccaacaacaa caacgaagac  180
gatagagaca acttgagcgg cgacgaccac gagccacgtg aaggagccgt ggaagctccc  240
acgcgccgac cacgtggacg tcctgctggt tccaagaaca aaccaaagcc accaatcttt  300
gtcacgcgtg actctccaaa cgctctcaag agccatgtca tggagatcgc tagtgggact  360
gacgtcatcg aaaccctagc tactttcgct aggcggcgcc aacgtggcat ctgcatcttg  420
agcggtaacg gcacggtggc taacgtcaca ctccgtcaac catcagtggc tcccgttgca  480
gctgcccctg gtggtgcggc tgtattggcg ttacaaggga ggtttgagat tctttctcta  540
accggttctt tcttacctgg accggctcca cctggatcca ctggtttaac tatttactta  600
gctggtggtc aaggtcaggt tgttggagga agcgtggtgg ggccattgat ggctgctggt  660
ccggtgatgc taatcgctgc cacgttttct aatgcgactt atgagagatt acctttggat  720
gaggaagaag cggctgaaag aggtggcggt ggaagcgacg gaggagtggt tccagggcag  780
ctcgggggcg taggttcccc gctgagtagt ggtggcggtg gaggccatgg gaaccaagga  840
cttcccgcgt ataatatgcc cggaaatctt gcttctaatg gcggtggagg aggacagatg  900
agcggccaag aagcttacgg ttgggctcaa gctaggtcag gattttaa               948
 
<210>8
<211>315
<212>PRT
<213>欧洲油菜
 
<400>8
Met Ala Asn Pro Trp Trp Thr Gly Gln Val Asn Leu Ser Gly Leu Glu
1               5                   10                  15
Thr Thr Pro Pro Ser Ser Ser Gln Leu Lys Thr Pro Asp Leu His Ile
            20                  25                  30
Ser Met Asn Met Ala Met Asp Ser Gly His Asn Asn His His His His
        35                  40                  45
His Gln Glu Val Asn Thr Asn Asn Asn Asn Glu Asp Asp Arg Asp Asn
    50                  55                  60
Leu Ser Gly Asp Asp His Glu Pro Arg Glu Gly Ala Val Glu Ala Pro
65                  70                  75                  80
Thr Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys
                85                  90                  95
Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Lys Ser His
            100                 105                 110
Val Met Glu Ile Ala Ser Gly Thr Asp Val Ile Glu Thr Leu Ala Thr
        115                 120                 125
Phe Ala Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu Ser Gly Asn Gly
    130                 135                 140
Thr Val Ala Asn Val Thr Leu Arg Gln Pro Ser Val Ala Pro Val Ala
145                 150                 155                 160
Ala Ala Pro Gly Gly Ala Ala Val Leu Ala Leu Gln Gly Arg Phe Glu
                165                 170                 175
Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly
            180                 185                 190
Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val
        195                 200                 205
Gly Gly Ser Val Val Gly Pro Leu Met Ala Ala Gly Pro Val Met Leu
    210                 215                 220
Ile Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Asp
225                 230                 235                 240
Glu Glu Glu Ala Ala Glu Arg Gly Gly Gly Gly Ser Asp Gly Gly Val
                245                 250                 255
Val Pro Gly Gln Leu Gly Gly Val Gly Ser Pro Leu Ser Ser Gly Gly
            260                 265                 270
Gly Gly Gly His Gly Asn Gln Gly Leu Pro Ala Tyr Asn Met Pro Gly
        275                 280                 285
Asn Leu Ala Ser Asn Gly Gly Gly Gly Gly Gln Met Ser Gly Gln Glu
    290                 295                 300
Ala Tyr Gly Trp Ala Gln Ala Arg Ser Gly Phe
305                 310                 315
 
<210>9
<211>978
<212>DNA
<213>芜青(Brassica rapa)
 
<400>9
ataatcagat acaatctatt tagggtttta atggcgaatc catggtggac aggacaagtg   60
aatctctccg gcctcgaaac gacgccgccg agttcctctc agttaaagac accagatctc  120
cacatctcca tgaatatggc catggactca ggtcataaca accaccacca tcatcaccaa  180
gaagtcaaca ccaacaacaa caacgaagac gatagagaca acttgagcgg cgacgaccac  240
gagccacgtg aaggagccgt ggaagctccc acgcgccgac cacgtggacg tcctgctggt  300
tccaagaaca aaccaaagcc accaatcttt gtcacgcgtg actctccaaa cgctctcaag  360
agccatgtca tggagatcgc tagtgggact gacgtcatcg aaaccctagc tactttcgct  420
aggcggcgcc aacgtggcat ctgcatcttg agcggtaacg gcacggtggc taacgtcaca  480
ctccgtcaac catcagtggc tcccgttgca gctgcccctg gtggtgcggc tgtattggcg  540
ttacaaggga ggtttgagat tctttctcta accggttctt tcttacctgg accggctcca  600
cctggatcca ctggtttaac tatttactta gctggtggtc aaggtcaggt tgttggagga  660
agcgtggtgg ggccattgat ggctgctggt ccggtgatgc taatcgctgc cacgttttct  720
aatgcgactt atgagagatt acctttggat gaggaagaag cggctgaaag aggtggcggt  780
ggaagcgacg gaggagtggt tccagggcag ctcgggggcg taggttcccc gctgagtagt  840
ggtggcggtg gaggccatgg gaaccaagga cttcccgcgt ataatatgcc cggaaatctt  900
gcttctaatg gcggtggagg aggacagatg agcggccaag aagcttacgg ttgggctcaa  960
gctaggtcag gattttaa                                                978
 
<210>10
<211>315
<212>PRT
<213>芜青
 
<400>l0
Met Ala Asn Pro Trp Trp Thr Gly Gln Val Asn Leu Ser Gly Leu Glu
1               5                   10                  15
Thr Thr Pro Pro Ser Ser Ser Gln Leu Lys Thr Pro Asp Leu His Ile
            20                  25                  30
Ser Met Asn Met Ala Met Asp Ser Gly His Asn Asn His His His His
        35                  40                  45
His Gln Glu Val Asn Thr Asn Asn Asn Asn Glu Asp Asp Arg Asp Asn
    50                  55                  60
Leu Ser Gly Asp Asp His Glu Pro Arg Glu Gly Ala Val Glu Ala Pro
65                  70                  75                  80
Thr Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys
                85                  90                  95
Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Lys Ser His
            100                 105                 110
Val Met Glu Ile Ala Ser Gly Thr Asp Val Ile Glu Thr Leu Ala Thr
        115                 120                 125
Phe Ala Arg Arg Arg GlnArg Gly Ile Cys Ile Leu Ser Gly Asn Gly
    130                 135                 140
Thr Val Ala Asn Val Thr Leu Arg Gln Pro Ser Val Ala Pro Val Ala
145                 150                 155                 160
Ala Ala Pro Gly Gly Ala Ala Val Leu Ala Leu Gln Gly Arg Phe Glu
                165                 170                 175
Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly
            180                 185                 190
Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val
        195                 200                 205
Gly Gly Ser Val Val Gly Pro Leu MetAla Ala Gly Pro Val Met Leu
    210                 215                 220
Ile Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Asp
225                 230                 235                 240
Glu Glu Glu Ala Ala Glu Arg Gly Gly Gly Gly Ser Asp Gly Gly Val
                245                 250                 255
Val Pro Gly Gln Leu Gly Gly Val Gly Ser Pro Leu Ser Ser Gly Gly
            260                 265                 270
Gly Gly Gly His Gly Asn Gln Gly Leu Pro Ala Tyr Asn Met Pro Gly
        275                 280                 285
Asn Leu Ala Ser Asn Gly Gly Gly Gly Gly Gln Met Ser Gly Gln Glu
    290                 295                 300
Ala Tyr Gly Trp Ala Gln Ala Arg Ser Gly Phe
305                 310                 315
 
<210>11
<211>843
<212>DNA
<213>大豆(Glycine max)
 
<400>11
atggccaacc ggtggtggac cgggtcggtg ggtctagaga actctggcca ctcgatgaaa    60
aaaccggatc tggggttttc catgaacgag agtacggtga cggggaacca tataggagaa    120
gaagatgagg acagagaaaa cagcgacgag ccaagagagg gagctattga cgtcgccacc    180
acgcgccgcc ctaggggacg tccaccgggc tccagaaaca agccgaaacc gccgatattc    240
gtcacccgag acagccctaa cgcgctgcgg agccacgtca tggagattgc cgtcggagcc    300
gacatcgccg actgcgtggc gcagttcgct cggaggcgcc agcgcggggt ttccattctc    360
agcggcagcg ggaccgtcgt caacgtcaat ctccggcaac ccacggcacc cggcgccgtc    420
atggcgctcc acggccgctt cgacatcctc tccctcaccg gctcctttct ccctgggccg    480
tcccctcccg gcgccaccgg gctcacaatc tacctcgccg gaggccaggg gcagatcgtc    540
ggcggcggag tggtgggccc gctcgtggcg gcgggccccg tattggtaat ggcggctact    600
ttttccaatg ctacgtatga aagattgcct ttagaggatg atgatcagga acaacacggc    660
ggcggaggcg gaggaggttc gccgcaggaa aaaaccgggg gtcccggcga ggcgtcgtcg    720
tcgatttcgg tttataacaa taatgttcct ccgagtttag gtcttccgaa tgggcaacat    780
ctgaaccatg aagcttattc ttctccttgg ggtcattctc ctcatgccag acctcctttc    840
taa                                                                  843
 
<210>12
<211>280
<212>PRT
<213>大豆
 
<400>12
Met Ala Asn Arg Trp Trp Thr Gly Ser Val Gly Leu Glu Asn Ser Gly
1               5                   10                  15
His Ser Met Lys Lys Pro Asp Leu Gly Phe Ser Met Asn Glu Ser Thr
            20                  25                  30
Val Thr Gly Asn His Ile Gly Glu Glu Asp Glu Asp Arg Glu Asn Ser
        35                  40                  45
Asp Glu Pro Arg Glu Gly Ala Ile Asp Val Ala Thr Thr Arg Arg Pro
    50                  55                  60
Arg Gly Arg Pro Pro Gly Ser Arg Asn Lys Pro Lys Pro Pro Ile Phe
65                  70                  75                  80
Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser His Val Met Glu Ile
                85                  90                  95
Ala Val Gly Ala Asp Ile Ala Asp Cys Val Ala Gln Phe Ala Arg Arg
            100                 105                 110
Arg Gln Arg Gly Val Ser Ile Leu Ser Gly Ser Gly Thr Val Val Asn
        115                 120                 125
Val Asn Leu Arg Gln Pro Thr Ala Pro Gly Ala Val Met Ala Leu His
    130                 135                 140
Gly Arg Phe Asp Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro
145                 150                 155                 160
Ser Pro Pro Gly Ala Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln
                165                 170                 175
Gly Gln Ile Val Gly Gly Gly Val Val Gly Pro Leu Val Ala Ala Gly
            180                 185                 190
Pro Val Leu Val Met Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg
        195                 200                 205
Leu Pro Leu Glu Asp Asp Asp Gln Glu Gln His Gly Gly Gly Gly Gly
    210                 215                 220
Gly Gly Ser Pro Gln Glu Lys Thr Gly Gly Pro Gly Glu Ala Ser Ser
225                 230                 235                 240
Ser Ile Ser Val Tyr Asn Asn Asn Val Pro Pro Ser Leu Gly Leu Pro
                245                 250                 255
Asn Gly Gln His Leu Asn His Glu Ala Tyr Ser Ser Pro Trp Gly His
            260                 265                 270
Ser Pro His Ala Arg Pro Pro Phe
        275                 280
 
<210>13
<211>834
<212>DNA
<213>陆地棉(Gossypium hirsutum)
<400>13
atggacccgg caggcaattc accagcttta aacaaacgtg accttgaaat ttctatgaac    60
gatgctaaca aaagtagaag caacggaaga ggggatgatg atgatgaaga tagagacacc    120
ggcgatgagc ctaaagaagg agcggtcgag gtcggtaacc gaagaccccg aggtcgtcca    180
ccgggatcca aaaacaagcc taaaccaccc atttttgtga caagggatag ccctaacgcg    240
ctccgtagtc atgttatgga agtcgcaagt ggaaccgatg tagccgagag tatagcccaa    300
ttcgctcgga gaagacaacg tggagtttgt ttgcttagcg gcagcggctc ggtcgccaac    360
gttactctaa gacaaccggc agcacccggc gcggtggttg cccttcatgg aaggtttgaa    420
attttgtctt tgaccggggc ttttctcccc ggaccggctc caccgggatc gacagggctc    480
accgtgtact tagctggtgg tcaaggacaa gttgttggag gaagtgttgt cggctcactt    540
atagcagcag ggcctgttat ggtcattgca gcaacttttt ccaacgcaac ttatgaaaga    600
ctgcctttag aagatgaaga agaagttgta agcgccggtc acggtggacc gatgcaaggc    660
ggagcaaacg attcaccgcc ggaaattggg agtagcggag gcggcggttc acacacaggt    720
ctgcctgatc catcttcact tccaatatac aatttgcctc ctaatttact ctcaaatgga    780
gggcaactag ggcatgaacc ctatggttgg acacatggga gaccacccta ttaa          834
<210>14
<211>277
<212>PRT
<213>陆地棉
 
<400>14
Met Asp Pro Ala Gly Asn Ser Pro Ala Leu Asn Lys Arg Asp Leu Glu
1               5                   10                  15
Ile Ser Met Asn Asp Ala Asn Lys Ser Arg Ser Asn Gly Arg Gly Asp
            20                  25                  30
Asp Asp Asp Glu Asp Arg Asp Thr Gly Asp Glu Pro Lys Glu Gly Ala
        35                  40                  45
Val Glu Val Gly Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys
    50                  55                  60
Asn Lys Pro Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala
65                  70                  75                  80
Leu Arg Ser His Val Met Glu Val Ala Ser Gly Thr Asp Val Ala Glu
                85                  90                  95
Ser Ile Ala Gln Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Leu Leu
            100                 105                 110
Ser Gly Ser Gly Ser Val Ala Asn Val Thr Leu Arg Gln Pro Ala Ala
        115                 120                 125
Pro Gly Ala ValVal Ala Leu His Gly Arg Phe Glu Ile Leu Ser Leu
    130                 135                 140
Thr Gly Ala Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu
145                 150                 155                 160
Thr Val Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val
                165                 170                 175
Val Gly Ser Leu Ile Ala Ala Gly Pro Val Met Val Ile Ala Ala Thr
            180                 185                 190
Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Asp Glu Glu Glu
        195                 200                 205
Val Val Ser Ala Gly His Gly Gly Pro Met Gln Gly Gly Ala Asn Asp
    210                 215                 220
Ser Pro Pro Glu Ile Gly Ser Ser Gly Gly Gly Gly Ser His Thr Gly
225                 230                 235                 240
Leu Pro Asp Pro Ser Ser Leu Pro Ile Tyr Asn Leu Pro Pro Asn Leu
                245                 250                 255
Leu Ser Asn Gly Gly Gln Leu Gly His Glu Pro Tyr Gly Trp Thr His
            260                 265                 270
Gly Arg Pro Pro Tyr
        275
 
<210>15
<211>813
<212>DNA
<213>莴苣(Lactuca sativa)
 
<400>15
atgtctaacc gatggtggac cggccaggtc aacgtggcag gcgtagaaac atcatctcag     60
gcgatcaaga aaccagatct gggtatctca atgaatgata ccaccacagg aagtgaagaa    120
gatgaaagag acaacaacag cgatgatcca agagaaggtg caattgaccc ttc taaccgt   180
aggccacgag gccgacctcc gggatccaaa aacaaaccaa agccaccgat tttcgtcacc    240
agagacagcc ctaacgccct ccgcagccac gtcatggagg tagcgagtgg tacagatatc    300
gcagaaagta tagctcaatt cagccgaaaa cgacaacgcg gtgtgtgtgt gatgagtgct    360
agcggcacag tcatgaatgt aaccctaaga caaccttcgg cacctggctc agtcatggct    420
ctacaaggcc ggttcgagat tttatcccta accggtgcct tcttaccggg tccttctcct    480
cctggatcca ccgggctcac tatatattta gctggtggcc agggccaggt tgtgggcggt    540
agcgtggtgg gatcattggt ggcatcagga ccagtgatgg ttatagcagc cacgttctcc    600
aacgccacat atgaaagact cccggttgag gaagaggagg aagcagatac cgtgacacct    660
gggctaggtg gtggtggatc accaccgcaa ctcggaatgg gtgatcagaa tccgatggca    720
gggtataata tgcagccgaa tttgatcccg aatggtggtg gacagatgaa ccatgaagct    780
tttgctttgg ctcatggccg gcccacgtac tag                                 813
 
<210>16
<211>270
<212>PRT
<213>莴苣
 
<400>16
Met Ser Asn Arg Trp Trp Thr Gly Gln Val Asn Val Ala Gly Val Glu
1               5                   10                  15
Thr Ser Ser Gln Ala Ile Lys Lys Pro Asp Leu Gly Ile Ser Met Asn
            20                  25                  30
Asp Thr Thr Thr Gly Ser Glu Glu Asp Glu Arg Asp Asn Asn Ser Asp
        35                  40                  45
Asp Pro Arg Glu Gly Ala Ile Asp Pro Ser Asn Arg Arg Pro Arg Gly
    50                  55                  60
Arg Pro Pro Gly Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Val Thr
65                  70                  75                  80
Arg Asp Ser Pro Asn Ala Leu Arg Ser His Val Met Glu Val Ala Ser
                85                  90                  95
Gly Thr Asp Ile Ala Glu Ser Ile Ala Gln Phe Ser Arg Lys Arg Gln
            100                 105                 110
Arg Gly Val Cys Val Met Ser Ala Ser Gly Thr Val Met Asn Val Thr
        115                 120                 125
Leu Arg Gln Pro Ser Ala Pro Gly Ser Val Met Ala Leu Gln Gly Arg
    130                 135                 140
Phe Glu Ile Leu Ser Leu Thr Gly Ala Phe Leu Pro Gly Pro Ser Pro
145                 150                 155                 160
Pro Gly Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln
                165                 170                 175
Val Val Gly Gly Ser Val Val Gly Ser Leu Val Ala Ser Gly Pro Val
            180                 185                 190
Met Val Ile Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro
        195                 200                 205
Val Glu Glu Glu Glu Glu Ala Asp Thr Val Thr Pro Gly Leu Gly Gly
    210                 215                 220
Gly Gly Ser Pro Pro Gln Leu Gly Met Gly Asp Gln Asn Pro Met Ala
225                 230                 235                 240
Gly Tyr Asn Met Gln Pro Asn Leu Ile Pro Asn Gly Gly Gly Gln Met
                245                 250                  255
Asn His Glu Ala Phe Ala Leu Ala His Gly Arg Pro Thr Tyr
            260                 265                 270
 
<210>17
<211>882
<212>DNA
<213>日本百脉根(Lotus japonicus)
 
<400>17
atggctaatc cttggtggac aagccaggga gggttctctg gggttgaccc aggaacccat   60
tcacctggct tgagcaaacg tcacacggac cttgtgatca atgaaaacag cagcggtggt  120
aatagagatg aagatgaaga tgataacagg gaagatgagc caaaagaagg tgcagttgag  180
gttggaactc ggagaccaag gggaagacca ccgggatcca agaacaagcc aagaccaccc  240
atctttgtaa caagggacag cccaaacgcc ctgaggagtc atgttatgga ggttgcagga  300
ggagctgatg tcgcagaaag cgtggcccag tttgcgagga ggcgccagcg tggggtttgt  360
gtgatgagcg ggagtggctc tgtggcaaac gttaccctga gacaacctgc ggctccgggt  420
gctgttgtag cactccatgg caggtttgag atcttatccc taactggggc gttcctacct  480
ggccctgctc ctccaggatc cactggtcta acagtgtatc tttctggagg acagggtcag  540
gtagtgggag ggagtgtggt ggggtctcta gttgcagcag gaccagttat ggtcattgct  600
gcaacttttg ctaatgcaac atatgagagg ttgccacttg atgatgatga tgagggacct  660
agtggggccg ctacggcggc aagcggagga ggaagtggat cgtctcctcc acctggaatt  720
ggaattggca gtggtggggg tcatcaactg caggctggac tggttccaga tccatcatcc  780
atgccgttgt ataatctgcc accaaatctg ttgtccaatg gaggaggagg acaagtgggg  840
catgatgctc ttgcttgggc tcatggaaga acaccttact ga                     882
 
<210>18
<211>293
<212>PRT
<213>日本百脉根
 
<400>18
Met Ala Asn Pro Trp Trp Thr Ser Gln Gly Gly Phe Ser Gly Val Asp
1               5                   10                  15
Pro Gly Thr His Ser Pro Gly Leu Ser Lys Arg His Thr Asp Leu Val
            20                  25                  30
Ile Asn Glu Asn Ser Ser Gly Gly Asn Arg Asp Glu Asp Glu Asp Asp
        35                  40                  45
Asn Arg Glu Asp Glu Pro Lys Glu Gly Ala Val Glu Val Gly Thr Arg
    50                  55                  60
Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro Arg Pro Pro
65                  70                  75                  80
Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser His Val Met
                85                  90                  95
Glu Val Ala Gly Gly Ala Asp Val Ala Glu Ser Val Ala Gln Phe Ala
            100                 105                 110
Arg Arg Arg Gln Arg Gly Val Cys Val Met Ser Gly Ser Gly Ser Val
        115                 120                 125
Ala Asn Val Thr Leu Arg Gln Pro Ala Ala Pro Gly Ala Val Val Ala
    130                 135                 140
Leu His Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Ala Phe Leu Pro
145                 150                 155                 160
Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Val Tyr Leu Ser Gly
                165                 170                 175
Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Ser Leu Val Ala
            180                 185                 190
Ala Gly Pro Val Met ValIle Ala Ala Thr Phe Ala Asn Ala Thr Tyr
        195                 200                 205
Glu Arg Leu Pro Leu Asp Asp Asp Asp Glu Gly Pro Ser Gly Ala Ala
    210                 215                 220
Thr Ala Ala Ser Gly Gly Gly Ser Gly Ser Ser Pro Pro Pro Gly Ile
225                 230                 235                 240
Gly Ile Gly Ser Gly Gly Gly His Gln Leu Gln Ala Gly Leu Val Pro
                245                 250                 255
Asp Pro Ser Ser Met Pro Leu Tyr Asn Leu Pro Pro Asn Leu Leu Ser
            260                 265                 270
Asn Gly Gly Gly Gly Gln Val Gly His Asp Ala Leu Ala Trp Ala His
        275                 280                 285
Gly Arg Thr Pro Tyr
    290
 
<210>19
<211>708
<212>DNA
<213>稻(Oryza sativa)
 
<400>19
atggcgtcca aggagccaag cggcgaccac gaccacgaga tgaacgggac cagcgccggg     60
ggcggcgagc ccaaggacgg cgcggtggtg accggccgca accggcgccc ccgcggacgg    120
ccgccgggct ccaagaacaa gcccaagccg cccatcttcg tgacgcggga cagcccgaac    180
gcgctgcgca gccacgtcat ggaggtggcc ggcggcgccg atgtcgccga gtccatcgcg    240
cacttcgcgc ggcggcggca gcgcggcgtc tgcgtgctca gcggggccgg caccgtgacc    300
gacgtggccc tgcgccagcc ggccgcgccg agcgccgtgg tggcgctccg tgggcggttc    360
gagatcctgt ccctgacggg gacgttcctg ccggggccgg cgccgccggg ctccaccggg    420
ctgaccgtgt acctcgccgg cgggcagggg caggtggtgg gcggcagcgt ggtggggacg    480
ctcaccgcgg cggggccggt catggtgatc gcctccacct tcgccaacgc cacctacgag    540
aggctgccgc tggatcagga ggaggaggaa gcagcggcag gcggcatgat ggcgccgccg    600
ccactcatgg ccggcgccgc cgatccacta cttttcggcg ggggaatgca cgacgccggg    660
cttgctgcat ggcaccatgc ccgccctccg ccgccgccgc cctactag                 708
<210>20
<211>235
<212>PRT
<213>稻
 
<400>20
Met Ala Ser Lys Glu Pro Ser Gly Asp His Asp His Glu Met Asn Gly
1               5                   10                  15
Thr Ser Ala Gly Gly Gly Glu Pro Lys Asp Gly Ala Val Val Thr Gly
            20                  25                  30
Arg Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro
        35                  40                  45
Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser
    50                  55                  60
His Val Met Glu Val Ala Gly Gly Ala Asp Val Ala Glu Ser Ile Ala
65                  70                  75                  80
His Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Ala
                85                  90                  95
Gly Thr Val Thr Asp Val Ala Leu Arg Gln Pro Ala Ala Pro Ser Ala
            100                 105                 110
Val Val Ala Leu Arg Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Thr
        115                 120                 125
Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Val Tyr
    130                 135                 140
Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Thr
145                 150                 155                 160
Leu Thr Ala Ala Gly Pro Val Met Val Ile Ala Ser Thr Phe Ala Asn
                165                 170                 175
Ala Thr Tyr Glu Arg Leu Pro Leu Asp Gln Glu Glu Glu Glu Ala Ala
            180                 185                 190
Ala Gly Gly Met Met Ala Pro Pro Pro Leu Met Ala Gly Ala Ala Asp
        195                 200                 205
Pro Leu Leu Phe Gly Gly Gly Met His Asp Ala Gly Leu Ala Ala Trp
    210                 215                 220
His His Ala Arg Pro Pro Pro Pro Pro Pro Tyr
225                 230                 235
 
<210>21
<211>801
<212>DNA
<213>稻
 
<400>21
atgggcttgc cggagcagcc gtccggctcg tcgggcccca aggcggagct cccggtggcc     60
aaggagccgg aggcgagccc gacggggggc gcggcggcgg accacgccga cgagaacaac    120
gaatccggcg gcggcgagcc gcgggagggc gccgtggtgg cggcgcccaa ccggcgcccc    180
cgcggccgcc cgccgggctc caagaacaag ccgaagccgc ccatcttcgt gacgcgcgac    240
agccccaacg cgctgcgcag tcacgtcatg gaggtggccg gcggcgccga cgtcgccgac    300
gccatcgcgc agttctcgcg ccgccgccag cgcggcgtct gcgtgctcag cggcgccggg    360
acggtcgcca acgtcgcgct gcgccagccg tcggcgcccg gcgccgtcgt cgccctgcac    420
ggccgcttcg agatcctctc cctcaccggc accttcctcc caggcccggc gcctccgggt    480
tccacggggc tcaccgtcta cctcgccggc ggccagggcc aggttgtcgg cggcagcgtc    540
gtggggtcgc tcatcgccgc gggcccggtc atggtgatcg cgtccacgtt cgccaacgcc    600
acctacgagc gcctgccact ggaggaagaa gaggagggct caggcccgcc catgcccggc    660
ggcgccgagc ccctcatggc cggcggccac ggcatcgccg acccttcggc gctgccaatg    720
ttcaacctgc cgccgagcaa cgggctcggc ggcggcggcg acggcttccc atgggcggcg    780
cacccctgcc caccgtactg a                                              800
 
<210>22
<211>266
<212>PRT
<213>稻
 
<400>22
Met Gly Leu Pro Glu Gln Pro Ser Gly Ser Ser Gly Pro Lys Ala Glu
1               5                   10                      15
Leu Pro Val Ala Lys Glu Pro Gl u Ala Ser Pro Thr Gly Gly Ala Ala
            20                  25                  30
Ala Asp His Ala Asp Glu Asn Asn Glu Ser Gly Gly Gly Glu Pro Arg
        35                  40                  45
Glu Gly Ala Val Val Ala Ala Pro Asn Arg Arg Pro Arg Gly Arg Pro
    50                  55                  60
Pro Gly Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Val Thr Arg Asp
65                  70                  75                  80
Ser Pro Asn Ala Leu Arg Ser His Val Met Glu Val Ala Gly Gly Ala
                85                  90                  95
Asp Val Ala Asp Ala Ile Ala Gln Phe Ser Arg Arg Arg Gln Arg Gly
            100                 105                 110
Val Cys Val Leu Ser Gly Ala Gly Thr Val Ala Asn Val Ala Leu Arg
        115                 120                 125
Gln Pro Ser Ala Pro Gly Ala Val Val Ala Leu His Gly Arg Phe Glu
    130                 135                 140
Ile Leu Ser Leu Thr Gly Thr Phe Leu Pro Gly Pro Ala Pro Pro Gly
145                 150                 155                 160
Ser Thr Gly Leu Thr Val Tyr Leu Ala Gly Gly Gln Gly Gln Val Val
                165                 170                 175
Gly Gly Ser Val Val Gly Ser Leu Ile Ala Ala Gly Pro Val Met Val
            180                 185                 190
Ile Ala Ser Thr Phe Ala Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu
        195                 200                 205
Glu Glu Glu Glu Gly Ser Gly Pro Pro Met Pro Gly Gly Ala Glu Pro
    210                 215                 220
Leu Met Ala Gly Gly His Gly Ile Ala Asp Pro Ser Ala Leu Pro Met
225                 230                 235                 240
Phe Asn Leu Pro Pro Ser Asn Gly Leu Gly Gly Gly Gly Asp Gly Phe
                245                 250                 255
Pro Trp Ala Ala His Pro Cys Pro Pro Tyr
            260                 265
 
<210>23
<211>855
<212>DNA
<213>似欧洲山杨(Populus tremuloides)
 
<400>23
atggcaaacc ggtggtggac agggcaagtg ggattgccgg ggatggacac atcaaccagt   60
tcatcatctc caatgaaaaa gccagatcta ggtatatcca tgtccaacaa caatagagaa  120
gccaccgaga gtggtgctgg caaagaagat gagcaagaag acgaaagaga aaatagcgac  180
gagcctagag aaggcgctat agatatcgcc tctcgccgcc ctagaggccg tccaccaggg  240
tccaagaaca agcctaagcc accaattttc gttactcgag acagccctaa tgcactcaag  300
agtcatgtga tggagatagc tagtggatct gatatagctg aaaatttagc ttgttttgca  360
aggaagagac aaagaggagt ttgtgtgctt agtggaagtg gtatggtaac caatgtaacc  420
ctcaagcaac cttctgcctc aggtgctgtt atggctctcc atggtaggtt tgagattttg  480
tcactcactg gagcgttctt gcctggacca gccccacctg gagcgacagg actaactata  540
tatttagccg gagggcaagg acaagtggta ggaggcagtg tggtaggatc actagttgca  600
tcaggaccgg taatggttat tgctgcaaca ttttcaaatg ctacttatga gagattgcca  660
ctagaagatg aagaggaagg cagtggtggc gcacaagggc agctcggtgg cggcaacggt  720
agcggtgagg gtaatggtgg gggcatgggg gatccagcaa catcaatgcc agtttatcaa  780
ttgccaaata tggtgcctaa tggacaattg aaccatgaag gatatgggtg ggctcacggc  840
agaccaccct attag                                                   855
 
<210>24
<211>284
<212>PRT
<213>似欧洲山杨
 
<400>24
Met Ala Asn Arg Trp Trp Thr Gly Gln Val Gly Leu Pro Gly Met Asp
1               5                   10                  15
Thr Ser Thr Ser Ser Ser Ser Pro Met Lys Lys Pro Asp Leu Gly Ile
            20                  25                  30
Ser Met Ser Asn Asn Asn Arg Glu Ala Thr Glu Ser Gly Ala Gly Lys
        35                  40                  45
Glu Asp Glu Gln Glu Asp Glu Arg Glu Asn Ser Asp Glu Pro Arg Glu
    50                  55                  60
Gly Ala Ile Asp Ile Ala Ser Arg Arg Pro Arg Gly Arg Pro Pro Gly
65                  70                  75                  80
Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro
                85                  90                  95
Asn Ala Leu Lys Ser His Val Met Glu Ile Ala Ser Gly Ser Asp Ile
            100                 105                 110
Ala Glu Asn Leu Ala Cys Phe Ala Arg Lys Arg Gln Arg Gly Val Cys
        115                 120                 125
Val Leu Ser Gly Ser Gly Met Val Thr Asn Val Thr Leu Lys Gln Pro
    130                 135                 140
Ser Ala Ser Gly Ala Val Met Ala Leu His Gly Arg Phe Glu Ile Leu
145                 150                 155                 160
Ser Leu Thr Gly Ala Phe Leu Pro Gly Pro Ala Pro Pro Gly Ala Thr
                165                 170                 175
Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly
            180                 185                 190
Ser Val Val Gly Ser Leu Val Ala Ser Gly Pro Val Met Val Ile Ala
        195                 200                 205
Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Asp Glu
    210                 215                 220
Glu Glu Gly Ser Gly Gly Ala Gln Gly Gln Leu Gly Gly Gly Asn Gly
225                 230                 235                 240
Ser Gly Glu Gly Asn Gly Gly Gly Met Gly Asp Pro Ala Thr Ser Met
                245                 250                 255
Pro Val Tyr Gln Leu Pro Asn Met Val Pro Asn Gly Gln Leu Asn His
            260                 265                 270
Glu Gly Tyr Gly Trp Ala His Gly Arg Pro Pro Tyr
        275                 280
 
<210>25
<211>885
<212>DNA
<213>马铃薯(Solanum tuberosum)
 
<400>25
atgtcaaacc catggtggac aggccaagta ggtttacaag gagttgaaac atcatcatcc   60
gcgggttcgc cttctctcaa gaagccagat ctaggcgtat caatgaacga tatagtgggt  120
ggtagtggta gtcatgatga agatagggac catagcgacg accctaaaga gggtgcagtc  180
gaagtagcca ctcgtcgacc cagaggtcga ccagctggct caaagaacaa acctaaacca  240
ccaatatttg ttacaaggga tagccctaac gcacttagaa gccacgtaat ggaagttgct  300
aatggagctg atgtggcgga aagtatagct caatttgcta ggaaaagaca aagaggtgtt  360
tgtgttttga gtgctactgg aactgttact aatgtaaccc taagacaacc atctgctcct  420
ggagctgtca tggcattaca cggccggttc gagatcttat cgttgaccgg agctttctta  480
cctggacccg cccctcctgg atcaacaggg ttgactatat acctagcagg aggacaagga  540
caagttgtgg gaggaagtgt agtagggtct ttagtggctt ccggaccagt tatggtaatt  600
gcatcaactt tttttaatgc aacatatgag aggctacctt tggaggagga ggaagaaggc    660
ggtggaacgg tggcccaagg acaacttggt ggtggtggat cgccaccggg aatgggagga    720
agtggtggtg gtggtggagg acaacaacaa caaggtggtg gtggtatggg tgatattcca    780
tcatcaaata tgccagtata taatttgcca ccaaatttgc taccaaatgg tggacaaatg    840
aaccatgaag catttggttg ggcacatgga cgccctcctt tttaa                    885
 
<210>26
<211>294
<212>PRT
<213>马铃薯
 
<400>26
Met Ser Asn Pro Trp Trp Thr Gly Gln Val Gly Leu Gln Gly Val Glu
1               5                   10                  15
Thr Ser Ser Ser Ala Gly Ser Pro Ser Leu Lys Lys Pro Asp Leu Gly
            20                  25                  30
Val Ser Met Asn Asp Ile Val Gly Gly Ser Gly Ser His Asp Glu Asp
        35                  40                  45
Arg Asp His Ser Asp Asp Pro Lys Glu Gly Ala Val Glu Val Ala Thr
    50                  55                  60
Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro
65                  70                  75                  80
Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser His Val
                85                  90                  95
Met Glu Val Ala Asn Gly Ala Asp Val Ala Glu Ser Ile Ala Gln Phe
            100                 105                 110
Ala Arg Lys Arg Gln Arg Gly Val Cys Val Leu Ser Ala Thr Gly Thr
        115                 120                 125
Val Thr Asn Val Thr Leu Arg Gln Pro Ser Ala Pro Gly Ala Val Met
    130                 135                 140
Ala Leu His Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Ala Phe Leu
145                 150                 155                 160
Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Ile Tyr Leu Ala
                165                 170                 175
Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Ser Leu Val
            180                 185                 190
Ala Ser Gly Pro Val Met Val Ile Ala Ser Thr Phe Phe Asn Ala Thr
        195                 200                 205
Tyr Glu Arg Leu Pro Leu Glu Glu Glu Glu Glu Gly Gly Gly Thr Val
    210                 215                 220
Ala Gln Gly Gln Leu Gly Gly Gly Gly Ser Pro Pro Gly Met Gly Gly
225                 230                 235                 240
Ser Gly Gly Gly Gly Gly Gly Gln Gln Gln Gln Gly Gly Gly Gly Met
                245                 250                 255
Gly Asp Ile Pro Ser Ser Asn Met Pro Val Tyr Asn Leu Pro Pro Asn
            260                 265                 270
Leu Leu Pro Asn Gly Gly Gln Met Asn His Glu Ala Phe Gly Trp Ala
        275                 280                 285
His Gly Arg Pro Pro Phe
    290
 
<210>27
<211>939
<212>DNA
<213>天蓝遏蓝菜
 
<400>27
atggcgaatc catggtggac aggacaagtg aatctctccg gccttgaaac gacgccgcct  60
ggttcctctc agttaaagaa atcagatctc cacatctcca tgaacatggc catggactca  120
ggtcataaca accatcatca tcaccaagaa gtcgacaaca ataacaacaa cgatgacgac  180
agagataact tgagcggcga tgaacacgag ccacgtgaag gagccgtaga agcccccacg  240
cgccgtccac gtggacgtcc tgctggttcc aagaacaaac caaagccacc gatctttgtc  300
acgcgcgatt ctccaaacgc tctcaagagc catgtcatgg agatcgctag tgggactgac  360
gtcatcgaaa ccctagctac tttcgctagg cggcgccaac gtggcatctg catcttgagc  420
ggcaacggca cggtggctaa cgtcactctc cgccaaccat catctgccgc agttgctgcg  480
gctcccgggg gtgcggcggt tttggcttta caagggaggt ttgagattct ctctttaaca  540
ggatcgttct tgcctggacc tgctccacct ggatccaccg gtttaaccat ctacttagcc  600
ggtggtcaag gtcaggtcgt tggaggaagt gtggtggggc cat tgatggc ggctggtccg 660
gttatgttaa tcgcggccac gttttctaat gcgacttacg agagattgcc tttggaggag  720
gaagaggcgg ctgagagagg cggtggagga ggcagcgtcc caggacaact cggaggggga  780
ggctcgccgc tgagtagcgg tggtggtgga ggggatggca atcaaggact tccggtgtac  840
aatatgcccg gaaatcttgt ttctaatggt ggcggaggcg gaggacagat gagtggccaa  900
gaagcttatg gttgggctca agctaggtca ggattttaa                         939
 
<210>28
<211>312
<212>PRT
<213>天蓝遏蓝菜
 
<400>28
Met Ala Asn Pro Trp Trp Thr Gly Gln Val Asn Leu Ser Gly Leu Glu
1               5                   10                  15
Thr Thr Pro Pro Gly Ser Ser Gln Leu Lys Lys Ser Asp Leu His Ile
            20                  25                  30
Ser Met Asn Met Ala Met Asp Ser Gly His Asn Asn His His His His
        35                  40                  45
Gln Glu Val Asp Asn Asn Asn Asn Asn Asp Asp Asp Arg Asp Asn Leu
    50                  55                  60
Ser Gly Asp Glu His Glu Pro Arg Glu Gly Ala Val Glu Ala Pro Thr
65                  70                  75                  80
Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro
                85                  90                  95
Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Lys Ser His Val
            100                 105                 110
Met Glu Ile Ala Ser Gly Thr Asp Val Ile Glu Thr Leu Ala Thr Phe
        115                 120                 125
Ala Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu Ser Gly Asn Gly Thr
    130                 135                 140
Val Ala Asn Val Thr Leu Arg Gln Pro Ser Ser Ala Ala Val Ala Ala
145                 150                 155                 160
Ala Pro Gly Gly Ala Ala Val Leu Ala Leu Gln Gly Arg Phe Glu Ile
                165                 170                 175
Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser
            180                 185                  190
Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly
        195                 200                 205
Gly Ser Val Val Gly Pro Leu Met Ala Ala Gly Pro Val Met Leu Ile
    210                 215                 220
Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Glu
225                 230                 235                 240
Glu Glu Ala Ala Glu Arg Gly Gly Gly Gly Gly Ser Val Pro Gly Gln
                245                 250                 255
Leu Gly Gly Gly Gly Ser Pro Leu Ser Ser Gly Gly Gly Gly Gly Asp
            260                 265                 270
Gly Asn Gln Gly Leu Pro Val Tyr Asn Met Pro Gly Asn Leu Val Ser
        275                 280                 285
Asn Gly Gly Gly Gly Gly Gly Gln Met Ser Gly Gln Glu Ala Tyr Gly
    290                 295                 300
Trp Ala Gln Ala Arg Ser Gly Phe
305                 310
 
<210>29
<211>876
<212>DNA
<213>葡萄(Vitis vinifera)
 
<400>29
atggcgaacc ggtggtgggc tgggcaggtg ggtctgcaag gtgtagatac ctcatcagct     60
tcacctgcaa tgaagaaacc agatctggga atatccatga atgaaaatgg aggaagcggg    120
agcggaggcg gaggagagga agaagaggaa aaagaaaaca gtgatgagcc cagagagggt    180
gcaattgagg tggctacgcg caggcctagg ggccggccgc ctggctccaa gaacaagcca    240
aaacctccga tttttgtgac aagggacagc cctaacgctc tgcgcagcca cgttatggag    300
gtggcaaacg gctccgacat cacagaaagc atagcccaat tcgcgagaag gcggcaacga    360
ggcgtctgcg tgctcagcgc aagtgggaca gtcatgaacg taacgcttcg ccagccttct    420
gcccctggtg gtgcagttat ggcacttcat ggccgattcg aaattctttc cttaaccggc    480
gcgttcctac cgggaccagc gccaccaggc tccactggac taaccatata cctagcaggc    540
ggtcaagctc aggtcgtggg tggtagcgtg gtgggttcac tcatagcggc aggtccagtt    600
atggtgattg cagctacctt ttcgaatgca acctacgaga ggctccccct agaagacgaa    660
gaagaggcgg gcagcgcagc acaggagcag ctcgctggcg gcggaggcgg tggtgggtca    720
ccgccaggga ttggcggcag tggggggcag cagcaggcag ggatggcaga tccttcctcc    780
atgccggttt ataatttgcc accaaatttg cttccaaatg gtggacaact gaaccatgat    840
gcttatggtt gggcacatgg gcgccagcct tactag                              876
 
<210>30
<211>291
<212>PRT
<213>葡萄
 
<400>30
Met Ala Asn Arg Trp Trp Ala Gly Gln Val Gly Leu Gln Gly Val Asp
1               5                   10                  15
Thr Ser Ser Ala Ser Pro Ala Met Lys Lys Pro Asp Leu Gly Ile Ser
            20                  25                  30
Met Asn Glu Asn Gly Gly Ser Gly Ser Gly Gly Gly Gly Glu Glu Glu
        35                  40                  45
Glu Glu Lys Glu Asn Ser Asp Glu Pro Arg Glu Gly Ala Ile Glu Val
    50                  55                  60
Ala Thr Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro
65                  70                  75                  80
Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser
                85                  90                  95
His Val Met Glu Val Ala Asn Gly Ser Asp Ile Thr Glu Ser Ile Ala
            100                 105                 110
Gln Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Ala Ser
        115                 120                 125
Gly Thr Val Met Asn Val Thr Leu Arg Gln Pro Ser Ala Pro Gly Gly
    130                 135                 140
Ala Val Met Ala Leu His Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly
145                 150                 155                 160
Ala Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Ile
                165                 170                 175
Tyr Leu Ala Gly Gly Gln Ala Gln Val Val Gly Gly Ser Val Val Gly
            180                 185                 190
Ser Leu Ile Ala Ala Gly Pro Val Met Val Ile Ala Ala Thr Phe Ser
        195                 200                 205
Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Asp Glu Glu Glu Ala Gly
    210                 215                 220
Ser Ala Ala Gln Glu Gln Leu Ala Gly Gly Gly Gly Gly Gly Gly Ser
225                 230                 235                 240
Pro Pro Gly Ile Gly Gly Ser Gly Gly Gln Gln Gln Ala Gly Met Ala
                245                 250                 255
Asp Pro Ser Ser Met Pro Val Tyr Asn Leu Pro Pro Asn Leu Leu Pro
            260                 265                 270
Asn Gly Gly Gln Leu Asn His AspAla Tyr Gly Trp Ala His Gly Arg
        275                 280                 285
Gln Pro Tyr
    290
 
<210>31
<211>783
<212>DNA
<213>葡萄
 
<400>31
atggacccgg cagctgtttc gccgatgcta aataaacgcg atcgcgagat atcaatcaac    60
gataaccccg gcacaggaga cgatgaagaa gagaaagaca acgaaggcga gcccacggag    120
ggtgcagtag aagtcggcac tcgtagacca agaggtcgcc cgcctggatc caaaaacaag    180
cccaaacccc ctattttcgt cacgcgcgac agcccgaacg cccttcggag ccacgtgatg    240
gaggtggccg gcggccacga cgttgccgaa agcgtcgccc agttcgcccg taggcgtcaa    300
cgaggggtct gcgtcctcag cggcagcggc tccgtagcca acgtgactct gagacagccc    360
gccgcgcctg gcgccgtggt ggcactccat ggaagattcg agattctgtc cctaacagga    420
gcattcctcc ccggacctgc ccctcccggc tccactggac tcaccgtgta cctcgccgga    480
ggtcagggcc aggttgtggg aggaagtgtg gttggatcac tggtagcggc aggcccggtg    540
atagtgatag ccgccacttt tgcgaacgca acatacgaaa gactgcctct ggaagaagaa    600
gaagaaggtg ggcaggcgcc gccgccgagt ggttcgccgc ctgcaattgg aagcagtggt    660
ggacagcatc actctggcct gccggagctg cccatataca atctgccacc gaacctactc    720
cctaacggcg gccaattgag tcatgacccc tactcatggg ctcatgctcg gcccccttac    780
tga                                                                  783
 
<210>32
<211>260
<212>PRT
<213>葡萄
 
<400>32
Met Asp Pro Ala Ala Val Ser Pro Met Leu Asn Lys Arg Asp Arg Glu
1               5                   10                  15
Ile Ser Ile Asn Asp Asn Pro Gly Thr Gly Asp Asp Glu Glu Glu Lys
            20                  25                  30
Asp Asn Glu Gly Glu Pro Thr Glu Gly Ala Val Glu Val Gly Thr Arg
        35                  40                  45
Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro Lys Pro Pro
    50                  55                  60
Ile Phe Val Thr Arg Asp Ser Pro Ash Ala Leu Arg Ser His Val Met
65                  70                  75                  80
Glu Val Ala Gly Gly His Asp Val Ala Glu Ser Val Ala Gln Phe Ala
                85                  90                  95
Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Ser Gly Ser Val
            100                 105                 110
Ala Asn Val Thr Leu Arg Gln Pro Ala Ala Pro Gly Ala Val Val Ala
        115                 120                 125
Leu His Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Ala Phe Leu Pro
    130                 135                 140
Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Val Tyr Leu Ala Gly
145                 150                 155                 160
Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Ser Leu Val Ala
                165                 170                 175
Ala Gly Pro Val Ile Val Ile Ala Ala Thr Phe Ala Asn Ala Thr Tyr
            180                 185                 190
Glu Arg Leu Pro Leu Glu Glu Glu Glu Glu Gly Gly Gln Ala Pro Pro
        195                 200                 205
Pro Ser Gly Ser Pro Pro Ala Ile Gly Ser Ser Gly Gly Gln His His
    210                 215                 220
Ser Gly Leu Pro Glu Leu Pro Ile Tyr Asn Leu Pro Pro Asn Leu Leu
225                 230                 235                 240
Pro Asn Gl y Gly Gln Leu Ser His Asp Pro Tyr Ser Trp Ala His Ala
                 245                 250                 255
Arg Pro Pro Tyr
            260
 
<210>33
<211>810
<212>DNA
<213>玉蜀黍(Zea mays)
 
<400>33
atggcacctt cctccaagga cggcgccacc gccaccgagc agccgacgag cggcgacgac     60
gaccgggaga acggcggcac gggcgagccc aaggaaggcg cggtggtggc gggcaaccgg    120
cggccccgcg ggcggccgcc ggggtccaag aacaagccca agccgcccat cttcgtgacg    180
cgcgacagcc ccaacgcgct gcgcagccac gtgatggagg tggccggcgg cgccgacgtg    240
gccgagtcca tcgcccactt cgcgcgccgc aggcagcgcg gcgtgtgcgt gctcagcggc    300
gcgggcaccg tcgccgacgt ggcgctccgc cagcccgcgg ctccgggcgc cgtggtcgcc    360
ctccgcggcc gcttcgagat cctctcgctc accggcacgt tcctgccggg ccccgcgccg    420
ccgggctcca cggggctcac cgtgtacctc gcgggcggcc aggggcaggt cgtcggcggc    480
agcgtcgtcg gcacgctcac cgcggcgggg cccgtcatgg tgatggcgtc cacgttcgcc    540
aacgccacct acgagaggct gccgctggac gacgccgacg aggagcccgc cgggcagcag    600
gcggcgcagc tgcctcccgg accgggcgga gggcagccta tggtaatggg cgggatggcc    660
gacccctcag cggtgccaat gttcggcggc gccggcggtg tgccgccaag cctcatgcca    720
gcaggggccg cagccgcctc ctccggtgcg ggcctgcagc tcgggcacga ccgacttgca    780
tgggctcatg cacggccacc gccatactag                                     810
<210>34
<211>269
<212>PRT
<213>玉蜀黍
 
<400>34
Met Ala Pro Ser Ser Lys Asp Gly Ala Thr Ala Thr Glu Gln Pro Thr
1               5                   10                  15
Ser Gly Asp Asp Asp Arg Glu Asn Gly Gly Thr Gly Glu Pro Lys Glu
            20                  25                  30
Gly Ala Val Val Ala Gly Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly
        35                  40                  45
Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro
    50                  55                  60
Asn Ala Leu Arg Ser His Val Met Glu Val Ala Gly Gly Ala Asp Val
65                  70                  75                  80
Ala Glu Ser Ile Ala His Phe Ala Arg Arg Arg Gln Arg Gly Val Cys
                85                  90                  95
Val Leu Ser Gly Ala Gly Thr Val Ala Asp Val Ala Leu Arg Gln Pro
            100                 105                 110
Ala Ala Pro Gly Ala Val Val Ala Leu Arg Gly Arg Phe Glu Ile Leu
        115                 120                 125
Ser Leu Thr Gly Thr Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr
    130                 135                 140
Gly Leu Thr Val Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly
145                 150                 155                 160
Ser Val Val Gly Thr Leu Thr Ala Ala Gly Pro Val Met Val Met Ala
                165                 170                 175
Ser Thr Phe Ala Asn Ala Thr Tyr Glu Arg Leu Pro Leu Asp Asp Ala
            180                 185                 190
Asp Glu Glu Pro Ala Gly Gln Gln Ala Ala Gln Leu Pro Pro Gly Pro
        195                 200                 205
Gly Gly Gly Gln Pro Met Val Met Gly Gly Met Ala Asp Pro Ser Ala
    210                 215                 220
Val Pro Met Phe Gly Gly Ala Gly Gly Val Pro Pro Ser Leu Met Pro
225                 230                 235                 240
Ala Gly Ala Ala Ala Ala Ser Ser Gly Ala Gly Leu Gln Leu Gly His
                245                 250                 255
Asp Arg Leu Ala Trp Ala Hi s Ala Arg Pro Pro Pro Tyr
            260                 265
 
<210>35
<211>2194
<212>DNA
<213>稻
 
<400>35
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct    60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact    120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt    180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc    240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata    300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga    360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt    420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat    480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag    540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt    600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc    660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat    720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa    780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca    840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag    900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa    960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata   1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag   1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc   1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt   1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct   1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt   1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt   1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt   1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa   1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt   1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga   1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt   1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc   1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct   1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg   1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg   1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa   1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct   2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg   2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc   2160
ttggtgtagc ttgccacttt caccagcaaa gttc                               2194
 
<210>36
<211>173
<212>PRT
<213>人工序列
<220>
<223>包含在SEQ ID NO:2中的保守结构域
 
<400>36
Glu Pro Arg Glu Gly Ala Val Glu Ala Pro Thr Arg Arg Pro Arg Gly
1               5                   10                  15
Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Val Thr
            20                  25                  30
Arg Asp Ser Pro Asn Ala Leu Lys Ser His Val Met Glu Ile Ala Ser
        35                  40                  45
Gly Thr Asp Val Ile Glu Thr Leu Ala Thr Phe Ala Arg Arg Arg Gln
    50                  55                  60
Arg Gly Ile Cys Ile Leu Ser Gly Asn Gly Thr Val Ala Asn Val Thr
65                  70                  75                  80
Leu Arg Gln Pro Ser Thr Ala Ala Val Ala Ala Ala Pro Gly Gly Ala
                85                  90                  95
Ala Val Leu Ala Leu Gln Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly
            100                 105                 110
Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Ile
        115                 120                 125
Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly
    130                 135                 140
Pro Leu Met Ala Ala Gly Pro Val Met Leu Il e Ala Ala Thr Phe Ser
145                 150                 155                 160
Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Glu Glu Glu
                165                 170
 
<210>37
<211>14
<212>PRT
<213>人工序列
 
<220>
<223>AT hook
 
<220>
<221>VARIANT
<222>(8)..(8)
<223>/置换=″Ala″
 
<220>
<221>VARIANT
<222>(11)..(11)
<223>/置换=″Arg″
<400>37
Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro
1               5                   10
 
<210>38
<211>125
<212>PRT
<213>人工序列
 
<220>
<223>包含在SEQ ID NO:2中的PPC结构域(DUF296)
 
<400>38
Leu Lys Ser His Val Met Glu Ile Ala Ser Gly Thr Asp Val Ile Glu
1               5                   10                  15
Thr Leu Ala Thr Phe Ala Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu
            20                  25                  30
Ser Gly Asn Gly Thr Val Ala Asn Val Thr Leu Arg Gln Pro Ser Thr
        35                  40                  45
Ala Ala Val Ala Ala Ala Pro Gly Gly Ala Ala Val Leu Ala Leu Gln
    50                  55                  60
Gly ArgPhe Glu Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro
65                  70                  75                  80
Ala Pro Pro Gly Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln
                85                  90                  95
Gly Gln Val Val Gly Gly Ser Val Val Gly Pro Leu Met Ala Ala Gly
            100                 105                 110
Pro Val Met Leu Ile Ala Ala Thr Phe Ser Asn Ala Thr
        115                 120                 125
 
<210>39
<211>52
<212>DNA
<213>人工序列
 
<220>
<223>引物:prm8135
 
<400>39
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc gaatccatgg tg    52
 
<210>40
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物:prm8136
 
<400>40
ggggaccact ttgtacaaga aagctgggtt aaaaaccatt ttaacgcacg    50
 
<210>41
<211>948
<212>DNA
<213>甘蓝(Brassica oleracea)
 
<400>41
atgcgaaatc catggtggac aggacaagtg aatctctcca gtctcgaaac gacgccgccg    60
agttcctctc agttaaagac accagatctc cacatctcca tgaacatggc catggtctca    120
ggtcataaca accaccatca tcatcaccaa gaagtcaaca ccaacaacaa caacgaagac    180
gatagagaca acttgagcgg cgacgaccgc gagccacgtg aaggagccgt ggaagctccc    240
acgcgccgac cacgtggacg tcctgctggt tccaagaaca aaccaaagcc accaatcttt    300
gtcacgcgtg attctccaaa cgctctcaag agccatgtca tggagatcgc tagtgggact    360
gatgtcatag aaaccctagc tactttcgct aggcggcgcc aacgtggcat ctgcatcttg    420
agcggtaacg gcacggtggc taacgtcaca ctccgtcaac catcagtggc tcccgttgca    480
gctgcccctg gtggtgcggc tgtattggcg ttacaaggga ggtttgagat tctttctcta    540
accggttctt tcttacctgg accggctcca cctggatcca ctggtttaac tatttactta    600
gctggtggtc aaggtcaggt tgttggagga agcgtggtgg gggcattgat ggctgctggt    660
ccggtgatgc taatcgctgc cacgttttct aatgcgactt atgagagatt acctttggat    720
gaggaagaag cggctgaaag aggtggcggt ggaagcgacg gaggagtggt tccagggcag    780
ctcgggggcg taggttcccc gctgagtagt ggtggcggtg gaggccacgg gaaccaagga    840
cttcccgcat ataatatgcc cggaaacctt gcttctaatg gcggtggagg aggacagatg    900
agcagccaag aagcgtacgg ttgggctcaa gctaggtcag gattttaa                 948
 
<210>42
<211>315
<212>PRT
<213>甘蓝
 
<400>42
 
Met Arg Asn Pro Trp Trp Thr Gly Gln Val Asn Leu Ser Ser Leu Glu
1               5                   10                  15
Thr Thr Pro Pro Ser Ser Ser Gln Leu Lys Thr Pro Asp Leu His Ile
            20                  25                  30
Ser Met Asn Met Ala Met Val Ser Gly His Asn Asn His His His His
        35                  40                  45
His Gln Glu Val Asn Thr Asn Asn Asn Asn Glu Asp Asp Arg Asp Asn
    50                  55                  60
Leu Ser Gly Asp Asp Arg Glu Pro Arg Glu Gly Ala Val Glu Ala Pro
65                  70                  75                  80
Thr Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys
                85                  90                  95
Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Lys Ser His
            100                 105                 110
Val Met Glu Ile Ala Ser Gly Thr Asp Val Ile Glu Thr Leu Ala Thr
        115                 120                 125
Phe Ala Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu Ser Gly Asn Gly
    130                 135                 140
Thr ValAla Asn Val Thr Leu Arg Gln Pro Ser Val Ala Pro Val Ala
145                 150                 155                 160
Ala Ala Pro Gly Gly Ala Ala Val Leu Ala Leu Gln Gly Arg Phe Glu
                165                 170                 175
Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly
            180                 185                 190
Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val
        195                 200                 205
Gly Gly Ser Val Val Gly Ala Leu Met Ala Ala Gly Pro Val Met Leu
    210                 215                 220
Ile Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Asp
225                 230                 235                 240
Glu Glu Glu Ala Ala Glu Arg Gly Gly Gly Gly Ser Asp Gly Gly Val
                245                 250                 255
Val Pro Gly Gln Leu Gly Gly Val Gly Ser Pro Leu Ser Ser Gly Gly
            260                 265                 270
Gly Gly Gly His Gly Asn Gln Gly Leu Pro Ala Tyr Asn Met Pro Gly
        275                 280                 285
Asn Leu Ala Ser Asn Gly Gly Gly Gly Gly Gln Met Ser Ser Gln Glu
    290                 295                 300
Ala Tyr Gly Trp Ala Gln Ala Arg Ser Gly Phe
305                 310                 315
 
<210>43
<211>918
<212>DNA
<213>蒺藜苜蓿(Me dicago truncatula)
 
<400>43
atggcgaaca ggtggtggac cggaccggtt ggtctaggag ggatggacaa ctcagtaacc   60
tcctctccac taggaaaacc ggatctgggt ttctccatga atcaaagtgc tgtaacagga  120
gtgaacaaca tgaacaacaa caacaatgaa gaagaagaag atgagaaaga aaacagcgac  180
gaacacaaag gaggtgcaat agaaacaaac acctccacgc gccgcccaag aggccgtcca  240
tcaggttcaa aaaacaaacc aaaaccacca atattcataa caagagatag ccctaacgcg  300
ctacgaagcc atgtcatgga agtagcaaca ggaacagata tatcagatag catcgttcag  360
tttgcaagaa aaagacagag aggtatttgc attctaagcg caagtggaac cgtcgttaac  420
gtttctctcc ggcaacctac aggtcccgga gctgtggtag cgcttccagg gagatttgat  480
atactctctt tgactggttc tgtgcttcct ggaccttcac cgccgggagc tactggtttg  540
actatttatc tttctggagg acaaggacag gtggttggcg gcggagttgt tggtcccctt  600
gtggcggcag gaccagttat gttgatggcg gcgacatttt cgaatgctac gtatgagagg  660
ctgccggttg aggatggtga tgatcaagaa gggcatcagg gtggtggtgg tgatgatgag  720
tctccgacgc gtgcagcggg gatgggacag ttagcgattg gatctgttgg agaaggttct  780
tcaattccac caggctataa caatgttggt ggtaatttgg gtgtttcaaa tggaggacaa  840
caacaattgt tgaataatca tgaggcttat aataattctc cttggggtca tgctagtcat  900
ggtagaccac catactaa                                                918
 
<210>4
<211>305
<212>PRT
<213>蒺藜苜蓿
 
<400>44
Met Ala Asn Arg Trp Trp Thr Gly Pro Val Gly Leu Gly Gly Met Asp
1               5                   10                  15
Asn Ser Val Thr Ser Ser Pro Leu Gly Lys Pro Asp Leu Gly Phe Ser
            20                  25                  30
Met Asn Gln Ser Ala Val Thr Gly Val Asn Asn Met Asn Asn Asn Asn
        35                  40                  45
Asn Glu Glu Glu Glu Asp Glu Lys Glu Asn Ser Asp Glu His Lys Gly
    50                  55                  60
Gly Ala Ile Glu Thr Asn Thr Ser Thr Arg Arg Pro Arg Gly Arg Pro
65                  70                  75                  80
Ser Gly Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Ile Thr Arg Asp
                85                  90                  95
Ser Pro Asn Ala Leu Arg Ser His Val Met Glu Val Ala Thr Gly Thr
            100                 105                 110
Asp Ile Ser Asp Ser Ile Val Gln Phe Ala Arg Lys Arg Gln Arg Gly
        115                 120                 125
Ile Cys Ile Leu Ser Ala Ser Gly Thr Val Val Asn Val Ser Leu Arg
    130                 135                 140
Gln Pro Thr Gly Pro Gly Ala Val Val Ala Leu Pro Gly Arg Phe Asp
145                 150                 155                 160
Ile Leu Ser Leu Thr Gly Ser Val Leu Pro Gly Pro Ser Pro Pro Gly
                165                 170                 175
Ala Thr Gly Leu Thr Ile Tyr Leu Ser Gly Gly Gln Gly Gln Val Val
            180                 185                 190
Gly Gly Gly Va lVal Gly Pro Leu Val Ala Ala Gly Pro Val Met Leu
        195                 200                 205
Met Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Val Glu
    210                 215                 220
Asp Gly Asp Asp Gln Glu Gly His Gln Gly Gly Gly Gly Asp Asp Glu
225                 230                 235                 240
Ser Pro Thr Arg Ala Ala Gly Met Gly Gln Leu Ala Ile Gly Ser Val
                245                 250                 255
Gly Glu Gly Ser Ser Ile Pro Pro Gly Tyr Asn Asn Val Gly Gly Asn
            260                 265                 270
Leu Gly Val Ser Asn Gly Gly Gln Gln Gln Leu Leu Asn Asn His Glu
        275                 280                 285
Ala Tyr Asn Asn Ser Pro Trp Gly His Ala Ser His Gly Arg Pro Pro
    290                 295                 300
Tyr
305
 
<210>45
<211>632
<212>DNA
<213>拟南芥
 
<400>45
gcagttccct actctcgcgt taacgctagc atggatctcg ggccccaaat aatgatttta   60
ttttgactga tagtgacctg ttcgttgcaa caaattgatg agcaatgctt ttttataatg  120
ccaactttgt acaaaaaagc aggcttcaca atgtcttgct gtggaggaaa ctgcggatgt  180
ggatctggct gcaagtgcgg caacggttgt ggaggttgca aaatgtaccc tgacttggga  240
ttctccggcg agacaaccac aactgagact tttgtcttgg gcgttgcacc ggcgatgaag  300
aatcagtacg aggcttcagg ggagagtaac aacgctgaga acgatgcttg caagtgtgga  360
tctgactgca agtgtgatcc ttgcacctgc aagtgaaacc cagctttctt gtacaaagtt  420
ggcattataa gaaagcattg cttatcaatt tgttgcaacg aacaggtcac tatcagtcaa  480
aataaaatca ttatttgcca tccagctgca gctctggccc gtgtctcaaa atctctgatg  540
ttacattgca caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa  600
cagtaataca aggggtgtta tgagccatat tc                                632
 
<210>46
<211>81
<212>PRT
<213>拟南芥
 
<400>46
Met Ser Cys Cys Gly Gly Asn Cys Gly Cys Gly Ser Gly Cys Lys Cys
1               5                   10                  15
Gly Asn Gly Cys Gly Gly Cys Lys Met Tyr Pro Asp Leu Gly Phe Ser
            20                  25                  30
Gly Glu Thr Thr Thr Thr Glu Thr Phe Val Leu Gly Val Ala Pro Ala
        35                  40                  45
Met Lys Asn Gln Tyr Glu Ala Ser Gly Glu Ser Asn Asn Ala Glu Asn
    50                  55                  60
Asp Ala Cys Lys Cys Gly Ser Asp Cys Lys Cys Asp Pro Cys Thr Cys
65                  70                  75                  80
Lys
 
<210>47
<211>2194
<212>DNA
<213>稻
 
<400>47
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct     60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact    120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt    180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc    240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata    300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga    360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt    420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat    480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag    540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt    600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc    660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat    720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa    780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca    840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag    900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa    960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata   1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag   1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc   1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt   1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct   1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt   1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt   1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt   1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa   1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt   1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga   1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt   1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc  1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct  1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg  1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg  1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa  1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct  2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg  2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc  2160
ttggtgtagc ttgccacttt caccagcaaa gttc                              2194
 
<210>48
<211>53
<212>DNA
<213>人工序列
 
<220>
<223>引物:prm03240
 
<400>48
ggggacaagt ttgtacaaaa aagcaggctt cacaatgtct tgctgtggag gaa           53
 
<210>49
<211>47
<212>DNA
<213>人工序列
 
<220>
<223>引物:prm03241
 
<400>49
ggggaccact ttgtacaaga aagctgggtt tcacttgcag gtgcaag                   47
 
<210>50
<211>1566
<212>DNA
<213>雷氏衣藻(Chlamydomonas reinhardtii)
 
<400>50
atgcggaagg aagcgactcg tcttgtgtcc gccctgctgc gggcgggcaa caatggcgtg   60
tctacgtcgt gggctgttgg tggcactcgc ctcaagtcgg cgatgcccca gcctgatgag  120
aagaaggacg aggacctgca tgccaaggag ggcaaggtgc tgcaccctca ccttctgaac  180
gagaacgtgg tgaagactca gtatgccgtc cgtggcgagc tttacctgcg cgctgagcag  240
ctccgcaagg agggcaagga gatcattttc acaaacgtcg gaaacccgca cgcgctgggt  300
gccaagcccc tgaccttcac ccgtcaggtg ctagccctgt gcgccgcgcc cttcctgctg  360
gatcacccca aggtggagga catgttcccc gccgacgcca tcgcgcgtgc caagaagatc   420
ctagcctcct tcaagggcgg tgtgggcgcc tacaccgact cgcgtggcaa cccgctggtg   480
cgcgaggagg tggcccgctt catcgagaag cgtgacggcg ttccctcgaa ccccgaccac   540
atcttcctga cggacggcgc ctcggtggcc gtgcgcttgt gcctgaacgc catgatccgc   600
cacgaccgcg actccgtgct ggtgcccatc ccgcagtacc cgctgtacag cgcctccatc   660
cgcctgtacg gcggcacgct ggtgggctac ttcctggatg agcgccgcgg ctggggcctg   720
tccgtggagg agctgcagcg cgcgctgcag gaggcgcgcg aggagggcaa gctggtgcgc   780
ggcctggtgt ttatcaaccc cggtaacccc accggccagt gcttgagcaa ggagaacctg   840
caggagctga tcaagtttgc gtaccaggag aagattgtgc tcatggcgga tgaggtgtac   900
caggagaacg tgtaccagga tgagcggccg tttgtgagcg ccaagaaggt gatgtgggag   960
atgggcgagc cctaccgcag ccacgtggag ctgctgtcct tccacaccgt gtccaagggc  1020
actgccggcg agtgcggcct gcgcggcggc tacgtggaga tgactaacat ccaccccggc  1080
gccattgagg aggtgtgcaa gtgcgcctcc attaacctgt cgcccaacac catgggccag  1140
atcgcgctgt ccgtgctcgt caacccgccc aagcccggcg atccctctta cgaccagtac  1200
accaaggaga aggcctcgga gctggtgtcg ctgcgccgcc gcgcgcacat ggtgacggac  1260
ggcttcaacg cgctggacgg cgtcacctgc aacttcaccg agggcgccat gtacagcttc  1320
ccccagatta agctgccggc caaggcgctg gaggccgcca aggccgccgg aaaggcgggc  1380
gacgtgttct actgcctcaa acttctggag gccaccggca tctccaccgt gcccggcagc  1440
ggcttcggcc aggaggaggg caccttccac ctgcgcacca ccattctgcc tcgcgaggag  1500
gtgatgacgc acttcgtgga gaagttcgac aagttccaca aggacttcat gaagcagtat  1560
tcgtaa                                                             1566
 
<210>51
<211>521
<212>PRT
<213>雷氏衣藻
 
<400>51
Met Arg Lys Glu Ala Thr Arg Leu Val Ser Ala Leu Leu Arg Ala Gly
1               5                   10                  15
Asn Asn Gly Val Ser Thr Ser Trp Ala Val Gly Gly Thr Arg Leu Lys
            20                  25                  30
Ser Ala Met Pro Gln Pro Asp Glu Lys Lys Asp Glu Asp Leu His Ala
        35                  40                  45
Lys Glu Gly Lys Val Leu His Pro His Leu Leu Asn Glu Asn Val Val
    50                  55                  60
Lys Thr Gln Tyr Ala Val Arg Gly Glu Leu Tyr Leu Arg Ala Glu Gln
65                  70                  75                  80
Leu Arg Lys Glu Gly Lys Glu Ile Ile Phe Thr Asn Val Gly Asn Pro
                85                  90                  95
Hi s Ala Leu Gly Ala Lys Pro Leu Thr Phe Thr Arg Gln Val Leu Ala
             100                 105                 110
Leu Cys Ala Ala Pro Phe Leu Leu Asp His Pro Lys Val Glu Asp Met
        115                 120                 125
Phe Pro Ala Asp Ala Ile Ala Arg Ala Lys Lys Ile Leu Ala Ser Phe
    130                 135                 140
Lys Gly Gly Val Gly Ala Tyr Thr Asp Ser Arg Gly Asn Pro Leu Val
145                 150                 155                 160
Arg Glu Glu Val Ala Arg Phe Ile Glu Lys Arg Asp Gly Val Pro Ser
                165                 170                 175
Asn Pro Asp His Ile Phe Leu Thr Asp Gly Ala Ser Val Ala Val Arg
            180                 185                 190
Leu Cys Leu Asn Ala Met Ile Arg His Asp Arg Asp Ser Val Leu Val
        195                 200                 205
Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Ser Ile Arg Leu Tyr Gly
    210                 215                 220
Gly Thr Leu Val Gly Tyr Phe Leu Asp Glu Arg Arg Gly Trp Gly Leu
225                 230                 235                 240
Ser Val Glu Glu Leu Gln Arg Ala Leu Gln Glu Ala Arg Glu Glu Gly
                245                 250                 255
Lys Leu Val Arg Gly Leu Val Phe Ile Asn Pro Gly Asn Pro Thr Gly
            260                 265                 270
Gln Cys Leu Ser Lys Glu Asn Leu Gln Glu Leu Ile Lys Phe Ala Tyr
        275                 280                 285
Gln Glu Lys Ile Val Leu Met Ala Asp Glu Val Tyr Gln Glu Asn Val
    290                 295                 300
Tyr Gln Asp Glu Arg Pro Phe Val Ser Ala Lys Lys Val Met Trp Glu
305                 310                 315                 320
Met Gly Glu Pro Tyr Arg Ser His Val Glu Leu Leu Ser Phe His Thr
                325                 330                 335
Val Ser Lys Gly Thr Ala Gly Glu Cys Gly Leu Arg Gly Gly Tyr Val
            340                 345                 350
Glu Met Thr AsnIle Hi s Pro Gly Ala Ile Glu Glu Val Cys Lys Cys
        355                 360                 365
Ala Ser Ile Asn Leu Ser Pro Asn Thr Met Gly Gln Ile Ala Leu Ser
    370                 375                 380
Val Leu Val Asn Pro Pro Lys Pro Gly Asp Pro Ser Tyr Asp Gln Tyr
385                 390                 395                 400
Thr Lys Glu Lys Ala Ser Glu Leu Val Ser Leu Arg Arg Arg Ala His
                405                 410                 415
Met Val Thr Asp Gly Phe Asn Ala Leu Asp Gl y ValThr Cys Asn Phe
            420                 425                 430
Thr Glu Gly Ala Met Tyr Ser Phe Pro Gln Ile Lys Leu Pro Ala Lys
        435                 440                 445
Ala Leu Glu Ala Ala Lys Ala Ala Gly Lys Ala Gly Asp Val Phe Tyr
    450                 455                 460
Cys Leu Lys Leu Leu Glu Ala Thr Gly Ile Ser Thr Val Pro Gly Ser
465                 470                 475                 480
Gly Phe Gly Gln Glu Glu Gly Thr Phe His Leu Arg Thr Thr Ile Leu
                485                 490                 495
Pro Arg Glu Glu Val Met Thr HisPhe Val Glu LysPhe Asp Lys Phe
            500                 505                 510
His Lys Asp Phe Met Lys Gln Tyr Ser
        515                 520
 
<210>52
<211>1416
<212>DNA
<213>稻
 
<400>52
cccacgcgtc cgcccacgcg tccgggacac cagaaacata gtacacttga gctcactcca    60
aactcaaaca ctcacaccaa tggctctcca agttcaggcc gcactcctgc cctctgctct   120
ctctgtcccc aagaagggta acttgagcgc ggtggtgaag gagccggggt tccttagcgt   180
gagcagaagg ccaagaagcc gtcgctggtg gtgagggcgg tggcgacgcg gcgggccggt   240
ggcgagcccc ggcgcgggca cgtcgaaggc ggacgggaag aagacgctgc ggcagggggt   300
ggtggtgatc accggcgcgt cgtcggggct cgggctcgcg gcggcgaagg cgcttggcgg   360
agacggggaa gtggcacgtg gtgatggcgt tccgcgactt tcctgaaggc ggcgacggcg   420
gcgaaggcgg cggggatggc ggcggggagc tacaccgtca tgcacctgga cctcgcctcc   480
ctcgacagcg tccgccagtt cgtggacaac ttccggcgct ccggcatgcc gctcgacgcg   540
ctggtgtgca acgccgcaca tctaccggcc gacggcgcgg caaccgacgt tcaacgccga   600
cgggtacgag atgagcgtcg gggtgaacca cctgggccac ttcctcctcg cccgcctcat   660
gctcgacgac ctcaagaaat ccgactaccc gtcgcggcgg ctcatcatcc tcggctccat   720
caccggcaac accaacacct tcgccggcaa cgtccctccc aaggccgggc taggcgacct   780
ccgggggctc gccggcgggc tccgcgggca gaacgggtcg gcgatgatcg acggcgcgga   840
gagcttcgac ggcgccaagg cgtacaagga cagcaagatc tgtaacatgc tgacgatgca   900
ggagttccac cggagattcc acgaggagac cgggatcacg ttcgcgtcgc tgtacccggg   960
gtgcatcgcg acgacgggct tgttccgcga gcacatcccg ctgttccggc tgctgttccc  1020
gccgttccag cggttcgtga cgaaggggtt cgtgtcggag gcggagtccg ggaagcggct  1080
ggcgcaggtg gtgggcgacc cgagcctgac caagtccggc gtgtactgga gctggaacaa  1140
ggactcggcg tcgttcgaga accagctctc gcaggaggcc agcgacccgg agaaggccag  1200
gaagctctgg gacctcagcg agaagctcgt cggcctcgtc tgagtttatt atttacccat  1260
tcgtttcaac tgttaatttc ttcggggttt agggggtttc agctttcagt gagagaggcc  1320
tgtcaagtga tgtacaatta gtaatttttt tttacccgac aaatcatgca ataaaaccac  1380
aggcttacat tatcgatttg tccacctaaa ttaagt                            1416
 
<210>53
<211>52
<212>DNA
<213>人工序列
 
<220>
<223>引物:prm08408
 
<400>53
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgcg gaaggaagcg ac    52
 
<210>54
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物:prm08409
 
<400>54
ggggaccact ttgtacaaga aagctgggtc gaattgctaa gctgttacga        50
 
<210>55
<211>1453
<212>DNA
<213>稻
 
<400>55
atggctgctc ccagcgtcgc cgtcgacaac ctcaacccca aggttttgaa ttgtgagtat     60
gcagtgcgtg gagagattgt gatccatgct cagcgcctgc agcaacagct acagactcaa    120
ccagggtctc ttccttttga tgagatccta tactgcaaca ttgggaatcc ccagtctctt    180
ggtcagaagc cagttacatt cttcagggag gttattgctc tttgtgatca tccatgcttg    240
ttggaaaagg aggaaaccaa atcattgttc agtgctgatg ccatttctcg agcaacaaca    300
attcttgcct cgattcctgg aagagcaact ggagcataca gccacagcca gggcatcaaa    360
gggctgcgtg atgcaattgc tgctggaatt gcatcacgtg atggataccc tgcaaatgca    420
gacgacattt tccttactga cggagcaagc cctggagttc acatgatgat gcagttactg    480
ataaggaacg agaaagatgg cattctctgc ccaattcctc aatatccttt gtactcagcc    540
tccattgctc ttcatggtgg agctcttgtc ccgtattatc ttaatgaatc aacaggctgg    600
ggtttggaga tctctgacct taagaagcaa ctcgaagatt ctcggttgaa aggcattgat    660
gttagggctt tggtagttat caatccagga aatccaactg ggcaggttct tgctgaggaa    720
aaccaacggg acatagtgaa gttctgcaaa aatgagggac ttgttcttct ggctgatgag    780
gtgtaccaag agaacatcta tgttgacaac aagaaattta actctttcaa gaagatagcg    840
agatccatgg gatacaacga ggatgatctc cctttagtat catttcaatc tgtttctaag    900
ggatattatg gtgaatgtgg caaaagagga ggctacatgg agattactgg cttcagtgct    960
ccagttagag agcagatcta caaagtggcg tcagtgaact tatgttccaa tatcactggc   1020
cagatccttg ccagcctcgt catgaatcca ccaaaggctg gagatgcatc atatgcttca   1080
tacaaggcag agaaagatgg aatcctccaa tcattagctc gccgtgcaaa ggcattggag   1140
aatgctttca acagtcttga gggaattaca tgcaacaaaa ctgaaggagc aatgtacctc   1200
ttccctcagc ttagtctgcc acaaaaggca attgacgctg ctaaagctgc taacaaagca   1260
cctgatgctt tctatgccct tcgtctcctc gaggcaaccg gaattgttgt tgtccctgga   1320
tctggatttg gccaagttcc tggcacatgg cacatcagat gcacaatcct gccacaggag   1380
gagaagatcc ccgcgatcat ctcccgcttc aaggcattcc atgagggctt catggcagcg   1440
taccgcgact  gaa                                                 1453
 
<210>56
<211>483
<212>PRT
<213>稻
 
<400>56
Met Ala Ala Pro Ser Val Ala Val Asp Asn Leu Asn Pro Lys Val Leu
1               5                   10                  15
Asn Cys Glu Tyr Ala Val Arg Gly Glu Ile Val Ile His Ala Gln Arg
            20                  25                  30
Leu Gln Gln Gln Leu Gln Thr Gln Pro Gly Ser Leu Pro Phe Asp Glu
        35                  40                  45
Ile Leu Tyr Cys Asn Ile Gly Asn Pro Gln Ser Leu Gly Gln Lys Pro
    50                  55                  60
Val Thr Phe Phe Arg Glu Val Ile Ala Leu Cys Asp His Pro Cys Leu
65                  70                  75                  80
Leu Glu Lys Glu Glu Thr Lys Ser Leu Phe Ser Ala Asp Ala Ile Ser
                85                  90                  95
Arg Ala Thr Thr Ile Leu Ala Ser Ile Pro Gly Arg Ala Thr Gly Ala
            100                 105                 110
Tyr Ser His Ser Gln Gly Ile Lys Gly Leu Arg Asp Ala Ile Ala Ala
        115                 120                 125
Gly Ile Ala Ser Arg Asp Gly Tyr Pro Ala Asn Ala Asp Asp Ile Phe
    130                 135                 140
Leu Thr Asp Gly Ala Ser Pro Gly Val His Met Met Met Gln Leu Leu
145                 150                 155                 160
Ile Arg Asn Glu Lys Asp Gly Ile Leu Cys Pro Ile Pro Gln Tyr Pro
                165                 170                 175
Leu Tyr Ser Ala Ser Ile Ala Leu His Gly Gly Ala Leu Val Pro Tyr
            180                 185                 190
Tyr Leu Asn Glu Ser Thr Gly Trp Gly Leu Glu Ile Ser Asp Leu Lys
        195                 200                 205
Lys Gln Leu Glu Asp Ser Arg Leu Lys Gly Ile Asp Val Arg Ala Leu
    210                 215                 220
Val Val Ile Asn Pro Gly Asn Pro Thr Gly Gln Val Leu Ala Glu Glu
225                 230                 235                 240
Asn Gln Arg Asp Ile Val Lys Phe Cys Lys Asn Glu Gly Leu Val Leu
                245                 250                 255
Leu Ala Asp Glu Val Tyr Gln Glu Asn Ile Tyr Val Asp Asn Lys Lys
            260                 265                 270
Phe Asn Ser Phe Lys Lys Ile Ala Arg Ser Met Gly Tyr Asn Glu Asp
        275                 280                 285
Asp Leu Pro Leu Val Ser Phe Gln Ser Val Ser Lys Gly Tyr Tyr Gly
    290                 295                 300
Glu Cys Gly Lys Arg Gly Gly Tyr Met Glu Ile Thr Gly Phe Ser Ala
305                 310                 315                 320
Pro Val Arg Glu Gln Ile Tyr Lys Val Ala Ser Val Asn Leu Cys Ser
                325                 330                 335
Asn Ile Thr Gly Gln Ile Leu Ala Ser Leu Val Met Asn Pro Pro Lys
            340                 345                 350
Ala Gly Asp Ala Ser Tyr Ala Ser Tyr Lys Ala Glu Lys Asp Gly Ile
        355                 360                 365
Leu Gln Ser Leu Ala Arg Arg Ala Lys Ala Leu Glu Asn Ala Phe Asn
    370                 375                 380
Ser Leu Glu Gly Ile Thr Cys Asn Lys Thr Glu Gly Ala Met Tyr Leu
385                 390                 395                 400
Phe Pro Gln Leu Ser Leu Pro Gln Lys Ala Ile Asp Ala Ala Lys Ala
                405                 410                 415
Ala Asn Lys Ala Pro Asp Ala Phe Tyr Ala Leu Arg Leu Leu Glu Ala
            420                 425                 430
Thr Gly Ile Val Val Val Pro Gly Ser Gly Phe Gly Gln Val Pro Gly
        435                 440                 445
Thr Trp His Ile Arg Cys Thr Ile Leu Pro Gln Glu Glu Lys Ile Pro
    450                 455                 460
Ala Ile Ile Ser Arg Phe Lys Ala Phe His Glu Gly Phe Met Ala Ala
465                 470                 475                 480
Tyr Arg Asp
 
<210>57
<211>2559
<212>DNA
<213>稻
 
<400>57
gaaaggggag agaaagagag agaagggaga gagagagaga gagaaggatg aggaagaaga     60
agggatgggg cgctggcgag ctcctctctg cgggtgaacg gccgacaagc tcctcccccg    120
cgcgtggacg gccagcgacc tccttccctg tgcgttgtcg ccgccgcccc gcgctctagt    180
gattgaaggt gagaggagag gaaaagatga gagagagggg agaggggtga gaatgatacg    240
tggggccata tgtcggtggg tcccactatt tttttttgtt aatgacatgt tggtcctaca    300
aatttttgtt tttactctaa tgccacctaa gcgacacgtc gacgacacgt ggaacgaaga    360
ccgggtcaac accgccacgt aggtgccacg tcagccaaaa ccaattccaa aaccacctag    420
gatatagttt gcaccggttt tgttagttag aagagtcgat atatccggtt ttgtggttgg    480
aggtcatgaa tcgtactctg gccatagttg agggagttaa agtatatttt ttccaaggaa    540
aaaatgaatc gagtgtgtca aactgaactg aagacttaaa aaggttgaat ggcagtttga    600
ctgctagtgc attaatcaga tttaaactta caatactact tatttttttc cctctcgagg    660
aatgtctagc agtatatttg cttgacagct caaaaatata aaggatttgc agtaccatcc    720
aaatttagga acaacataca tggaaaagac aaatcgcctg gcgcatgagg cgcttacgtg    780
caggaaaaat aaaaggaaac tgaagctgga aaaaagagag acattataat ttgccgttgc    840
tcattttcta ttttagtgag agttacatgc gggtgcagtg gtgcgtgtga gttgtgactc   900
tccacttccg tgtaatcggg aaaagaagta aaaaagaaaa gaaaagggga gtcggagaga   960
gcaccggtag cattattcca agcaggtgga cccgcgtgtc atccccactc tacaaagcgc  1020
aaaatcatca agggccttcg cctcggcgtg gaggagagtg aggacggccc acgcggagca  1080
gcagagagtc gggaggtggc tccgcttcca cagctctact ccatctctct cagtgtcggg  1140
ctcgccggag tccggccaat ccagccggtt catgcttcat tctctcggtg cgtgatttct  1200
ccgattttcg tctccatcta gtacctgaag cgaggcaaat ttaattgccc ccttttcggt  1260
gcaaactatc tcgtcagatt agtcgcatgc atgttccttc gttgaatttt gcaaagttag  1320
ttgtagagag aagttcttgg gagggtggat gctacggtct catcttctct cttttccccc  1380
aacaagcgag ctagcgaagg ggaaaatggg gggagcagaa gaatatccat gttaggttcg  1440
cgtgcttgcc tctcggctga gctctagctg ttacggcgtt cgtcaggatg gctaatccgt  1500
ctcgccaatt agaagatgga taggtcgtag cgttagatgg attacttgat ggttgatgcg  1560
ctgcccattt attgttctta gcaggttctg tcttctcagt ccgtgtgagt gtttcatcat  1620
attggctacc aagatgatca ctcttcgttt atcaagagag tagggtgaga tctcaatccg  1680
ttgcaactga tgagtacttc ctttgtctca gaatgtaagt atttttgagt tagacacaga  1740
tattaagaaa gtaggtagag atgattggag gagagttgtg attgatgggg aagagaaagt  1800
aggtgaaaaa aaatggttgt gattggttaa gaggacagag taggtgaata aatagcttca  1860
ttttgagaca agttactgtg ctaaaaatag ctacattttg agacggagat agtagtatac  1920
ttcacttact accgagtacg gctttagttt tgctacctcc gtcctaaaat atagcaacct  1980
aggatcggat gtagcatgtt actactaatc tagataggca gcatgtctaa attcatagta  2040
atatggtgac tcgtttagta gaatgttgat atattttagg atggaagaaa tatataaata  2100
ctgttttttt attcgaagta gttggcccat catttctgaa atagatgatt gatgccatga  2160
cgccgcttgc tttctagaac tactagtaat tttaggtgag agctagtact gatgcgtcag  2220
tctaagataa tggacaaaaa agggctacag gctactattg attatcacat taaaactctg  2280
tacgacagat ttttctgatt aaatgatagc catatgccca acgtgctgct tgtctaaact  2340
gaaacctgac atcactcaca gtatgcccag ttgttgggtg gtctattatt atttataaat  2400
tataactctg gcattttttt tattgtaggg caatatgttt tccattattt tccattaaaa  2460
cctctaatct gcacttccac tatctgctca aaatctcagg ctactttctt tcctcttcct  2520
caggacatta acctggttta cttgtaagaa agtaaagcc                         2559
 
<210>58
<211>49
<212>DNA
<213>人工序列
 
<220>
<223>引物:prm001646
 
<400>58
ggggacaagt ttgtacaaaa aagcaggctt cacaatggct gctcccagc              49
 
<210>59
<211>46
<212>DNA
<213>人工序列
<220>
<223>引物:prm001647
 
<400>59
ggggaccact  ttgtacaaga aagctgggta attcagtcgc ggtacg                      46

Claims (26)

1.相对于对照植物增强植物的种子产率相关性状的方法,包括增加植物中编码产率增加性多肽的核酸序列的表达,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽,和丙氨酸氨基转移酶(AAT)多肽,以及任选地选择具有增强的种子产率相关性状的植物。
2.权利要求1的方法,其中所述产率增加性多肽是核定位AT-hook基序蛋白19/20(AHL19/20)多肽,该AHL19/20多肽包含与SEQ ID NO:36所示保守结构域(CD)具有至少70%、75%、80%、85%、90%、95%、98%、99%或更大的氨基酸序列同一性的结构域,或所述AHL19/20多肽包含:(i)与SEQ ID NO:37所示AT-hook基序具有至少75%、80%、85%、90%、95%、98%、99%或更大的氨基酸序列同一性的基序;和(ii)与SEQID NO:38所示植物及原核生物保守(PPC)结构域具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更大的氨基酸序列同一性的结构域。
3.权利要求1或2的方法,其中所述AHL19/20多肽包含:(i)核定位信号;(ii)具有InterPro登录号IPR014476的AT-hook DNA结合基序;和(iii)具有InterPro登录号IPR005175的植物及原核生物保守(PPC)结构域。
4.任何前述权利要求的方法,其中所述AHL19/20多肽,当用于构建AHL系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ IDNO:2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。
5.权利要求1的方法,其中所述产率增加性多肽按照递增的优选顺序分别与SEQ ID NO:2所示的AHL19/20多肽、或本文表A中所示的任何多肽序列、或SEQ ID NO:46所示GRP多肽、或SEQ ID NO:51所示AAT样多肽、或SEQ ID NO:56所示AAT多肽具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的氨基酸序列同一性。
6.任何前述权利要求的方法,其中所述编码AHL19/20多肽的核酸序列为表A中所示的任一SEQ ID NO核酸序列或其部分、或能够与表A中所示的任一SEQ ID NO核酸序列杂交的序列。
7.任何前述权利要求的方法,其中所述核酸序列编码表A中所示的任何SEQ ID NO多肽序列的直系同源物或旁系同源物。
8.任何前述权利要求的方法,其中所述增加的表达通过任何一个或多个下列技术实现:T-DNA激活标签、TILLING、或同源重组。
9.任何前述权利要求的方法,其中所述增加的表达通过在植物中引入和表达编码AHL19/20多肽的核酸序列来实现。
10.任何前述权利要求的方法,其中所述增强的种子产率相关性状是一个或多个下列性状:(i)增加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加的饱满种子数;或(iv)增加的收获指数。
11.权利要求2的方法,其中相对于对照植物,所述增强的种子产率相关性状发生在于养分可利用度下降的条件下,优选氮可利用度下降的条件下生长的植物中。
12.权利要求11的方法,其中所述增强的种子产率相关性状是一个或多个下列性状:(i)增加的每植物的种子总产率;(ii)增加的饱满种子数;或(iii)增加的收获指数。
13.权利要求2的方法,其中所述核酸序列与组成型启动子,优选与植物组成型启动子,更优选与GOS2启动子,最优选与SEQ ID NO:35所示的稻的GOS2启动子有效连接。
14.任何前述权利要求的方法,其中所述编码AHL19/20多肽的核酸序列是植物来源的,优选来自双子叶植物,还优选来自十字花科,最优选来自拟南芥。
15.可通过任何前述权利要求的方法获得的植物、其部分(包括种子)、或植物细胞,其中所述植物、其部分或细胞包含与植物组成型启动子有效连接的编码产率增加性多肽的分离的核酸转基因,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。
16.构建体,其包含:
(a)编码产率增加性多肽的核酸序列,所述产率增加性多肽选自权利要求2至7中任一项所定义的:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽;
(b)一个或多个能够驱动(a)中的核酸序列表达的控制序列;和任选地
(c)转录终止序列。
17.权利要求16的构建体,其中所述控制序列是植物组成型启动子,优选GOS2启动子,更优选SEQ ID NO:35所示的GOS2启动子。
18.权利要求16或17的构建体在产生相对于对照植物具有增强的种子产率相关性状的植物的方法中的用途,所述增强的种子产率相关性状是一个或多个下列性状:(i)增加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加的饱满种子数;或(iv)增加的收获指数。
19.用权利要求16或17的构建体转化的植物、植物部分或植物细胞。
20.产生相对于对照植物具有增强的种子产率相关性状的转基因植物的方法,包括:
(i)在植物、植物部分或植物细胞中引入和表达处于植物组成型启动子控制之下的编码产率增加性多肽的核酸序列,所述产率增加性多肽选自权利要求2至7中任一项所定义的:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞、植物部分或植物。
21.由于编码产率增加性多肽的核酸序列的增加表达而相对于对照植物具有增强的种子产率相关性状的转基因植物、或源自所述转基因植物的转基因植物细胞或转基因植物部分,其中所述核酸序列与植物组成型启动子有效连接,所述产率增加性多肽选自权利要求2至7中任一项所定义的:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。
22.权利要求15、19或21的转基因植物或源自所述转基因植物的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
23.权利要求22的植物的可收获部分,其包含编码产率增加性多肽的核酸序列,所述产率增加性多肽选自:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽,其中所述可收获部分优选是种子。
24.来源于权利要求22的植物和/或来源于权利要求23的植物的可收获部分的产品。
25.编码产率增加性多肽的核酸序列在增强种子产率相关性状中的用途,所述产率增加性多肽选自如权利要求2至7中任一项所定义的:核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽,所述增强的种子产率相关性状包括一个或多个下列性状:i)增加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加的饱满种子数;或(iv)增加的收获指数。
26.权利要求25的用途,其中所述增强的种子产率相关性状在养分可利用度下降的条件下,优选在氮可利用度下降的条件下发生。
CN200880025418A 2007-07-20 2008-07-21 具有增强的产率相关性状的植物及其制备方法 Pending CN101849009A (zh)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
EP07112903.5 2007-07-20
EP07112908 2007-07-20
EP07112903 2007-07-20
EP07112902.7 2007-07-20
EP07112908.4 2007-07-20
EP07112902 2007-07-20
EP07113319.3 2007-07-27
EP07113319 2007-07-27
US97006507P 2007-09-05 2007-09-05
US60/970,065 2007-09-05
US98568807P 2007-11-06 2007-11-06
US60/985,688 2007-11-06
US98725207P 2007-11-12 2007-11-12
US60/987,252 2007-11-12
PCT/EP2008/059515 WO2009013263A2 (en) 2007-07-20 2008-07-21 Plants having increased yield-related traits and a method for making the same

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN2012102818627A Division CN102827865A (zh) 2007-07-20 2008-07-21 具有增强的产率相关性状的植物及其制备方法
CN201410645868.7A Division CN104404078A (zh) 2007-07-20 2008-07-21 具有增强的产率相关性状的植物及其制备方法

Publications (1)

Publication Number Publication Date
CN101849009A true CN101849009A (zh) 2010-09-29

Family

ID=39969468

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201410645868.7A Pending CN104404078A (zh) 2007-07-20 2008-07-21 具有增强的产率相关性状的植物及其制备方法
CN200880025418A Pending CN101849009A (zh) 2007-07-20 2008-07-21 具有增强的产率相关性状的植物及其制备方法
CN2012102818627A Pending CN102827865A (zh) 2007-07-20 2008-07-21 具有增强的产率相关性状的植物及其制备方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201410645868.7A Pending CN104404078A (zh) 2007-07-20 2008-07-21 具有增强的产率相关性状的植物及其制备方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2012102818627A Pending CN102827865A (zh) 2007-07-20 2008-07-21 具有增强的产率相关性状的植物及其制备方法

Country Status (9)

Country Link
US (2) US8697947B2 (zh)
EP (3) EP2535417A1 (zh)
CN (3) CN104404078A (zh)
AR (1) AR067633A1 (zh)
AU (1) AU2008280152B2 (zh)
CA (1) CA2692777A1 (zh)
DE (1) DE112008001879T5 (zh)
ES (1) ES2440265T3 (zh)
WO (1) WO2009013263A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102154317A (zh) * 2011-01-29 2011-08-17 中山大学 莲金属硫蛋白基因MT2a在提高种子寿命和活力上的应用
CN112567042A (zh) * 2018-06-15 2021-03-26 科沃施种子欧洲股份两合公司 增强基因组工程化效率的方法
CN114032251A (zh) * 2015-08-07 2022-02-11 拜尔作物科学公司 根优先和胁迫诱导型启动子及其用途

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009080802A2 (en) * 2007-12-20 2009-07-02 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same
WO2011089071A2 (de) 2010-01-22 2011-07-28 Bayer Cropscience Ag Akarizide und/oder insektizide wirkstoffkombinationen
US9265252B2 (en) 2011-08-10 2016-02-23 Bayer Intellectual Property Gmbh Active compound combinations comprising specific tetramic acid derivatives
CN104024415A (zh) * 2011-11-14 2014-09-03 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物及其制备方法
US9670500B2 (en) * 2012-04-20 2017-06-06 Monsanto Technology Llc Transgenic plants with enhanced traits
CN104428414B (zh) 2012-05-02 2022-01-21 陶氏益农公司 苹果酸脱氢酶的靶向修饰
KR20150001926A (ko) * 2013-06-28 2015-01-07 제노마인(주) 식물의 생산성 증대 기능, 스트레스 내성 기능 및 노화 지연 기능을 갖는 atpg10 단백질과 그 유전자 및 이들의 용도
KR20150003099A (ko) * 2013-06-28 2015-01-08 제노마인(주) 식물의 생산성 증대 기능, 스트레스 내성 기능 및 노화 지연 기능을 갖는 atpg6 단백질과 그 유전자 및 이들의 용도
WO2015006105A1 (en) 2013-07-09 2015-01-15 Board Of Trustees Of Michigan State University Transgenic plants produced with a k-domain, and methods and expression cassettes related thereto
US11459579B2 (en) 2013-07-09 2022-10-04 Board Of Trustees Of Michigan State University Transgenic plants produced with a K-domain, and methods and expression cassettes related thereto
NL2011980C2 (en) * 2013-12-17 2015-06-18 Univ Leiden New effects of plant ahl proteins.
CN110484651B (zh) * 2019-09-25 2023-12-19 中国农业科学院作物科学研究所 一种小麦产量相关基因TaNRT2-6D中的分子标记及其应用
CN110923243B (zh) * 2019-12-18 2021-04-13 华中农业大学 Ahl4在调控植物脂代谢中的应用及提高植物种子含油量、不饱和脂肪酸含量的方法
CN111471692B (zh) * 2020-04-10 2022-09-06 河南大学 Ahl9和ahl11基因在调控植物叶片衰老方面应用
CN116103435B (zh) * 2023-02-24 2023-12-12 中山大学 与生菜镉积累相关的snp分子标记及其应用

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
JP2996995B2 (ja) 1988-06-01 2000-01-11 ザ テキサス エイ アンド エム ユニヴァーシティ システム 茎頂による植物の形質転換方法
CA2118513A1 (en) 1992-04-24 1993-11-11 David A. Zarling In vivo homologous sequence targeting in eukaryotic cells
HUT71929A (en) 1992-06-29 1996-02-28 Gene Shears Pty Ltd Nucleic acids and methods of use thereof for controlling viral pathogens
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
WO1994012015A1 (en) 1992-11-30 1994-06-09 Chua Nam Hai Expression motifs that confer tissue- and developmental-specific expression in plants
WO1995003404A1 (en) 1993-07-22 1995-02-02 Gene Shears Pty Limited Dna virus ribozymes
CN1048254C (zh) 1993-12-09 2000-01-12 托马斯杰弗逊大学 用于将预定的改变引入靶基因中的化合物
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
HUP9802535A3 (en) 1995-10-06 2001-04-28 Plant Genetic Systems Nv Seed shattering
US7390937B2 (en) 1996-02-14 2008-06-24 The Governors Of The University Of Alberta Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof
GB9607517D0 (en) 1996-04-11 1996-06-12 Gene Shears Pty Ltd The use of DNA Sequences
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
NL1006681C2 (nl) 1997-07-29 1999-02-08 Gho St Holding Bv Toepassing van fysiologisch acceptabele vanadiumverbindingen, -zouten en -complexen.
GB9720148D0 (en) 1997-09-22 1997-11-26 Innes John Centre Innov Ltd Gene silencing materials and methods
CN1202246C (zh) 1998-04-08 2005-05-18 联邦科学和工业研究组织 获得修饰表型的方法和措施
TR200100705T2 (tr) 1998-06-26 2001-10-22 Iowa State University Research Foundation, Inc. Bitkilerde enzim ve asetil'in değiştirilmesi için yöntemler.
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
US7193129B2 (en) 2001-04-18 2007-03-20 Mendel Biotechnology, Inc. Stress-related polynucleotides and polypeptides in plants
US20090265813A1 (en) * 2005-08-31 2009-10-22 Mendel Biotechnology , Inc. Stress tolerance in plants
US7897843B2 (en) * 1999-03-23 2011-03-01 Mendel Biotechnology, Inc. Transcriptional regulation of plant biomass and abiotic stress tolerance
AU775233B2 (en) 1999-07-22 2004-07-22 National Institute Of Agrobiological Sciences Method for superrapid transformation of monocotyledon
HUP0203693A2 (hu) 1999-08-26 2003-04-28 Basf Plant Science Gmbh. Növényi gén expressziója konstitutív növényi V-ATP-áz promoterek irányítása alatt
DE60130866T2 (de) * 2000-01-28 2008-07-17 The Governors Of The University Of Alberta, Edmonton Wurzel-spezifische expression von ziel-genen in pflanzen
EP1313867A2 (en) * 2000-08-24 2003-05-28 The Scripps Research Institute Stress-regulated genes of plants, transgenic plants containing same, and methods of use
EP1585820B1 (en) 2003-01-21 2007-01-03 CropDesign N.V. Use of the regulatory sequence of the rice gos2 gene for the gene expression in dicotyledonous plants or plant cells
EP2177617A1 (en) 2003-02-04 2010-04-21 CropDesign N.V. Rice promoters
EP1613146B1 (en) * 2003-04-14 2013-06-19 CropDesign N.V. Plants having modified growth characteristics and method for making the same
US20080148432A1 (en) * 2005-12-21 2008-06-19 Mark Scott Abad Transgenic plants with enhanced agronomic traits
AU2006320596B2 (en) 2005-12-01 2013-02-07 Cropdesign N.V. Plants having improved growth characteristics and methods for making the same
CN101378651B (zh) * 2005-12-23 2012-03-14 阿凯迪亚生物科学公司 氮源高效利用的单子叶植物

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102154317A (zh) * 2011-01-29 2011-08-17 中山大学 莲金属硫蛋白基因MT2a在提高种子寿命和活力上的应用
CN102154317B (zh) * 2011-01-29 2013-01-09 中山大学 莲金属硫蛋白基因MT2a在提高种子寿命和活力上的应用
CN114032251A (zh) * 2015-08-07 2022-02-11 拜尔作物科学公司 根优先和胁迫诱导型启动子及其用途
CN112567042A (zh) * 2018-06-15 2021-03-26 科沃施种子欧洲股份两合公司 增强基因组工程化效率的方法

Also Published As

Publication number Publication date
CN104404078A (zh) 2015-03-11
AU2008280152B2 (en) 2013-11-21
US20140165230A1 (en) 2014-06-12
EP2173884A2 (en) 2010-04-14
AR067633A1 (es) 2009-10-21
WO2009013263A3 (en) 2009-03-12
US20100325753A1 (en) 2010-12-23
WO2009013263A2 (en) 2009-01-29
EP2173884B1 (en) 2013-09-18
US8697947B2 (en) 2014-04-15
DE112008001879T5 (de) 2010-07-29
EP2987861A1 (en) 2016-02-24
AU2008280152A1 (en) 2009-01-29
ES2440265T3 (es) 2014-01-28
EP2535417A1 (en) 2012-12-19
CN102827865A (zh) 2012-12-19
CA2692777A1 (en) 2009-01-29

Similar Documents

Publication Publication Date Title
US8697947B2 (en) Plants having increased yield-related traits and a method for making the same
US20140366222A1 (en) Plants having enhanced yield-related traits and a method for making the same
US20140189910A1 (en) Plants having enhanced yield-related traits and a method for making the same
US9175303B2 (en) Plants having enhanced yield-related traits and a method for making the same
US20150052637A1 (en) Plants having enhanced yield-related traits and a method for making the same
WO2011048009A1 (en) Plants having enhanced yield-related traits and a method for making the same
CN104789573A (zh) 具有增强的产量相关性状的植物及其制备方法
US9428763B2 (en) Plants having enhanced yield-related traits and a method for making the same
US20130305414A1 (en) Plants Having Enhanced Yield-Related Traits and a Method for Making the Same
US20130019347A1 (en) Plants having enhanced yield-related traits and a method for making the same
CN101548016B (zh) 产率相关性状增强的植物及使用来自yabby蛋白家族的共有序列制备其的方法
CN103814133A (zh) 具有增强的产量相关性状的植物和其生产方法
US8569576B2 (en) Plants having enhanced yield-related traits and a method for making the same
CN102770545A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
US20130031670A1 (en) Plants having enhanced yield-related traits and method for making the same
US20120331585A1 (en) Plants having enhanced yield-related traits and a method for making the same
AU2014280886A1 (en) Plants having enhanced yield-related traits and a method for making the same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100929