CN102144032A - Eg82013和eg81345核酸及其用途 - Google Patents

Eg82013和eg81345核酸及其用途 Download PDF

Info

Publication number
CN102144032A
CN102144032A CN2009801342982A CN200980134298A CN102144032A CN 102144032 A CN102144032 A CN 102144032A CN 2009801342982 A CN2009801342982 A CN 2009801342982A CN 200980134298 A CN200980134298 A CN 200980134298A CN 102144032 A CN102144032 A CN 102144032A
Authority
CN
China
Prior art keywords
seq
plant
nucleic acid
sequence
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801342982A
Other languages
English (en)
Inventor
W·麦斯尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Evolutionary Genomics LLC
Original Assignee
Evolutionary Genomics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Evolutionary Genomics LLC filed Critical Evolutionary Genomics LLC
Publication of CN102144032A publication Critical patent/CN102144032A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Botany (AREA)
  • Biomedical Technology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了用于鉴定可能与植物中的商业上相关的性状相关的核酸和多肽序列的方法,特别地,由此鉴定的核酸和多肽序列是产量基因EG82013和EG81345。由此鉴定的序列可用于增强栽培植物或野生祖先植物中的商业上需要的性状、鉴定相关的核酸序列、对植物进行基因分型和标志物辅助的培育。由此鉴定的序列还可用于产生异源DNA、转基因植物和转染的宿主细胞。

Description

EG82013和EG81345核酸及其用途
技术领域
本发明涉及用于鉴定核酸和多肽序列的分子的和改良的技术,所述核酸和多肽序列对应于祖先植物和栽培植物中的商业上相关的性状,例如产量;鉴定的核酸和多肽序列;以及使用所述鉴定的核酸和多肽序列的方法。
背景技术
人类培育植物和动物已有数千年,选择那些商业上有价值的和/或美观的性状。栽培植物与其野生祖先或科成员的区别在于以下性状,例如,产量、花期短、蛋白和/或油的含量、收获的容易性、味道、疾病抗性和干旱抗性。驯化的动物与其野生祖先或科成员的区别在于以下性状,例如,脂肪和/或蛋白含量、产奶量、温顺性、生殖力和达到成熟所需的时间。目前,促成上述差异的多数基因都是未知的,更重要的是,不知道这些基因中发生了何种特定变化以提供这些能力。理解关于栽培的植物和驯化的动物与其野生祖先或科成员之间的这些差异的基础将为保持和增强这些性状提供有用的信息。在农作物植物的情况下,鉴定控制想要的性状的特定基因将允许以之前不可能的方式进行直接的和迅速的改良。
鉴定那些相对于同源的祖先的基因而言已经进化以赋予独特的、增强的或改变的功能的驯化物种的基因可用于开发调节这些功能的试剂。鉴定潜在的驯化物种的基因和已经发生的特定核苷酸变化以及进一步表征由这些进化的基因所编码的蛋白的物理和生物化学变化,能够为解释想要的性状的机理提供有价值的信息。这种有价值的信息可应用于DNA标志物辅助的培育或DNA标志物辅助的选择。或者,这种信息可用于开发进一步增强靶蛋白功能的试剂。或者,对起负责作用的基因的进一步工程化改造可以修饰或增强想要的性状。另外,可能发现所鉴定的基因在其它栽培植物或科成员中具有控制所关注的性状的作用。
通过人工选择,人类已经对农作物植物提供了强烈的选择压力。该压力反映在驯化生物与其野生祖先或科成员的同源基因之间的进化上的显著变化上。已经发现仅有少数基因控制栽培的农作物植物的商业上关注的性状,例如10-15个基因/物种。这些少数基因通过标准的植物分子生物学方法是极其难以鉴别的。
在上文所列的相关专利和申请中描述了鉴定由于驯化而发生变化的基因的方法。DNA标志物辅助的培育(MAB)和DNA标志物辅助的选择(MAS)方法是本领域技术人员熟知的,并且在很多公开物中有描述(参见例如Peleman and van der Voort,Breeding by Design,TRENDS inPlant Science 8(7):330-334)。此类方法可以通过在开发新的植物品种的过程中增强选择和引入与想要的表型相关的特定等位基因的能力而使植物培育更加高效。现今一般使用的标志物的一个问题是,它们会通过重组与靶基因或性状分离(参见Holland在2004年9月26日至10月1日在澳大利亚布里斯班召开的第4届国际农作物科学大会上的论文)。事实上,Holland举出了使用标志物比常规培育效果更好的例子,以及常规培育提供比标志物辅助的培育结果更好的其它例子。Holland指出:“标志物不可能在短时期内普遍用于操作复杂的性状,例如产量”。标志物用于操作复杂的性状例如产量所需要的是负责此等复杂性状的具体基因,而非仅在有些时候与此等复杂性状相关的标志物。
发明内容
在一个实施方式中,本发明包括用于鉴定植物中的EG81345同源核酸序列或EG81345等位基因的方法。该方法包括以下步骤。在一个步骤中,将植物核酸序列的至少一部分与至少一个核酸进行比较。该核酸可以是下列任意项:包含选自SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ IDNO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55;SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;和任意上述核酸的互补物。该方法还包括鉴定植物中的与任意上述核酸相同的至少一个核酸序列。该方法还可以以EG81345多肽进行。或者,该方法包括比较上述SEQ ID NO之一,或其至少20个核苷酸的部分,或其互补物,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
在另一个实施方式中,本发明包括用于鉴定植物中的EG82013同源核酸序列或EG82013等位基因的方法。该方法包括以下步骤。在一个步骤中,将植物核酸序列的至少一部分与至少一个核酸进行比较。该核酸可以是下列任意项:包含选自SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:58和SEQ ID61的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;和任意上述核酸的互补物。该方法还包括鉴定植物中的与任意上述核酸相同的至少一个核酸序列。该方法还可以以EG82013多肽进行。或者,该方法包括比较上述SEQ ID NO之一,或其至少20个核苷酸的部分,或其互补物,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
在另一个实施方式中,本发明包括用于标志物辅助的培育的方法,包括就特定的EG81345核酸序列进行植物的标志物辅助的培育的方法。该实施方式包括以下步骤。一个步骤包括,对于至少一种植物,将所述植物的核苷酸序列的至少一部分与本发明的特定的EG81345核酸序列进行比较,所述特定的EG81345核酸序列是例如选自下列的核酸序列的至少一部分:(i)包含选自下列的核酸的核酸:包含选自SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ IDNO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:54、SEQ IDNO:55;SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物的核酸;和任意上述核酸的互补物。该方法还包括鉴定该植物是否包含特定核酸序列的步骤;以及培育包含特定核酸序列的植物以产生后代的步骤。该方法也可以以EG81345多肽进行。或者,该方法包括比较上述SEQ ID NO之一,或其至少20个核苷酸的部分,或其互补物,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
用于标志物辅助的培育的方法还包括就特定的EG82013核酸序列进行植物的标志物辅助的培育的方法。步骤包括,对于至少一种植物,将所述植物的核苷酸序列的至少一部分与本发明的特定的EG82013核酸序列进行比较,所述特定的EG82013核酸序列是例如选自下列的核酸序列的至少一部分:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30和SEQ ID NO:58;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物的核酸;和任意上述核酸的互补物;鉴定该植物是否包含特定核酸序列;以及培育包含特定核酸序列的植物以产生后代。该方法也可以以EG82013多肽进行。或者,该方法包括比较上述SEQ ID NO之一,或其至少20个核苷酸的部分,或其互补物,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
在一个实施方式中,本发明包括EG81345和EG82013核酸,其包括分离的核酸,所述分离的核酸包括选自下列的核酸:SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:58、SEQ ID NO:59和SEQ ID NO:60;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸。分离的核酸还包括选自下列的核酸的互补物:SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:58、SEQ ID NO:59和SEQ ID NO:60。
本发明还包括分离的多肽,其包含(包括)SEQ ID NO:5或SEQ IDNO:52的至少6个氨基酸的部分;由包含选自下列的核酸的核酸编码的一种或多种多肽的至少一部分:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59和SEQ ID NO:60;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;以及任意上述核酸的互补物;以及由核酸编码的多肽,所述核酸与以上所列的核酸具有至少大约80%的序列同一性,并且赋予与以上所列核酸赋予的产量基本上相同的产量。
在另一个实施方式中,本发明包括用于鉴定植物中的编码EG81345的基因的一个或多个等位基因的方法。特别地,该方法包括:测定来自植物的核酸样品中是否存在植物EG81345基因中的一个或多个单核苷酸多态性,其中所述单核苷酸多态性选自:SEQ ID NO:51,位置521,C或T;SEQ ID NO:51,位置600,C或T;SEQ ID NO:51,位置644,A或G;SEQ ID NO:51,位置649,G或A;SEQ ID NO:51,位置665,A或G;SEQ ID NO:51,位置807,C或T;SEQ ID NO:51,位置825,T或G;SEQ ID NO:51,位置873,T或C;SEQ ID NO:51,位置924,T或C和SEQ ID NO:51,位置984,T或C。在本文公开的野生稻(O.rufipogon)的序列中,等同的核苷酸位置是:SEQ ID NO:49,位置71,C或T;SEQID NO:49,位置150,C或T;SEQ ID NO:49,位置194,A或G;SEQID NO:49,位置199,G或A;SEQ ID NO:49,位置215,A或G;SEQID NO:49,位置357,C或T;SEQ ID NO:49,位置375,T或G;SEQID NO:49,位置423,T或C;SEQ ID NO:49,位置474,T或C和SEQID NO:49,位置984,T或C。
本发明还包括用于鉴定植物中的编码EG82013的基因的一个或多个等位基因的方法,该方法包括:测定来自植物的核酸样品中是否存在植物EG82013基因中的一个或多个单核苷酸多态性,其中所述单核苷酸多态性选自:SEQ ID NO:2(或SEQ ID NO:4),位置72,C或T;SEQ IDNO:2(或SEQ ID NO:4),位置78,C或T;SEQ ID NO:2(或SEQ IDNO:4),位置132,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置183,C或T;SEQ ID NO:2(或SEQ ID NO:4),位置279,A或G;SEQ IDNO:2(或SEQ ID NO:4),位置306,C或T;SEQ ID NO:2(或SEQ IDNO:4),位置340,T或C;SEQ ID NO:2(或SEQ ID NO:4),位置348,G或A;SEQ ID NO:2(或SEQ ID NO:4),位置414,A或G;SEQ IDNO:2(或SEQ ID NO:4),位置546,A或G;SEQ ID NO:2(或SEQ IDNO:4),位置555,T或C;SEQ ID NO:2(或SEQ ID NO:4),位置690,T至G;SEQ ID NO:2(或SEQ ID NO:4),位置851,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置901,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置924,G至A;SEQ ID NO:2(或SEQ ID NO:4),位置953,C或G;SEQ ID NO:2(或SEQ ID NO:4),位置1000,G或A;SEQ ID NO:2(或SEQ ID NO:4),位置1012,A或T;SEQ ID NO:2(或SEQ ID NO:4),位置1016,T或A;SEQ ID NO:2(或SEQ ID NO:4),位置1153,A或T;SEQ ID NO:2(或SEQ ID NO:4),位置1174,G或A;SEQ ID NO:2(或SEQ ID NO:4),位置1185,T或A和SEQ ID NO:2(或SEQ ID NO:4),位置1248,T或A。
本发明的一个实施方式包括制备经转染的植物细胞或转基因植物的方法,包括以EG82013或EG81345多核苷酸转染植物细胞。
具体实施方式
在本发明中,本发明人鉴定了对应于EG82013(对于栽培稻(O.sativa)(栽培的水稻)和野生稻(祖先水稻)而言)的基因、核酸和多肽,以及对应于EG81345(对于栽培稻(栽培的水稻)和野生稻(祖先水稻)而言)的核酸。本发明人还从公众可获得的来源选择了对应于数个其它植物物种中的上述基因的EST。这些基因均与产量相关,并且本发明人已经表明它们控制产量。本发明的核酸和多肽可用于多种方法,例如用于鉴定植物中的与产量有关的核酸序列或者作为产量标志物的核酸序列的方法;测定植物是否具有包含EG81345或EG82013序列的一种或多种核酸序列的方法;以及就特定的EG81345或EG82013序列进行植物的标志物辅助的培育的方法。本发明的核酸和多肽还可用于产生植物细胞、繁殖材料、转基因植物,以及转染的宿主细胞。更具体而言,本发明的核酸和多肽可用作用于改进的标志物辅助的选择或标志物辅助的培育的标志物。此外,此类核酸和多肽可用于鉴定具有共同祖先的其它物种或科成员中的同源基因,用作培育此类其它物种的标志物。例如,玉米、水稻、小麦、粟、高粱和其它谷物具有共同的祖先或科成员,在水稻中鉴定的基因可直接在这些其它的禾本科植物中产生同源基因。同样,番茄和马铃薯具有共同的祖先或科成员,通过本方法在番茄中鉴定的基因预期在马铃薯中具有同源物,反之亦然。
除非另有指明,否则本发明的实施应用常规的分子生物学、遗传学和分子进化技术,这些是本领域内的技能。此类技术在文献中有完善记载,例如″Molecular Cloning:A Laboratory Manual″,第二版(Sambrook等人,1989);″Oligonucleotide Synthesis″(M.J.Gait,ed.,1984);″Current Protocols in Molecular Biology″(F.M.Ausubel等人,eds.,1987);″PCR:The Polymerase Chain Reaction″,(Mullis等人,eds.,1994);″Molecular Evolution″,(Li,1997)。
应该注意,术语,″一种(a)″或″一种(an)″实体是指一种或多种该实体;例如,一种基因是指一种或多种基因或至少一种基因。因此,术语″一种(a)″(或″一种(an)″)、″一种或多种″和″至少一种″可以在本文中相互替换地使用。还应该注意,术语″包含(comprising)″、″包括(including)″和″具有(having)″可以相互替换地使用。
本文使用的“核酸”是指任意长度的核苷酸的聚合物形式,可以是核糖核苷酸或脱氧核糖核苷酸,或其类似物。该术语是指分子的初级结构,因此包括双链和单链DNA,以及双链和单链RNA。其还包括修饰的核酸,例如甲基化和/或加帽的核酸,含有修饰的碱基、骨架修饰的核酸等。术语“核酸”和“核苷酸序列”相互替换地使用。
本文使用的“基因”是指包含编码蛋白的序列的核酸或核酸的一部分。本领域熟知的是,基因也包括非编码序列,例如5’和3’侧翼序列(例如启动子、增强子、阻抑子和其它调节序列)以及内含子。
在本文中,术语“多肽”、“肽”和“蛋白”可相互替换地使用,其是指任意长度的氨基酸的聚合物。这些术语还包括,通过包括糖基化、乙酰化和磷酸化的反应进行翻译后修饰的蛋白。
术语“驯化的生物”是指经历了人工选择压力并具有了商业上或审美上相关的性状的单个的活生物体或其群体、物种、亚种、品种、栽培变种或株。在一些优选的实施方式中,驯化的生物是选自下列的植物:玉米、小麦、水稻、高粱、番茄或马铃薯,或任何其它商业上受关注的栽培植物,其中祖先或科成员是已知的。“植物”是处于任意发育阶段的任意植物,尤其是种子植物。
术语“野生祖先或科成员”或“祖先或科成员”或“祖先/科成员”意思是祖先的或先前的生物、物种、亚种、品种、栽培变种或株,或由其进化而来的驯化的生物、物种、亚种、品种、栽培变种或株。驯化的生物可以具有一个或多个祖先或科成员。通常而言,栽培植物可以具有一个或多个祖先或科成员。术语“科成员”意思是相同的分类科的成员,作为一个物种。例如,水稻和玉米属于分类科的禾本科。禾本科中的其它“科成员”包括柳枝稷、甘蔗、高粱、芒草等。
术语“商业上或审美上相关的性状”在本文中用于指存在于驯化的生物例如植物或动物中的性状,其分析可以提供有关开发改良的生物或开发能够调节负责该性状的多肽或相应核酸的试剂的信息(例如物理或生物化学数据)。所述的商业上或审美上相关的性状相对于祖先或科成员而言可以是独特的、增强的或改变的。“改变的”意思是相关性状与在祖先或科成员中观察到的性状具有质量或数量上的差异。优选的商业上或审美上相关的性状是产量。
术语“KA/KS-型方法”意思是评估同源基因中的错义替换(nonsynonymous substitution)和同义替换(synonymoussubstitution)的数目之间的差异的方法(包括测定错义和同义位点的更严格的方法),所述差异通常(但不绝对)显示为比例。这些方法的命名使用数种命名系统,包括但不限于KA/KS、dN/dS、DN/DS
术语“进化上显著的变化”和“适应性的进化上的变化”是指,两种生物、物种、亚种、品种、栽培变种和/或株之间的一个或多个核苷酸或肽序列的变化,所述变化可归因于选择性压力或阳性选择性压力的松弛。用于测定存在进化上显著的变化的一种方法是使用KA/KS-型分析方法,例如测定KA/KS比。通常而言,等于或大于1.0的KA/KS比被认为是进化上显著的变化。
严格来讲,恰好等于1.0的KA/KS比表示选择性压力的松弛(中性进化,neutral evolution),而大于1.0的KA/KS比表示阳性选择。但是,通常接受的是,GenBank和其它公共数据库中的EST通常会有一定程度的测序谬误,即使是少数错误的核苷酸也会影响KA/KS比。因此,可以对那些KA/KS比低至0.75的核酸认真地进行重新测序,并且重新评估选择性压力(中性的进化上的显著性变化)、阳性选择压力(阳性的进化上的显著性变化)或阴性选择性压力(进化上保守的变化)的松弛。
术语“阳性的进化上的显著性变化”意思是特定生物、物种、亚种、品种、栽培变种或株中的进化上显著的变化,该变化导致相对于其它相关生物而言是阳性的适应性改变。阳性的进化上的显著性变化的实例是引起农作物植物的增加的产量的变化。如上所述,阳性选择由大于0.75的KA/KS比指示;更高的比例也显示阳性选择,例如大于1.0的那些。在其它实施方式中,KA/KS比值大于1.25、1.5和2.0。
术语“中性的进化上的显著性变化”是指,相对于其祖先生物出现在驯化生物中的核酸或多肽变化,所述变化在中性条件下产生。中性的进化上的变化由大约0.75至1.25,优选大约0.9至1.1,最优选等于大约1.0的KA/KS比值指示。另外,在中性进化的情况下,不推断“定向性(directionality)”。基因可以自由地积累变化,没有限制,所以祖先和驯化形式相对于彼此都在改变。
术语“同源的”或“同源物”或“直向同源物(ortholog)”在本领域是已知的且有周知的含义,其是指具有共同祖先或科成员的相关序列,其是基于序列同一性程度而测定的。这些术语描述了存在于一种物种、亚种、品种、栽培变种或株中的基因与存在于另一物种、亚种、品种、栽培变种或株中的对应基因或等同基因之间的关系。为了本发明的目的,比较了同源序列。“同源序列”或“同源物”或“直向同源物”被认为是、被相信是或已知是在功能上相关的。可以以多种方式中的任一种表示功能上的关系,所述方式包括但不限于:(a)序列同一性程度;(b)相同或相似的生物学功能。优选地,以(a)和(b)二者来表示。序列同一性的程度可以变化,但是,在一个实施方式中,其是至少50%(使用本领域已知的标准序列比对程序时),至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少大约91%,至少大约92%,至少大约93%,至少大约94%,至少大约95%,至少大约96%,至少大约97%,至少大约98%,或至少大约99%。
可以使用本领域中可以容易地获得的软件程序测定同源性,例如在Current Protocols in Molecular Biology(F.M.Ausubel等人编,1987)增刊30,第7.718部分,表7.71中讨论的那些。优选的比对程序是MacVector(Oxford Molecular Ltd,Oxford,U.K.)和ALIGN Plus(Scientific and Educational Software,Pennsylvania)。另一种优选的比对程序是Sequencher(Gene Codes,Ann Arbor,Michigan),使用缺省参数。下文中可以找到展开的讨论。
术语“核苷酸变化”是指核苷酸的替换、删除和/或插入,如本领域所熟知的。
“持家基因”是本领域熟知的术语,其意思是与一般性的细胞功能,包括但不限于生长、分裂、停滞、代谢和/或死亡相关的那些基因。“持家”基因一般执行在不止一种细胞类型中存在的功能。相反,细胞特异性基因一般执行特定细胞类型和/或类别中的功能。
本文使用的术语“试剂”意思是生物或化学化合物,例如单一的或复合的有机或无机分子、肽、蛋白或寡核苷酸,它们调节核酸或多肽的功能。可以合成大量的化合物,例如寡聚体,例如寡肽和寡核苷酸,以及基于多种核心结构的合成的有机和无机化合物,这些也包括在术语“试剂”的范围内。此外,多种天然来源可以提供用于筛选的化合物,例如植物或动物提取物等。可以单独地或彼此结合地测试化合物。
术语“调节核酸或多肽的功能”意思是,核酸或多肽的功能与不添加试剂时相比发生了改变。调节可以在任何影响功能的水平上进行。核酸或多肽的功能可以是直接的或间接的,并且可以直接地或间接地测定。
“核酸的功能”包括但不限于,复制、翻译、表达样式。核酸功能还包括与该核酸编码的多肽相关的功能。例如,作用于核酸并影响蛋白表达、构象、折叠(或其它物理特性)、结合其它部分(例如配体)、活性(或其它功能特性)、调节和/或蛋白结构或功能的其它方面的试剂被认为是调节了核酸的功能。
“多肽的功能”包括但不限于,构象、折叠(或其它物理特性)、结合其它部分(例如配体)、活性(或其它功能特性)和/或蛋白结构或功能的其它方面。例如,作用于多肽并影响其构象、折叠(或其它物理特性)、结合其它部分(例如配体)、活性(或其它功能特性)和/或蛋白结构或功能的其它方面的试剂被认为是调节了多肽的功能。有效的试剂可以发挥作用以调节多肽功能的方式包括但不限于,1)改变构象、折叠或其它物理特性;2)改变与其天然配体的结合强度或改变与配体结合的特异性;和3)改变多肽的活性。
术语“靶位点”意思是多肽中的位置,其可以是单一的氨基酸和/或是结构性和/或功能性基序的一部分,例如结合位点、二聚化结构域或催化活性位点。靶位点可用于直接或间接与试剂例如治疗性试剂相互作用。
术语“分子差异”包括任何结构上和/或功能上的差异。在本文中描述了用于检测此类差异的方法,以及此类差异的实例。
“功能效应”是本领域熟知的术语,其意思是在任何活性水平上显示的任何效应,无论是直接的还是间接的。
术语“收获的容易性”是指植物特性或特征,其促进人工或自动化收集结构或部分(例如果实、叶子、根)以用于消费或其它商业加工。
术语“产量”是指可以获得的植物或动物组织或材料的数量,以被人类用于食物、治疗、兽医或其它市场。可以通过多种直接度量值定量产量。例如,可以通过以下直接度量值定量水稻的产量:每英亩产量、谷粒重量(千粒重、有壳的和去壳的种子重量)、谷粒宽度、谷粒长度、穗数、每穗种子数、每穗饱满种子数、饱满种子的重量、结实率、每株穗数、总研磨重量、完全研磨重量、生物质等。可以通过例如每英亩产量、穗数、每穗粒数、总粒重等直接度量值来定量玉米产量。还可以通过多种间接度量值(例如,倒伏、植物活力)以及可接受质量的谷粒产量的度量值来定量产量,例如,可以通过谷粒质量度量值例如ASV、淀粉含量和垩白(chalk)来定量水稻产量。可以通过间接度量值例如每粒的淀粉量、倒伏等定量玉米产量。可以通过总的植物生物质、植物生长速率等来测定植物产量。
术语“产量基因”是指对于产量或与产量相关的性状具有显著影响的基因,例如,如通过上文描述的直接和间接度量值来定量的。
术语“增强的经济上的生产力”是指调节商业上或审美上相关的性状以便改善想要的特性的能力。增加的产量和增强的压力抗性是增强的经济上的生产力的两个实例。
为了本发明的目的,来自栽培植物或其祖先或科成员或任何其它植物的核酸的来源可以是任何适当的来源,例如基因组序列或cDNA序列。优选地,对cDNA序列进行比较。可以从可获得的私人的、公共的和/或商业的数据库例如本文描述的那些获得编码蛋白的序列。这些数据库作为通过目前正在进行的研究成果产生的分子序列数据的贮库。或者,可以从例如由细胞中表达的mRNA逆转录而来的cDNA的测序或进行PCR扩增之后(根据本领域熟知的方法)获得编码蛋白的序列。或者,可以使用基因组序列进行序列比较。可以从可获得的公共的、私人的和/或商业的数据库获得基因组序列,或者可以在PCR之后从基因组DNA文库或从基因组DNA的测序获得基因组序列。
在一些实施方式中,从获自确定的发育阶段的组织,或在生物经历了特定环境状况之后获得的组织的mRNA制备cDNA。可以使用常规的cDNA文库构建技术来构建用于本发明的序列比较的cDNA文库,所述技术在本领域文献中有完善的解释。总mRNA用作模板以逆转录cDNA。将转录的cDNA亚克隆进入合适的载体以建立cDNA文库。建立的cDNA文库可以就全长cDNA含量进行最大化,虽然小于全长的cDNA也是可以使用的。此外,可以根据例如Bonaldo等人(1996)Genome Research6:791-806来校正序列频率。可以使用标准的自动化测序技术对从构建的cDNA文库中随机选择的cDNA克隆进行测序。优选的,使用全长cDNA克隆进行测序。可以对来自cDNA文库的全部的或大部分的cDNA克隆进行测序,虽然也可以通过仅对单个cDNA或数个cDNA克隆进行测序来实施本发明的一些实施方式。
在本发明的一个优选实施方式中,可以根据表达特异性预选择待测序的cDNA克隆。为了选择对应于特异性表达的活性基因的cDNA,可以使用获自其它生物、相同生物的组织或细胞的mRNA对cDNA进行扣除杂交(subtraction hybridization)。在具有合适的严格性和浓度的一定的杂交条件下,那些与非组织特异性mRNA杂交并因此可能代表“持家”基因的cDNA将会被从cDNA库中排除。因此,剩余的待测序的cDNA更有可能与组织特异性功能有关。为了扣除杂交的目的,可以从一种组织或优选从不同组织和细胞的组合中获得非组织特异性的mRNA。使非组织特异性的mRNA的数量最大化以使组织特异性cDNA饱和。
或者,可以使用来自在线数据库的信息来选择更有可能与特定功能有关的cDNA或给予此等cDNA优先权。例如,可以使用从候选的驯化生物的cDNA序列设计而来的引物通过PCR来选择用于测序的祖先cDNA候选物。候选的驯化生物的cDNA序列是例如,那些仅存在于植物的特定部分中的cDNA序列,或那些对应于有可能在特定功能中具有重要意义的基因的cDNA序列。可以通过搜索在线序列数据库(其中可能指明了关于cDNA序列的表达特征谱和/或生物学活性的信息)获得此类特定的cDNA序列。
可以使用本领域的标准方法,例如PCR方法(使用例如GeneAmp PCRSystem 9700热循环仪(Applied Biosystems,Inc.))获得与已知的驯化生物的基因同源的祖先序列。例如,可以使用从候选的驯化生物的cDNA序列设计而来的引物通过PCR选择用于测序的祖先cDNA候选物。对于PCR而言,可以使用本领域的标准方法,从驯化生物的序列制备引物,包括公众可以获得的引物设计程序例如
Figure BDA0000048637190000141
(WhiteheadInstitute)。然后,可以使用本领域标准的方法和设备,例如自动化测序仪(Applied Biosystems,Inc.),对扩增的祖先序列进行测序。同样,可以使用祖先或科成员基因模拟物来获得驯化生物中的对应基因。
在优选的实施方式中,本文描述的方法可用于鉴定控制农业上具有重要意义的栽培植物的感兴趣的性状的基因。人类已经培育了栽培植物数千年,但没有掌握关于控制这些性状的基因的知识。掌握关于涉及的特定遗传机理的知识将允许更加迅速和直接地在分子水平上进行干预以产生具有想要的或增强的性状的植物。
通过人工选择,人类已经对农作物植物提供了强烈的选择压力。该压力反映在驯化生物与其野生祖先或科成员的同源基因之间的进化上的显著变化上。已经发现仅有少数基因控制栽培的农作物植物的商业上关注的性状,例如10-15个基因/物种。这些少数基因通过标准的植物分子生物学方法是极其难以鉴别的。本文描述的KA/KS和相关的分析能够鉴定控制感兴趣的性状的基因。
特别地,KA/KS型分析已经鉴定了EG82013和EG81345基因,作为在水稻驯化过程中经过阳性的进化上选择的基因。
对于任意感兴趣的农作物植物,可以从栽培的物种或亚种及其野生祖先或科成员构建cDNA文库。如1999年1月29日提交的USSN09/240,915(现在是美国专利号6,228,586)所描述,每个cDNA文库针对另一个进行″BLAST″,以鉴定同源核酸。或者,技术人员可以获得商业上和/或公众可获得的基因组或cDNA数据库,而不是构建cDNA文库。本文引用的所有专利和专利申请都通过引用的方式全文并入本文。
接下来,可以进行KA/KS或相关分析以鉴定在选择性压力下已经迅速进化的选择的基因。然后使用标准的分子和转基因植物方法评估这些基因,以确定它们是否在商业上或审美上感兴趣的性状中具有作用。使用本发明的方法,本发明人已经鉴定了对应于基因EG81345或EG82013(它们是产量基因)的核酸和多肽。可以通过例如随机或定点诱变来操作感兴趣的基因,以开发新的改良的品种、亚种、株或栽培变种。
一般而言,在本发明的一个实施方式中,核苷酸序列获自驯化的生物及野生祖先或科成员。将所述驯化的生物及祖先或科成员的核苷酸序列彼此比较以鉴定同源的序列。分析同源的序列以鉴定那些在驯化的生物与祖先或科成员之间具有核酸差异的同源序列。然后,进行分子进化分析,以定量和定性地评估该差异在进化上的显著性。对于经过阳性选择的基因,可以进行外围分析(outgroup analysis)以鉴定那些在驯化的生物(或在祖先或科成员)中经过阳性选择的基因。然后,以分子/遗传同一性和生物学功能的方式表征序列。最后,信息可用于鉴定调节基因编码的多肽的生物学功能的试剂。
本发明的一般性方法需要比较祖先与驯化生物的编码蛋白的核苷酸序列。生物信息学被应用到所述比较,并选择包含进化上的显著性变化的核苷酸变化的序列。本发明实现了基因的鉴定,所述基因进化为赋予一些进化上的益处;实现了特定进化变化的鉴定。例如,驯化的生物可以是栽培稻;野生祖先或科成员可以是野生稻。在本发明的情况下,编码蛋白的核苷酸序列通过标准测序技术获自植物克隆。
将驯化生物及其祖先或科成员的编码蛋白的序列进行比较以鉴定同源序列。本发明考虑到用于完成该比较的任何合适的机制。
以下术语用于描述两个或更多个核酸之间的序列关系:(a)“参考序列”,(b)“比较窗口”,(c)“序列同一性”,(d)“序列同一性百分率”,和(e)“基本上的同一性”。
(a)如本发明使用的“参考序列”是用作序列比较的基础的确定序列。参考序列可以是指定序列的子集或全部;例如,全长cDNA或基因序列的区段,或完整的cDNA或基因序列。(b)如本文使用的“比较窗口”包括提及核酸序列的连续的且指定的区段,其中所述核酸序列可以与参考序列进行比较,并且其中,比较窗口中的核酸序列的部分相对于参考序列(不包含添加或删除)可以包含添加或删除(即空隙),以进行两个序列的优化比对。一般而言,比较窗口的长度是至少20个连续核苷酸,任选可以是30、40、50、100或更长。本领域技术人员理解,为了避免由于在核酸序列中包括空隙而造成的与参考序列的高度相似性,通常引入空隙罚分并从匹配的数目中减掉它。用于比较的序列比对方法是本领域熟知的。
可以人工进行比对或由软件进行(合适的比对程序的实例是本领域已知的)。优选的,将来自祖先/科成员或科成员的编码蛋白的序列通过数据库搜索例如BLAST搜索与驯化物种的序列进行比较。恢复并分析高得分的“命中”,即在BLAST分析之后显示显著相似性的序列。显示显著相似性的序列可以是那些具有至少大约60%、至少大约75%、至少大约80%、至少大约85%或至少大约90%序列同一性的序列。优选地,对那些显示出大约80%以上同一性的序列进行进一步分析。可以使用本领域已知的和可获得的序列比对方法和程序例如通常使用的Higgins等人(1992)CABIOS 8:189-191的简便比对程序CLUSTAL V来比对通过数据库搜索鉴定的同源序列(以其整体进行比对)。
在其它实施方式中,用于比较的序列比对可由下列方法进行:Smithand Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法;Needleman and Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法;Pearson and Lipman,Proc.Natl.Acad Sci.85:2444(1988)的搜索相似性方法;这些算法的计算机化执行,包括但不限于:Intelligenetics,Mountain View,Calif.的PC/Gene程序中的CLUSTAL;Genetics Computer Group(GCG),575 Science Dr.,Madison,Wis.,USA的Wisconsin Genetics Software Package中的GAP、BESTFIT、BLAST、PASTA和TFASTA;CLUSTAL程序由Higgins and Sharp,Gene73:237-244(1988);Higgins and Sharp,CABIOS 5:151-153(1989);Corpet,等人,Nucleic Acids Research 16:10881-90(1988);Huang,等人,Computer Applications in the Biosciences 8:155-65(1992);和Pearson,等人,Methods in Molecular Biology 24:307-331(1994)进行了很好的描述。可用于数据库相似性搜索的BLAST程序家族包括:用于核苷酸查询序列针对核苷酸数据库序列的BLASTN;用于核苷酸查询序列针对蛋白数据库序列的BLASTX;用于蛋白查询序列针对蛋白数据库序列的BLASTP;用于蛋白查询序列针对核苷酸数据库序列的TBLASTN;以及,用于核苷酸查询序列针对核苷酸数据库序列的TBLASTX。参见Molecular Biology,第19章中的Chapter Protocols,Ausubel等人编,Greene Publishing and Wiley-Interscience,New York(1995)。
除非另有指明,否则本文提供的序列同一性/相似性数值是指,使用缺省参数使用BLAST 2.0程序包(Altschul等人,Nucleic Acids Res.25:3389-3402(1997))获得的值。用于执行BLAST分析的软件是公众可以获得的,例如通过国家生物信息中心(http://www.hcbi.nlm.nih.gov/)获得。该算法包括,首先通过鉴定查询序列中长度为W的短词(short word)来鉴定高得分序列对(HSP),当与数据库序列中相同长度的词比对时,其匹配或满足一些阳性数值的阈值分T。T被称作相邻词分阈值(neighborhood word scorethreshold)(Altschul等人,见上文)。这些最初的相邻词命中作为种子以启动搜索以发现包含它们的更长的HSP。然后沿着每个序列的两个方向延伸词命中(word hit),尽量远地延伸,直至累积比对不能再增加为止。对于核苷酸序列而言,使用参数M(匹配残基的配对的奖励得分;总是大于0)和N(错配残基的罚分;总是小于0)计算累积得分。对于氨基酸序列而言,使用得分矩阵来计算累积得分。当出现以下情况时,每个方向上的词命中的延伸停止:累积比对分数相对于其达到的最大值下降数量X;由于一个或多个负得分残基比对的积累,累积分数成为0或小于0;或达到任一序列的末端。BLAST算法的参数W、T和X决定该算法的灵敏性和速度。BLASTN程序(用于核苷酸序列)使用的缺省值是:词长(W)=11,期望(B)=10,截止=100,M=5,N=-4,比较两条链。对于氨基酸序列,BLASTP程序使用的缺省值是:词长(W)=3,期望(B)=10,和BLOSUM62得分矩阵(参见Henikoff & Henikoff(1989)Proc.Natl.Acad.Sci,USA 89:10915)。
除了计算序列同一性百分率,BLAST算法还进行两个序列之间的相似性的统计学分析(参见,例如Karlin & Altschul,Proc.Nalt.Acad.Sci USA 90:5873-5787(1993))。BLAST算法提供的相似性的一个度量值是最小求和概率(P(N)),其提供了两个核苷酸或氨基酸序列发生机会性匹配的概率的指征。BLAST搜索假设蛋白可被模拟为随机序列。然而,很多真实的蛋白包含非随机序列的区域,所述非随机序列可以是同聚串、短期重复序列或富含一种或多种氨基酸的区域。即使蛋白的其它区域是完全不相似的,也可以在不相关蛋白之间比对此类低复杂性的区域。可以应用多个低复杂性过滤程序以减少此类低复杂性比对。例如,可以单独使用SEG(Wooten and Federhen,Comput.Chem.,17:149-163(1993))和XNU(Claverie and States,Comput.Chem.,17:191-201(1993))低复杂性过滤器或联合使用。(c)在两个核酸或多肽序列的语境下,如本文使用的“序列同一性”或“同一性”包括指称两个序列中的这样的残基:当在指定的比较窗口就最大相应性比对时,所述残基是相同的。当序列同一性百分率用于指称蛋白时,应认识到,不同的残基位置的区别经常在于保守性氨基酸替换,其中氨基酸残基被替换为其它具有相似化学性质(例如电荷或疏水性)的氨基酸残基,因此,不会改变分子的功能特性。当序列的区别在于保守性替换时,可以上调序列同一性百分率以校正替换的保守性质。区别在于此类保守性替换的序列被称为具有“序列相似性”或“相似性”。进行此类调整的方法是本领域技术人员熟知的。通常,这包括将保守性替换的得分规定为部分的而非完全的错配,从而增加序列同一性百分率。因此,例如,当相同的氨基酸的得分是1并且非保守性替换的得分是0时,保守性替换的分数定为0和1之间。根据例如Meyers and Miller,Computer Applic.Biol.Sci.,4:11-17(1988)的算法计算保守性替换的得分,如在程序PC/GENE(Intelligenetics,Mountain View,Calif.USA)中执行。(d)如本文使用的“序列同一性百分率”意思是,通过在比较窗口上比较两个最佳比对的序列而确定的数值,其中比较窗口中的核酸序列的部分相对于参考序列(其不包含添加或删除)可以包含添加或删除(即空隙),以进行两个序列的最佳比对。百分率是这样计算的:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置数,以产生匹配位置数,将匹配位置数除以比较窗口中的总位置数,并将结果乘以100以产生序列同一性百分率。(e)(I)术语核酸序列的“基本上的同一性”意思是,核酸包含与参考序列相比具有至少70%序列同一性,优选至少80%,更优选至少90%,最优选至少95%序列同一性的序列(使用标准参数使用所描述的一种比对程序确定)。技术人员将认识到,通过考虑密码子简并性、氨基酸相似性、阅读框位置等,可以对这些数值进行适当的调整以确定两个核苷酸序列编码的蛋白的相应的同一性。为此目的,氨基酸序列的基本上的同一性的通常的意思是至少60%,或优选至少70%,最优选至少80%的序列同一性。
在一个实施方式中,为了本发明的方法,本发明提供了以下序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ IDNO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55;SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:58、SEQ ID NO:59和SEQ ID:60。本发明还提供了分离的核酸,其包含上述核酸的至少20个连续核苷酸;以及与上述核酸具有至少大约50%、至少大约55%、至少大约60%、至少大约65%、至少大约70%、至少大约75%、至少大约80%、至少大约85%、至少大约90%、至少大约95%的同一性并且是植物中的产量标志物或产量基因的核酸;以及任意上述核酸的互补物。所述20个连续核苷酸可以选自核酸序列的任意部分。
在一个实施方式中,核酸序列包含引物组,当使用所述引物组对植物的核酸序列的一部分进行基因分型时,产生扩增子,所述扩增子包含至少一个核苷酸差异,该差异鉴别EG81345或EG82013的特定的等位基因、同源物或直向同源物。优选地,所述至少一个核苷酸差异与产量差异相关联。更具体地,在该实施方式中,针对邻近EG82013或EG81345核酸中的靶向扩增子(例如,与参考核酸相比包含至少一个核苷酸变化的扩增子,或与参考核酸相同的扩增子,取决于具体应用)的区域、远离它的区域、或与之重叠的区域设计引物,并产生另外的扩增子。在一个实施方式中,可以通过对每个扩增子进行DNA测序来实现基因分型。如果在来自一种植物品系(近亲交配或杂交)的扩增子与来自另一种植物品系的直向同源扩增子之间存在任何核苷酸差异,则进行统计学分析以确定与产生此类核苷酸差异的任何关联。靶扩增子的长度可以变化。用于基因分型的最有用的扩增子长度是通过经验确定的。可以在EG82013或EG81345染色体基因座上的任何位置设计靶扩增子;此类扩增子可以邻近用于该实施例的靶扩增子,或者此类扩增子可以与靶扩增子重叠。或者,可以从我们的靶扩增子分离合适的扩增子;它们可能位于EG82013或EG81345染色体基因座内,但是在5’或3’处距离靶扩增子一段距离。
在一个实施方式中,本发明的至少20个连续核酸包括这样的核酸,所述核酸包括引物,所述引物被设计为产生掺入了如上所述的一个或多个多态性的扩增子。在另一个实施方式中,本发明的至少20个连续核酸包括这样的核酸,所述核酸与所称的EG82013或EG81324序列具有至少60%的同一性,与所称的EG82013或EG81324序列具有至少65%的同一性,与所称的EG82013或EG81324序列具有至少70%的同一性,与所称的EG82013或EG81324序列具有至少75%的同一性,与所称的EG82013或EG81324序列具有至少80%的同一性,与所称的EG82013或EG81324序列具有至少85%的同一性,与所称的EG82013或EG81324序列具有至少90%的同一性,或与所称的EG82013或EG81324序列具有至少95%的同一性。
在另一个实施方式中,通过本发明的方法鉴定的核酸包括:与所称的EG82013或EG81324序列的至少20个连续核酸的部分至少60%同一的核苷酸,与所称的EG82013或EG81324序列的至少20个核酸的部分至少65%同一的核苷酸,与所称的EG82013或EG81324序列的至少20个核酸的部分至少70%同一的核苷酸,与所称的EG82013或EG81324序列的至少20个核酸的部分至少75%同一的核苷酸,与所称的EG82013或EG81324序列的至少20个核酸的部分至少80%同一的核苷酸,与所称的EG82013或EG81324序列的至少20个核酸的部分至少85%同一的核苷酸,与所称的EG82013或EG81324序列的至少20个核酸的部分至少90%同一的核苷酸,或与所称的EG82013或EG81324序列的至少20个核酸的部分至少95%同一的核苷酸。
在一个实施方式中,本发明包括用于鉴定植物中的EG81345同源核酸序列或EG81345等位基因的方法。该方法包括以下步骤。在一个步骤中,将植物核酸序列的至少一部分与至少一个核酸进行比较。该核酸可以是以下任意项:包含选自SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ IDNO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ IDNO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55;SEQ ID NO:56,SEQ IDNO:57,SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%的序列同一性并且是植物中的产量标志物或产量基因的核酸;以及上述任意核酸的互补物。所述方法还包括鉴定该植物中与任意上述核酸相同的至少一个核酸序列。或者,该方法包括将上述SEQ ID NO之一,或其至少20个核苷酸的部分,或其互补物与植物核酸序列的至少一部分进行比较,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
本发明还包括,将植物多肽序列的至少一部分与下列任意项所编码的至少一个EG81345多肽进行比较的步骤:包含选自SEQ ID NO:31,SEQID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ IDNO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ IDNO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55;SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;以及上述任意核酸的互补物。所述方法还包括鉴定该植物中与任意上述多肽相同的至少一个多肽序列。或者,该方法包括将上述SEQ ID NO之一,或其至少20个核苷酸的部分,或其互补物与植物核酸序列的至少一部分进行比较,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
在一个实施方式中,本发明包括用于鉴定植物中的EG82013同源核酸序列或EG82013等位基因的方法。该方法包括以下步骤。在一个步骤中,将植物核酸序列的至少一部分与至少一个核酸进行比较。该核酸可以是以下任意项:包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ IDNO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ IDNO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30和SEQ ID NO:58的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;以及上述任意核酸的互补物。所述方法还包括鉴定该植物中与任意上述核酸相同的至少一个核酸序列。或者,该方法包括将上述SEQ ID NO之一,或其至少20个核苷酸的部分,或其互补物与植物核酸序列的至少一部分进行比较,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
本发明还包括,将植物多肽序列的至少一部分与下列任意项所编码的至少一个EG82013多肽进行比较的步骤:包含选自SEQ ID NO:1,SEQID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ IDNO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30和SEQ ID NO:58的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;以及上述任意核酸的互补物。所述方法还包括鉴定该植物中与任意上述多肽相同的至少一个多肽序列。或者,该方法包括将上述SEQID NO之一,或其至少20个核苷酸的部分,或其互补物与植物核酸序列的至少一部分进行比较,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
提供了上述方法的数个实施方式。简而言之,本发明人在本文中提供了以下新的观点:EG82013和EG81345是与产量相关的基因和/或是产量的标志物。本发明人还证明,EG80312和EG81345是控制产量的基因。因此,本发明提供了鉴定特定植物物种中的、密切相关的植物物种之间(例如祖先植物和栽培植物)的、植物的特定科(例如禾本科)中的、或相关性不那么密切的植物的EG82013和EG81345的同源和/或直向同源基因,以及等位基因的方法。所述同源和/或直向同源基因和等位基因可以在多个植物物种中测定,最优选是如本文其它地方所描述的经驯化的植物物种。对应于EG82013和EG81345的任何区域的任何核苷酸序列(和/或多肽序列),或与EG82013和EG81345的区域具有显著序列同一性的核苷酸序列(和/或多肽序列)可用于本发明。
作为用于获得相同物种或密切相关物种中的直向同源序列的方法的实例,对应于野生稻(O.rufipogon)或栽培稻(O.sativa)中的EG82013或EG81345的核苷酸序列可用作查询序列,以搜索GenBank中的栽培稻(O.sativa)、野生稻(O.rufipogon)或稻属(Oryza)的任何其它成员例如野生稻(O.nivara)的EST以鉴定直向同源序列,搜索例如GenBank或任何其它序列库,例如由技术人员产生的文库。作为另一个实例,对应于获自栽培稻(O.sativa)、野生稻(O.rufipogon)或稻属(Oryza)的任何其它成员例如野生稻(O.nivara)的EG82013或EG81345的核苷酸序列可用作查询序列,以搜索GenBank中的栽培稻(O.sativa)、野生稻(O.rufipogon)或稻属(Oryza)的任何其它成员例如野生稻(O.nivara)的EST以鉴定直向同源序列。同源物可以理解为与世袭自共同祖先DNA序列的第二基因相关的基因。术语“直向同源物”涉及通过物种形成(speciation)而从共同祖先进化而来的不同物种中的基因。
或者,对应于获自栽培稻(O.sativa)、野生稻(O.rufipogon)或稻属(Oryza)的任何其它成员例如野生稻(O.nivara)的EG82013或EG81345的核苷酸序列可用作查询序列,以搜索其它物种尤其是商业上具有重要意义的物种(例如玉米、小麦、高梁、大麦等,如本文其它地方所描述)中的对应于EG82013或EG81345的基因。
应该注意,完整的编码蛋白的核苷酸序列是不需要的。事实上,可以比较部分cDNA序列,例如源自EST的序列。一旦通过以下描述的方法鉴定目标序列之后,可以使用进一步的克隆和/或生物信息学方法以获得基因或目标蛋白的完整编码序列。可以使用测序芯片技术同时进行驯化生物与其祖先/科成员或科成员之间的编码蛋白的序列的测序和同源性比较。参见,例如Rava等人,美国专利5,545,531。
对经比对的例如驯化生物与祖先/科成员或科成员的编码蛋白的序列进行分析,以鉴定特定位点处的核苷酸序列差异和/或肽序列差异。再次重申,本发明考虑到用于实现该分析的任何合适方法。如果不存在核苷酸序列差异,则通常不对祖先/科成员或科成员的编码蛋白的序列进行进一步分析。一般并且优选地,就正确性对所检出的序列差异进行初步检查。优选地,所述初步检查包括进行一个或多个下列步骤,任意这些步骤和所有这些步骤都是本领域已知的:(a)找到祖先与驯化生物序列之间存在变化的位点;(b)检查序列荧光分析图(色谱图)以确定看起来对祖先或科成员或驯化生物特异的碱基是否对应于特异于所述碱基的强烈的清晰的信号;(c)检查驯化生物的命中以确定是否存在不止一个对应于序列变化的驯化生物序列。
对于在某位置处具有相同核苷酸的相同基因(在所述位置处,在祖先或科成员序列中存在不同核苷酸)而言,多个驯化生物序列条目提供了独立的支持,其支持该驯化序列是正确的,并且该变化是显著性的。使用数据库信息和遗传密码检查此类变化以确定这些核苷酸序列变化是否引起所编码的蛋白的氨基酸序列的变化。从“核苷酸变化”的定义可知,本发明包括至少一个核苷酸变化,其可以是,与来自祖先或科成员的相应序列相比,在驯化生物的编码蛋白的核酸序列中的替换、删除或插入。优选地,所述变化是核苷酸替换。更优选地,在所鉴定的序列中存在不止一个替换,并且进行了分子进化分析。
本发明的该实施方式包括用于鉴定本发明的序列的等位基因变体的方法。如本文使用的“标志物”包括提及染色体上的基因座,其用于鉴定该染色体上的独特位置。“多形态标志物”包括提及以多种形式出现的标志物(等位基因),以致于,当不同形式的标志物存在于同源对中时,允许监控该对中的每个染色体的遗传。可以通过使用一种或多种标志物来定义基因型。
在另一个实施方式中,EG82013或EG81345基因可以是等位基因变体,其包括与本发明的EG82013或EG81345相似但不同的序列,位于基因组中的活性与相同的生物化学或发育过程相关的基因座(或多个基因座)上;和/或与包括本发明的EG82013或EG81345基因的基因出现在基本上相同的基因座上的基因,但是由于例如突变或重组造成的天然变异,该基因具有相似但不同的序列。由于基因组可以进行重排,所以等位基因的物理排列并不总是相同的。等位基因变体通常编码这样的多肽,所述多肽的活性类似于由与它们进行比较的那些基因所编码的多肽的活性。等位基因变体还包括基因的5’或3’非翻译区(例如调节控制区)中的改变。等位基因变体对于本领域技术人员而言是熟知的,并且被预期存在于给定的栽培变种或株中,因为基因组是多倍体的;和/或存在于包含两个或更多个栽培变种或株的群体中。等位基因可以定义为,与第二EG81345或EG82013核酸序列相比具有至少一个核苷酸变化的EG81345或EG82013核酸序列。
因此,用于编码本发明的EG82013或EG81345多肽同源物的核酸的最小的大小是大约12至大约18个核苷酸的长度。对于此类核酸的最大大小没有限制,除非是实际中的限制,因为所述核酸可以包括基因的一部分、整个基因或多个基因,或其部分。类似地,本发明的EG82013或EG81345多肽同源物的最小大小是大约4至大约6个氨基酸的长度,想要的大小取决于是否需要此类多肽的全长、融合、多价或功能部分。在一些实施方式中,所述多肽的长度是至少30个氨基酸。
如本文使用的EG82013或EG81345基因包括与天然EG82013或EG81345基因相关的所有核酸序列,例如控制由该基因编码的EG82013或EG81345多肽的产生的调节区域(例如但不限于,转录、翻译或翻译后控制区域),以及编码区本身。在一个实施方式中,EG82013或EG81345基因包括本发明的EG82013或EG81345核酸。在另一个实施方式中,EG82013或EG81345基因可以是等位基因变体,所述等位基因变体包括与本发明的EG82013或EG81345核酸相似但不同的序列。
在本文的另一个用途中,术语“产量或一些其它功能的标志物”是指观察到EG81345和EG82013等位基因可用作植物中的产量(或一些其它功能)的标志物。如本文使用的术语“产量基因”是指观察到EG81345和EG82013对产量具有影响。特别地,对于EG82013而言,本发明人获得的结果表明了与产量性状(包括产量、完整碾磨、总碾磨、种子重量和种子宽度)以及农学上的性状(倒伏和植物高度)的强烈的统计学上显著的相关性。对于EG81345而言,本发明人证明了与种子重量、总制粉率、碾磨水稻的完整重量、完整制粉率和倒伏的强烈的统计学上显著的相关性。由于本发明的基因是通过用于选择在驯化过程中产生的进化上显著的基因的方法发现的,所以由每个所述的基因的非驯化变体携带的每个等位基因可以是相对于驯化变体而言降低的产量的标志物。此外,在驯化的植物物种之间,以及在物种之内,例如在变体之间,在与产量相关的EG81345和EG82013之间存在等位基因差异,并且可以与不同数量的产量相关联。因此,本发明的范围内包括用于确定特定植物可能包含这些基因的哪些特定等位基因的方法。
优选地,EG82013或EG81345核酸序列与植物中增加的产量相关。在另一个实施方式中,本发明的EG82013或EG81345核酸序列调节植物的产量。在一个实施方式中,EG82013或EG81345核酸增加植物的产量。用于确定并定量产量的方法是本领域已知的,并且在本说明书的其它地方有讨论。例如,增加的产量可以是相对于来自共同祖先、属的第二植物或具有第二EG82013或EG81345核酸序列的科成员植物的增加的产量,所述第二EG82013或EG81345核酸序列相对于来自植物的EG82013或EG81345核酸序列具有至少一个核苷酸变化。
因此,本发明还提供了分离的核酸,其包含足够长并且与本发明的基因具有互补性的核酸,以用作检测、定量或分离基因转录物的探针或扩增引物。例如,本发明的分离的核酸可用作探针,以检测用于筛选想要的转基因植物的mRNA水平中的不足,用于检测基因中的突变(例如替换、删除或添加),用于监视用在化合物筛选测定中的酶活性的表达的上调或变化,用于检测基因的任意数目的等位基因变体(或多态性),或用作植物培育程序中的分子标志物。
特别地,本发明包括用于鉴定植物中的编码EG81345的基因的一个或多个等位基因的方法。特别地,该方法包括:测定来自植物的核酸样品中植物EG81345基因中的一个或多个单核苷酸多态性的存在,其中所述单核苷酸多态性选自:SEQ ID NO:51,位置521,C或T;SEQ ID NO:51,位置600,C或T;SEQ ID NO:51,位置644,A或G;SEQ ID NO:51,位置649,G或A;SEQ ID NO:51,位置665,A或G;SEQ ID NO:51,位置807,C或T;SEQ ID NO:51,位置825,T或G;SEQ ID NO:51,位置873,T或C;SEQ ID NO:51,位置924,T或C;和SEQ ID NO:51,位置984,T或C。已经发现:对于祖先等位基因SEQ ID NO:49,在对应于SEQ ID NO:51的等同位置,包括驯化的等位基因,在等同位置71处是T;在等同位置150处是T;在等同位置194处是G;在等同位置199处是A;在等同位置215处是G;在等同位置357处是T;在等同位置375处是G;在等同位置423处是C;在等同位置474处是C;在等同位置534处是C。相反,祖先等位基因在等同位置71处是C;在等同位置150处是C;在等同位置194处是A;在等同位置199处是G;在等同位置215处是A;在等同位置357处是C;在等同位置375处是T;在等同位置423处是C;在等同位置474处是T;在等同位置534处是T。本领域技术人员通过例如排列SEQ ID NO:51和SEQ ID NO:49上出现的起始密码子的方法将认识到,每个核苷酸变化的相应位置位于驯化的等位基因SEQ ID NO:51上的什么位置。
在另一个实施方式中,本发明包括用于鉴定植物中的编码EG81345的基因的一个或多个等位基因的方法。特别地,该方法包括以下步骤。在一个步骤中,将植物核酸序列的至少一部分与包含EG81345的等位基因的至少一个核酸进行比较。该核酸可以是下列任意项:包含选自SEQID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ IDNO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55;SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:59和SEQ IDNO:60的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸序列具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;和任意上述核酸的互补物。在该方法中,核酸在对应于SEQ ID NO:51的等同位置上包含下列核苷酸:位置521,C或T;SEQ ID NO:51,位置600,C或T;SEQ ID NO:51,位置644,A或G;SEQ ID NO:51,位置649,G或A;SEQ ID NO:51,位置665,A或G;SEQ ID NO:51,位置807,C或T;SEQ ID NO:51,位置825,T或G;SEQ ID NO:51,位置873,T或C;SEQ ID NO:51,位置924,T或C;和SEQ ID NO:51,位置984,T或C。
本发明还包括用于鉴定植物中的编码EG82013的基因的一个或多个等位基因的方法,其包括:测定来自植物的核酸样品中植物EG82013基因中的一个或多个单核苷酸多态性的存在,其中所述单核苷酸多态性选自:SEQ ID NO:2(或SEQ ID NO:4),位置72,C或T;SEQ ID NO:2(或SEQ ID NO:4),位置78,C或T;SEQ ID NO:2(或SEQ ID NO:4),位置132,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置183,C或T;SEQ ID NO:2(或SEQ ID NO:4),位置279,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置306,C或T;SEQ ID NO:2(或SEQ ID NO:4),位置340,T或C;SEQ ID NO:2(或SEQ ID NO:4),位置348,G或A;SEQ ID NO:2(或SEQ ID NO:4),位置414,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置546,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置555,T或C;SEQ ID NO:2(或SEQ ID NO:4),位置690,T至G;SEQ ID NO:2(或SEQ ID NO:4),位置851,A或G;SEQ SEQ ID NO:2(或SEQ ID NO:4),位置901,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置924,G至A;SEQ ID NO:2(或SEQ ID NO:4),位置953,C或G;SEQ ID NO:2(或SEQ ID NO:4),位置1000,G或A;SEQ ID NO:2(或SEQ ID NO:4),位置1012,A或T;SEQ ID NO:2(或SEQ ID NO:4),位置1016,T或A;SEQ ID NO:2(或SEQ ID NO:4),位置1153,A或T;SEQ ID NO:2(或SEQ ID NO:4),位置1174,G或A;SEQ ID NO:2(或SEQ ID NO:4),位置1185,T或A;和SEQ ID NO:2(或SEQ ID NO:4),位置1248,T或A。本领域技术人员通过例如排列SEQ ID NO:2和SEQ IDNO:4上出现的起始密码子的方法将认识到,每个核苷酸变化的相应位置位于驯化的等位基因和/或相关的多核苷酸例如SEQ ID NO:4上的什么位置。
在另一个实施方式中,本发明包括用于鉴定植物中的编码EG82013的基因的一个或多个等位基因的方法。特别地,该方法包括以下步骤。在一个步骤中,将植物核酸序列的至少一部分与包含EG81345的等位基因的至少一个核酸进行比较。该核酸可以是下列任意项:包含选自SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:59和SEQ ID:60的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸序列具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;和任意上述核酸的互补物。在该方法中,核酸在等同位置上包含下列核苷酸:SEQ ID NO:2(或SEQID NO:4),位置72,C或T;SEQ ID NO:2(或SEQ ID NO:4),位置78,C或T;SEQ ID NO:2(或SEQ ID NO:4),位置132,A或G;SEQ IDNO:2(或SEQ ID NO:4),位置183,C或T;SEQ ID NO:2(或SEQ ID NO:4),位置279,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置306,C或T;SEQ ID NO:2(或SEQ ID NO:4),位置340,T或C;SEQ ID NO:2(或SEQ ID NO:4),位置348,G或A;SEQ ID NO:2(或SEQ ID NO:4),位置414,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置546,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置555,T或C;SEQ ID NO:2(或SEQ ID NO:4),位置690,T至G;SEQ ID NO:2(或SEQ ID NO:4),位置851,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置901,A或G;SEQ ID NO:2(或SEQ ID NO:4),位置924,G至A;SEQ ID NO:2(或SEQ ID NO:4),位置953,C或G;SEQ ID NO:2(或SEQ ID NO:4),位置1000,G或A;SEQ ID NO:2(或SEQ ID NO:4),位置1012,A或T;SEQ ID NO:2(或SEQ ID NO:4),位置1016,T或A;SEQ ID NO:2(或SEQ ID NO:4),位置1153,A或T;SEQ ID NO:2(或SEQ ID NO:4),位置1174,G或A;SEQ ID NO:2(或SEQ ID NO:4),位置1185,T或A;和SEQ ID NO:2(或SEQ ID NO:4),位置1248,T或A。
本发明人已经确定,对于驯化的等位基因SEQ ID NO:4而言,在上文对于SEQ ID NO:2所述的等同位置上,等同位置72是T;等同位置78是T;等同位置132是G;等同位置183是T;等同位置279是G;等同位置306是T;等同位置340是C;等同位置348是A;等同位置414是G;等同位置546是G;等同位置555是C;等同位置690是G;等同位置851是G;等同位置901是G;等同位置924是A;等同位置953是G;等同位置1000是A;等同位置1012是T;等同位置1016是A;等同位置1153是T;等同位置1174是A;等同位置1185是A;并且等同位置1248是A。
相反地,本发明人也已经确定,对于祖先等位基因SEQ ID NO:2而言,位置72是C,位置78是C,位置132是A,位置183是C,位置279是A,位置306是C,位置340是T,位置348是G,位置414是A,位置546是A,位置555是T,位置690是T,位置851是A,位置901是A,位置924是G,位置953是C,位置1000是G,位置1012是A,位置1016是T,位置1153是A,位置1174是G,位置1185是T;并且位置1248是T。
另外,本发明还提供了分离的核酸,其包含编码多肽/核酸的一个或多个多形态(等位基因)变体的核酸。多形态变体通常用于监控例如用于农作物改良的标志物辅助的选择方法中的染色体区域的分离。
本发明提供了使用本发明的核酸对植物进行基因分型的方法。基因分型提供了区分染色体对的同源物的方法,并且可用于区分植物群体中的分离子。分子标志物方法可用于系统发生研究、表征农作物品种之间的遗传关系、鉴定杂交后代或体细胞杂种、定位影响单基因性状的染色体区段、基于绘图的克隆,以及定量遗传的研究。参见,例如Peleman andvan der Voort,(2003)Trends in Plant Science vol8(7):330-334和Holland(2004)在2004年9月26日至10月1日在澳大利亚布里斯班召开的第4届国际农作物科学大会上的论文。基因分型提供了物种的成员之间的遗传变异的度量。基因分型的一种方法包括对靶基因座进行DNA测序,以检测单核苷酸多态性(SNP)。单核苷酸多态性(SNP)是遗传变异的最常见的类型。SNP是特定基因座(通常由两个等位基因组成)上的单一碱基对突变。用于基因分型的方法是本领域已知的,包括例如以下的方法:基于杂交的方法,例如动态等位基因特异性杂交。简而言之,以生物素化的引物通过PCR反应扩增基因组区断并连接至珠子。在第二个步骤中,将扩增的产物连接至链霉亲和素柱并以NaOH洗涤以除掉未被生物素化的链。然后在存在分子(当与双链DNA结合时,所述分子发荧光)的情况下加入等位基因特异性寡核苷酸。然后测定随着温度的升高的强度,直至可以测定Tm。SNP将产生低于预期的Tm(Howell等人1999)。另一种方法依赖于分子信标。本质上讲,通过分子信标检测SNP是利用经过特定工程化改造的单链寡核苷酸探针。所述寡核苷酸设计为:在每个末端具有互补性区域,并且探针序列位于其中。该设计允许探针在其天然的分离状态下采纳发夹或茎-环结构。探针的一个末端连接荧光团,另一个末端连接荧光猝灭剂。由于探针的茎-环结构的存在,荧光团靠近猝灭剂,因此阻止分子发射任何荧光。还对分子进行工程化改造,从而只有用于测定中的探针序列是与基因组DNA互补的(Abravaya等人2003)。
其它方法包括高密度寡核苷酸SNP阵列,其中在小的芯片上排列了几十万个探针,允许同时检测大量的SNP(Rapley & Harbron 2004)。由于SNP等位基因的区别仅在于一个核苷酸,并且由于难以针对阵列上的所有探针都实现最佳杂交条件,所以靶DNA具有与错配的探针杂交的潜在可能。通过使用数个冗余探针(redundant probe)检测每个SNP,部分地解决了这个问题。将探针设计为在数个不同位置具有SNP位点,并且包含与SNP等位基因的错配。通过将靶DNA与这些冗余探针中的每一个的杂交的不同量进行比较,可以确定特定的纯合和杂合等位基因(Rapley & Harbron 2004)。虽然,寡核苷酸微阵列具有相对较低的特异性和灵敏性,但是可以检测的SNP的规模是其主要优势。AffymetrixHuman SNP 5.0GeneChip执行基因组范围内的测定,其可以对超过500,000个人类SNP进行基因分型(Affymetrix 2007)。
其它方法包括基于酶的方法,例如用于基因分型的DNA连接酶、DNA聚合酶和核酸酶。限制性片段长度多态性(RFLP)被认为是最简单和最早的用于检测SNP的方法。SNP-RFLP利用很多不同的限制性核酸内切酶及其对唯一和特异性限制性位点的高度亲和性。通过对基因组样品进行消化并通过凝胶测定法测定片段的长度,可以确定酶是否切割预期的限制性位点。未能切割基因组样品将导致产生可辨认的比预期大的片段,这暗示在该限制性位点处存在突变,该突变保护其免于核酸酶活性。本发明中的具体的基因分型方法可以使用任何数目的分子标志物分析技术,例如但不限于,限制性片段长度多态性(RFLP)。RFLP是由核苷酸序列可变性引起的DNA限制性片段之间的等位基因差异的产物。如本领域技术人员所熟知,通常通过提取基因组DNA并以限制性酶消化来检测RFLP。一般而言,将得到的片段根据大小进行分离并与探针进行杂交;单拷贝探针是适宜的。来自同源染色体的限制性片段被显示。等位基因之间片段大小的差异代表RFLP。因此,本发明进一步提供了,使用诸如FRLP分析的技术来监视本发明的基因或核酸的分离以及与这些基因或核酸在遗传上连接的染色体序列的方法。连接的染色体序列在本发明的基因的50厘摩(cM)之内,通常是40或30cM之内,在一些情况下是20或10cM之内,在一些情况下是5、3、2或1cM之内。
检测RFLP的方法包括以下步骤:(a)以限制性酶消化植物的基因组DNA;(b)在选择性杂交条件下,使核酸探针与所述基因组DNA的核酸的序列杂交;(c)从中检测RFLP。区分本发明的核酸的多形态(等位基因)变体的其它方法可以使用本领域技术人员熟知的分子标志物技术进行,包括例如以下技术:1)单链构象分析(SSCP);2)变性梯度凝胶电泳(DGGE);3)RNase保护测定法;4)等位基因特异性寡核苷酸(ASO);5)使用识别核苷酸错配的蛋白,例如大肠杆菌mutS蛋白;和6)等位基因特异性PCR。其它基于检测两个互补DNA链之间的错配的方法包括夹式变性凝胶电泳(clamped denaturing gel electrophoresis,CDGE);异双链分析法(HA);和化学错配切割(CMC)。
其它方法包括基于PCR的方法,例如四引物ARMS-PCR,其使用两对引物在一个PCR反应中扩增两个等位基因。将引物设计为,两个引物对在SNP位置重叠,但是每对仅与一个可能的SNP完美匹配。结果是,如果在PCR反应中存在给定的等位基因,则特异于该等位基因的引物对将产生产物,但不针对具有不同SNP的替代性等位基因产生产物。两个引物对的设计还要实现:它们的PCR产物具有显著不同的长度,以允许通过凝胶电泳容易地区分的条带。
Flap核酸内切酶(FEN)是催化结构特异性切割的核酸内切酶。该切割对于错配是高度敏感的,可用于检测具有高度特异性的SNP(Olivier2005)。
另一种方法是通过引物延伸。引物延伸是两步法,其中第一步包括使探针与SNP核苷酸的紧邻上游的碱基杂交,然后进行“微小测序”反应,其中DNA聚合酶通过添加互补于所述SNP核苷酸的碱基而使杂交的引物延伸。检测被掺入的碱基,并确定SNP等位基因(Syvanen 2001)。由于引物延伸是基于高精确度的DNA聚合酶,所以一般而言该方法是非常可靠的。引物延伸能够在非常相似的反应条件下对多数SNP进行基因分型,这使得其也是非常灵活的。引物延伸方法应用于多种形式的测定中。这些形式使用多种检测技术,包括MALDI-TOF质谱法和ELISA样方法(Rapley & Harbron 2004)。
Taq DNA聚合酶的5’核酸酶活性被应用于Taqman测定法,以进行SNP基因分型。Taqman测定与PCR反应同时进行,可以随着PCR反应的进行实时读取结果(McGuigan & Ralston 2002)。该测定需要正向和反向PCR引物,所述引物将扩增包括SNP多形态位点的区域。另一种方法使用的是DNA连接酶。DNA连接酶催化DNA片段的3’末端与直接相邻的DNA片段的5’末端的连接。该机理可用于通过使两个探针直接在SNP多形态位点上杂交来检测SNP,其中只有当探针与靶DNA相同时才会发生连接。在寡核苷酸连接酶测定中,设计两个探针:等位基因特异性探针,其与靶DNA杂交,从而其3’碱基直接位于SNP核苷酸之上;第二探针,其在SNP多形态位点的上游杂交,提供用于连接反应的5’末端。如果等位基因特异性探针与靶DNA匹配,则其将与靶DNA完全杂交并且发生连接。在存在错配的3’碱基的情况下一般不会发生连接。连接的或非连接的产物可以通过凝胶电泳、MALDI-TOF质谱法或通过毛细电泳检测,以用于大规模应用(Rapley & Harbron 2004)。
在本发明中,用于对植物核基因组进行分子标志物绘图的核酸探针在选择性杂交条件下与编码本发明的核酸的基因选择性杂交。在一些实施方式中,探针选自本发明的核酸。通常而言,这些探针是cDNA探针或Pst I基因组克隆。探针的长度在上文中有详尽讨论,但通常的长度是至少15个碱基,在一些情况下长度是至少20、25、30、35、40或50个碱基。但是一般而言,探针的长度小于大约1000个碱基。在一些实施方式中,探针是单拷贝探针,其与单倍体染色体互补物中的独特基因座杂交。用于RFLP绘图的一些示例性的限制性酶是EcoRI、EcoRV和Sstl。如本文使用的术语“限制性酶”包括提及识别并切割(单独或与另一种成分联合)特定核苷酸序列的成分。
因此,本发明进一步提供了基因分型的方法,其包括以下步骤:在严格杂交条件下使怀疑包含本发明的核酸的样品与核酸探针接触。一般而言,所述样品是植物样品;怀疑包含本发明的核酸(例如基因、mRNA或EST)的样品。所述核酸探针在严格条件下与包含多形态标志物的本发明的核酸的子序列选择性杂交。核酸探针与多形态标志物核酸序列的选择性杂交产生杂交复合物。该杂交复合物的检测指示样品中存在该多形态标志物。在一些实施方式中,所述核酸探针包含本发明的核酸。
对本领域技术人员明显的是,可以通过对这些基因进行测序而就EG82013和EG81345来鉴定多形态变体。对本领域技术人员清楚的是,可以通过对更多的玉米品系和杂种、更多的水稻品系和杂种、更多的高粱、大麦、小麦品系、粟或甘蔗品系进行测序来鉴定EG82013和EG81345的另外的多形态变体或等位基因,可以进行结合试验来发现与产量性状(例如,对水稻而言:总产量、种子重量、总制粉率、碾磨水稻的完整重量、完整制粉率或其它产量相关性状)或质量性状(例如倒伏、植物高度和其它质量相关性状)的最佳表型相关的这两种基因的每一个的等位基因。以这些另外的等位基因进行的结合试验将表明哪些等位基因与特定性状的想要的表型相关。然后可以筛选预期的亲代近交系中是否存在与产量性状(例如,总产量、谷粒重量、谷粒长度、每株谷粒数等)的最佳表现或质量性状(例如ASV或垩白等)的最佳表现相关的等位基因(或想要的等位基因的一部分,其为诊断的)。与产量性状或质量性状的最佳表现相关的等位基因将是达到想要的表型的“想要的等位基因”。
在优选的实施方式中,本发明提供了用于鉴定农作物物种中的EG82013或EG81345的等位基因的方法;用于测定植物是否包含EG82013或EG81345的优选的等位基因的方法;以及用于就EG82013或EG81345的优选的等位基因筛选植物的方法。EG82013和EG81345的等位基因包括例如,包含任意以下序列的核酸:包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ IDNO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ IDNO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ IDNO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ IDNO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ IDNO:55;SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%的序列同一性并且是植物中的产量标志物或产量基因的核酸;以及上述任意核酸的互补物。也可以以相似的方式使用相应的多肽。或者,所述方法包括,将上述SEQ ID NO之一或其至少20个核苷酸的部分或其互补物与植物核酸序列的至少一部分进行比较,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
对于鉴定EG82013或EG81345的其它等位基因的方法,该方法在一个步骤中包括:使用来自本发明的核酸序列的任意序列的至少一部分扩增农作物物种的一种或多种植物中的相应的EG82013或EG81345序列。在另一个步骤中,这些方法包括测定所扩增的序列的核苷酸序列。在另一个步骤中,这些方法包括将所扩增的序列与本发明的核酸序列进行比较,以鉴定农作物物种的测试植物中的EG82013或EG81345的任何等位基因。
一般而言,这些方法还包括用于鉴定或确定优选的等位基因(例如,与想要的性状相关的等位基因)的方法。在一个步骤中,使用来自本发明的核酸序列的任意序列的至少一部分来扩增至少两种植物中的相应的EG82013或EG81345序列,针对所述至少两种植物已经或者可以测定某性状的具体参数。所述性状包括例如产量。在另一个步骤中,这些方法包括测定每个植物中的EG82013或EG81345的序列。在另一个步骤中,这些方法包括鉴定EG82013或EG81345的优选的等位基因或其核酸序列。可以通过测定等位基因与想要的性状的结合,通过基因分型分析来鉴定优选的等位基因。此类基因分型分析的实例可以参见本文的实施例。
一般而言,这些方法还包括用于就优选的等位基因或核酸序列筛选植物的方法。此类方法包括,使用优选的等位基因(例如与想要的性状相关的等位基因)的至少一部分来扩增植物中的相应的EG82013或EG81345序列,并选择那些包含想要的等位基因(或核酸序列)的植物。本发明还提供了产生EG82013或EG81345多肽的方法,其包括:a)提供以编码EG82013或EG81345多肽的核酸转染的细胞,所述核酸配置为在该细胞中表达;b)在表达所述核酸的条件下培养所述经转化的细胞;和c)分离EG82013或EG81345多肽。
本发明还提供了从重组植物细胞库中分离产量基因的方法。该方法包括:提供植物细胞DNA的制备物或重组植物细胞库;使所述制备物或植物细胞库与可检测地标记的EG82013或EG81345保守性寡核苷酸(从本发明的EG82013或EG81345核酸序列产生,如本文其它地方所描述)在杂交条件下接触,提供具有50%或更高的序列同一性的基因的检测;和通过其与可检测标记物的结合来分离产量基因。
本发明还提供了从植物细胞DNA中分离产量基因的方法。该方法包括:提供植物细胞DNA的样品;提供与EG82013或EG81345基因的寡核苷酸(从本发明的EG82013或EG81345核酸序列产生,如本文其它地方所描述)的保守性区域具有序列同源性的一对寡核苷酸;将所述的一对寡核苷酸与植物细胞DNA样品在适合于聚合酶链式反应介导的DNA扩增的条件下混合;和分离经扩增的产量基因或其片段。
通过本文描述的方法鉴定的序列可用于通过使用这些序列来鉴定那些在调节驯化生物特异性的、增强的或改变的功能能力和/或矫正这些能力中的缺陷中有用的试剂。这些方法使用例如本领域已知的筛选技术,例如体外系统、基于细胞的表达系统和转基因动物和植物。本发明提供的方法不仅迅速鉴定进化的基因,而且指明了可以对蛋白进行的可能不具有很高毒性的调节(因为所述调节存在于另一物种中)。
本发明还提供了检测植物细胞中的增加产量的基因或基因的增加产量的等位基因变体的方法,其包括以下步骤。所述步骤包括:将EG82013或EG81345核酸或其长度是至少大约12个核苷酸的部分、至少大约20个核苷酸的部分、在一些情况下是至少大约30个核苷酸的部分与来自植物细胞的基因组DNA的制备物在杂交条件下接触,以提供与本发明的EG82013或EG81345核酸具有大约50%或更高的序列同一性的核酸分子序列的检测,所述本发明的EG82013或EG81345核酸是例如,包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ IDNO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ IDNO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ IDNO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55;SEQ ID NO:56,SEQ IDNO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的核酸;与任意上述SEQ ID NO具有至少大约80%的序列同一性的核酸;以及上述任意核酸的互补物;和检测杂交,其中增加产量的基因可以被鉴定。
本发明还提供了检测植物细胞中的增加产量的基因或基因的特异性的增加产量的等位基因变体的方法。所述方法包括,将增加产量的基因EG82013或EG81345或任意这些基因的长度为至少大约12个核苷酸、在一些情况下是至少大约20个核苷酸、在一些情况下长度是至少大约30个核苷酸的一部分与来自植物细胞的基因组DNA的制备物在杂交条件下接触,以提供与本文其它地方所述的本发明的核酸具有大约50%或更高的序列同一性的核酸分子序列的检测;和检测杂交,其中增加产量的基因或基因的特异性的增加产量的等位基因变体可以被鉴定。
通过本文描述的方法鉴定的序列可用于通过使用这些序列来鉴定那些在调节驯化生物特异性的、增强的或改变的功能能力和/或矫正这些能力中的缺陷中有用的试剂。这些方法使用例如本领域已知的筛选技术,例如体外系统、基于细胞的表达系统和转基因动物和植物。本发明提供的方法不仅迅速鉴定进化的基因,而且指明了可以对蛋白进行的可能不具有很高毒性的调节(因为所述调节存在于另一物种中)。
在一个实施方式中,本发明包括测定植物是否具有包含EG82013或EG81345序列的特定的多肽或核酸序列的方法。该方法包括以下步骤。一个步骤包括,将所述植物的编码多肽的核苷酸序列的至少大约一部分与本发明的EG82013或EG81345核酸的核酸序列的至少一部分进行比较,例如,包含选自下列的核酸的至少一部分的那些:(i)选自SEQ IDNO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ IDNO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ IDNO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ IDNO:30,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ IDNO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ IDNO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55;SEQ ID NO:56,SEQ IDNO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ ID NO:60的核酸;和由上述一种核酸编码的多肽;和(ii)与(i)中的核酸具有至少大约65%序列同一性并且是产量标志物或产量基因的核酸,和由上述一种核酸编码的多肽。上述核酸或多肽之一可以被选择为特定核酸或多肽(即,目标核酸或多肽,以用于测定植物是否包含该核酸或多肽或相关的核酸或多肽)。在另一个步骤中,该方法包括鉴定植物是否包含所述特定核酸或多肽。优选地,植物核酸序列是基因组DNA或cDNA,或源于cDNA的多肽。或者,该方法包括,将上述SEQ ID NO之一或其至少20个核苷酸的部分或其互补物与植物核酸序列的至少一部分进行比较,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
知晓本发明的一些植物EG82013或EG81345核酸的核酸序列允许本领域技术人员,例如,(a)制备那些核酸的拷贝,(b)获得包括此类核酸的至少一部分的核酸(例如包括全长基因、全长编码区、调节控制序列、截短的编码区的核酸),和(c)获得其它植物的EG82013或EG81345核酸。此类核酸可以通过多种方式获得,包括使用本发明的抗体筛选合适的表达库;使用本发明的寡核苷酸探针通过传统的克隆技术来筛选合适的文库或DNA;和使用本发明的寡核苷酸引物进行合适的文库或DNA的PCR扩增。用于筛选的或用于从中扩增核酸的合适的文库包括以下文库,例如基因组DNA文库、BAC文库、YAC文库、从分离的植物组织(包括但不限于,茎、生殖结构/组织、叶、根和分蘖(tiller))制备的cDNA文库;和从来自任意或全部上述组织汇集的cDNA构建而来的文库。在水稻和玉米的情况下,可以使用可从克莱姆森大学(Clemson University)获得的BAC文库。类似地,用于筛选的或用于从中扩增核酸的DNA来源包括植物基因组DNA。克隆和扩增基因的技术公开于例如Sambrook等人,同上;和Galun & Breiman,TransgenicPlants,Imperial College Press,1997。
本发明还包括这样的核酸,其是能够在严格杂交条件下与本发明的其它核酸(有时是更长的核酸)的互补性区域杂交的寡核苷酸,所述本发明的其它核酸是例如那些包含植物EG82013或EG81345基因的核酸或其它植物的EG82013或EG81345核酸。本发明的寡核苷酸可以是RNA、DNA或其衍生物。此类寡核苷酸的最小大小是在给定寡核苷酸与本发明的其它核酸上的互补性序列之间形成稳定杂交体所需的大小。最小大小的特征在本文中有公开。寡核苷酸的大小还必须足以满足根据本发明的寡核苷酸的使用。本发明的寡核苷酸可以用于多种应用,包括但不限于,作为探针以鉴定另外的核酸,作为引物以扩增或延伸核酸,作为靶标以进行表达分析,作为候选物以进行靶向诱变和/或恢复,或用于农业应用以改变EG82013或EG81345多肽的产生或活性。此类农业应用包括,将此类寡核苷酸用于例如基于反义、三链形成、核酶和/或基于RNA药物的技术。因此,本发明包括此类寡核苷酸和通过使用一种或多种此类技术增强植物中的经济生产力的方法。
在另一个实施方式中,本发明包括测定植物是否具有包含EG82013序列的特定核酸序列的方法。该方法包括以下步骤,将所述植物的核酸序列的至少一部分与本发明的EG82013核酸序列的至少一部分进行比较,例如,包含选自下列的核酸的核酸:包含选自SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ IDNO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ IDNO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30和SEQ IDNO:58的核酸的至少20个连续核酸的分离的核酸;与(i)中的核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;和任意这些上述核酸的互补物。上述核酸之一可以被选择为特定核酸(即,目标核酸,以用于测定植物是否包含该核酸或相关的核酸)。在另一个步骤中,该方法包括鉴定植物是否包含所述特定核酸。或者,该方法包括,将上述SEQ ID NO之一或其至少20个核苷酸的部分或其互补物与植物核酸序列的至少一部分进行比较,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
如本文使用的核酸或多肽的“至少一部分”意思是具有如上所述的此类序列的最小大小特征的部分,或全长分子的任意更大的片段,直至并包括全长分子。在一个实施方式中,“至少一部分”是指EG82013和/或EG81345的至少20个连续核苷酸。在另一个实施方式中,核酸的一部分可以是至少大约12个核苷酸,至少大约13个核苷酸,至少大约14个核苷酸,至少大约15个核苷酸,至少大约16个核苷酸,至少大约17个核苷酸,至少大约18个核苷酸,至少大约19个核苷酸,至少大约20个核苷酸,至少大约22个核苷酸,至少大约24个核苷酸,至少大约26个核苷酸,至少大约28个核苷酸,至少大约30个核苷酸,至少大约32个核苷酸,至少大约34个核苷酸,至少大约36个核苷酸,至少大约38个核苷酸,至少大约40个核苷酸,至少大约45个核苷酸,至少大约50个核苷酸,至少大约55个核酸,等等,直至全长核酸。类似地,多肽的一部分可以是至少大约4个氨基酸,至少大约5个氨基酸,至少大约6个氨基酸,至少大约7个氨基酸,等等,直至全长多肽。所使用的部分的长度将取决于具体的应用。如上文所讨论,用作杂交探针的核酸的一部分可以短至12个核苷酸;在一个实施方式中,其是20个核苷酸。用作表位的多肽的部分可以短至4个氨基酸;在一个实施方式中,其是至少大约6个氨基酸。执行全长多肽的功能的多肽的部分一般将是长于4个氨基酸。
本发明的其它植物的EG82013或EG81345多肽是指这样的多肽,包括但不限于,编码的多肽、全长多肽、及其经加工的多肽、融合多肽和多价多肽,以及这样的多肽,其是包括上述SEQ ID NO的至少一部分的多肽的截短的同源物。
优选的植物核酸序列包括源自植物的基因组DNA或源自表达的基因的植物序列,即,其为cDNA。执行这些的方法是本领域已知的,并且在本说明书的其它地方有讨论。
优选地,EG82013或EG81345核酸序列与植物中增加的产量相关。测定并定量产量的方法是本领域已知的,并且在本说明书的其它地方有讨论(参见,例如,在本发明的具体实施方式开头处给出的术语“产量”的定义)。最优选地,可以通过测定产量相对于第二植物是否增加来定量产量,所述第二植物来自共同祖先、属或科成员植物,更优选同一个种,再更优选相同的栽培变种,其具有第二EG82013或EG81345核酸序列,该序列相对于来自植物的EG82013或EG81345核酸序列具有至少一个核苷酸变化。
在本发明的所有实施方式中,优选的核酸序列包括,与本发明的EG82013或EG81345核酸具有至少大约60%序列同一性并且对于产量具有基本上相同的效应或者是产量标志物或产量基因的核酸。优选地,本发明的核酸与包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ IDNO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ IDNO:28,SEQ ID NO:29和SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ IDNO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ IDNO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55;SEQ ID NO:56,SEQ IDNO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的任意核酸序列相同或与之具有至少大约65%的同一性,至少大约66%的同一性,至少大约67%的同一性,至少大约68%的同一性,至少大约69%的同一性,至少大约70%的同一性,至少大约71%的同一性,至少大约72%的同一性,至少大约73%的同一性,至少大约74%的同一性,至少大约75%的同一性,至少大约76%的同一性,至少大约77%的同一性,至少大约78%的同一性,至少大约79%的同一性,至少大约80%的同一性,至少大约81%的同一性,至少大约82%的同一性,至少大约83%的同一性,至少大约84%的同一性,至少大约85%的同一性,至少大约86%的同一性,至少大约87%的同一性,至少大约88%的同一性,至少大约89%的同一性,至少大约90%的同一性,至少大约91%的同一性,更优选至少大约至少大约92%的同一性,至少大约93%的同一性,至少大约94%的同一性,至少大约95%的同一性,再更优选至少大约95.5%的同一性,至少大约96%的同一性,至少大约96.5%的同一性,至少大约97%的同一性,至少大约97.5%的同一性,至少大约98%的同一性,至少大约98.5%的同一性,至少大约99%的同一性,至少大约99.5%的同一性,并且其为植物中的产量标志物或产量基因;以及任意上述核酸的互补物。
在本发明的所有实施方式中,优选的多肽序列包括,与本发明的EG82013或EG81345多肽具有至少大约60%序列同一性并且对于产量具有基本上相同的效应和/或是产量标志物的多肽。优选地,本发明的多肽与由包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ IDNO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ IDNO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ IDNO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ IDNO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55;SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的核酸编码的任意多肽序列相同或与之具有至少大约65%的同一性,至少大约66%的同一性,至少大约67%的同一性,至少大约68%的同一性,至少大约69%的同一性,至少大约70%的同一性,至少大约71%的同一性,至少大约72%的同一性,至少大约73%的同一性,至少大约74%的同一性,至少大约75%的同一性,至少大约76%的同一性,至少大约77%的同一性,至少大约78%的同一性,至少大约79%的同一性,至少大约80%的同一性,至少大约81%的同一性,至少大约82%的同一性,至少大约83%的同一性,至少大约84%的同一性,至少大约85%的同一性,至少大约86%的同一性,至少大约87%的同一性,至少大约88%的同一性,至少大约89%的同一性,至少大约90%的同一性,至少大约91%的同一性,更优选至少大约至少大约92%的同一性,至少大约93%的同一性,至少大约94%的同一性,至少大约95%的同一性,再更优选至少大约95.5%的同一性,至少大约96%的同一性,至少大约96.5%的同一性,至少大约97%的同一性,至少大约97.5%的同一性,至少大约98%的同一性,至少大约98.5%的同一性,至少大约99%的同一性,至少大约99.5%的同一性,其中所述核酸为植物中的产量标志物或产量基因;以及任意选自下列的多肽序列:选自SEQ ID NO:5和SEQ ID NO:52的6个连续氨基酸序列。
在本发明所有的实施方式中,本发明的栽培植物优选包括玉米(Zeamays mays)、栽培稻(Oryza sativa)、小麦(Triticum aestivum)、大麦(Hordeum vulgare)、甘蔗(Saccharum officinarum)、高粱(Sorghumbicolor)和珍珠稷(Pennisetum typhoides)。在本发明的所有实施方式中,野生祖先或科成员植物优选包括选自玉米(Zea mays mays)、栽培稻(Oryza sativa)、小麦(Triticum aestivum)、大麦(Hordeumvulgare)、甘蔗(Saccharum officinarum)、高粱(Sorghum bicolor)和珍珠稷(Pennisetum typhoides)的栽培植物的野生祖先或科成员植物。特别优选的野生祖先或科成员植物是野生稻(Oryza rufipogon)。任意植物的EG82013或EG81345多肽是本发明的适宜的多肽。适宜的植物还包括柳枝稷(Pannicum virgatum)、黑麦(Secale cereale)和拟南芥(Arabidopsis thaliana)和/或细弱翦股颖(Agrostiscapillaries)、欧洲山杨(Populus tremula)、棉花(Gossypiumhirsutum)和马铃薯(Solanum tuberosum)。
从中分离EG82013或EG81345多肽(包括分离天然多肽或通过重组或合成技术产生多肽)的适宜植物包括玉米、小麦、大麦、黑麦、粟、草、鹰嘴豆、小扁豆、亚麻、橄榄、无花果杏仁、开心果、核桃、甜菜、欧洲防风草、柑橘类水果,包括但不限于,橙子、柠檬、酸橙、柚子、橘子、橘栾果(minneola)和橘柚(tangelo),甘薯、豆类、豌豆、菊苣、莴苣、卷心菜、花椰菜(cauliflower)、花椰菜(broccoli)、萝卜(turnip)、萝卜(radish)、菠菜、芦笋、洋葱、蒜、胡椒、芹菜、南瓜(squash)、南瓜(pumpkin)、大麻、夏南瓜(zucchini)、苹果、梨、榅桲(quince)、甜瓜、李子、樱桃、桃子、油桃、杏、草莓、葡萄、覆盆子(raspberry)、黑莓、菠萝、鳄梨、木瓜、芒果、香蕉、大豆、番茄、高粱、甘蔗、甜菜、向日葵、油菜籽、三叶草、烟草、胡萝卜、棉花、紫花苜蓿、水稻、马铃薯、茄子、黄瓜、拟南芥,以及木本植物,例如针叶树和落叶树,其中玉米、高粱、甘蔗、草、大麦和小麦是特别优选的。
本发明还提供了产生EG82013或EG81345多肽的方法。步骤包括:提供以编码EG82013或EG81345多肽的核酸转染的细胞,所述核酸配置为在该细胞中表达;和在表达所述核酸的条件下培养所述经转化的细胞;和c)分离EG82013或EG81345多肽。
本发明还提供了修改植物群体中的产量基因或作为产量标志物的基因的频率的方法,以及标志物辅助的培育或标志物辅助的选择的方法,其包括以下步骤。一个步骤包括,使用寡核苷酸作为标志物来筛选多个植物,以确定在单个植物中是否存在与产量相关的基因,所述寡核苷酸由下列组成:包含选自下列的核酸序列的核酸序列的不超过300个核苷酸和/或至少20个连续核苷酸:包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ IDNO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ IDNO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ IDNO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ IDNO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ IDNO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;和任意上述核酸的互补物。另一个步骤包括,基于所述产量基因的存在或不存在,选择至少一个单个植物以进行培育;另一个步骤包括,培育所选的至少一个植物以产生具有修改的产量基因的频率的植物的群体。或者,该方法包括,将上述SEQ ID NO之一或其至少20个核苷酸的部分或其互补物与植物核酸序列的至少一部分进行比较,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
在一个实施方式中,标志物辅助的培育的方法包括就特定的EG81345核酸序列进行植物的标志物辅助的培育的方法。该实施方式包括以下步骤。一个步骤包括,对于至少一种植物,将所述植物的核苷酸序列的至少一部分与本发明的特定的EG81345核酸序列进行比较,所述特定的EG81345核酸序列是例如包含选自下列的核酸的核酸:包含选自SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ IDNO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55;SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物的核酸;和任意上述核酸的互补物。该方法还包括鉴定该植物是否包含特定核酸序列的步骤;以及培育包含特定核酸序列的植物以产生后代的步骤。或者,该方法包括将上述SEQ ID NO之一或其至少20个核苷酸的部分或其互补物与植物核酸序列的至少一部分进行比较,并鉴定与其具有至少大约80%序列同一性的至少一个核酸序列。
本发明还包括就特定的EG81345多肽序列进行植物的标志物辅助的培育的方法。该方法包括以下步骤。对于至少一种植物,将所述植物的多肽序列的至少一部分与特定的EG81345多肽序列进行比较。所述多肽序列可以包括,由包含选自SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ IDNO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55;SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的分离的核酸编码的多肽。所述多肽序列还可以包括,与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物的核酸。该方法还包括鉴定该植物是否包含特定多肽序列的步骤;以及培育包含特定多肽序列的植物以产生后代的步骤。
标志物辅助的培育的方法包括就特定的EG82013核酸序列进行植物的标志物辅助的培育的方法。步骤包括,对于至少一种植物,将所述植物的核苷酸序列的至少一部分与选自下列的特定核酸序列进行比较:包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ IDNO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ IDNO:29,SEQ ID NO:30和SEQ ID NO:58的核酸的至少20个连续核苷酸的分离的核酸;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物的核酸;和任意上述核酸的互补物;鉴定该植物是否包含特定核酸序列;以及培育包含特定核酸序列的植物以产生后代。
本发明还包括就特定的EG81013多肽序列进行植物的标志物辅助的培育的方法。该方法包括以下步骤。对于至少一种植物,将所述植物的多肽序列的至少一部分与特定的EG81013多肽序列进行比较。所述多肽序列可以包括,由包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:1O,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ IDNO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ IDNO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30和SEQ ID NO:58的核酸的至少20个连续核苷酸的分离的核酸编码的多肽。所述多肽序列还可以包括,与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物的核酸。该方法还包括鉴定该植物是否包含特定多肽序列的步骤;以及培育包含特定多肽序列的植物以产生后代的步骤。
这些标志物辅助的培育方法包括用于选择具有改变的产量的植物的方法,所述植物是例如谷类植物或禾本科植物(包括但不限于,玉米、小麦、大麦和禾本科的其它成员)或豆科植物(例如大豆),所述方法包括,从待选择的植物获得核酸分子,将所述核酸分子与一个或多个探针接触,所述探针在严格或高度严格条件下与包含本发明的EG82013和EG81345核酸的核酸序列选择性杂交;检测所述一个或多个探针与核酸序列的杂交,其中杂交的存在指示与改变的产量相关的基因的存在;以及,基于所述杂交的存在或不存在选择植物。在一个实施方式中,标志物辅助的选择在水稻中完成。在另一个实施方式中,标志物辅助的选择在小麦中完成,其中使用一个或多个探针,所述探针在严格或高度严格条件下与包含本发明的EG82013和EG81345核酸的序列选择性杂交。在另一个实施方式中,标志物辅助的选择在玉米(maize)或玉米(corn)中完成,其中使用一个或多个探针,所述探针在严格或高度严格条件下与包含本发明的EG82013和EG81345核酸的核酸选择性杂交。在另一个实施方式中,标志物辅助的选择在高粱中完成,其中使用一个或多个探针,所述探针在严格或高度严格条件下与包含本发明的EG82013和EG81345核酸的序列选择性杂交。在另一个实施方式中,标志物辅助的选择在大麦中完成,其中使用一个或多个探针,所述探针在严格或高度严格条件下与包含本发明的EG82013和EG81345核酸的序列选择性杂交。在每种情况下,可以使用针对单一序列或多个序列的一个或多个探针来完成标志物辅助的选择。如果使用多个序列,则可以同时或依次使用它们。
在培育过程中还可以使用分子标志物,以选择质量性状。例如,与等位基因密切相关的标志物,或包含实际的目标等位基因内的序列的标志物可用于在回交培育程序中选择包含目标等位基因的植物。标志物还可用于就回交亲本的基因组并针对供体亲本的标志物进行选择。使用该程序可以使保留在所选植物中的来自供体亲本的基因组的数量最小化。其还可用于减少回交程序中所需的与回交亲本回交的次数。在选择方法中使用分子标志物通常被称作遗传标志物增强的选择(Genetic MarkerEnhanced Selection)。
在一个实施方式中,本发明包括EG81345和EG82013核酸,其包括分离的核酸,所述分离的核酸包含选自SEQ ID NO:1,SEQ ID NO:2,SEQID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ IDNO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ IDNO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ IDNO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ IDNO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ IDNO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ ID NO:60的核酸;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸。分离的核酸还包括选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ IDNO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ IDNO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:29,SEQ ID NO:31,SEQ IDNO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ IDNO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ IDNO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ IDNO:60的核酸的互补物。优选地,在该实施方式中,核酸与SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ IDNO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ IDNO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ IDNO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ IDNO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ IDNO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ ID NO:60具有至少大约65%的同一性,至少大约66%的同一性,至少大约67%的同一性,至少大约68%的同一性,至少大约69%的同一性,至少大约70%的同一性,至少大约71%的同一性,至少大约72%的同一性,至少大约73%的同一性,至少大约74%的同一性,至少大约75%的同一性,至少大约76%的同一性,至少大约77%的同一性,至少大约78%的同一性,至少大约79%的同一性,至少大约80%的同一性,至少大约81%的同一性,至少大约82%的同一性,至少大约83%的同一性,至少大约84%的同一性,至少大约85%的同一性,至少大约86%的同一性,至少大约87%的同一性,至少大约88%的同一性,至少大约89%的同一性,至少大约90%的同一性,至少大约91%的同一性,更优选至少大约至少大约92%的同一性,至少大约93%的同一性,至少大约94%的同一性,至少大约95%的同一性,再更优选至少大约95.5%的同一性,至少大约96%的同一性,至少大约96.5%的同一性,至少大约97%的同一性,至少大约97.5%的同一性,至少大约98%的同一性,至少大约98.5%的同一性,至少大约99%的同一性,至少大约99.5%的同一性,并且其为植物中的产量标志物或产量基因。
本发明的一个实施方式是,在严格杂交条件下与EG82013或EG81345基因中的至少一个的至少一部分杂交的分离的植物核酸。上文描述了此类基因的鉴定特征。本发明的核酸可以包括分离的天然的植物EG82013或EG81345基因或其同源物,后者的更详细的描述见下文。本发明的核酸可以包括一个或多个调节区、全长或部分编码区,或其组合。本发明的核酸的最小大小是:在严格杂交条件下可以与上述基因之一形成稳定杂交体的最小大小。上文公开了适宜的植物。
根据本发明,分离的核酸是从其天然环境中取出的核酸(即经过了人工操作)。因此,“分离的”不反映该核酸被纯化的程度。分离的核酸可以包括DNA、RNA,或者DNA或RNA的衍生物。
本发明的分离的植物EG82013或EG81345核酸可以从其天然来源获得,作为整个的(即完整的)基因或其能够与该基因形成稳定杂交体的一部分。还可以使用重组DNA技术(例如聚合酶链式反应(PCR)扩增、克隆)或化学合成法产生分离的植物EG82013或EG81345核酸。分离的植物EG82013或EG81345核酸包括天然核酸及其同源物,包括但不限于,天然等位基因变体和修饰的核酸,其中以一定方式插入、删除、替换和/或倒位核苷酸,所述方式为使此类修饰对核酸的编码本发明的EG82013或EG81345多肽的能力或在严格条件下与天然基因分离体形成稳定杂交体的能力没有实质上的干扰。
一旦分离了想要的DNA,可以通过已知方法对其进行测序。本领域认识到的是,此类方法会发生错误,因此同一区域的多次测序是常规的,并仍预期会在得到的推导序列中产生可测比例的错误,尤其是在具有重复结构域、广阔的二级结构或不常见的碱基组成的区域,例如具有高GC碱基含量的区域。当出现矛盾时,可以进行重测序,并且可以使用特别的方法。特别的方法可以包括,通过使用下列项来改变测序条件:不同的温度;不同的酶;改变寡核苷酸的能力以形成更高等级的结构的蛋白;改变的核苷酸,例如ITP或甲基化的dGTP;不同的凝胶成分,例如添加甲酰胺;不同的引物或与有问题的区域相距不同距离的引物;或不同的模板,例如单链DNA。还可以应用mRNA的测序。
可以使用本领域技术人员已知的多种方法(参见,例如Sambrook等人,见上文)产生植物EG82013或EG81345核酸同源物。例如,可以使用多种技术修饰核酸,包括但不限于,经典的诱变技术和重组DNA技术,例如定点诱变,化学处理核酸以诱导突变,核酸片段的限制性酶切割,核酸片段的连接,核酸序列的所选区域的聚合酶链式反应(PCR)扩增和/或诱变,寡核苷酸混合物的合成和将混合物组连接以“构建”核酸的混合物,及其组合。可以通过筛选核酸编码的多肽的功能(例如,引发针对EG82013或EG81345多肽的至少一个表位的免疫应答的能力,增加包含EG82013或EG81345基因的转基因植物的产量的能力)和/或通过与EG82013或EG81345基因的杂交而从修饰的核酸的混合物中选择核酸同源物。
本发明的分离的核酸可以包括,编码本发明的至少一个植物EG82013或EG81345多肽的核酸序列,此类多肽的实例已在本文公开。虽然词语“核酸”主要是指物理意义上的核酸并且词语“核酸序列”主要是指核酸上的核苷酸的序列,但这两个词语可以相互替换地使用,尤其是在能够编码EG82013或EG81345多肽的核酸或核酸序列的情况下。如前文所公开,本发明的植物EG82013或EG81345多肽包括但不限于,具有全长的植物EG82013或EG81345编码区的多肽,具有部分的植物EG82013或EG81345编码区的多肽,融合多肽,多价保护性多肽,及其组合。
至少一些本发明的核酸编码可以选择性结合源自动物的免疫血清的多肽,所述动物经过所述核酸所分离自的EG82013或EG81345多肽的免疫。
当在合适的宿主中表达时,包含本发明的核酸的核酸能够增加植物的产量。如下文更详细地公开,此类核酸可以是或者编码反义RNA、能够形成三螺旋的分子、核酶,或其它基于核酸的化合物。
本发明的一个实施方式是植物EG82013或EG81345核酸,其在严格杂交条件下与本发明的EG82013或EG81345核酸杂交,或者与此类EG82013或EG81345核酸的同源物杂交,或者与此类核酸的互补物杂交。本发明的任意核酸序列的核酸互补物是指,与所述序列的链互补(即可以形成完全的双螺旋)的核酸的核酸序列。应该注意的是,本发明的双链核酸分子(已经确定了其一条链的核酸序列,由SEQ ID NO来表示)还包括具有与该SEQ ID NO互补的序列的互补链。因此,本发明的核酸(其可以是双链或单链的)包括那些在严格杂交条件下与给定的本文指明的SEQ ID NO和/或与该SEQ ID NO的互补物(在本文中指明的或者未指明的)形成稳定杂交体的核酸。推导互补序列的方法是本领域技术人员已知的。在一些实施方式中,EG82013或EG81345核酸能够编码在植物中天然存在的EG82013或EG81345多肽的至少一部分。
在一些实施方式中,本发明的EG82013或EG81345核酸在严格杂交条件下与至少一个下列核酸杂交:包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ IDNO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ IDNO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ IDNO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ IDNO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ IDNO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的分离的核酸;或此类核酸的同源物或互补物。
在一些实施方式中,本发明的EG82013或EG81345核酸包括下列核酸:包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ IDNO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ IDNO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:29,SEQ ID NO:31,SEQ IDNO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ IDNO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ IDNO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:59和SEQ IDNO:60的核酸的至少20个连续核苷酸的分离的核酸。优选地,在该实施方式中,核酸与上述序列具有至少大约65%的同一性,至少大约66%的同一性,至少大约67%的同一性,至少大约68%的同一性,至少大约69%的同一性,至少大约70%的同一性,至少大约71%的同一性,至少大约72%的同一性,至少大约73%的同一性,至少大约74%的同一性,至少大约75%的同一性,至少大约76%的同一性,至少大约77%的同一性,至少大约78%的同一性,至少大约79%的同一性,至少大约80%的同一性,至少大约81%的同一性,至少大约82%的同一性,至少大约83%的同一性,至少大约84%的同一性,至少大约85%的同一性,至少大约86%的同一性,至少大约87%的同一性,至少大约88%的同一性,至少大约89%的同一性,至少大约90%的同一性,至少大约91%的同一性,更优选至少大约至少大约92%的同一性,至少大约93%的同一性,至少大约94%的同一性,至少大约95%的同一性,再更优选至少大约95.5%的同一性,至少大约96%的同一性,至少大约96.5%的同一性,至少大约97%的同一性,至少大约97.5%的同一性,至少大约98%的同一性,至少大约98.5%的同一性,至少大约99%的同一性,至少大约99.5%的同一性,并且其为植物中的产量标志物。
本发明还包括分离的多肽,其包含(包括)由包含选自下列的核酸的核酸编码的一个或多个多肽的至少一部分:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ IDNO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ IDNO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ IDNO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ IDNO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ IDNO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:60和SEQ ID NO:59;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;以及任意上述核酸的互补物;和由与上述核酸具有至少大约80%序列同一性的核酸编码的多肽,并且赋予与上述核酸基本上相同的产量。本发明的分离多肽还包括选自SEQ ID NO:5和SEQ ID NO:52的多肽的至少6个氨基酸的部分,以及与SEQ ID NO:5或SEQ ID NO:52的至少6个氨基酸的部分具有至少大约80%序列同一性的多肽,并且其中,其编码核酸是植物中的产量标志物或产量基因;以及与SEQ ID NO:5或SEQ ID NO:52的至少6个氨基酸的部分具有至少大约80%序列同一性的核酸;并且赋予与任意上述多肽基本上相同的产量。优选地,在该实施方式中,核酸编码的多肽或多肽本身与SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ IDNO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ IDNO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30,SEQ ID NO:29,SEQ ID NO:31,SEQ IDNO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ IDNO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ IDNO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58,SEQ ID NO:60和SEQ IDNO:59具有至少大约65%的同一性,至少大约66%的同一性,至少大约67%的同一性,至少大约68%的同一性,至少大约69%的同一性,至少大约70%的同一性,至少大约71%的同一性,至少大约72%的同一性,至少大约73%的同一性,至少大约74%的同一性,至少大约75%的同一性,至少大约76%的同一性,至少大约77%的同一性,至少大约78%的同一性,至少大约79%的同一性,至少大约80%的同一性,至少大约81%的同一性,至少大约82%的同一性,至少大约83%的同一性,至少大约84%的同一性,至少大约85%的同一性,至少大约86%的同一性,至少大约87%的同一性,至少大约88%的同一性,至少大约89%的同一性,至少大约90%的同一性,至少大约91%的同一性,更优选至少大约至少大约92%的同一性,至少大约93%的同一性,至少大约94%的同一性,至少大约95%的同一性,再更优选至少大约95.5%的同一性,至少大约96%的同一性,至少大约96.5%的同一性,至少大约97%的同一性,至少大约97.5%的同一性,至少大约98%的同一性,至少大约98.5%的同一性,至少大约99%的同一性,至少大约99.5%的同一性,并且其为植物中的产量标志物或产量基因,或者其编码核酸是植物中的产量标志物或产量基因。
本发明还包括分离的多肽,其包含(包括)由包含选自下列的核酸的核酸编码的一个或多个多肽的至少一部分:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7或SEQ ID NO:8,SEQ ID NO:58,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ IDNO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:60;与上述核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的核酸;以及任意上述核酸的互补物;和由与上述核酸具有至少大约80%序列同一性的核酸编码的多肽,并且赋予与上述核酸基本上相同的产量。本发明的分离多肽还包括选自SEQ ID NO:5和SEQ ID NO:52的多肽;以及与SEQ ID NO:5和SEQ ID NO:52具有至少大约80%序列同一性的多肽,并且其中,其编码核酸是植物中的产量标志物或产量基因;与SEQ ID NO:5和SEQ ID NO:52具有至少大约80%序列同一性的核酸;并且赋予与任意上述多肽基本上相同的产量。优选地,在该实施方式中,核酸编码的多肽或多肽本身与SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,或SEQ ID NO:8,SEQ ID NO:58,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ IDNO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:60具有至少大约65%的同一性,至少大约66%的同一性,至少大约67%的同一性,至少大约68%的同一性,至少大约69%的同一性,至少大约70%的同一性,至少大约71%的同一性,至少大约72%的同一性,至少大约73%的同一性,至少大约74%的同一性,至少大约75%的同一性,至少大约76%的同一性,至少大约77%的同一性,至少大约78%的同一性,至少大约79%的同一性,至少大约80%的同一性,至少大约81%的同一性,至少大约82%的同一性,至少大约83%的同一性,至少大约84%的同一性,至少大约85%的同一性,至少大约86%的同一性,至少大约87%的同一性,至少大约88%的同一性,至少大约89%的同一性,至少大约90%的同一性,至少大约91%的同一性,更优选至少大约至少大约92%的同一性,至少大约93%的同一性,至少大约94%的同一性,至少大约95%的同一性,再更优选至少大约95.5%的同一性,至少大约96%的同一性,至少大约96.5%的同一性,至少大约97%的同一性,至少大约97.5%的同一性,至少大约98%的同一性,至少大约98.5%的同一性,至少大约99%的同一性,至少大约99.5%的同一性,并且其为植物中的产量标志物或产量基因,或者其编码核酸是植物中的产量标志物。
根据本发明,分离的或生物学上纯的多肽是从其天然环境中取出的多肽。因此,“分离的”和“生物学上纯的”不一定反映该多肽被纯化的程度。本发明的分离的EG82013或EG81345多肽可以获自其天然来源,可以使用重组DNA技术产生,或者可以通过化学合成产生。本发明的EG82013或EG81345多肽可以通过其在功能测定中执行天然EG82013或EG81345功能的能力来鉴定。“天然EG82013或EG81345多肽”意思是全长的EG82013或EG81345多肽。词语“能够在功能测定中执行天然EG82013或EG81345的功能”意思是多肽在功能测定中具有天然多肽的至少大约10%的活性。在其它实施方式中,EG82013或EG81345多肽在功能测定中具有天然多肽的至少大约20%的活性。在其它实施方式中,EG82013或EG81345多肽在功能测定中具有天然多肽的至少大约30%的活性。在其它实施方式中,EG82013或EG81345多肽在功能测定中具有天然多肽的至少大约40%的活性。在其它实施方式中,EG82013或EG81345多肽在功能测定中具有天然多肽的至少大约50%的活性。在其它实施方式中,多肽在功能测定中具有天然多肽的至少大约60%的活性。在其它实施方式中,多肽在功能测定中具有天然多肽的至少大约70%的活性。在其它实施方式中,多肽在功能测定中具有天然多肽的至少大约80%的活性。在其它实施方式中,多肽在功能测定中具有天然多肽的至少大约90%的活性。功能测定的实例包括抗体结合测定,或产量增加性测定,或产量的直接和间接测量,如本说明书中其它地方所详述。
如本文使用的分离的植物EG82013或EG81345多肽可以是全长多肽或此类多肽的任意同源物。EG82013或EG81345的同源物的实例包括这样的EG82013或EG81345多肽:其中氨基酸被删除(例如多肽的截短的形式,例如肽)、插入、倒位、替换和/或衍生(例如通过糖基化、磷酸化、乙酰化、十四烷基化、异戊二烯化、棕榈酰化、酰胺化和/或添加甘油磷脂酰肌醇),从而该同源物具有天然EG82013或EG81345活性。
在一个实施方式中,当使用本领域技术人员已知的技术将同源物作为免疫原施用至动物时,该动物将产生针对EG82013或EG81345多肽的至少一个表位的体液和/或细胞免疫应答。还可以通过其在功能测定中执行EG82013或EG81345的功能的能力来选择EG82013或EG81345同源物。
植物EG82013或EG81345多肽同源物可以是天然等位基因变异或天然突变的结果。本发明的EG82013或EG81345多肽同源物还可以使用本领域已知的技术来产生,包括但不限于,使用例如经典的或重组DNA技术进行基因改组或随机或定向诱变,以对多肽直接进行修饰,或对编码多肽的基因进行修饰。
根据本发明,模拟表位(mimetope)是指能够模拟本发明的分离的植物EG82013或EG81345多肽的能力以在功能测定中执行本发明的EG82013或EG81345多肽的功能的任意化合物。模拟表位的实例包括但不限于,抗独特型抗体或其片段,其包括模拟本发明的分离的多肽的一个或多个表位的至少一个结合位点;分离的多肽的非多肽型免疫原性部分(例如碳水化合物结构);以及合成的或天然的有机分子,包括核酸,其具有类似于本发明的分离的多肽的至少一个表位的结构。可以使用计算机产生的本发明的多肽的结构来设计此类模拟表位。还可以通过产生分子例如寡核苷酸、肽或其它有机分子的随机样品,并使用相应的结合伴侣通过亲和色谱技术筛选此类样品来获得模拟表位。
本发明的EG82013或EG81345多肽同源物的最小大小是由足以能够与编码相应天然多肽的核酸的互补序列形成稳定杂交体的核酸编码的大小。因此,编码此类多肽同源物的核酸的大小取决于核酸的组成和核酸与互补序列之间的同源性百分率,以及取决于杂交条件本身(例如温度、盐浓度和甲酰胺浓度)。应该注意,形成稳定杂交体所需的同源性程度可以变化,其取决于同源序列是否散布在核酸中,或者是成簇于(即定位于)核酸中的独特区域。此类核酸的最小大小通常是:如果核酸富含GC,其长度是至少大约12至大约15个核苷酸;如果核酸富含AT,则其程度是至少大约15至大约17个碱基。在一些实施方式中,核酸的长度是至少12个碱基。本发明的植物EG82013或EG81345多肽是这样的化合物:当在植物中表达或调节时,其能增加该植物的产量。
本发明的一个实施方式是融合多肽,其包括连接至融合部分的包含EG82013或EG81345多肽的结构域。加入融合部分作为本发明的EG82013或EG81345多肽的一部分可以增强多肽在生产、储存和/或使用中的稳定性。取决于所述部分的特性,融合部分还可以用作免疫增效剂以增强经包含此类融合部分的EG82013或EG81345多肽免疫的动物所产生的免疫应答。此外,融合部分可以作为工具以简化EG82013或EG81345多肽的纯化,例如其能够实现使用亲和色谱法纯化所得到的融合多肽。合适的融合部分可以是具有想要的功能(例如,赋予增加的稳定性、赋予多肽增加的免疫原性、和/或简化多肽的纯化)的任意大小的结构域。本发明范围内包括使用一种或多种融合部分。融合部分可以连接至多肽的包含EG82013或EG81345的结构域的氨基和/或羧基末端。融合部分与融合多肽的包含EG82013或EG81345的结构域之间的键合可以易于被切割,以实现此类多肽的包含EG82013或EG81345的结构域的简便回收。在一些实施方式中,通过培养以编码多肽(所述多肽包括连接至包含EG82013或EG81345的结构域的羧基和/或氨基末端的融合部分)的融合核酸转化的重组细胞来产生融合多肽。
用于本发明的一些融合部分包括,结合谷胱甘肽的结构域;结合金属的结构域,例如能够结合二价金属离子的多组氨酸部分;结合免疫球蛋白的结构域,例如结合多肽A、多肽G、T细胞、B细胞、Fc受体或补体多肽抗体的结构域;结合糖的结构域,例如来自结合麦芽糖的多肽的结合麦芽糖的结构域;和/或“标签”结构域(例如,β-半乳糖苷酶的至少一部分,strep标签肽,可以使用结合该结构域的化合物例如单克隆抗体纯化的其它结构域)。其它融合部分包括结合金属的结构域,例如多组氨酸部分;结合麦芽糖的结构域;strep标签肽。
就EG82013或EG81345而言,一些重组细胞是植物细胞。“植物细胞”意思是任意自我繁殖的细胞,其与半透膜结合并含有质体。如果需要进一步的繁殖,此类细胞还需要细胞壁。如本文使用的植物细胞包括但不限于,藻类、蓝细菌、种子、悬浮培养物、胚芽、分生组织区、愈伤组织、叶、根、枝条、配子体、孢子体、花粉和小孢子。重组细胞和转基因植物的特征以及适当方法的描述见WO 03/062382,以及美国专利号6,040,497,二者通过引用全文并入本文。例如,基因在玉米中的表达是本领域已知的,合适的启动子是已知的,可以由技术人员进行选择。例如,可以使用已知的玉米表达载体例如那些可以从Rhone PoulencAgrochimie获得的玉米表达载体来构建植物表达载体。构建表达构建体和转化载体的方法包括标准的体外遗传重组和操作。参见,例如Weissbach and Weissbach,1988,Methods For Plant MolecularBiology,Academic Press,第26-28章中描述的技术。本发明的转化载体可以从本领域已知的任何植物转化载体开发,包括但不限于,熟知的来自土壤杆菌属的Ti质粒家族及其衍生物,包括整合型和二元载体,包括但不限于pBIB-KAN、pGA47l、pEND4K、pGV38SO和pMONSOS。还包括DNA和RNA植物病毒,包括但不限于CaMV、双粒病毒组、烟草花叶病毒,以及从其进行工程化改造获得的衍生物,其中任意项可以有效作为载体以将编码序列或其功能等同物与相关的调节元件转移进入植物细胞和/或自主地维持该转移的序列。此外,转座元件可以与任意载体联合使用以将编码序列和调节序列转移进入植物细胞。
为了辅助转化子和转染子的选择,优选可以对转化载体进行修饰以使其包含编码报告基因产物或选择性标志物的编码序列。此类编码报告分子或选择性标志物的编码序列优选与上文描述的调节元件的编码序列可操作地连接。
可用于本发明的报告基因的包括但不限于,′3-葡萄糖醛酸酶(GUS)基因(Jefferson等人,Proc.Natl.Acad.Sci.USA,83:8447(1986))和萤光素酶基因(Ow等人,Science 234:856(1986))。可用于本发明的编码选择性标志物的编码序列包括但不限于,编码赋予对抗生素、抗代谢物或除草剂(包括但不限于卡那霉素、潮霉素、链霉素、草胺膦、庆大霉素、氨甲蝶呤、草甘膦和磺酰脲类除草剂)抗性的基因产物的序列;以及,包括但不限于,编码酶例如新霉素磷酸转移酶II(NPTII)、氯霉素乙酰转移酶(CAT)和潮霉素磷酸转移酶I(HPT,HYG)的编码序列。
可以使用多种植物表达系统来表达编码序列或其功能等同物。具体的植物物种可以选自任意双子叶植物、单子叶植物物种、裸子植物、低等维管植物或非维管植物,包括任意谷类农作物或其它农业上具有重要意义的作物。此类植物包括但不限于,紫花苜蓿、拟南芥、芦笋、小麦、甘蔗、珍珠稷、高粱、大麦、卷心菜、胡萝卜、芹菜、玉米、棉花、黄瓜、亚麻、莴苣、油菜、梨、豌豆、矮牵牛花、白杨、马铃薯、水稻、甜菜、向日葵、烟草、番茄、小麦和白花苜蓿。转化或转染植物的方法是本领域技术人员熟知的。参见,例如Plant Biotechnology,1989,Kung & Arntzen,eds.,Butterworth Publishers,第1、2章。可用于有效实施本发明的转化方法的实例包括但不限于,土壤杆菌介导的叶片或其它植物组织的转化、将DNA直接微注射进入植物细胞、DNA电穿孔进入植物细胞原生质体、脂质体或原生质球融合、微弹轰击(microprojectile bombardment),以及通过合适的工程化改造的植物病毒转染植物细胞或组织。实施本发明所需要的植物组织培养程序是本领域技术人员熟知的。参见,例如Dixon,l985,Plant Cell Culture:A Practical Approach,IRL Press。可用于有效实施本发明的组织培养程序包括:产生并培养植物原生质体和细胞悬浮液、叶片或其它植物组织在含有转化剂例如土壤杆菌或植物病毒株的工程化株的培养基上的无菌培养繁殖,以及从原生质体、细胞悬浮液和愈伤组织再生出完整的经转化的植物。本发明可以这样实施:以包含含有序列的编码序列的表达构建体的转化载体转化或转染植物或植物细胞;选择表达该序列的转化子或转染子。可以通过本领域技术人员熟知的技术选择经转化或转染的植物细胞和组织,所述技术包括但不限于,检测报告基因产物,或基于如上文描述的选择性标志物中的一种的存在进行选择。然后使经转化或转染的植物细胞或组织生长,并从中再生出完整植物。可以通过标准技术确认植物基因组中编码序列的整合情况和维持情况,例如,通过Southern杂交分析、PCR分析,包括逆转录酶-PCR(RT-PCR)或免疫测定预期的蛋白产物。一旦鉴定出此类植物转化子或转染子,本发明的非限制性实施方式包括克隆性扩增和将该转化子或转染子用于产生序列。
可用于表达构建体的调节元件包括启动子,其对于植物细胞而言可以是异源的或同源的。启动子可以是植物启动子或非植物启动子,它们能够驱动相连的序列在植物细胞和植物中的高水平转录。可用于有效实施本发明的植物启动子的非限制性实例包括花椰菜花叶病毒(CaMV)19S或35S、rbcS、叶绿素11a/b结合蛋白的启动子、AdhI、NOS和HMG2,或其修饰物或衍生物。启动子可以是组成型的或可诱导的。例如(但非以限制方式),可诱导的启动子可以是在植物、植物组织或植物细胞的机械基因激活(MGA)之后促进或增加本发明的核酸的表达的启动子。此类MGA-可诱导型植物启动子的一个非限制性实例是MeGA。
还可以根据本领域技术人员已知的方法对表达构建体进行另外的修饰,以增强或优化植物和植物细胞中的异源基因表达。此类修饰包括但不限于,使DNA调节元件突变以增强启动子的强度,或改变编码序列本身。其它修饰包括,删除内含子序列或从编码序列的5’和/或3’末端删除多余的非编码序列,以使序列相关或距离相关的对蛋白表达的负面影响降到最低,例如,通过最小化或消除信使去稳定序列(messagedestabilizing sequence)。
还可以根据本领域技术人员已知的方法对表达构建体进行进一步修饰,以添加、除掉或修饰肽信号序列以改变信号肽的切割,或通过植物内膜系统增加或改变表达的多肽的靶向。例如(但非以限制方式),可以对表达构建体进行特定的工程化改造以使多肽靶向分泌,或定位于叶泡,或保留在内质网(ER)中。
本发明还包括能够选择性结合本发明的EG82013或EG81345多肽的至少一部分或其模拟表位的分离的抗体。重组细胞和转基因植物的特征以及合适的方法的描述见WO 03/062382。
本发明还包括植物细胞,其包含编码EG81345或EG82013多肽的至少一部分的异源DNA。此类多肽能够改变植物的产量。例如,最优选地,多肽能够增加植物产量,次优选地,多肽能够降低植物的产量。植物细胞包括如本文其它地方所描述的本发明的多肽。另外,本发明包括包含上文描述的转基因植物细胞的转基因植物的繁殖材料。
本发明还包括转基因植物,其包含编码在植物组织中表达的EG81345或EG82013多肽的异源DNA。此类多肽能够改变植物的产量。转基因植物包含如本文其它地方所描述的本发明的多肽。
本发明还包括分离的核酸,其包含与编码植物组织中的EG81345或EG82013多肽的至少一部分的核酸可操作连接的启动子。此类多肽能够改变植物的产量。转基因植物包含如本文其它地方所描述的本发明的多肽。所述核酸可以是重组核酸,并且可以包含任意启动子,包括EG81345或EG82013基因的天然启动子。
本发明还包括经转染的宿主细胞,其包括经构建体转染的宿主细胞,所述构建体包含与编码报告蛋白的核酸可操作连接的来自EG81345或EG82013核酸的启动子、增强子或内含子核酸或其任意组合。此类构建体能够改变植物的产量。经转染的宿主细胞包含如本文其它地方所描述的本发明的多肽。
本发明还包括重组载体,其包括,插入至能够将核酸递送进入宿主细胞的任意载体的本发明的至少一个植物EG82013或EG81345核酸的至少一部分。重组分子的特征以及合适的方法的描述见WO 03/062382。包括在本发明的重组载体中的合适的核酸如针对合适的植物EG82013或EG81345核酸本身在本文中公开的那些。包括在本发明的重组载体尤其是重组分子中的核酸包括本发明的EG82013和EG81345核酸。
如本文使用的严格杂交条件是指这样的标准杂交条件:在该条件下核酸包括寡核苷酸用于鉴定具有相似核酸序列的分子。此类标准杂交条件公开于例如Sambrook等人,Molecular Cloning:A LaboratoryManual,Cold Spting Harbor Labs Press,1989。在本申请的实施例部分提供了此类条件的实例。
如本文使用的来自植物的特定物种的EG82013或EG81345基因包括所有与天然EG82013或EG81345基因相关的核酸序列,例如控制产生由该基因编码的EG82013或EG81345多肽的调节区(例如但不限于,转录、翻译或翻译后控制区)以及编码区本身。
提供了以下实施例以进一步帮助本领域普通技术人员。这些实施例意在解释,因此不应被认为限制本发明。在本申请中描述了多个示例性修饰和变体,其它修饰和变体对本领域技术人员是明显的。此类变体被认为落在本发明的如本文所描述和要求保护的范围内。
实施例1.EG82013的发现
从野生稻(O.rufipogon)的组织的mRNA制备cDNA文库。以高通量方式对随机cDNA进行测序。将来自该测序结果的EST针对公众可获得的数据库例如GenBank中的栽培稻(O.sativa)的DNA序列进行BLAST。使用如美国专利号6,274,319中更详尽描述的Ka/Ks分析进行成对比较。发现已知数据库中的一个同源对:野生稻(O.rufipogon)EST克隆号EG82013和栽培稻(O.sativa)具有3.9的Ka/Ks比,这表明了阳性选择。Ka/Ks比与选择压力的强度相关联。理论最大值是4.0。因此,EG82013由于栽培而被置于强烈的选择压力下。
EG82013位于染色体3,GenBank:AC104487 Pb:58670-59166,位于与千粒重、穗数、谷粒产量、粒数、淀粉含量和精米率的QTL相关的区域(见实施例4)。其编码独特的黄素依赖性单加氧酶,该酶与参与植物生长的单加氧酶家族相关。已经报道该家族中的蛋白影响植物活力、总植物生长(生物质)和植物生长速率。
对应于野生稻克隆号EG82013的核酸编码序列是核酸序列SEQ IDNO:1,其被称作野生稻EG82013核酸,也被称作EG82013的祖先等位基因。SEQ ID NO:1是部分的mRNA,其起始密码子位于核苷酸51-53。SEQID NO:2是部分的编码序列。
在栽培稻中鉴定了EG82013的同源物:核酸序列SEQ ID NO:3。SEQID NO:3是mRNA转录物,其起始密码子是核苷酸28-30,终止密码子是核苷酸1387-1389。SEQ ID NO:4是预测的CDS。预测的由SEQ ID NO:4编码的多肽序列是多肽SEQ ID NO:5。SEQ ID NO:6包括位于水稻染色体3上的EG82013的位置(即外显子/内含子结构)。基因组序列来自Gramene数据库:由Evolutionary Genomics对所有的外显子进行完全测序(并对其位置进行确认)。在该序列中可以见到内含子GT/AG边界。在核苷酸73-75处可以见到起始密码子。第一个外显子是核苷酸76-103。下一个外显子是核苷酸457-600;核苷酸1269-1327;核苷酸1883-1950;核苷酸2038-2089;核苷酸2974-3162;核苷酸3250-3853;核苷酸4117-4329;终止密码子是核苷酸4330-4332。
对SEQ ID NO:2与SEQ ID NO:4进行的并排比较(以起始密码子排列)显示:在栽培过程中,相对于驯化的等位基因发生了多个核苷酸变化,即:SEQ ID NO:2,位置72,C至T;SEQ ID NO:2,位置78,C至T;SEQ ID NO:1,位置132,A至G;SEQ ID NO:1,位置183,C至T;SEQ ID NO:2,位置279,A至G;SEQ ID NO:2,位置306,C至T;SEQID NO:2,位置340,T至C;SEQ ID NO:2,位置348,G至A;SEQ IDNO:2,位置414,A至G;SEQ ID NO:2,位置546,A至G;SEQ ID NO:2,位置555,T至C;SEQ ID NO:2,位置690,T至G;SEQ ID NO:2,位置851,A至G;SEQ ID NO:2,位置901,A至G;SEQ ID NO:2,位置924,G至A;SEQ ID NO:2,位置953,C至G;SEQ ID NO:2,位置1000,G至A;SEQ ID NO:2,位置1012,A至T;SEQ ID NO:2,位置1016,T至A;SEQ ID NO:2,位置1153,A至T;SEQ ID NO:2,位置1174,G至A;SEQ ID NO:2,位置1185,T至A;和SEQ ID NO:2,位置1248,T至A。
我们通过同源性搜索推断了由EG82013编码的基因的生物化学功能。同源性搜索表明:EG82013是泛醌生物合成单加氧酶。有3个保守性蛋白结构域:单加氧酶(单加氧酶包括利用FAD的多种酶);UBiH,(2-聚戊烯-6-甲氧基苯酚羟化酶和相关的FAD依赖性氧化还原酶)[这些酶参与能量的产生和保存,包括辅酶代谢];FixC(这些氢化酶,也称为黄素蛋白,参与能量的产生和保存)。
水稻染色体3的区域在玉米中的同线(syntenic)区域是玉米染色体1。
实施例2.EG 81345的发现
鉴定为如实施例1中所述的阳性选择的另一对同源序列是已知数据库中的野生稻EST克隆号81345和栽培稻,发现其具有1.9的Ka/Ks比。对应于野生稻克隆号81345的核酸编码序列是核酸序列SEQ ID NO:48,其在本文中被称作野生稻EG81345核酸,还被称作祖先等位基因。SEQ IDNO:48是部分的mRNA;SEQ ID NO:49是部分的CDS。
同源的栽培稻核酸的核酸序列是核酸序列SEQ ID NO:50,其在以下实施例和本申请其它地方被称作栽培稻EG81345核酸,并且也被称作衍生的或驯化的等位基因。起始密码子存在于95-97,终止密码子存在于1175-1177。SEQ ID NO:51是编码序列,预测的栽培稻的多肽是多肽SEQID NO:52。SEQ ID NO:53包括位于水稻染色体6上的EG81345的位置(即,外显子/内含子结构)。水稻染色体6的区域在玉米中的同线区域是玉米染色体9。基因组序列来自Gramene数据库:由EvolutionaryGenomics对所有的外显子进行完全测序(并对其位置进行确认)。在该序列中可以见到内含子GT/AG边界。在核苷酸335-337处可以见到起始密码子。第一个外显子是核苷酸338-554;下一个外显子是核苷酸2128-2721;下一个外显子是核苷酸3699至4077;终止密码子是核苷酸4078至4080。
EG81345位于水稻染色体6,GenBank:AP004806Bp:151921-152274,位于结实率、谷粒产量、千粒重、穗数、粒数、淀粉含量、精米率和成熟天数的QTL中(见实施例4)。其编码独特的B-Box型锌指蛋白,具有B-Box型锌指结构域和锌结合结构域,很有可能介导蛋白-蛋白相互作用。报道了拟南介直向同源物赋予盐耐受性(见GenBank登录号Q9SYM2)。
对SEQ ID NO:51与SEQ ID NO:49进行的并排比较(以起始密码子排列)显示:在栽培过程中,相对于驯化的等位基因发生了多个核苷酸变化,即:SEQ ID NO:51,位置521,C至T;SEQ ID NO:51,位置600,C至T;SEQ ID NO:51,位置644,A至G;SEQ ID NO:51,位置649,G至A;SEQ ID NO:51,位置665,A至G;SEQ ID NO:51,位置807,C至T;SEQ ID NO:51,位置825,T至G;SEQ ID NO:51,位置873,T至C;SEQ ID NO:51,位置924,T至C;和SEQ ID NO:51,位置984,T至C。
实施例3.通过BLAST鉴定另外的EG82013和EG81345水稻序列
野生稻和栽培稻的EG82013核酸用于进一步对GenBank进行BLAST以鉴定水稻中的同源基因(见表1):
表1.
Figure BDA0000048637190000701
实施例4.公开的与EG82013和EG81345有关的QTL
对Gramene(www.gramene.org)进行的搜索表明EG82013和EG81345与水稻中的以下QTL有关:
EG82013:
CQB5  性状类别:产量性状:千粒重
Lu-C-F Shen-L-H Tan-Z-B Xu-Y-B He-P Chen-Y Zhu-L-H,Comparative mapping of QTLs for agronomic traits of rice acrossenvironments by using a doubled-haploid population,Theoreticaland applied genetics,94,1997,pp.145-150
Lu-C Shen-L Tan-Z Xu-Y He-P Chen-Y Zhu-L Xu-Y-B,Comparativemapping of QTLs for agronomic traits of rice across environmentsusing a doubled haploid population,Theoretical and appliedgenetics,93,1996,pp.1211-1217
CQAE21  性状类别:产量性状:千粒重
Moncada-P Martinez-C-P Borrero-J Chatel-M Gauch-HGuimaraes-E Tohme-J McCouch-S-R,Quantitative trait loci foryield and yield components in an Oryza sativa X Oryza rufipogonBC2F2 population evaluated in an upland environment,Theoreticaland applied genetics,102(1),201,pp.41-42
AQBK048  性状类别:产量性状:结实率
Li-J-Z Zheng-X-W Zhu-L-H He-P Lu-R-L,Identification andinteraction analysis of six agronomic trait loci of rice basedon a recombinant inbred population,Acta.Bot.Sinica,41,1999,pp.1199-1203
AQEJ084  性状类别:活力性状:根系分泌物(同义词:根活力)
Yan-C-J Liang-G-H Chen-F Li-X Tang-S-Z Yi-C-D Tian-S Lu-J-FGu-M-H,Mapping quantitative trait loci associated with ricegrain shape based on an indica/japonica backcross population,Acta genetica Sinica,30,2003,pp.711-716
AQCN006  性状类别:活力性状:植物高度(同义词:幼苗高度)
Albar-L Lorieux-M Ahmadi-N Rimbault-I Pinel-AFargette-A-A-S-D Ghesquiere-A,Genetic basis and mapping of theresistance to rice yellow mottle virus.I.QTLs identificationand relationship between resistance and plant morphology,Theoretical and applied genetics,97,1998,pp.1145-1154
AQCN007  性状类别:活力性状:植物高度(同义词:幼苗高度)
Albar-L Lorieux-M Ahmadi-N Rimbault-I Pinel-AFargette-A-A-S-D Ghesquiere-A,Genetic basis and mapping of theresistance to rice yellow mottle virus.I.QTLs identificationand relationship between resistance and plant morphology,Theoretical and applied genetics,97,1998,pp.1145-1154
AQBP009  性状类别:质量性状:白核谷粒百分率(grain corepercent white)
He-P Li-S-G Qian-Q Ma-Y-Q Li-J-Z Wang-W-M Chen-Y Zhu-L-H,Genetic analysis of rice grain quality,Theoretical and appliedgenetics,98,1999,pp.502-508
EG81345:
AQCF038  性状类别:产量(能育性)性状:小穗育性(结实率)
Zhuang-J-Y Fan-Y-Y Wu-J-L Xia-Y-W Zheng-K-L,Comparison ofthe detection of QTL for yield traits in different generationsof a rice cross using two mapping approaches,Acta genetica Sinica,28,2001,pp.458-464
AQCF040  性状类别:产量性状:谷粒产量
Zhuang-J-Y Fan-Y-Y Wu-J-L Xia-Y-W Zheng-K-L,Comparison ofthe detection of QTL for yield traits in different generationsof a rice cross using two mapping approaches,Acta genetica Sinica,28,2001,pp.458-464
AQCQ017  性状类别:产量性状:千粒重
Yu-S-B Li-J-X Xu-C-G Tan-Y-F Gao-Y-J Li-X-H Zhang-QMaroof-M-A,Importance of epistasis as the genetic basis ofheterosis in an elite rice hybrid,Proceedings of the NationalAcademy of Sciences of the United States of America,94,1997,pp.9226-9231
AQCY026  性状类别:产量性状:穗数
Hua-J Xing-Y Wu-W Xu-C Sun-X Yu-S Zhang-Q,Single-loGusheterotic effects and dominance by dominance interactions canadequately explain the genetic basis of heterosis in an elite ricehybrid,Proceedings of the National Academy of Sciences of theUnited States of America,100,2003,pp.2574-2579
AQCF021  性状类别:产量性状:谷粒产量
Zhuang-J-Y Fan-Y-Y Wu-J-L Xia-Y-W Zheng-K-L,Comparison ofthe detection of QTL for yield traits in different generationsof a rice cross using two mapping approaches,Acta genetica Sinica,28,2001,pp.458-464
AQCF037  性状类别:产量性状:粒数
Zhuang-J-Y Fan-Y-Y Wu-J-L Xia-Y-W Zheng-K-L,Comparison ofthe detection of QTL for yield traits in different generationsof a rice cross using two mapping approaches,Acta genetica Sinica,28,2001,pp.458-464
AQFU016  性状类别:质量性状:淀粉含量
Aluko-G Martinez-C Tohme-J Castano-C Bergman-C Oard-J-H,QTLmapping of grain quality traits from the interspecific crossOryza sativa x O.glaberrima,Theoretical and applied genetics,,2004,pp.
AQFU006  性状类别:质量性状:精米率
Aluko-G Martinez-C Tohme-J Castano-C Bergman-C Oard-J-H,QTLmapping of grain quality traits from the interspecific crossOryza sativa x O.glaberrima,Theoretical and applied genetics,,2004,pp.
AQCF009  性状类别:产量性状:粒数
Zhuang-J-Y Fan-Y-Y Wu-J-L Xia-Y-W Zheng-K-L,Comparison ofthe detection of QTL for yield traits in different generationsof a rice cross using two mapping approaches,Acta genetica Sinica,28,2001,pp.458-464
实施例5.通过BLAST鉴定其它属中的与EG82013同源的EST
野生稻和栽培稻EG82013的核酸用于对GenBank进行进一步BLAST以鉴定其它植物中的同源基因。通过这种方式,鉴定了以下基因,见表2:
表2
*仅能获得该基因的非常小的一部分
实施例6.通过BLAST鉴定其它属中的与EG81345同源的EST
野生稻和栽培稻的EG82013核酸用于对GenBank进行进一步BLAST以鉴定其它植物中的同源基因。通过这种方式,鉴定了以下基因,见表3:
表3
Figure BDA0000048637190000751
实施例7.水稻品系和杂种中的EG82013的基因分型和统计学分析
从水稻品系和杂种中通过PCR扩增EG82013核酸并测定其核酸序列。一般而言,发现较高产量的品系和杂种具有衍生的EG82013等位基因,产量较低的品系和杂种具有EG82013的祖先等位基因。事实上,对于具有祖先等位基因的条目而言,平均产量是7,136磅/英亩,而对于具有衍生的EG82013等位基因的条目而言,产量是8,806磅/英亩。使用统计学软件确定了与商业上具有重要意义的性状的关联,所述软件包括SAS(SAS Institute.SAS/STAT User’s Guide Version 8(SASInstitute,Cary,North Carolina,1999)和TASSEL(Yu,Jainming等人Nature Genetics 2006 38(2):203-208)。这些统计学软件包计算R2值,其指示可以被特定基因或基因座解释的特定性状中的变异百分率。结果表明了与产量性状的强烈的、统计学上显著的关联,所述产量性状包括产量、完整制粉、总制粉、种子重量和种子宽度,以及农学上的性状:倒伏,以及植物高度(见表4)。
表4 EG 82013的关联分析结果
Figure BDA0000048637190000761
实施例8.水稻品系和杂种中的EG81345的基因分型和统计学分析
从水稻品系和杂种中通过PCR扩增EG81345核酸并测定其核酸序列。根据上文所述进行统计学分析,并且表明了与种子重量、总制粉率、碾磨水稻的完整重量、完整制粉率和倒伏的强烈的、统计学上显著的关联(见表5)。
表5 EG 81345的关联分析结果
  性状   完整制粉率   总制粉率   种子重量   种子宽度   倒伏
  R2   48%   20%   31%   30%   27%
实施例9.EG82013的表达特征谱
如下表所示的通过分析GenBank中的EST计数给出的表达特征谱显示:相对于愈伤组织、花、叶、根、种子和茎而言,EG82013的表达在花序中是最高的。
  愈伤组织   0  0/15887
  花   0  0/5122
  花序   47 2/41731
  叶   0  0/44341
  根   0  0/4902
  种子   0  0/7737
  茎   0  0/2264
实施例10.EG81345的表达特征谱
如下表所示的(其为GenBank中的EST计数的分析)表达特征谱显示:相对于花、叶、根和茎而言,EG81345的表达在花序、种子和愈伤组织中是最高的。
  愈伤组织   62  1/15887
  花   0   0/5122
  花序   23  1/41731
  叶   0   0/44341
  根   0   0/4902
  种子   129 1/7737
  茎   0   0/2264
实施例11.EG81345的等位基因
就EG81345基因座,对114个水稻品系和杂种进行了基因分型,以测定等位基因多样性的程度和性质。我们靶向EG81345基因座的一部分,其显示包含足够的核苷酸多样性以允许等位基因的分化。使用标准技术设计了引物MR07021F(5’-TTC AGT TGG CTG TGT CAT GTG C-3’)(SEQID NO:54)和MR07022R(5’-GGT ACA GGT TTT CAC TTA ACG AAT GACG-3’)(SEQ ID NO:55),以针对每个样品(品系或杂种)产生1026个碱基的扩增子。通过对来自每个扩增子的相同的835个碱基对的部分进行DNA测序完成基因分型。在114个水稻品系和杂种中仅鉴定了2个等位基因。
实施例12.EG81345的另外的等位基因
对另外的水稻种质进行的检查显示,发现了至少一些其它等位基因。对除了上文讨论的835个连续碱基对之外的EG81345基因座内的其它非编码区进行的检测揭示了更多的等位基因。
针对邻近如上所述的靶向扩增子的区域、远离它的区域、或与之重叠的区域设计引物,并产生另外的扩增子。通过对每个扩增子进行DNA测序完成基因分型。如果在来自一种品系的扩增子与来自另一品系的直向同源扩增子之间存在任何核苷酸差异,则进行统计学分析以确定与产生此类核苷酸差异的任何关联。靶扩增子的长度可以变化。用于基因分型的最有用的扩增子长度是通过经验确定的。可以在EG81345染色体基因座上的任何位置设计靶扩增子;此类扩增子可以邻近用于本实施例的靶扩增子,或者此类扩增子可以与靶扩增子重叠。或者,合适的扩增子可以与我们的靶扩增子分离开;它们可能位于EG81345染色体基因座内,但是在5’或3’处距离我们的靶扩增子一段距离。
本领域技术人员可以使用本文提供的EG81345序列对一组水稻品系进行测序,以发现我们所鉴定的两个EG81345等位基因(野生稻序列和栽培稻序列)的标志物,并鉴定对于产量具有不同影响的新的等位基因。
实施例13.EG82013的等位基因
就EG82013基因座,对114个水稻品系和杂种进行了基因分型,以测定等位基因多样性的程度和性质。我们靶向EG82013基因座的一部分,其显示包含足够的核苷酸多样性以允许等位基因的分化。使用标准技术设计了引物MR07033F(5’-CAC CCA TGT GTA GGA CAG AGT AAA CC-3)(SEQ ID NO:7)和MR070008R(5’-5’-CAA CAG AGT ACA TCT TCT GGAAAC CAT CTA GC-3’)(SEQ ID NO:8),以针对每个样品(品系或杂种)产生1354个碱基的扩增子。通过对来自每个扩增子的相同的636个碱基对的部分进行DNA测序完成基因分型。在114个水稻品系和杂种中仅鉴定了2个等位基因。
实施例14.EG82013的另外的等位基因
针对邻近如上所述的靶向扩增子的区域、远离它的区域、或与之重叠的区域设计引物,并产生另外的扩增子。通过对每个扩增子进行DNA测序完成基因分型。如果在来自一种品系的扩增子与来自另一品系的直向同源扩增子之间存在任何核苷酸差异,则进行统计学分析以确定与产生此类核苷酸差异的任何关联。靶扩增子的长度可以变化。用于基因分型的最有用的扩增子长度是通过经验确定的。可以在EG82013染色体基因座上的任何位置设计靶扩增子;此类扩增子可以邻近用于本实施例的靶扩增子,或者此类扩增子可以与靶扩增子重叠。或者,合适的扩增子可以与我们的靶扩增子分离开;它们可能位于EG82013染色体基因座内,但是在5’或3’处距离我们的靶扩增子一段距离。
实施例15.玉米中EG82013和EG81345的鉴定
从玉米(Zea mays mays)中获得了鉴定为与实施例1和实施方式2中鉴定的EG81345和EG82013同源的另一对同源序列。对应于玉米中的EG 82013的核酸mRNA是核酸序列SEQ ID NO:58,其起始密码子位于核苷酸52-54,终止密码子位于1618-1620。对应于玉米中的EG81345的核酸mRNA(部分的)是核酸序列SEQ ID NO:59和SEQ ID NO:60(二者都是部分的mRNA)。
Figure IDA0000048637220000011
Figure IDA0000048637220000021
Figure IDA0000048637220000031
Figure IDA0000048637220000041
Figure IDA0000048637220000051
Figure IDA0000048637220000071
Figure IDA0000048637220000081
Figure IDA0000048637220000091
Figure IDA0000048637220000111
Figure IDA0000048637220000121
Figure IDA0000048637220000131
Figure IDA0000048637220000141
Figure IDA0000048637220000151
Figure IDA0000048637220000161
Figure IDA0000048637220000171
Figure IDA0000048637220000181
Figure IDA0000048637220000191
Figure IDA0000048637220000201
Figure IDA0000048637220000211
Figure IDA0000048637220000221
Figure IDA0000048637220000241
Figure IDA0000048637220000251
Figure IDA0000048637220000261
Figure IDA0000048637220000271
Figure IDA0000048637220000281
Figure IDA0000048637220000291
Figure IDA0000048637220000311
Figure IDA0000048637220000321
Figure IDA0000048637220000341
Figure IDA0000048637220000351

Claims (51)

1.分离的EG81345核酸,其包括选自下列的核酸:
a)选自SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:60的核酸;
b)与a)中的核酸具有至少大约80%序列同一性并且是植物中的产量基因或产量标志物的核酸。
2.分离的EG81345多肽,其包括选自下列的多肽:
a)由选自SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:60的核酸编码的多肽;
b)由与a)中的核酸具有至少大约80%序列同一性的核酸编码的多肽,并且其编码核酸是植物中的产量标志物或产量基因;
c)包含SEQ ID NO:52的多肽;和
d)包含与c)的多肽具有至少大约80%序列同一性的多肽的多肽,并且其编码核酸是产量基因或产量标志物。
3.包含异源DNA的植物细胞,所述异源DNA包含权利要求17的核酸或包含权利要求2的多肽。
4.包含权利要求3的转基因植物细胞的转基因植物的繁殖材料。
5.包含异源DNA的转基因植物,所述异源DNA包含权利要求17的核酸或包含权利要求2的多肽。
6.分离的核酸,其包括与权利要求1的核酸可操作连接的启动子。
7.包含经构建体转染的宿主细胞的转染的宿主细胞,所述构建体包含与编码报告蛋白的核酸可操作连接的来自权利要求1的EG81345核酸的启动子、增强子或内含子核酸。
8.分离的EG82013核酸,其包括选自下列的核酸:
a)SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ IDNO:6,SEQ ID NO:7,SEQ ID NO:8和SEQ ID NO:58;和
b)与a)中的核酸具有至少大约80%序列同一性并且是植物中的产量基因或产量标志物的核酸。
9.分离的EG82013多肽,其包括选自下列的多肽:
a)由选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8和SEQ ID NO:58的核酸编码的多肽;
b)由与a)中的核酸具有至少大约80%序列同一性的核酸编码的多肽,并且其编码核酸是植物中的产量基因或产量标志物;
c)包含SEQ ID NO:5的多肽;和
d)包含与c)的多肽具有至少大约80%序列同一性的多肽的多肽,并且其编码核酸是植物中的产量基因或产量标志物。
10.包含异源DNA的植物细胞,所述异源DNA包含权利要求24的核酸或包含权利要求9的多肽。
11.包含权利要求10的转基因植物细胞的转基因植物的繁殖材料。
12.包含异源DNA的转基因植物,所述异源DNA包含权利要求24的核酸或包含权利要求9的多肽。
13.分离的核酸,其包括与权利要求8的核酸可操作连接的启动子。
14.权利要求13的分离的核酸,其中所述核酸是重组核酸。
15.包含经构建体转染的宿主细胞的转染的宿主细胞,所述构建体包含与编码报告蛋白的核酸可操作连接的来自权利要求8的EG82013核酸的启动子、增强子或内含子核酸。
16.鉴定植物中的EG81345同源核酸序列或EG81345等位基因的方法,其包括以下步骤:
a)将植物核酸序列的至少一部分与至少一个选自下列的核酸进行比较:
i)包含选自SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ IDNO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:59和SEQ IDNO:60的核酸的至少20个连续核苷酸的分离的核酸;
ii)i)中的核酸的互补物;和
b)鉴定与i)或ii)中的核酸具有至少大约80%序列同一性并且是植物中的产量基因或产量标志物的至少一个核酸序列。
17.权利要求16的方法,其中所述植物核酸序列是基因组DNA。
18.权利要求16的方法,其中所述植物核酸序列是cDNA。
19.权利要求16的方法,其中所述EG81345核酸序列调节植物的产量。
20.权利要求19的方法,其中调节的产量是相对于来自相同的属的第二植物而言,所述第二植物具有相对于来自所述植物的EG81345核酸序列具有至少一个核苷酸变化的第二EG81345核酸序列。
21.权利要求16的方法,其中所述植物选自玉米(Zea mays mays)、栽培稻(Oryza sativa)、小麦(Triticum aestivum)、大麦(Hordeumvulgare)、甘蔗(Saccharum officinarum)、高粱(Sorghum bicolor)、柳枝稷(Pannicum virgatum)、黑麦(Secale cereale)和拟南芥(Arabidopsis thaliana)。
22.权利要求16的方法,其中所述植物选自栽培植物的野生祖先植物,所述栽培植物选自玉米(Zea mays mays)、栽培稻(Oryza sativa)、小麦(Triticum aestivum)、大麦(Hordeum vulgate)、甘蔗(Saccharumofficinarum)、高粱(Sorghum bicolor)、柳枝稷(Pannicum virgatum)、黑麦(Secale cereale)和拟南芥(Arabidopsis thaliana)。
23.鉴定植物中的EG81345同源序列或EG81345等位基因的方法,其包括以下步骤:
a)将植物多肽序列的至少一部分与由包含选自SEQ ID NO:31,SEQ IDNO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQID NO:37,SEQ ID NO:38,SEQ ID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:59和SEQ ID NO:60的核酸的至少20个连续核苷酸的分离的核酸编码的至少一个多肽进行比较;和
b)鉴定与上述多肽序列具有至少大约80%序列同一性并且是植物中的产量基因或产量基因的标志物的至少一个多肽序列。
24.鉴定植物中的EG82013同源核酸序列或EG82013等位基因的方法,其包括以下步骤:
a)将植物核酸序列的至少一部分与至少一个选自下列的核酸进行比较:
i)包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30和SEQ ID NO:58的核酸的至少20个连续核苷酸的分离的核酸;
ii)i)中的核酸的互补物;和
b)鉴定与i)中的核酸具有至少大约80%序列同一性并且是植物中的产量标志物或产量基因的至少一个核酸序列。
25.权利要求24的方法,其中所述植物核酸序列是基因组DNA。
26.权利要求24的方法,其中所述植物核酸序列是cDNA。
27.权利要求24的方法,其中所述EG82013核酸序列调节植物的产量。
28.权利要求24的方法,其中调节的产量是相对于来自相同的属的第二植物而言,所述第二植物具有相对于来自所述植物的EG82013核酸序列具有至少一个核苷酸变化的第二EG82013核酸序列。
29.权利要求24的方法,其中所述植物选自玉米(Zea mays mays)、栽培稻(Oryza sativa)、小麦(Triticum aestivum)、大麦(Hordeumvulgare)、甘蔗(Saccharum officinarum)、高粱(Sorghum bicolor)、细弱翦股颖(Agrostis capillaries)、欧洲山杨(Populus tremula)、棉花(Gossypium hirsutum)、马铃薯(Solanum tuberosum)和拟南芥(Arabidopsis thaliana)。
30.权利要求24的方法,其中所述植物选自栽培植物的野生祖先植物,所述栽培植物选自玉米(Zea mays mays)、栽培稻(Oryza sativa)、小麦(Triticum aestivum)、大麦(Hordeum vulgare)、甘蔗(Saccharumofficinarum)、高粱(Sorghum bicolor)、细弱翦股颖(Agrostiscapillaries)、欧洲山杨(Populus tremula)、棉花(Gossypiumhirsutum)、马铃薯(Solanum tuberosum)和拟南芥(Arabidopsisthaliana)。
31.鉴定植物中的EG82013同源序列或EG82013等位基因的方法,其包括以下步骤:
a)将植物多肽序列的至少一部分与由包含选自SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ IDNO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30和SEQ ID NO:58的核酸的至少20个连续核苷酸的分离的核酸编码的至少一个多肽进行比较;和
b)鉴定与上述多肽具有至少大约80%序列同一性并且是植物中的产量基因或产量标志物的至少一个多肽序列。
32.就EG81345核酸序列进行植物的标志物辅助的培育的方法,其包括以下步骤:
a)对于至少一种植物,将所述植物的核苷酸序列的至少一部分与选自下列的EG81345核酸序列进行比较:
i)包含选自SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ IDNO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:59和SEQ IDNO:60的核酸的至少20个连续核苷酸的分离的核酸;
ii)i)中的核酸的互补物;
b)鉴定该植物是否包含所述核酸序列或与i)中的核酸具有至少大约80%序列同一性并且是植物中的产量基因或产量标志物的核酸;和
c)培育包含所述核酸序列的植物以产生后代。
33.权利要求32的方法,其中所述植物核酸序列是基因组DNA。
34.权利要求32的方法,其中所述植物核酸序列是cDNA。
35.权利要求32的方法,其中所述EG81345核酸序列调节植物的产量。
36.权利要求32的方法,其中调节的产量是相对于来自相同的属的第二植物而言,所述第二植物具有相对于来自所述植物的EG81345核酸序列具有至少一个核苷酸变化的第二EG81345核酸序列。
37.权利要求36的方法,其中所述至少一个核苷酸变化是进化上显著的核苷酸变化。
38.权利要求36的方法,其中所述植物选自玉米(Zea mays mays)、栽培稻(Oryza sativa)、小麦(Triticum aestivum)、大麦(Hordeumvulgare)、甘蔗(Saccharum officinarum)、高粱(Sorghum bicolor)、柳枝稷(Pannicum virgatum)、黑麦(Secale cereale)和拟南芥(Arabidopsis thaliana)。
39.权利要求36的方法,其中所述第二植物选自栽培植物的野生祖先植物,所述栽培植物选自玉米(Zea mays mays)、栽培稻(Oryza sativa)、小麦(Triticum aestivum)、大麦(Hordeum vulgare)、甘蔗(Saccharumofficinarum)、高粱(Sorghum bicolor)、柳枝稷(Pannicum virgatum)、黑麦(Secale cereale)和拟南芥(Arabidopsis thaliana)。
40.就EG81345多肽序列进行植物的标志物辅助的培育的方法,其包括以下步骤:
a)对于至少一种植物,将所述植物的多肽序列的至少一部分与包含由下列编码的多肽的EG81345多肽序列进行比较:
i)包含选自SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ IDNO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQID NO:39,SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42,SEQ ID NO:43,SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46,SEQ ID NO:47,SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:54,SEQ ID NO:55,SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:59和SEQ IDNO:60的核酸的至少20个连续核苷酸的分离的核酸;和
b)鉴定该植物是否包含特定多肽序列或与上述多肽具有至少大约80%序列同一性并且是植物中的产量基因或产量标志物的多肽;和
c)培育包含所述多肽序列的植物以产生后代。
41.就EG82013核酸序列进行植物的标志物辅助的培育的方法,其包括以下步骤:
a)对于至少一种植物,将所述植物的核苷酸序列的至少一部分与选自下列的特定EG82013核酸序列进行比较:
i)包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30和SEQ ID NO:58的核酸的至少20个连续核苷酸的分离的核酸;
ii)i)中的核酸的互补物;和
b)鉴定该植物是否包含特定的核酸序列或与i)或ii)中的核酸具有至少大约80%序列同一性并且是植物中的产量基因或产量标志物的核酸;和
c)培育包含所述核酸序列的植物以产生后代。
42.权利要求41的方法,其中所述植物核酸序列是基因组DNA。
43.权利要求41的方法,其中所述植物核酸序列是cDNA。
44.权利要求41的方法,其中所述EG82013核酸序列调节植物的产量。
45.权利要求44的方法,其中调节的产量是相对于来自相同的属的第二植物而言,所述第二植物具有相对于来自所述植物的EG82013核酸序列具有至少一个核苷酸变化的第二EG82013核酸序列。
46.权利要求45的方法,其中所述至少一个核苷酸变化是进化上显著的核苷酸变化。
47.权利要求45的方法,其中所述植物选自玉米(Zea mays mays)、栽培稻(Oryza sativa)、小麦(Triticum aestivum)、大麦(Hordeumvulgare)、甘蔗(Saccharum officinarum)、高粱(Sorghum bicolor)、细弱翦股颖(Agrostis capillaries)、欧洲山杨(Populus tremula)、棉花(Gossypium hirsutum)、马铃薯(Solanum tuberosum)和拟南芥(Arabidopsis thaliana)。
48.权利要求45的方法,其中所述第二植物选自栽培植物的祖先野生植物,所述栽培植物选自玉米(Zea mays mays)、栽培稻(Oryza sativa)、小麦(Triticum aestivum)、大麦(Hordeum vulgare)、甘蔗(Saccharumofficinarum)、高粱(Sorghum bicolor)、细弱翦股颖(Agrostiscapillaries)、欧洲山杨(Populus tremula)、棉花(Gossypiumhirsutum)、马铃薯(Solanum tuberosum)和拟南芥(Arabidopsisthaliana)。
49.就EG82013序列进行植物的标志物辅助的培育的方法,其包括以下步骤:
a)对于至少一种植物,将所述植物的多肽序列的至少一部分与包含由下列编码的多肽的EG82013多肽序列进行比较:
i)包含选自SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:29,SEQ ID NO:30和SEQ ID NO:58的核酸的至少20个连续核苷酸的分离的核酸;和
b)鉴定该植物是否包含特定多肽序列或与上述多肽具有至少大约80%序列同一性并且是植物中的产量基因或产量标志物的多肽;和
c)培育包含所述多肽序列的植物以产生后代。
50.鉴定植物中的编码EG81345的基因的一个或多个等位基因的方法,其包括:测定来自植物的核酸样品中是否存在植物EG81345基因中的一个或多个单核苷酸多态性,其中所述单核苷酸多态性选自:SEQ IDNO:51,位置521,C或T;SEQ ID NO:51,位置600,C或T;SEQ ID NO:51,位置644,A或G;SEQ ID NO:51,位置649,G或A;SEQ ID NO:51,位置665,A或G;SEQ ID NO:51,位置807,C或T;SEQ ID NO:51,位置825,T或G;SEQ ID NO:51,位置873,T或C;SEQ ID NO:51,位置924,T或C;和SEQ ID NO:51,位置984,T或C。
51.鉴定植物中的编码EG82013的基因的一个或多个等位基因的方法,该方法包括:测定来自植物的核酸样品中是否存在植物EG82013基因中的一个或多个单核苷酸多态性,其中所述单核苷酸多态性选自:SEQ IDNO:2,位置72,C或T;SEQ ID NO:2,位置78,C或T;SEQ ID NO:2,位置132,A或G;SEQ ID NO:2,位置183,C或T;SEQ ID NO:2,位置279,A或G;SEQ ID NO:2,位置306,C或T;SEQ ID NO:2,位置340,T或C;SEQ ID NO:2,位置348,G或A;SEQ ID NO:2,位置414,A或G;SEQ ID NO:2,位置546,A或G;SEQ ID NO:2,位置555,T或C;SEQ ID NO:2,位置690,T至G;SEQ ID NO:2,位置851,A或G;SEQ ID NO:2,位置901,A或G;SEQ ID NO:2,位置924,G至A;SEQID NO:2,位置953,C或G;SEQ ID NO:2,位置1000,G或A;SEQ IDNO:2,位置1012,A或T;SEQ ID NO:2,位置1016,T或A;SEQ ID NO:2,位置1153,A或T;SEQ ID NO:2,位置1174,G或A;SEQ ID NO:2,位置1185,T或A;和SEQ ID NO:2,位置1248,T或A。
CN2009801342982A 2008-07-29 2009-07-29 Eg82013和eg81345核酸及其用途 Pending CN102144032A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US8445708P 2008-07-29 2008-07-29
US61/084,457 2008-07-29
PCT/US2009/052143 WO2010014740A2 (en) 2008-07-29 2009-07-29 Eg82013 and eg81345 nucleic acids and uses thereof

Publications (1)

Publication Number Publication Date
CN102144032A true CN102144032A (zh) 2011-08-03

Family

ID=41610947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801342982A Pending CN102144032A (zh) 2008-07-29 2009-07-29 Eg82013和eg81345核酸及其用途

Country Status (6)

Country Link
US (1) US20110173723A1 (zh)
CN (1) CN102144032A (zh)
AU (1) AU2009276573A1 (zh)
BR (1) BRPI0917213A2 (zh)
CA (1) CA2732524A1 (zh)
WO (1) WO2010014740A2 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1566444A3 (en) * 1999-11-17 2005-08-31 Mendel Biotechnology, Inc. Yield-related genes
AU2006230352A1 (en) * 2005-03-29 2006-10-05 Evolutionary Genomics Llc EG1117 and EG307 polynucleotides and uses thereof

Also Published As

Publication number Publication date
AU2009276573A1 (en) 2010-02-04
WO2010014740A2 (en) 2010-02-04
CA2732524A1 (en) 2010-02-04
BRPI0917213A2 (pt) 2017-05-23
WO2010014740A3 (en) 2010-05-06
US20110173723A1 (en) 2011-07-14

Similar Documents

Publication Publication Date Title
US10577623B2 (en) Quantitative trait loci (QTL) associated with shatter resistant capsules in sesame and uses thereof
US11445692B2 (en) Quantitative trait loci (QTL) associated with shatter resistant capsules in sesame and uses thereof
AU2013290124A1 (en) Molecular markers for various traits in wheat and methods of use
JP2017501731A (ja) エリート系統を作出するための最適な半数体価に基づく選択
US20220010325A1 (en) Quantitative trait loci (qtl) associated with shattering-resistant capsules in sesame and uses thereof
US20220025471A1 (en) Markers linked to reniform nematode resistance
CN112375130A (zh) 玉米穗长基因和分子标记及其应用
US20110083229A1 (en) EG1117 And EG307 Polynucleotides And Uses Thereof
BR112021012597A2 (pt) Métodos e composições para selecionar e/ou prever plantas de algodão resistentes à resistência ao fusarium race-4 em algodão
US20170166916A1 (en) Genetic Markers Associated with Drought Tolerance in Maize
CN102144032A (zh) Eg82013和eg81345核酸及其用途
AU2014386227B2 (en) Markers linked to reniform nematode resistance
CA3228149A1 (en) Methods of identifying, selecting, and producing anthracnose stalk rot resistant crops
US20150167105A1 (en) Genetic loci associated with gray leaf spot in maize
US20080047032A1 (en) Eg307 nucleic acids and uses thereof
CN116179734A (zh) 鉴别或辅助鉴别番茄颈腐根腐病抗性的分子标记及其应用
CN101501192A (zh) Eg8798和eg9703多核苷酸和其用途
CN101495629A (zh) Eg1117和eg307多核苷酸及其用途
WO2007028121A9 (en) Eg8798 and eg9703 polynucleotides and uses thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110803