CN111566121A - 小麦7a染色体上决定每穗小穗数QTL的基因 - Google Patents

小麦7a染色体上决定每穗小穗数QTL的基因 Download PDF

Info

Publication number
CN111566121A
CN111566121A CN201980008053.9A CN201980008053A CN111566121A CN 111566121 A CN111566121 A CN 111566121A CN 201980008053 A CN201980008053 A CN 201980008053A CN 111566121 A CN111566121 A CN 111566121A
Authority
CN
China
Prior art keywords
wheat
seq
sequence
protein
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980008053.9A
Other languages
English (en)
Inventor
M·达韦
C·R·卡瓦纳
R·阿里亚达萨
W·博维尔
J·巴雷罗桑切斯
K·韦比拉
A·斯普里格斯
M·汉娜
王曦
L·维特恩
K·加德纳
A·A·韦伯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Commonwealth Scientific and Industrial Research Organization CSIRO
BASF SE
Original Assignee
Commonwealth Scientific and Industrial Research Organization CSIRO
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Commonwealth Scientific and Industrial Research Organization CSIRO, BASF SE filed Critical Commonwealth Scientific and Industrial Research Organization CSIRO
Publication of CN111566121A publication Critical patent/CN111566121A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/46Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
    • A01H6/4678Triticum sp. [wheat]
    • AHUMAN NECESSITIES
    • A21BAKING; EDIBLE DOUGHS
    • A21DTREATMENT, e.g. PRESERVATION, OF FLOUR OR DOUGH, e.g. BY ADDITION OF MATERIALS; BAKING; BAKERY PRODUCTS; PRESERVATION THEREOF
    • A21D13/00Finished or partly finished bakery products
    • A21D13/02Products made from whole meal; Products containing bran or rough-ground grain
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L7/00Cereal-derived products; Malt products; Preparation or treatment thereof
    • A23L7/10Cereal-derived products
    • A23L7/117Flakes or other shapes of ready-to-eat type; Semi-finished or partly-finished products therefor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • C12N15/827Flower development or morphology, e.g. flowering promoting factor [FPF]
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Botany (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physiology (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Nutrition Science (AREA)
  • Polymers & Plastics (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明涉及农业领域。特别地,本发明提供了蛋白质、核酸、重组基因、包含重组基因的植物、以及改变小麦植物每穗小穗数的方法。

Description

小麦7a染色体上决定每穗小穗数QTL的基因
发明领域
本发明涉及通过分子生物学方法、标记技术和基因技术优化植物的领域。本发明提供了如核酸分子、载体和方法等技术手段,以及使用它们来生产和鉴别具有改变的“每穗总小穗数”(在本文中称为“SPS”)表型的非转基因和转基因小麦植物。
发明背景
小麦的籽粒产量主要由三个产量成分决定,包括单位面积的有效穗、每穗粒数和粒重。导致小麦产量提高的主要因素之一是每穗籽粒数增加或每穗籽粒数和单位面积穗数均增加。总籽粒数可进一步受如每株有效分蘖数、每穗小穗数、每个小穗可育小花数等性状的影响。从理论上讲,任何产量成分或性状的增加都可以增加小麦的产量潜力。然而,由于它们可能在穗生长阶段竞争同化物,因此可能会出现补偿效应,其中一个性状或成分的增加并不一定导致籽粒总产量增加。
决定小麦花序结构的遗传因素在很大程度上仍然未知。迄今只有光周期敏感基因Ppd-1被证明影响小穗数[Shaw,L.M.,等人,PLoS One,2013.8(11):p.e79459]。这意味着尚未被开发的遗传潜力的巨大来源,有助于到2050年实现70%的作物产量增长,以养活不断增长的世界人口[联合国,F.a.A.O.o.t.U.在2050年如何养活世界.罗马:高级别专家论坛.2009年]。小麦的花序(通常称为穗(spike,ear或head))由附着在穗轴节上的小穗组成。每个小穗由两个颖片和一些小花组成,其中通常有二至四个小花在受精后形成籽粒。小穗的最终数量取决于末端小穗的形成。这在最后一个起始原基而非正在形成的小穗原基发育成颖片和小花原基时发生[Kirby,E.J.M.和M.Appleyard,F.G.H.Lupton编辑.1987,SpringerNetherlands:Dordrecht.第287-311页]。
在过去几年中,小麦中永久性作图群体的发展,同时基于大量分子标记构建的全基因组标记图谱,为鉴定、分析和利用农艺特性(包括每穗小穗数)QTL开辟了可能性。
Tian等人(2015年小麦遗传分析和分子标记辅助育种,第1卷,科学出版社,北京)总结了与穗形态、特别是小穗数量相关QTL(第167页,表1.37)的信息。在染色体2D、2DS、3AS、3B、3DL、4AL、4DS、5A、5B、5D、7A、7AL和7D上鉴定到了QTL。
Jantasuriyara等人(2004,Theor.Appl Genet.108:261-273)报告了使用International Triticeae Mapping Initiative绘图群体的重组自交系定位的一些QTL,其中7A染色体上的两个QTL与小穗数量相关。一个QTL由标记Xfba69-XksuH9界定(182.7-213.4厘摩,峰值标记196.3厘摩,最近位点Xmwg938)或由标记Xfba350-Xfbb1界定(188.53-201.3厘摩,峰值标记196.3厘摩,最近位点Xmwg938),其在两年两点是显著的,而另一个QTL仅在一年一点是显著的(标记为Xfbg354-Xfba350,160.1-174.9厘摩,峰值标记164.9厘摩,最近位点Xfba69)。在所有情况下,小穗数量的增加均由Opata85的等位基因引起。
Ma等人(2007,Mol.Gen.Genomics 277:31-42)报告了由Nanda2419与Wangshuibai间杂交种单粒传发展的重组自交系(“RILs”)群体中或由这些RILs完全随机化群内交配产生的永久F2群体中,7A染色体上两个每穗小穗数QTL。在RILs群体中,QTL区间由标记Xbarc154-Xwmc83e界定,而在IF2群体中,QTL由标记Xwmc83-Xwmc17界定。Wangshuibai等位基因对增加的每穗小穗数起贡献。
Xu等人(2014,Theor.Appl.Genet.127:59-72)报告了在Xiaoyan 54与Jing 411间杂交种发展的RILs群体中,通过标记Xgwm276-Xbarc192-Xbarc253鉴定的7A染色体上SPSQTL。亲本Jing 411贡献有利等位基因。
Zhai等人(2016Frontiers in Plant Science,Volume 7,article 1617)提及了Xu等人2014年鉴定的7A染色体区域,并指明该区域位于123.50-137.50厘摩区间。
Saarah Noriko Kuzay等人(P0848,第二十五届国际动植物基因组学大会,2017年1月14-18日,San Diego)在海报摘要中提到,使用全基因组关联分析,在7AL染色体的长臂上鉴定到了SPS QTL。在双亲群体BerkutxRC875中验证该QTL使得其精确遗传定位到7AL染色体上的2Mb区域内。与QTL峰值区域携带RAC875等位基因的品系相比,携带SPS的Berkut等位基因的品系每穗小穗数平均多2.4个。他们还报告了从两个杂合自交家系发展出大量高密度群体,来精确定位该QTL并最终克隆了该QTL下面的基因。
Zhang等人(2015,Scientific Reports DOI 10:1038/srep12211)报告了小麦中推定的MOC1直系同源基因(MOC1代表水稻中的MONCULM1)可能参与小麦小穗的发育。在Hanxuan 10与Lumai 14间杂交种发展的双单倍体群体中,TaMoc1-A被定位到7A染色体上WMC488(4.7厘摩)和P2071-180(11.6厘摩)之间的区域。在3年2个地点10个环境中,TaMoc1-7A单倍型HapH与每穗小穗数的略为增加相关。然而,该TaMOC1同源基因不是构成本文描述的7A染色体上SPS QTL的基因。当将TaMOC1-7A与中国春(在本文缩写为“CS”)小麦的NRgene-HiC参考基因组进行比对时,TaMOC1-7A定位在7A染色体上557,480,502bp处,其与本文描述和分析的SPS 7A QTL相距超过100Mb,因此显然是不同的。如下文所示,MAGIC定位群体中鉴别该QTL区间的左侧和右侧标记分别定位在671,146,796和674,103,435处,而GWAS分析中鉴别该QTL区间的标记定位在小麦7A染色体上674,203,435和674,203,741位置处(位置是指在NRgene-HiC中国春参考基因组序列上)。
因此,仍然需要对位于小麦7号(特别是7A)染色体上的SPS QTL进行进一步的遗传解析,来鉴定其中的基因,以便利于优化每穗小穗数,从而实现小麦的最大产量潜力。
发明概要
在一个方面,本发明提供了参与决定小麦每穗小穗数的蛋白质,其与水稻“Aberrant panicle organization 1”(Apo1)蛋白直系同源。该蛋白包含选自以下的氨基酸序列:a)SEQ ID NO:3、15或17的氨基酸序列或其功能变体,和b)与SEQ ID NO:3、15或17的氨基酸序列具有至少85%的序列一致性的氨基酸序列或其功能变体。
本发明的另一个目的是提供编码根据本发明蛋白质的分离核酸,所述核酸可包含选自以下的核苷酸序列:a)SEQ ID NO:1或SEQ ID NO:2的核酸序列,b)与SEQ ID NO:1或SEQ ID NO:2的核酸序列具有至少80%的一致性的核酸序列,c)具有与a)或b)的核酸互补序列的核酸。根据本发明的核酸可位于小麦7A染色体上的一个区间内,该区间包含NRgene-HiC中国春参考基因组序列中674,081,462位的核苷酸和NRgene-HiC中国春参考基因组序列中674,082,918位的核苷酸之间的核苷酸序列,两侧有SEQ ID NO:10和SEQ ID NO:11的标记,或两侧有SEQ ID NO:12和SEQ ID NO:13或SEQ ID NO:14的标记,或两侧有SEQ IDNO:23和SEQ ID NO:24的标记;或可位于侧翼为SEQ ID NO:26和27的标记的小麦7B染色体上的区间内。在一个实施方案中,编码根据本发明蛋白质的分离核酸可包含选自以下的核苷酸序列:a)SEQ ID NO:1、2、6、7、15、16、20、21、28或30的核酸序列,b)与SEQ ID NO:1、2、6、7、15、16、20、21、28或30的核酸序列具有至少80%的一致性的核酸序列,c)具有与a)或b)的核酸互补序列的核酸。在一个实施方案中,编码根据本发明蛋白质的分离核酸可包含选自以下的核苷酸序列:a)SEQ ID NO:1、2、6、7或28的核酸序列,b)与SEQ ID NO:1、2、6、7或28的核酸序列具有至少80%的一致性的核酸序列,c)具有与a)或b)的核酸互补序列的核酸。在一个实施方案中,任何此类核酸序列都是分离的或人工的核酸。
本发明还提供了重组的基因,该基因包含植物可表达启动子可操作地连接编码根据本发明蛋白质的核酸序列、以及可选地转录终止子和多聚腺苷酸化序列,优选在植物中起作用的转录终止子和多聚腺苷酸化区域。在另一个实施方案中,植物可表达启动子可选自组成型启动子、诱导型启动子或组织特异性启动子。植物可表达启动子可以是CaMV35S启动子,泛素启动子或来自具有相对较高每穗小穗数的小麦品种的根据本发明的APO1基因的天然启动子。
在另一方面,本发明提供了小麦植物、植物部分或种子,它们由小麦植物细胞组成,所述细胞包含本文所述的重组基因。
在可替代的实施方案中,提供了生产具有改变的每穗小穗数小麦植物的方法或改变小麦植物每穗小穗数的方法,这两种方法都包括改变小麦植物中根据本发明的蛋白质之丰度的步骤。在一个实施方案中,与其中蛋白质丰度没有改变的小麦植物的每穗小穗数相比,特别是其中小麦植物具有初始(相对)较低的每穗小穗数时,蛋白质的丰度增加且每穗小穗数增加。本发明的蛋白质的丰度可以通过向所述小麦植物提供a)根据本发明的重组基因或b)编码根据本发明的蛋白质的异源基因来增加,其中异源基因的表达量高于相应的内源基因。异源基因可包含SEQ ID NO:4、5、9、19或SEQ ID NO:22的核苷酸序列或与这些序列之任一具有至少90%的序列一致性的核苷酸序列。在一个实施方案中,异源基因可包含SEQID NO:4、5、9、19的核苷酸序列或与这些序列之任一具有至少90%的序列一致性的核苷酸序列,其中所述序列的特征是在ATG起始密码子(对应于参考序列SEQ ID NO:1中的起始密码子)上游约500个核苷酸的位置处具有约115个核苷酸(如100至130个核苷酸,或115个核苷酸)的缺失。
在另一个实施方案中,与其中蛋白质丰度没有改变的小麦植物的每穗小穗数相比,特别是其中小麦植物具有初始(相对)较高的每穗小穗数时,蛋白质的丰度降低且每穗小穗数降低。本发明的蛋白质的丰度可以通过向所述小麦植物提供如下基因来降低:a)编码根据本发明的蛋白质的异源基因,其中所述异源基因的启动子的活性低于内源基因的启动子,或b)编码根据本发明的蛋白质的内源基因之突变等位基因。异源基因可包含SEQ IDNO:9的核苷酸序列或与其具有至少90%的序列一致性的核苷酸序列,并且优选不包含SEQID NO:5第4399位至4513位的核苷酸序列或与其具有至少90%的序列一致性的核苷酸序列。异源基因还可包含SEQ ID NO:19的核苷酸序列或与其具有至少90%的序列一致性的核苷酸序列,优选地缺失SEQ ID NO:19第7816位至7930位的核苷酸序列或与其具有至少90%的序列一致性的核苷酸序列。突变等位基因可以是敲除等位基因。突变等位基因也可以是,优选具有较低活性的,替换突变等位基因、或缺失或插入突变等位基因。
在另一个实施方案中,在上述方法中,提供的步骤包括通过转化、杂交、回交、渗入(introgress)、基因组编辑或诱变提供。
进一步的实施方案公开了鉴别和/或选择小麦植物的方法,该小麦植物含有对每穗小穗数分别起正或负贡献的基因的等位基因,所述方法包括鉴别小麦植物基因组中是否存在这样的核酸的步骤,所述核酸具有SEQ ID NO:5的第4399位至4513位的核苷酸或与其具有至少90%的序列一致性的核苷酸序列,或所述核酸具有SEQ ID NO:19的第7816位至7930位的核苷酸序列或与其具有至少90%的序列一致性的核苷酸序列。
附图简述
图1:不同春小麦品种(MAGIC建立者)以及含和不含对SPS起贡献的等位基因的对比HIF中的APO1 RNA表达水平。TS:末端小穗,DR:二棱期。Baxter、Chara、Westonia和Yitpi为四交MAGIC群体的亲本。Fam1_A_1、Fam1_B_1、Fam2_B_1、Fam2_C_1、Fam2_H_1、Fam3_E_1、Fam3_I_1、Fam4_A、Fam4_G、Fam5_C_1和Fam5_F_1为所分析的11个HIF。具有较高每穗小穗数的品系以星号标记。
图2:A.分析了每穗总小穗数(SPS)表型的2014年冬小麦群体的所有品系的平均表型分布,显示了这些建立者小麦品种的SPS。B.SPS表型和相关遗传力变化的总结。
图3:QTsn.jbl-7的精细作图。a)Mpwgaim QTL模型,b)MAGIC遗传图谱比对,c)IWGSCv1物理图谱,含注释的MEGAP基因模式,d)Robigus和Claire/中国春之间APO1直系同源基因的序列多态性。
图4:QTsn.jbl-7A QTL与QTsn.jbl-7B QTL和水稻qPBN6 QTL的同线关系。
图5:a)TaAPO1-7A转录本相对于看家基因TaRP15[Shaw,L.M.,A.S.Turner和D.A.Laurie,Plant J,2012.71(1):p.71-84]Ta2291[Paolacci,A.R.,等人,BMC MolecularBiology,2009.10(1):p.11]的表达,相对于Brompton中TaAPO1-7A的表达归一化。b)对2014年田间试验中MAGIC建立者品系,BLUP上TaAPO1-7A表达相对于总小穗数的回归。除了Soissons由于Ppd-D1等位基因导致加速开花而在GS34阶段取样外,所有其它品种均在GS32阶段取样。因此,Soissons中TaAPO1-7A表达低的原因可能与Robigus和Brompton中观察到的与序列变异相关的原因不同。
发明详述
本发明基于以下发现:水稻Apo1的小麦直系同源物参与决定小麦品种(包括春小麦和冬小麦品种)中每穗小穗数。
在一个方面,本发明提供了参与决定小麦每穗小穗数的蛋白质,其与水稻“Aberrant panicle organization 1”(Apo1)蛋白直系同源。该蛋白包含选自以下的氨基酸序列:a)SEQ ID NO:3、15或17的氨基酸序列或其功能变体,和b)与SEQ ID NO:3、15或17的氨基酸序列具有至少85%的序列一致性的氨基酸序列或其功能变体。
每穗小穗数受遗传和环境两者控制。在给定环境中,不同小麦品种的每穗平均小穗数不同。取决于所观测的小麦品系,主茎上每穗小穗数的观测值在约17至约40之间变化。春小麦品种一般具有较少的每穗小穗数(18-24),而冬小麦品种通常具有较多的每穗小穗数。如果小麦品系含有SPS QTL的正贡献等位基因,与没有正贡献等位基因的类似品系相比,其小穗数至少增加1个,有时增加2或3个,不管其它遗传组成或环境如何。
术语“蛋白质”和术语“多肽”在本文中可互换使用,指由多于30个氨基酸组成的分子,而术语“肽”指由最多30个氨基酸组成的分子。蛋白质和肽可进一步形成二聚体、三聚体和更高级别的寡聚体(即由一个以上的肽或多肽分子组成)。形成这种二聚体、三聚体等的蛋白质或肽分子可以是相同或不同的。因此,相应的高阶结构称为同源或异源二聚体,同源或异源三聚体等。术语“蛋白质”和“肽”也指天然修饰的蛋白质或肽,其中修饰通过例如糖基化、乙酰化、磷酸化等发生。这类修饰在本领域众所周知。
Ikeda等人2005年(Developmental Biology,282:349-360)鉴定出ABERRANTPANICLE ORGANIZATION 1(APO1)基因是水稻花的关键调节因子。APO1的功能丧失使得花序分生组织过早转变为小穗分生组织,从而导致小穗数减少(Ikeda等人2005,Ikeda等人2007,Plant Journal 51,1030-1040)。APO1的功能获得性突变使得花序分生组织向小穗分生组织的转变推迟,从而导致小穗数增加(Ikeda等人2007,Ikeda Kawakatsu等人2009,Plant physiol.150:736-747)。APO1还被Terao等人2010(Theor Appl Genet,120:875-893)鉴定为负责如下数量性状座位的基因,所述QTL正向控制一次枝梗数、每穗籽粒数和每株水稻植物的籽粒产量。
本文中使用的“与APO1直系同源的基因”是这样的基因,其存在于不同的物种中,但通过物种形成从共同的祖先基因进化而来,并保留了相同的功能。APO1编码一种F盒蛋白,已知的直系同源基因包括来自拟南芥名为UNUSUAL FLORAL ORGANS(UFO)的基因,以及来自矮牵牛名为DOUBLE TOP(DOT)的基因,这两个基因也已被证明可以控制向开花过渡的时间以及花序的结构。
SEQ ID NO:3表示中国春小麦品种APO1基因编码的氨基酸序列。Baxter和Westonia品种产生具有与SEQ ID NO:3一致的氨基酸序列的APO1蛋白。SEQ ID NO:8表示小麦品种Chara的APO1基因的氨基酸序列。Yitpi品种产生具有与SEQ ID NO:8一致的氨基酸序列的APO1蛋白。具有SEQ ID NO:8的氨基酸序列的APO1蛋白是具有SEQ ID NO:3的氨基酸序列的APO1蛋白的功能变体。Claire品种产生具有与SEQ ID NO:3一致的氨基酸序列的APO1蛋白。Robigus、Cadenza和Paragon品种产生具有SEQ ID NO:3的氨基酸序列的APO1蛋白,其中第47位的苯丙氨酸被半胱氨酸取代,第384位的天冬氨酸被天冬酰胺取代。具有SEQID NO:3的氨基酸序列但其中第47位的苯丙氨酸被半胱氨酸取代、第384位的天冬氨酸被天冬酰胺取代的APO1蛋白,是具有SEQ ID NO:3的氨基酸序列的APO1蛋白的功能变体。SEQ IDNO:29表示中国春小麦品种7A染色体上APO1基因根据可选基因模式的氨基酸序列,其缺乏SEQ ID NO:3的27个N端氨基酸。SEQ ID NO:17表示中国春和Claire小麦品种7B染色体上APO1基因的氨基酸序列。在Robigus中,该蛋白的特征是具有H47R和A173S替换。SEQ ID NO:31表示中国春小麦品种7B染色体上APO1基因根据可选基因模式的氨基酸序列,其缺乏SEQID NO:17的71个N端氨基酸。SEQ ID NO:3与SEQ ID NO:17具有89%的序列一致性。SEQ IDNO:29与31具有98%的序列一致性。
适合本发明的是这样的APO1蛋白,其包含与本文描述的蛋白质具有至少85%、或至少90%、或至少95%、或至少98%、或至少99%的序列一致性或完全相同的氨基酸序列,也称为变体。关于本发明氨基酸序列SEQ ID NO:3或SEQ ID NO:8,术语“变体”意为基本相似的序列。在一个实施方案中,本发明蛋白质的变体是如定义的人工蛋白,或是变体蛋白,不包括任何自然产生的蛋白质。
如本文所用,术语“百分比序列一致性”是指,在最佳比对的氨基酸序列的窗口中两个区段之间相同氨基酸的百分比,或在最佳比对的核苷酸序列的窗口中两个区段之间相同核苷酸的百分比。用于比对比较窗口的序列最佳比对为本领域技术人员所熟知,可以通过例如如下工具进行:例如,Smith和Waterman的局部同源算法(Waterman,M.S.,Chapman&Hall.伦敦,1995)、Needleman和Wunsch(1970)的同源比对算法、Pearson和Lipman(1988)的搜寻相似性,以及优选地,这些算法的计算机执行形式,如GAP、BESTFIT、FASTA和TFASTA,可以作为Wisconsin Package(加利福尼亚州圣地亚哥Accelrys公司的注册商标)的GCG(注册商标)的部分获得。测试序列与参考序列的比对区段的“一致性分数”是两个比对序列共有的相同组分的数目除以参考序列区段(即整个参考序列或参考序列的较小的限定部分)中组分的总数。百分比序列一致性表示为一致性分数乘以100。可以将一个或多个氨基酸或DNA序列与全长氨基酸或DNA序列或其一部分进行比较,或与更长的氨基酸或DNA序列进行比较。基于较短的核苷酸或氨基酸序列计算序列一致性。
此外,很明显,小麦APO1蛋白的变体(其中一个或多个氨基酸残基已被缺失,替换或插入)也可用于根据本发明的方法中来达到相同的效果,条件是F盒结构域(SEQ ID NO:3从第33位氨基酸至第77位氨基酸,如Pfam数据库中所定义的)不受氨基酸的缺失、替换或插入的影响。
替换的例子是保守性替换,即一种氨基酸被具有类似物理化学特性的另一种氨基酸替换。这些替换已知不会影响蛋白质的结构。这种替换是通过将一种氨基酸替换为属于以下同一组的另一种氨基酸来实现的:
第1组:半胱氨酸(C);
第2组:苯丙氨酸(F)、色氨酸(W)和酪氨酸(Y);
第3组:组氨酸(H)、赖氨酸(K)和精氨酸(R);
第4组:天冬氨酸(D)、谷氨酸(E)、天冬酰胺(N)和谷氨酰胺(Q);
第5组:异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)和缬氨酸(V);
第6组:丙氨酸(A)、甘氨酸(G)、脯氨酸(P)、丝氨酸(S)和苏氨酸(T)。
本发明的另一个目的是提供核酸,包括分离的或人工核酸,其编码根据本发明的蛋白质,可以包含选自以下的核苷酸序列:a)SEQ ID NO:1、2、6、7或28之任一的核酸序列,b)与SEQ ID NO:1、2、6、7或28的核酸序列具有至少80%的一致性的核酸序列,c)具有与a)或b)的核酸互补序列的核酸。根据本发明的核酸可位于小麦7A染色体上的一个区间内,该区间包含中国春小麦参考基因组(NRgene-HiC)中第674,081,462位的核苷酸和第674,082,918位的核苷酸之间的核苷酸序列,且两侧有SEQ ID NO:10和SEQ ID NO:11的标记,或两侧有SEQ ID NO:12和SEQ ID NO:13或SEQ ID NO:14的标记,或两侧有SEQ ID NO:23和SEQ IDNO:24的标记;或可位于侧翼为SEQ ID NO:26和27的标记的小麦7B染色体上的区间内。
如本文中使用,“分离的核酸”与“分离的DNA”可互换使用,是指不存在于其天然基因组环境中的核酸,与其长度和序列无关。例如,分离的DNA可以指与基因组环境物理分离的DNA,如基因组DNA的片段。分离的DNA也可以是人工产生的DNA,如化学合成的DNA,或者通过扩增反应如本领域众所周知的聚合酶链反应(PCR)产生的DNA。分离的DNA可以还指存在于非天然存在的DNA环境中的DNA。例如,分离的DNA可以指存在于质粒中的一段DNA。此外,分离的DNA可以指存在于另一个染色体环境而非其天然存在环境中的DNA片段,例如在基因组中的另一个位置而非其天然位置,在另一个物种而非其天然存在的物种的基因组中,或在人工染色体中。本文使用的“人工DNA”或“人工核酸”是在序列或其他方面不同于天然DNA或核酸的DNA或核酸,例如,其具有天然不存在的一个或多个内部核苷酸缺失(不包括在任一端的缺失),或天然不存在的核苷酸替换或插入,具有和天然存在的序列不同的核苷酸序列,与DNA或核酸天然不相连接的标签或分子连接(例如与异源或人工启动子或3’非翻译区连接)等。同样,本发明的“人工蛋白质”是在序列或其他方面不同于天然蛋白质的蛋白质,例如,其具有天然不存在的一个或多个氨基酸缺失(在一个实施方案中是内部氨基酸缺失(不包括在蛋白质任一端的缺失))、或在天然蛋白质中不存在的氨基酸替换或插入,具有和天然存在的序列不同的氨基酸序列,与蛋白质天然不相连接的标签或分子连接,等。与天然存在的形式相比,人工DNA或核酸的序列已经被人为地改变,例如通过(化学或其他方式)诱变、重组、使用序列特异性核酸酶进行的靶向性基因组或碱基编辑,等等。
适合本发明的是编码小麦APO1蛋白的核酸,所述核酸包含与本文所述的基因具有至少40%、至少50%、或至少60%、或至少70%、或至少80%、或至少85%、或至少90%、或至少95%、或至少98%的序列一致性的核苷酸序列,其也称为变体。关于本发明的核苷酸序列SEQ ID NOs:1、2、6、7或28之任一,术语“变体”意指编码与SEQ ID NOs:3、8或29的氨基酸序列之任一基本上相似的氨基酸序列的基本上相似的核苷酸序列。关于本发明的核苷酸序列SEQ ID NOs:15、20、21或30之任一,术语“变体”意指编码与SEQ ID NOs:17或31的氨基酸序列之任一基本相似的氨基酸序列的基本相似的核苷酸序列。关于本发明的核苷酸序列SEQID NOs:16,术语“变体”意指编码与SEQ ID NOs:18的氨基酸序列基本相似的氨基酸序列的基本相似的核苷酸序列。可以使用众所周知的分子生物学技术鉴别天然存在的等位基因变体,所述技术例如本文描述的聚合酶链式反应(PCR)和杂交技术。变体核苷酸序列还可以包括合成衍生的核苷酸序列,例如通过对SEQ ID NO:1、2、6、7、15、16、20、21、28或30之任一进行定点诱变产生的核苷酸序列。一般来说,本发明的核苷酸序列变体与SEQ ID NO:1、2、6、7、15、16、20、21、28或30之任一具有至少40%、50%、60%至70%,例如优选71%、72%、73%、74%、75%、76%、77%、78%至79%,一般至少80%,例如81%至84%,至少85%,例如86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%的核苷酸序列一致性。本文公开的DNA分子的衍生物包括但不限于序列缺失、单点或多点突变、在特定限制性酶切位点的改变、添加功能元素、或其他分子修饰。获得这些衍生物的技术在本领域众所周知(见例如,见J.F.Sambrook,D.W.Russell,and N.Irwin(2000)分子克隆:实验室手册,第3版第1、2和3卷,冷泉港实验室出版社)。本领域技术人员熟悉描述大分子(例如DNA分子、质粒等)的构建、操纵和分离以及重组生物体的产生和DNA分子的筛选与分离的特定条件和步骤的标准资源材料。在一个实施方案中,本发明的DNA或核酸的变体是人工DNA或核酸,或是变体DNA或核酸,不包括任何天然存在的DNA或核酸。
SEQ ID NO:1表示小麦品种中国春的APO1的编码DNA的核苷酸序列。SEQ ID NO:2表示中国春品种的APO1的相应基因组DNA。SEQ ID NO:28表示小麦品种中国春7A染色体上APO 1根据可变基因模式的编码DNA的核苷酸序列。Baxter和Westonia品种包含APO1基因,该基因具有与SEQ ID NO:1相同的核苷酸序列作为编码DNA的核苷酸序列,以及与SEQ IDNO:2相同的核苷酸序列作为APO1的相应基因组DNA。SEQ ID NO:6表示小麦品种Chara的APO1的编码DNA的核苷酸序列。SEQ ID NO:7表示Chara品种的APO1相应的基因组DNA。Yitpi品种包含APO1基因,该基因具有与SEQ ID NO:6相同的核苷酸序列作为编码DNA的核苷酸序列,以及与SEQ ID NO:7相同的核苷酸序列。Claire品种包含APO1基因,该基因具有分别与SEQ ID NO:1和SEQ ID NO:2相同的序列作为APO1的编码DNA和相应基因组DNA的核苷酸序列。Robigus、Cadenza和Paragon品种包含APO1基因,该基因具有SEQ ID NO:1的核苷酸序列作为编码DNA的核苷酸序列,其中第140位的胸腺嘧啶被鸟嘌呤取代,第1150位的鸟嘌呤被丙氨酸取代;并且具有SEQ ID NO:2的核苷酸序列作为基因组DNA的核苷酸序列,其中第140位的胸腺嘧啶被鸟嘌呤取代,第1284位的鸟嘌呤被丙氨酸取代。SEQ ID NO:20表示小麦品种中国春7B染色体上APO1的编码DNA的核苷酸序列。SEQ ID NO:30表示小麦品种中国春7B染色体上APO 1根据可变基因模式的编码DNA的核苷酸序列。SEQ ID NO:21表示中国春品种的APO1-7B相应的基因组DNA。当查看Robigus的APO1等位基因中与SPS表型相关的关键保守SNP和indel(2个SNP在编码序列中(改变2个氨基酸),1个SNP在内含子中)时,Brompton具有与Robigus相同的保守SNP和indel。
本发明的Apo1 SPS基因或等位基因(如在Robigus或Yitpi中)与中国春参考Apo1序列具有以下关键差异,所述差异是在不同春小麦或冬小麦群体中测试的所有Apo1 SPS等位基因所特征性的。与中国春参考Apo1-7A序列的这些特征性差异选自:a)ATG起始密码子约500nt上游的115bp缺失,编码序列中2个错义SNP(其中错义SNP是导致密码子编码不同氨基酸的单个核苷酸改变),起始密码子约7.5kb上游的约5至7.5kb缺失,存在于约5kb启动子中的SNP和indel(例如,下表2中所示的SNP和indel,对于Yitpi/Chara),以及内含子中的SNP;b)ATG起始密码子约500nt上游的115bp缺失,编码序列中2个错义SNP,起始密码子约7.5kb上游的约5至7.5kb缺失,存在于约5kb启动子中的SNP和indel(例如,下表2中所示SNP和indel,对于Yitpi/Chara);c)ATG起始密码子约500nt上游的115bp缺失,编码序列中2个错义SNP,起始密码子约7.5kb上游的约5至7.5kb缺失;d)ATG起始密码子约500nt上游的115bp缺失,编码序列中2个错义SNP;或e)ATG起始密码子约500nt上游的115bp缺失。在所测试的SPS品系中保守的这些差异可能对所观察的SPS表型起贡献。当然,在不同小麦植物背景中SPS-Apo1等位基因之间可能存在一些其他小的差异(如SNP/indel),但这些差异被认为在生物学上不重要的。
包含与SEQ ID NO:1或SEQ ID NO:2具有至少80%的序列一致性的核苷酸序列的核酸,因此可以是包含分别与SEQ ID NO:1或SEQ ID NO:2具有至少80%、或至少85%、或至少90%、或至少95%、或至少98%、或至少99%或100%的序列一致性的核苷酸序列的核酸。SEQ ID NO:6的核苷酸序列与SEQ ID NO:1的核苷酸序列具有至少99%的序列一致性。SEQID NO:7的核苷酸序列与SEQ ID NO:2的核苷酸序列具有至少99%的序列一致性。
本发明还提供了重组基因,其包含植物可表达启动子(包括异源或人工的植物可表达启动子),与编码根据本发明的APO1蛋白的Apo1核酸序列、以及可选地转录终止子和多聚腺苷酸化序列(优选在植物中起作用的转录终止子和多聚腺苷酸化区域)可操作地连接。在一个实施方案中,植物可表达启动子可以是组成型启动子、诱导型启动子或组织特异性启动子。植物可表达启动子可以是CaMV35S启动子、泛素启动子、或来自具有较高每穗小穗数的小麦品种的根据本发明的APO1基因的天然启动子。在另一个实施方案中,Apo1核酸选自:a)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:7或SEQ ID NO:28的核酸序列;或b)与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:7或SEQ ID NO:28的核酸序列具有至少80%的一致性的核酸序列;或c)具有与a)或b)的核酸互补序列的核酸,如人工核酸。
如本文中所用,“重组基因”是通过可操作地连接不相关基因或其他核酸序列的片段构建的人工基因。换句话说,“重组基因”表示这样的基因,其通常不在植物物种中存在;或指任何这样的基因,其中基因的启动子或一个或多个其他调控区与转录的核酸的一部分或全部不天然相关(即与转录的核酸异源)。更特别地,重组基因是人工的,即非天然存在的基因,其通过将植物可表达启动子与编码APO1蛋白的核酸序列可操作地连接而产生。
如本文中所用,“植物可表达启动子”是指,对在植物细胞中起始转录关键的DNA序列区域。这包括任何植物来源的启动子,但也包括能够在植物细胞中指导转录的任何非植物来源启动子,即某些病毒或细菌来源的启动子,如CaMV35S、地三叶草病毒启动子No 4或No 7(WO9606932)或T-DNA基因启动子等。
组成型启动子的例子包括细菌来源的启动子,如来自农杆菌的章鱼碱合酶(OCS)和胭脂碱合酶(NOS)启动子,也包括病毒来源的启动子,如花椰菜花叶病毒(CaMV)35S转录本(Hapster等人,1988,Mol.Gen.Genet.212:182-190)或19S RNA基因(Odell等人,1985,Nature.6;313(6005):810-2;U.S.Pat.No.5,352,605;WO 84/02913;Benfey等人,1989,EMBO J.8:2195-2202)的启动子,增强型2x35S启动子(Kay at al.,1987,Science 236:1299–1302;Datla等人(1993),Plant Sci 94:139–149),木薯叶脉花叶病毒的启动子(CsVMV;WO 97/48819,US 7,053,205),2xCsVMV(WO2004/053135)),环状病毒(AU 689 311)启动子,甘蔗杆形杆状DNA病毒(ScBV)启动子(Samac等人,2004,Transgenic Res.13(4):349-61),玄参花叶病毒(FMV)启动子(Sanger等人,1990,Plant Mol Biol.14(3):433-43),地三叶草病毒启动子No 4或No 7(WO 96/06932),以及US 5,164,316、US 5,196,525、US 5,322,938、US 5,359,142和US 5,424,200中描述的增强型35S启动子。在植物来源的启动子中,可以提及来源于玉米和向日葵的植物核酮糖-双羧化酶/加氧酶(Rubisco)小亚基启动子(US 4,962,028;WO99/25842),拟南芥组蛋白H4基因的启动子(Chaboutéet aI.,1987),水稻actin 1启动子(Act-1,US 5,641,876),EP 0 507 698A1中描述的组蛋白启动子,玉米醇脱氢酶1启动子(Adh-1)(来自http://www.patentlens.net/daisy/promoters/242.html)。如果与其相应的终止子结合使用,菊属的小亚基启动子也是可以使用的(Outchkourov等人,Planta,216:1003–1012,2003)。特别要提到的是,玉米、水稻和甘蔗的泛素启动子(Holtorf等人,1995,Plant Mol.Biol.29:637-649,US 5,510,474),如由Christensen和Quail(1996,Transgenic Research Vol 5issue 3,pp 213-218)描述的那些。
诱导型启动子的例子包括受化合物施用调控的启动子,包括醇调控的启动子(参见例如EP637339)、四环素调控的启动子(参见例如US 5464758)、类固醇调控的启动子(参见US5512483;US6063985;US6784340;US6379945;WO01/62780),金属调控的启动子(参见例如US4601978)。
组织特异性启动子的例子包括分生组织特异性启动子,如水稻OSH1启动子(Sato等人(1996)Proc.Natl.Acad.Sci.USA 93:8117-8122),水稻金属硫蛋白启动子(BAD87835.1),WAK1和WAK2启动子(Wagner&Kohorn(2001)Plant Cell 13(2):303-318),大麦穗组织特异性启动子D5(US6291666),大麦外稃/内稃特异性Lem2启动子(Abebe等人(2005)Planta,221,170-183),大麦早期花序特异性Pvrn1启动子(Alonse Peral等人2011,PLoS ONE 6(12)e29456),大麦早期花序特异性Pcrs4/PrA2启动子(Koppolu等人2013,Proc.Natl.Acad.Sci USA,110(32)13198-13203),水稻含Act1内含子的分生组织特异性pkn1启动子(Zhang等人,1998,Planta 204:542-549,Postma-Haarsma等人2002,PlantMolecular Biology 48:423-441),石斛属物种的SAM/花序特异性启动子Pdomads1(Yu等人2002)。
短语“可操作地连接”指两个或多个核酸区域或核酸序列的功能性空间排列。例如,可以将启动子区域相对于核酸序列放置,使得核酸序列的转录由启动子区域指导。因此,启动子区域与核酸序列“可操作地连接”。“功能性连接”是等效术语。
术语“异源”指来自不同来源的两个或多个核酸或蛋白质序列之间的关系。例如,如果通常天然不存在启动子与可操作地连接的核酸序列(如编码序列)的组合,则所述启动子对于该可操作地连接的核酸序列是异源的。此外,特定的序列对于其插入的细胞或生物体可是“异源的”(即不天然存在于该特定的细胞或生物体中)。例如,本文公开的重组基因是异源核酸。
也可以通过向(小麦)植物提供转录因子来实现调节小麦APO1基因的表达,包括增加其表达,从而导致APO1蛋白质被调节的水平,包括APO1蛋白的增加,所述转录因子例如(特别是)识别APO1启动子区域并促进转录的转录因子,如与转录增强子偶联的TALeffector、dCas、dCpf1等(参见,例如Moore等人2014ACS Synth Biol.3(10)708-716;Qi等人(2013)Cell 152(5)1173-118,Liu等人2017 Nature Communications 8ArticleNumber 2095)。
如本文中所用,术语“包含”应解释为,规定存在所述及的特性、整体、步骤或组件,但不排除存在或添加一个或多个特性、整体、步骤或组件,或其组群。因此,例如,包含核苷酸或氨基酸序列的核酸或蛋白质,可以包含比实际所述及的核苷酸或氨基酸更多的核苷酸或氨基酸,即它们可以被内嵌于更大的核酸或蛋白质中。包含在功能上或结构上确定的DNA区域的重组基因可以包含额外的DNA区域等。然而,在本公开情况下,术语“包含”也包括“由……组成”。
本文描述的重组基因可选地包含参与转录终止和多聚腺苷酸化的DNA区域。各种在植物中起作用、参与转录终止和多聚腺苷酸化的DNA区域在本领域已知,本领域技术人员知道可以适合执行本文所述方法的终止子和多聚腺苷酸化序列。多聚腺苷酸化区域可以来自天然基因、来自各种其他植物基因、来自T-DNA基因或甚至来自植物病毒基因组。要添加的3’末端序列可以来自例如胭脂碱合酶或章鱼碱合酶基因,或者可选地来自其它植物基因,或来自任何其他真核基因。
词语“DNA”、“DNA序列”、“核酸序列”、“核酸分子”、“核苷酸序列”和“核酸”指,包含有序排列的核苷酸的物理结构。DNA序列或核苷酸序列可以包含在更大的核苷酸分子、载体等之中。此外,这些序列中有序排列的核酸可以以序列表、图形、表格、电子介质等形式描述。
在另一方面,本发明提供了小麦植物、植物部分或种子,它们由小麦植物细胞组成,所述细胞包含本文所述的重组基因。
如本文所用的“小麦”或“小麦植物”可以是可用于生长小麦的任何品种。小麦的例子包括但不限于普通小麦(Triticum aestivum)、Triticum aethiopicum、密穗小麦(Triticum compactum)、野生二粒小麦(Triticum dicoccoides)、栽培二粒小麦(Triticumdicoccum)、硬粒小麦(Triticum durum)、一粒小麦(Triticum monococcum)、斯卑尔脱小麦(Triticum spelta)、圆锥小麦(Triticum turgidum)。“小麦”还包括春小麦和冬小麦品种,冬小麦品种定义为需要春化来开花,而春小麦品种不需要这样的春化来开花。
如本文使用的“植物部分”是植物的一部分,其可以是细胞、组织或器官,如种子,被分割的部分,如根、叶、花、花粉、纤维等。
当提到根据本发明的“植物”时,应理解的是除非另有说明,本文也涵盖植物部分(细胞、组织或器官,种荚、种子,被分割的部分如根、叶、花、花粉等)、保留了亲本的识别性特征的植物后代,如通过自交或杂交获得的种子,例如杂交种子(通过两个亲本近交品系杂交获得),来源于其的杂交种植物和其植物部分。
在一些实施方案中,本发明的植物细胞以及根据本发明的方法产生的植物细胞,可以是非繁殖性细胞。
根据本发明获得的植物可用于常规育种计划,以生产更多具有相同特性的植物,或用于将相同的特性引入到相同或相关植物种的其他品种中,或杂交种植物中。所获得的植物可进一步用于产生繁殖材料。根据本发明的植物可以进一步用于生产配子体、种子(包括压榨种子和种子饼)、种子油、纤维、纱线、(合子或体细胞)胚、通过本发明的方法获得的植物的后代或杂交种。从根据本发明的植物获得的种子也涵盖在本发明中。
如本文中所用的“产生繁殖材料”涉及本领域已知的生产更多植物、植物部分或种子的任何手段,包括例如营养繁殖方法(例如空中或地面压条、分割、(芽)嫁接、微繁殖,匍匐茎和匍匐枝,储存器官如球茎、地下茎、块茎和根状茎,扦插或切割,twin-scaling)、有性繁殖(与另一植物杂交)和无性繁殖(如无融合生殖,体细胞杂交)。
在一些实施方案中,提供了生产具有改变的每穗小穗数小麦植物的方法或改变小麦植物每穗小穗数的方法,这两种方法都包括改变小麦植物中根据本发明的蛋白质之丰度的步骤。在另一个实施方案中,与其中蛋白质丰度没有改变的小麦植物的每穗小穗数相比,特别是其中小麦植物具有初始较低的每穗小穗数时,蛋白质的丰度增加且每穗小穗数增加。本发明的蛋白质的丰度可以通过向小麦植物提供如下来增加:a)根据本发明的重组或修饰的基因;或b)编码根据本发明的蛋白质的异源基因,其中异源基因的表达量高于相应的内源基因;或c)如本申请其它地方描述的通过使用重组的转录效应子。异源基因可包含SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:9或SEQ ID NO:19的核苷酸序列,或与其具有至少90%的序列一致性的核苷酸序列。
在一个实施方案中,APO1-7A蛋白的丰度增加,或APO1-7A蛋白和APO1-7B蛋白的丰度增加,或APO1-7A蛋白和APO1-7D蛋白的丰度增加,或APO1-7A、APO1-7B和APO1-7D蛋白的丰度增加。
在另一个实施方案中,与其中蛋白质丰度没有改变的小麦植物的每穗小穗数相比,特别是其中小麦植物具有初始较高的每穗小穗数时,蛋白质的丰度降低且每穗小穗数降低。本发明的蛋白质的丰度可以通过向小麦植物提供如下物质来降低:a)编码根据本发明的蛋白质的异源基因,其中所述异源基因的表达低于相应的内源基因,或b)编码根据本发明的蛋白质的内源基因之突变等位基因。异源基因可包含SEQ ID NO:9的核苷酸序列或与其具有至少90%的序列一致性的核苷酸序列,并且优选缺乏SEQ ID NO:4或SEQ ID NO:5第4399位至4513位的核苷酸序列,或缺乏SEQ ID NO:19第7816位至7930位的核苷酸序列,或与其具有至少90%的序列一致性的核苷酸序列。在一个实施方案中,APO1-7A蛋白的丰度降低,或APO1-7A蛋白和APO1-7B蛋白的丰度降低,或APO1-7A蛋白和APO1-7D蛋白的丰度降低,或APO1-7A、APO1-7B和APO1-7D蛋白的丰度降低。
具有初始较低每穗小穗数的小麦植物是指,小麦植物来源于这样的品种,所述品种具有的平均每穗小穗数低于约23个、低于约22个、低于约21个、低于约20个、低于约19个、或低于约18个每穗小穗。所述品种可以具有如下的平均每穗小穗数:约17至约23个、约17至约22个、约17至约21个、约17至约20个、约17至约19个、约17至约18个、约18至约23个、约18至约22个、约18至约21个、约18至约20个、约18至约19个、约19至约23个、约19至约22个、约19至约21个、约19至约20个、约20至约23个、约20至约22个、约20至约21个、约21至约23个、约21至约22个、约22至约23个每穗小穗。
具有初始较高每穗小穗数的小麦植物是指,小麦植物来源于这样的品种,所述品种具有的平均每穗小穗数为至少约23个、至少约24个、至少约25个、或至少约26个、至少约27个、至少约28个、或至少约29个或至少约30个每穗小穗。所述品种可具有如下的平均每穗小穗数:约23至约30个、约24至约30个、约25至约30个、约26至约30个、约27至约30个、约28至约30个、约29至约30个、约23至约29个、约24至约29个、约25至约29个、约26至约29个、约27至约29个、约28至约29个、约23至约28个、约24至约28个、约25至约28个、约26至约28个、约27至约28个、约23至约27个、约24至约27个、约25至约27个、约26至约27个、约23至约26个、约24至约26个、约25至约26个、约23至约25个、约24至约25个、或约23至约24个每穗小穗。
如本文所使用的“改变每穗小穗数”意思是显著增加或显著减少小麦植物的平均每穗小穗数。
每穗小穗数的增加指,与小麦植物,特别是具有初始较低每穗小穗数的小麦植物的每穗小穗数相比,每穗增加至少约1个、至少约2个、至少约3个、或至少约5个小穗。
每穗小穗数的减少指,与小麦植物,特别是具有初始较高每穗小穗数的小麦植物的每穗小穗数相比,每穗减少至少约3个、至少约2个、或至少约1个小穗。
如本文所用的“改变蛋白质的丰度”意思是,(显著)增加或(显著)降低本文所述蛋白质的丰度。
增加指,与小麦植物,特别是具有初始较低每穗小穗数的小麦植物的细胞产生的蛋白质的量相比,增加至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%。
降低指,与小麦植物,特别是具有初始较高每穗小穗数的小麦植物的细胞产生的蛋白质的量相比,降低至少10%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%。
在一个实施方案中,可以通过减少所产生的功能性APO1蛋白的量,来降低APO1基因和/或蛋白质的表达和/或活性。所述降低可以是,与具有野生型APO1表达水平和活性的细胞产生的功能性APO1蛋白的量相比,降低至少30%、40%、50%、60%、70%、80%、90%、95%或100%(即细胞不产生功能性APO1蛋白)。所述表达和/或活性的降低可以是所产生的功能性APO1蛋白质的量组成型降低。所述降低也可以是所产生的功能性APO1蛋白质的量暂时/诱导性减低。
本发明的APO1基因的表达和/或活性的降低也可以通过使用导致APO1基因的表达和/或活性降低的RNA分子来实现。导致APO1基因和/或蛋白质的表达和/或活性降低的RNA分子可以是这样的RNA,其编码的蛋白质抑制所述APO1蛋白的表达和/或活性。此外,导致APO1基因和/或蛋白质的表达和/或活性降低的RNA分子也可以是这样的RNA分子,其抑制基因的表达,该基因是所述APO1蛋白质表达和/或活性的激活因子。所述抑制APO1基因和/或蛋白质的表达和/或活性的RNA分子也可以是直接抑制APO1基因和/或蛋白质的表达和/或活性的RNA分子,如介导所述APO1基因沉默的RNA。
可以通过内源APO1基因表达的转录或转录后沉默来方便地减少或消除APO1基因和/或蛋白质的表达和/或活性。为此,可以将靶向内源APO1编码基因的沉默RNA分子引入植物细胞中。如本文所述,“沉默RNA”或“沉默RNA分子”指当引入到植物细胞中时会减少靶基因的表达的任何RNA分子。
沉默RNA也可以是人工小RNA分子,其描述于例如WO2005/052170、WO2005/047505或US 2005/0144667中,或ta-siRNA,其描述于WO2006/074400中(所有文件均通过参考引用并入本文)。在一些实施方案中,本发明的嵌合基因表达的核酸是催化性RNA,或针对靶标序列具有特异性核酶活性。因此,该多核苷酸将造成从靶标基因/序列转录的内源信使RNA降解,导致植物中蛋白质表达的降低。在一个实施方案中,本发明的嵌合基因表达的核酸编码一种锌指蛋白,该锌指蛋白与编码所述蛋白质的基因结合,导致靶标基因表达减低。在特定的实施方案中,锌指蛋白与所述基因的调控区域结合。在其他实施方案中,锌指蛋白与编码所述蛋白质的信使RNA结合,从而阻止其翻译。
在可选的实施方案中,可以通过抑制植物中所述APO1蛋白的表达来降低APO1基因和/或蛋白质的表达和/或活性。使用抑制性核酸(如在RNA介导的基因沉默中起作用的RNA或DNA分子,例如WO2011/112570中所描述的(通过参考引用并入本文))进行喷雾(系统性施用),可以在所需时刻诱导对所述APO1基因和/或蛋白质表达的抑制。
在本发明的一个实施方案中,具有较低每穗小穗数的小麦植物(APO1-7A的SPS-等位基因形式)在某些环境中种植时可获得产量增加,但是同样的植物如果具有较高每穗小穗数(APO1的SPS+等位基因形式)则在种植在另一环境中时可表现出产量增加。因此,产量效应可以在不同的种植环境中逆转,但对SPS的影响在不同环境中是一致的。这种跨环境的排序变化(在这种情况下是对于产量)称为基因型与环境(GxE)互作,是作物遗传增益的主要限制因素。通过鉴定背后的基因,可以针对每个目标环境利用合适的等位基因。
SEQ ID NO:4表示来自小麦品种Westonia的APO1之5’上游约5kb非编码DNA的核苷酸序列。SEQ ID NO:5表示来自小麦品种Baxter的APO1之5’上游约5kb非编码DNA的核苷酸序列。SEQ ID NO:4和SEQ ID NO:5是功能性变体,共享99%的序列一致性。SEQ ID NO:9表示来自小麦品种Chara的APO1之5’上游相应非编码DNA的核苷酸序列。品种Yitpi包含具有与SEQ ID NO:9相同的核苷酸序列的APO1之5’上游的相应非编码DNA。SEQ ID NO:19表示小麦品种中国春7A染色体上APO1之5’上游约8kb非编码DNA的核苷酸序列。品种Robigus包含具有SEQ ID NO:19的核苷酸序列的APO1之5’上游相应非编码DNA,其中SEQ ID NO:19的第7816位至7930位核苷酸缺失,且在SEQ ID NO:19的第901位核苷酸处(更具体地说,在SEQID NO:19的第900位核苷酸和第901位核苷酸之间–参见SEQ ID NO:19中的第一个misc_特征)插入了约5至7.7Kb核苷酸。此外,Robigus具有与表2中品种Yitpi/Chara相同的SNP和indel,而Claire具有与表2中品种Westonia相同的SNP和indel。
因此,包含与SEQ ID NO:4、5、9或19具有至少90%序列一致性的核苷酸序列的核酸,可以是包含与SEQ ID NO:4、5、9或19分别具有至少90%、或至少95%、或至少98%、或至少99%或100%序列一致性的核苷酸序列的核酸。与SEQ ID NO:4、5或9具有100%序列一致性的核苷酸序列,也指分别与SEQ ID NO:4、5或9相同的核苷酸序列。SEQ ID NO:9的核苷酸序列与SEQ ID NO:4或5的核苷酸序列具有97%的一致性,但不包含SEQ ID NO:5的第4399位至第4513位的核苷酸序列、或SEQ ID NO:4的第4401位至第4516位的核苷酸序列。
在另一个实施方案中,在上述方法中,“提供步骤”可以意指通过转化、杂交、回交、渗入、基因组编辑或诱变来提供。
术语“提供”可指通过转化将外源DNA分子引入到植物细胞中,可选地随后从转化的植物细胞再生植物。该术语还可指通过将包含重组DNA分子的转基因植物与另一植物杂交,以及选择遗传了重组DNA分子或转基因的后代植物,来引入重组DNA分子。“提供”的另一种含义是指,通过如原生质体融合等技术,任选地然后从融合的原生质体再生植物,来引入重组DNA分子。
很明显,使用的转化方法与本发明关系不大。植物的转化现在是一种常规技术。有利的是,几种转化方法中的任何一种都可用于将感兴趣的核酸/基因引入合适的祖先细胞中。转化方法包括使用脂质、电穿孔、增加游离DNA吸收的化学物质,将DNA直接注射到植物(细胞)中,如显微注射、粒子枪轰击,使用病毒或花粉转化和显微投射(microproject)。方法可以选自针对原生质体的钙/聚乙二醇方法(Krens等人(1982)Nature 296:72-74;Negrutiu等人(1987)Plant.Mol.Biol.8:363-373);原生质体电穿孔(Shillito等人(1985)Bio/Technol.3:1099-1102);显微注射到植物材料中(Crossway等人(1986)Mol.Gen.Genet.202:179-185);DNA或RNA涂层粒子轰击((Klein等人(1987)Nature 327:70);以病毒进行感染(非整合性)等。
小麦植物的转化方法在本领域众所周知。可以针对各种谷类作物建立不同的转化系统:在可再生组织和细胞中,组织电穿孔、原生质体转化和通过粒子轰击的DNA转移(综述见Jane,Euphytica 85(1995),35-44)。小麦的转化在文献中已被多次描述(综述见Maheshwari,Critical Reviews in Plant Science 14(2)(1995),149-178,Nehra等人,Plant J.5(1994),285-297)。Ishida等人2015Agrobacterium protocols:Volume 1,Methods in Molecular Biology,vol.1223:189-198描述了一种高效的农杆菌介导的转化方法。
如本文所用的“诱变”是指,使植物细胞(例如多个小麦种子或其他部分)接受诱导细胞中DNA发生突变的技术处理的过程,所述技术例如,接触诱变剂,例如化学物质(如甲基磺酸乙酯(EMS),乙基亚硝基脲(ENU)等),或电离辐射(中子(如快中子诱变等)、α射线、γ射线(如由钴60源提供的射线)、X射线、紫外线辐射),T-DNA插入诱变(Azpiroz-Leehan等人(1997)Trends Genet 13:152-156),转座子诱变(McKenzie等人(2002)Theor Appl Genet105:23-33),或组织培养诱变(诱导体细胞无性系变异),或这些技术的两个或更多的组合。因此,可以通过使用上述方法之一,完成一个或多个APO1等位基因的所需诱变。辐照引起的突变通常是大的缺失或其他的大损伤(如易位或复杂重排),而化学诱变剂引起的突变往往是更离散的损伤,如点突变。例如,EMS使鸟嘌呤碱基烷基化,这会导致碱基错配:烷基化的鸟嘌呤将会与胸腺嘧啶碱基配对,主要导致G/C至A/T的转换。在诱变后,可以使用已知技术,从经过处理的细胞再生小麦植物。例如,可以按照常规的种植程序种植所产生的小麦种子,并在植物上形成自花授粉种子。可以收获在当代或后续世代中作为这种自花授粉产生的额外种子,并筛选是否存在突变apo1等位基因。已知几种技术可以筛选特定的突变等位基因,例如DeleteageneTM(Delete-a-gene;Li等人,2001,Plant J 27:235-242)使用聚合酶链反应(PCR)测定来筛选快中子诱变产生的缺失突变体,TILLING(定向诱导的基因组局部损伤;McCallum等人,2000,Nat Biotechnol 18:455-457)鉴别EMS诱导的点突变等。
术语“基因打靶”在本文中指利用同源重组、错配修复或定点诱变等机制进行定向基因修饰。该方法可用于替换、插入和缺失植物细胞中存在的或之前引入的内源序列或序列。基因打靶的方法可见于例如WO2006/105946或WO2009/002150中。基因打靶可用于产生突变体或人工apo1等位基因。
基因打靶也可用于创建新型单体型或单体型区块。例如,7A染色体上包含APO1基因的单体型区块可能在几个方面有益于产量潜力,但包含与低SPS数相关的上游缺失和/或插入,对该区块可以通过基因打靶替换上游缺失和/或插入来进行工程化改造。
如本文中所有,“野生型”(也写“野生类”或“野生类型”)是指在自然界中最常见的植物或基因的典型形式。“野生型植物”指,具有在自然群体中这种植物最常见表型的植物。“野生型等位基因”指产生野生型表型所需的基因的等位基因。相对地,“突变体植物”是指通过人干预(例如通过诱变)产生的具有这种植物的不同罕见表型的植物,“突变等位基因”指产生突变表型所需的基因的等位基因。
如本文所用的“突变体”是指植物或基因的形式,所述形式与自然群体中这种植物或基因的形式不同,并且通过人类干预(例如通过诱变)产生;“突变等位基因”是指在自然群体或育种群体的植物中未发现的等位基因,其通过人类干预(如诱变或基因打靶)产生。
如本文中所用,术语“野生型等位基因”(例如野生型APO1等位基因),是指在植物(特别是小麦植物)中天然存在的等位基因,其编码功能性蛋白(例如功能性APO1蛋白)。相对地,如本文中所有,术语“突变等位基因”(例如突变apo1等位基因)是指这样的等位基因,所述等位基因不编码功能性蛋白,即编码非功能性APO1蛋白或根本不编码APO1蛋白的apo1等位基因,如本文中所用,非功能性APO1蛋白指与相应的野生型功能性APO1蛋白相比,没有生物活性或生物活性显著减少的APO1蛋白。
如本文中所用,“完全敲除”或“无效”突变等位基因是指,该突变等位基因编码与相应的野生型功能性蛋白相比没有生物活性的蛋白质、或根本不编码蛋白质。例如,这种“完全敲除突变等位基因”可以是,野在其核酸序列中包含一个或多个突变,例如一个或多个无义或错义突变的生型等位基因。特别是,这种完全敲除的突变apo1等位基因是,包含突变的野生型APO1等位基因,所述突变优选导致产生这样的APO1蛋白,所述APO1蛋白缺乏至少一个功能性结构域(如F-box结构域),或缺乏至少一个对其功能至关重要的氨基酸,使得该APO1蛋白的生物活性完全丧失,或其中所述突变优选导致不产生APO1蛋白。
如本文中所有,“部分敲除”突变等位基因是指,该突变等位基因编码与相应的野生型功能性蛋白相比生物活性显著降低的蛋白。例如,这种“部分敲除的突变等位基因”可以是,在其核酸序列中包含一个或多个突变,例如一个或多个错义突变的野生型等位基因。特别是,这种部分敲除的突变等位基因可以是包含突变的野生型等位基因,其中所述突变优选导致产生这样的蛋白质,其中所述蛋白质中至少一个保守的和/或功能性的氨基酸被另一氨基酸替代,从而显著减少但并没有完全消除生物活性。
本领域技术人员可以例如使用从核酸产生的RNA累积物的分析来确定基因的表达水平。RNA累积物或RNA(如mRNA)水平可以在单个时间点或多个时间点、在单种组织或几种组织中测量,由此,倍数增加可以是平均倍数增加或从实验测量值得出的外推值。可以通过如RT-qPCR等技术,或使用基于杂交的微阵列来确定表达水平。也可以通过全转录组鸟枪测序来估计表达水平,使用下一代测序来揭示RNA的存在和数量,所述的RNA可以针对多聚腺苷酸化的RNA被选择,或耗竭核糖体RNA。
在某些实施方案中,修饰内源Apo1基因的步骤可以包括在内源Apo1基因中进行核苷酸修饰,以增加或减少植物中的SPS。
在本文所述的植物或方法的某些实施方案中,可以通过基因组编辑修饰内源Apo1基因。在某些实施方案中,可以用选自以下的一种或多种工程化核酸酶来进行基因组编辑:RNA引导的核酸酶、大范围核酸酶(meganuclease)、锌指核酸酶(ZFNs)、和基于转录激活物样效应因子的核酸酶(TALEN)。
在某些实施方案中,提供植物的步骤可以包括:提供野生型植物;通过基因组编辑来修饰植物中的内源Apo1基因,以获得包含如本文中定义的核酸的植物。
术语“基因组编辑”或“使用工程化核酸酶进行基因组编辑”通常指一种基因工程,其中使用(工程)核酸酶在活生物体的基因组中插入、缺失或替换DNA。核酸酶可以产生位点特异性断裂,例如在基因组中所需位置的双链断裂(DSB)。
在某些实施方案中,可以通过在基因组的一个或多个所需位置产生位点特异性断裂(如双链断裂(DSB))来修饰内源Apo1基因。所诱导的双链断裂可以通过非同源末端连接(NHEJ)或同源修复(HDR)进行修复。
在某些实施方案中,可以通过基因组编辑的方法修饰内源Apo1基因,所述方法为在预选位点修饰植物细胞基因组,优选核基因组的方法,该方法包括以下步骤:
-通过在所述细胞中表达在识别位点识别并在切割位点诱导双链DNA断裂(DSB)的双链DNA断裂诱导(DSBI)酶,在所述细胞的基因组中,在位于DSBI酶的识别位点或其邻近的切割位点处诱导DSB;
-向所述细胞引入修复核酸分子,该核酸分子包含与所述预选位点上游DNA区域具有同源性的上游侧翼区域、和/或与所述预选位点下游DNA区域具有同源性的下游侧翼DNA区域,从而允许所述侧翼区域(一个或两个区域)与位于所述预选位点侧翼的所述DNA区域(一个或两个区域)之间发生同源重组;和
-选择这样的细胞,其中所述修复核酸分子已被用作模板用于造成所述基因组在所述预选择位点的修饰,
其中,所述修饰选自至少一个核苷酸的取代、至少一个核苷酸的缺失、至少一个核苷酸的插入,或其任何组合。
如本文中所用,“双链DNA断裂诱导酶”是这样的酶,其能够在特定的核苷酸序列(称为“识别位点”)处诱导双链DNA断裂。
稀有切割内切核酸酶是DSBI酶,其识别位点约为14至70个连续核苷酸,因此即使在较大的基因组(如大多数植物基因组)中,其切割的频率也非常低。归巢内切核酸酶,也称为大范围核酸酶(meganucleease),构成了这类稀有切割内切核酸酶的一个家族。它们可由内含子、独立基因或间隔序列编码,并呈现出引人注目的结构和功能特性,这使它们区别于更经典的限制性酶(通常来自细菌的限制-修饰II型系统)。它们的识别位点具有总体不对称性,这与大多数限制性酶识别位点特有的二分对称性形成对比。由内含子或内含肽编码的几种归巢内切核酸酶已被证明能够促进它们各自的遗传元素归巢进入等位基因的无内含子或无内含肽位点。通过在无内含子或无内含肽等位基因中制造位点特异性双链断裂,这些核酸酶产生致重组发生末端,其参与基因转换过程,该过程复制编码序列并导致在DNA水平上插入内含子或间隔序列。
WO03/004659的表1(第17至20页)提供了其他稀有切割大范围核酸酶及其各自识别位点的列表(通过参考引用并入本文)。它们包括I-Sce I、I-Chu I、I-Dmo I、I-Cre I、I-Csm I、PI-Fli I、Pt-Mtu I、I-Ceu I、I-Sce II、I-Sce III、HO、PI-Civ I、PI-Ctr I、PI-Aae I、PI-BSU I、PI-DhaI、PI-Dra I、PI-Mav I、PI-Mch I、PI-Mfu I、PI-Mfl I、PI-Mga I、PI-Mgo I、PI-Min I、PI-Mka I、PI-Mle I、PI-Mma I、PI-Msh I、PI-Msm I、PI-Mth I、PI-Mtu I、PI-Mxe I、PI-Npu I、PI-Pfu I、PI-Rma I、PI-Spb I、PI-Ssp I、PI-Fac I、PI-MjaI、PI-Pho I、PI-Tag I、PI-Thy I、PI-Tko I或PI-Tsp I。
此外,还有一些方法可用于设计定制的稀有切割内切核酸酶,这些酶基本上能识别所选的任何靶标核苷酸序列。简言之,可以使用设计用来识别特定核苷酸序列的锌指结构域与来自天然限制性酶的非特异性DNA切割结构域(如FokI)之间的杂合物,制备嵌合的限制性酶。这些方法已描述于例如WO 03/080809、WO94/18313或WO95/09233中和Isalan等人,2001,Nature Biotechnology 19,656-660;Liu等人1997,Proc.Natl.Acad.Sci.USA,94,5525-5530中。
可以如WO2004/067736中描述的,通过从变体文库选择来产生定制的大范围核酸酶。具有改变的序列特异性和DNA结合亲和力的定制大范围核酸酶也可以通过如WO2007/047859中描述的合理设计来获得。
定制设计的内切核酸酶的另一个例子包括所谓的TALE核酸酶(TALEN),它基于来自细菌黄单胞杆菌属(Xanthomonas)的转录激活物样效应子(TALE)与核酸酶的催化结构域(例如FOKI)相融合。这些TALE的DNA结合特异性由串联排列的34/35个氨基酸重复单元的重复-可变双残基(RVD)定义,其中一个RVD识特异性别靶标DNA中的一个核苷酸。可以组装重复单元以识别基本上任何靶标序列,并与核酸酶的催化结构域融合,产生序列特异性内切核酸酶(参见例如Boch等人,2009,Science,326:p1509-1512;Moscou and Bogdanove,2009,Science,326:p1501;Christian等人,2010,Genetics,186:p757-761;和WO10/079430、WO11/072246、WO2011/154393、WO11/146121、WO2012/001527、WO2012/093833、WO2012/104729、WO2012/138927、WO2012/138939)。WO2012/138927进一步描述了单体(紧凑型)TALEN和具有各种催化结构域的TALEN及其组合。
另一个可定制的内切核酸酶已被描述;所谓的成簇的规律间隔短回文重复(CRISPR)/Cas系统,其利用特定的RNA分子(crRNA)赋予序列特异性来引导相关RNA指导的内切核酸酶的切割。这种定制设计的稀有切割内切核酸酶也被称为非自然存在的稀有切割内切核酸酶。
如本文中所用,RNA指导的核酸酶或RNA指导的内切核酸酶(RGEN)是具有(内切)核酸酶活性的RNA指导的DNA修饰多肽。
RGEN通常来源于成簇的规律间隔短回文重复(CRISPR)系统,CRISPR系统是一类广泛的细菌系统,用于防御外来核酸。CRISPR系统广泛存在于真细菌和古细菌生物中。CRISPR系统包括I、II、III和V亚类(参见例如WO2007025097;WO2013098244;WO2014022702;WO2014093479;WO2015155686;EP3009511;US2016208243)。野生型II型CRISPR/Cas系统利用RNA指导的核酸酶(例如Cas9),在与指导和激活RNA形成的复合体中,识别和切割外源核酸(Jinek等人,2012,Science,337(6096):816-21)。
Cas9同源物存在于广泛多种真细菌中,包括但不限于以下分类学群组的细菌:放线菌门(Actinobacteria)、产水菌门(Aquificae)、拟杆菌门-绿菌门(Bacteroidetes-Chlorobi)、衣原体门-疣微菌门(Chlamydiae-Verrucomicrobia)、绿弯菌门(Chlroflexi)、蓝细菌门(Cyanobacteria)、厚壁菌门(Firmicutes)、变形菌门(Proteobacteria)、螺旋体门(Spirochaetes)和热袍菌门(Thermotogae)。典型的Cas9蛋白是化脓性链球菌(Streptococcus pyogenes)Cas9蛋白。另外的Cas9蛋白,其同源物和变体及在基因组编辑中使用的方法描述于例如Chylinksi,等人,2013,RNA Biol.,10(5):726-737;Makarova等人,2011,Nat.Rev.Microbiol.,9(6):467-477;Hou,等人,2013,Proc Natl Acad Sci U SA,110(39):15644-9;Sampson等人,2013,Nature,497(7448):254-7;Jinek,等人,2012,同上引文;WO2013142578;WO2013176772;WO2014065596;WO2014089290;WO2014093709;WO2014093622;WO2014093655;WO2014093701;WO2014093712;WO2014093635;WO2014093595;WO2014093694;WO2014093661;WO2014093718;WO2014093709;WO2014099750;WO2014113493;WO2014190181;WO2015006294;WO2015071474;WO2015077318;WO2015089406;WO2015103153;WO201621973;WO201633298;WO201649258中,均通过参考引用并入本文。
另外的RNA指导的核酸酶包括,例如,Cpf1及其同源物和变体(例如描述于Zetsche等人,2015,Cell,Volume 163,Issue 3,759-771;EP3009511;US2016208243;Kleinstiver等人,2016,Nat Biotechnol.,34(8):869-74;Gao等人,2016,Cell Res.,6(8):901-13;Hur等人,2016,Nat Biotechnol.,34(8):807;Kim等人,2016,Nat Biotechnol.,34(8):863-8.;Yamano等人,2016,Cell,165(4):949-62中),以及C2c1和C2c3(Shmakov等人,2015,MolCell.,60(3):385-97),均通过参考引用并入本文。
另外的RNA指导的核酸酶可以包括Argonaut样蛋白,例如WO2015157534中所描述的。
另外的RNA指导的核酸酶和其他多肽描述于WO2013088446中。
在一个实施方案中,RGEN也可以是RNA指导的切刻酶(切口酶),或一对RNA指导的切刻酶,其中每一个酶只于双链DNA的一条链中在预选位点处引入断裂。在一对切口酶中,一个酶于DNA的一条链中在预选位点处或其邻近位置引入断裂,而另一个酶于DNA的另一条链中在预选位点处或其邻近位置引入断裂。可以在两条链上于相同的核苷酸位置处引入这两个单链断裂,从而产生平端双链DNA断裂;但这两个单链断裂也可以在每条链的不同核苷酸位置引入,从而在断裂点处产生5’或3’悬挂(“粘性末端”或“交错切口”)。切刻突变体及其使用描述于例如上述文献中和特别是WO2014191518、WO2014204725和WO2016286882中。此外,只在两条DNA链的一条中引入断裂(即单链DNA断裂)的单切刻突变体,可以利用供体多核苷酸来增强同源定向修复(HDR)(Richardson等人2016,Nature Biotechnology 34,339-344;US62/262,189)。
作为核酸酶或切刻酶的替代,上述核酸酶的核酸酶缺陷性(也称为“死的”或非催化活性的)变体,如dCas9,可用来增加供体多核苷酸的靶向插入,例如Richardson等人2016,Nature Biotechnology 34,339-344;US62/262,189中所描述的。此类变体缺乏切割或切刻DNA的能力,但能够被靶向并结合DNA(参见例如WO2013176772、EP3009511)。这些“死的”核酸酶被认为可通过与两链之一(“DNA熔解”)结合来诱导链置换,从而通过允许供体多核苷酸与另一条“自由”DNA链退火来增强与供体多核苷酸的重组。
各种RGEN的切刻突变体已被描述,涉及催化结构域(如HNH和RuvC结构域(例如Cas9)或RuvC样结构域(例如Cpf1))中的一个或多个突变。例如,通过在RuvC中突变D10A可以将SpCas9转变为切刻酶,HNH核酸酶结构域中的863A可以将SpCas9转变为DNA切刻酶,而两个核酸酶结构域均失活将导致无催化活性的蛋白(Jinek等人,2012,supra,Gasiunas等人,2012,Proc.Natl.Acad.Sci.USA 109,E2579-E2586)。在Cpf1中,已经发现,D917A和E1006A突变完全消除了FnCpf1的DNA切割活性,而D1255A显著降低了核解活性(Zetsche等人,2015,同上)。可以通过最优比对来确定其他RGEN(例如Cas9或Cpf1)变体的相应残基。
DSBI酶的切割位点与在DNA上诱导双链DNA断裂的确切位置相关。切割位点可以包含或可以不包含在(与其重合)DSBI酶的识别位点中,并由此称DSBI酶的切割位点在其识别位点位置或在其邻近位置。DSBI酶的识别位点(有时也称为结合位点)是被DSBI酶(特异性)识别和确定其结合特异性的核苷酸序列。例如,TALEN或ZNF单体具有分别由其RVD重复或ZF重复确定的识别位点,而其切割位点由其核酸酶结构域(例如FOKI)确定,且通常位于识别位点之外。在二聚体TALEN或ZFN情况下,切割位点位于相应单体的两个识别/结合位点之间,切割发生的间隔DNA区域被称为间隔子区域。另一方面,对于大范围核酸酶,DNA切割在其特定的结合区域内发生,因此结合位点和切割位点重叠。
本领域技术人员能够选择识别特定识别位点并在预选位点或其邻近的切割位点诱导DSB的DSBI酶,或者工程化构建这样的DSBI酶。或者,可以采用任何常规转化方法或通过与基因组中具有DSBI酶识别位点的生物体杂交,将DSBI酶识别位点引入到靶标基因组中,随后可在该DSBI酶的切割位点或其邻近引入任何所需的DNA。
如本文中所用,修复核酸分子是单链或双链DNA分子或RNA分子,其用作模板用于在位于切割位点或其邻近位置的预选位点处修饰基因组DNA。如本文中所用,用作修饰基因组DNA的模板是指,该修复核酸分子可以通过侧翼区(一个或多个)与靶基因组中位于预定位点侧翼的相应同源区(一个或多个)之间的同源重组,任选地结合在所述修复核酸分子的两末端之一的非同源末端连接(NHEJ)(例如,当仅有一个侧翼区时),被拷贝或整合在预定位点。通过同源重组的整合将允许修复核酸分子与靶标基因组进行精确到核苷酸水平的连接,而NHEJ可导致在修复核酸分子与基因组DNA的连接处出现小的插入/缺失。
如本文中所用,“基因组的修饰”是指,基因组被改变了至少一个核苷酸(在一个实施方案中,所述改变不存在于未经修饰的/野生型植物中)。这可以通过替换至少一个核苷酸和/或缺失至少一个核苷酸和/或插入至少一个核苷酸来实现,只要是:与修饰前预选基因组靶位点的核苷酸序列相比,这导致总体至少一个核苷酸的改变,从而允许例如通过技术人员清楚知晓的测序或PCR分析等技术鉴别该修饰。
另外的实施方案公开了鉴别和/或选择小麦植物的方法,其中小麦植物包含对每穗小穗数分别具有正或负贡献的基因的等位基因,所述方法包括鉴别小麦植物基因组中是否存在这样的核酸的步骤,所述核酸具有SEQ ID NO:5的第4399位至第4513位的核苷酸、或SEQ ID NO:19的第7816位至第7930位的核苷酸、或与之具有至少90%序列一致性的核苷酸序列。
本发明的小麦植物可种植或收获谷物,主要用作人类消费的食品或作为动物饲料,或用于发酵或工业原料生产,如乙醇生产等用途。或者,小麦植物可以直接用作饲料。本发明的植物优选用于食品生产,特别是商业食品生产。这样的食品生产可以包括制作面粉、面团、粗粒面粉或来自谷物的其它产品,所述其它产品可以是商业食品生产中的配料。本发明还提供面粉、粗粉或从谷物制备的其他产品。这些产品可以不经处理或例如通过分级分离或漂白进行处理。
本发明还提供了从本发明的植物或谷物/种子生产的产品,如食品,其可以是食品配料。食品的例子包括面粉、淀粉、发酵或未发酵面包、意大利面、面条、动物饲料、早餐麦片、零食、蛋糕、麦芽、糕点和含有面粉酱的食物。食品可以是百吉饼、饼干、面包、小圆面包、羊角面包、饺子、英国松饼、松饼、皮塔饼、快速面包、冷藏/冷冻面团产品、面团、烤豆、面卷饼、辣椒粉、墨西哥煎玉米粉卷(taco)、墨西哥玉米粉蒸肉卷(tamale)、玉米饼(tortilla)、菜肉馅饼(pot pie)、即食谷物、即食食品、馅料、可微波加热餐食、布朗尼、蛋糕、奶酪蛋糕、咖啡蛋糕、曲奇饼、甜点、糕点、甜面包、糖果棒、馅饼皮、馅饼馅、婴儿食品、烘焙混合物、面糊(batter)、拌粉(breading)、肉卤混合物、嫩肉剂、肉类替代品、混合调味品、汤包粉、肉汁、乳酪面粉糊(roux)、沙拉酱、汤、酸奶油、面条、意大利面、ramen面、炒面(chow meinnoodles)、捞面(lo mein noodles)、冰淇淋内含物、冰淇淋棒、冰淇淋蛋卷、冰淇淋三明治、薄脆饼干、油炸面包丁、甜甜圈、蛋卷、挤出式零食、水果和谷物条、可微波加热小吃产品、营养条、煎饼、par-baked烘焙食品、椒盐卷饼、布丁、格兰诺拉麦片食品、零食片、零食食品、小食拼盘、华夫饼、比萨饼皮、动物食品或宠物食品。食品可以通过将谷物或来自所述谷物的面粉、全麦粉或麸皮与其他成分混合来制备。另一种产品是动物饲料,如收获的谷物、干草、稻草或青贮。本发明的植物例如在田间生长时,可直接用作动物饲料。
在一个实施方案中,本发明提供了生产小麦面粉、全麦粉、淀粉、淀粉粒或小麦麸的方法,该方法包括获得本发明植物的谷粒并加工谷粒以生产面粉、全麦粉、淀粉、淀粉粒或小麦麸;本发明也提供通过该方法生产的或包含本发明Apo1核酸分子和/或本发明APO1多肽的小麦面粉、全麦粉、淀粉、淀粉粒或小麦麸。
本文还提供了生产食品的方法,该方法包括将本发明植物的谷粒或上述小麦面粉、全麦粉、淀粉、淀粉粒或小麦麸与至少一种其他食品配料混合来生产食品。还提供了生产淀粉的方法,该方法包括获得本发明植物的谷粒并加工谷粒以生产淀粉;以及生产乙醇的方法,该方法包括发酵所述淀粉,从而产生乙醇。
本文还提供了喂养动物的方法,该方法包括向动物提供本发明的小麦植物、本发明的麦粒、本发明的小麦细胞或包含上述小麦面粉、全麦粉、淀粉、淀粉粒或小麦麸的饲料产品。
本发明还提供了食品,所述食品包含本发明的小麦植物或其部分、本发明的小麦粒、本发明的小麦细胞、本发明的核酸分子、本发明的多肽,或上述小麦面粉、全麦粉、淀粉、淀粉粒或小麦麸作为成分,诸如上述食品,其中食品是发酵了的或未发酵的面包、意大利面食、面条、早餐谷物、零食、蛋糕、糕点或面粉酱(flour-based sauce)。
本文还提供了本发明植物的种子,其包含本发明的Apo1等位基因,以及由此种子生产的小麦产品,其中所述小麦产品包含Apo1等位基因。这样的小麦产品可以是或可以包括粗粉、研磨的种子、面粉,薄片等。尤其是,这种小麦产品包含这样的核酸,所述核酸可以产生对本发明的Apo1等位基因具有诊断性或特异性的扩增子。
本文还提供了改变小麦植物每穗小穗数的方法,该方法包括改变所述小麦植物中本发明APO1蛋白丰度的步骤,特别是这样的方法,其中所述蛋白质的丰度增加,从而与其中所述蛋白的丰度没有改变的小麦植物的每穗小穗数相比,每穗小穗数增加。
根据上述段落的方法,其中所述蛋白的丰度被降低,从而与其中所述蛋白的丰度没有改变的小麦植物的每穗小穗数相比,每穗小穗数降低,例如所述方法,其中所述蛋白的丰度通过向所述小麦植物提供如下物质来增加:
a.本发明的重组基因,或
b.编码本发明APO1蛋白的异源基因,其中所述异源基因表达高于相应的内源基因,例如,当异源基因包含SEQ ID NO:4或SEQ ID NO:5的核苷酸序列或与它们具有至少90%序列一致性的核苷酸序列时。
本文还提供了上述2段的方法,其中所述蛋白的丰度通过向所述小麦植物提供如下物质来增加:
a.编码根据本发明APO1蛋白的异源基因,其中所述异源基因的表达低于内源基因,或
b.编码根据本发明APO1蛋白质的内源基因的突变等位基因。
上述段落的方法,其中所述异源基因的启动子包含SEQ ID NO:9的核苷酸序列或与其具有具有至少90%序列一致性的核苷酸序列,但不包含SEQ ID NO:5的第4399位核苷酸至第4513位核苷酸的核苷酸序列,也不包括与它们具有至少90%序列一致性的核苷酸序列,例如,其中所述突变等位基因为敲除等位基因。
根据上述段落的方法,其中提供的步骤包括通过转化、杂交、回交、渗入、基因组编辑或诱变来提供。
通过本文中所描述的方法获得的转化的植物细胞和植物可进一步用于本领域众所周知的育种程序,如杂交、自交和回交。育种程序可涉及杂交产生F1代(子一代),然后进行几代自交(产生F2、F3等)。育种程序还可涉及回交(BC)步骤,其中后代与亲本品系之一(称为轮回亲本)回交。
在一些司法实践中,当用于生产植物的方法完全由自然现象组成时(例如杂交或选择),该方法被认为主要是生物学的方法,因此对于仅是通过主要是生物学的方法已经获得的本发明植物,可能是不能授予专利权的。但本发明的植物也涵盖那些并非完全通过主要是生物学的方法获得的植物。
序列表包含在名为“BCS18-2001-WO1_ST25.txt”的文件中,文件大小为87千字节,包含SEQ ID NO:1至SEQ ID NO:31共31条序列,通过电子递交方式与本文一起提交,并通过参考引用并入本文。
在说明书描述和实施例中,提及了以下序列:
SEQ ID No.1:中国春、Westonia或Baxter的Apo1-7A之编码DNA的核苷酸序列。
SEQ ID No.2:中国春、Westonia或Baxter的Apo1-7A之基因组DNA的核苷酸序列。
SEQ ID No.3:中国春、Westonia或Baxter的APO1-7A蛋白的氨基酸序列。
SEQ ID No.4:Westonia的Apo1-7A之5’上游序列的核苷酸序列。
SEQ ID No.5:Baxter的Apo1-7A之5’上游序列的核苷酸序列。
SEQ ID No.6:Chara或Yitpi的Apo1-7A之编码DNA的核苷酸序列。
SEQ ID No.7:Chara或Yitpi的Apo1-7A之基因组DNA的核苷酸序列。
SEQ ID No.8:Chara或Yitpi的APO1-7A蛋白的氨基酸序列。
SEQ ID No.9:Chara或Yitpi的Apo1-7A之5’上游序列的核苷酸序列。
SEQ ID No.10:分子标记wsnp_Ku_c19943_29512612的核苷酸序列。
SEQ ID No.11:分子标记Excalibur_c95707_285的核苷酸序列。
SEQ ID No.12:分子标记mTRI00073530的核苷酸序列。
SEQ ID No.13:分子标记mTRI00055675的核苷酸序列。
SEQ ID No.14:分子标记mTRI00055678的核苷酸序列。
SEQ ID No.15:7B同源APO1基因编码序列的核苷酸序列(中国春)。
SEQ ID No.16:7D同源APO1基因编码序列的核苷酸序列(中国春)。
SEQ ID No.17:APO1-7B蛋白的氨基酸序列(中国春)。
SEQ ID No.18:APO1-7D蛋白的氨基酸序列(中国春)。
SEQ ID No.19:中国春的Apo1-7A之5’上游序列的核苷酸序列。
SEQ ID No.20:中国春的Apo1-7B之编码DNA的1242个核苷酸序列。
SEQ ID No.21:中国春的Apo1-7B之基因组DNA的核苷酸序列。
SEQ ID No.22:中国春的Apo1-7B之5’上游序列的核苷酸序列。
SEQ ID No.23:标记CAP7_c2350_105的核苷酸序列。
SEQ ID No.24:标记wsnp_Ku_rep_c104159_90704469的核苷酸序列。
SEQ ID No.25:标记BS00021657_51的核苷酸序列。
SEQ ID No.26:标记BS00066288_51的核苷酸序列。
SEQ ID No.27:标记BS00039502_51的核苷酸序列。
SEQ ID No.28:中国春的Apo1-7A之编码DNA的核苷酸序列(较短版本)。
SEQ ID No.29:中国春的APO1-7A蛋白的氨基酸序列(较短版本)。
SEQ ID No.30:中国春的Apo1-7B之编码DNA的核苷酸序列(较短版本)。
SEQ ID No.31:中国春的APO1-7B蛋白的氨基酸序列(较短版本)。
实施例
除非在实施例中另有说明,所有重组DNA技术均按照标准实验程序进行,所述实验程序描述于Sambrook和Russell(2001年)分子克隆:实验室手册,第3版,冷泉港实验室出版社,纽约,Ausubel等人(1994年)Current Protocols in Molecular Biology,CurrentProtocols(美国)的第1卷和第2卷,和Brown(1998)Molecular Biology LabFax,第2版,Academic出版社(英国)的第1卷和第2卷中。植物分子工作的标准材料和方法描述于R.D.D.Croy编著的Plant Molecular Biology Labfax(1993)中,其由BIOS Scientific出版有限公司(英国)和Blackwell Scientific出版社(英国)联合出版。用于聚合酶链式反应的标准材料和方法见于Dieffenbach和Dveksler(1995)PCR引物:实验手册,冷泉港实验室出版社,和McPherson at al.(2000)PCR-Basics:From Background to Bench,第1版,Springer Verlag,德国。AFLP分析的标准程序描述于Vos等人(1995,NAR 23:4407-4414)中和公开于EP专利申请EP 534858中。
实施例显示了使用两种不同的小麦群体获得的结果,一个是基于对一组春小麦植物的分析(以下A部分),另一个是基于对一组冬小麦植物的分析(以下B部分),表明所鉴定到的与APO1等位基因类型连锁的SPS表型(SPS-或SPS+)适用于所有小麦种群体/基因型。
A.春小麦品系中APO1分析实施例1:作图定位7A染色体上控制每穗小穗数的QTL
通过计算不同植物品系中每穗小穗数,对四交MAGIC春小麦群体(Huang等人2012Plant Biotechnology Journal 10:826-839)进行表型分析。
使用几个SNP的遗传图谱,进行了QTL分析,以测试每穗小穗数变异在所有标记中的效应。通过负对数转换的p值大于3来识别显著的标记-性状关联。这样,界定了显著关联标记的区间,该区间包括侧翼标记(SEQ ID NO.10和SEQ ID NO.11)。使用以下标准界定显著关联标记的区间:显著性阈值为2.5,显著性下降为1.5,峰值之间显著性下降为2。这样通过左侧和右侧标记将区间界定到7A上的2.1厘摩。
构建了具有对比存在的7A SPS QTL(Fam1_A_1、Fam1_B_1、Fam2_B_1、Fam2_C_1、Fam2_H_1、Fam3_E_1、Fam3_I_1、Fam4_A、Fam4_G、Fam5_C_1和Fam5_F_1)的杂合近交家系(HIF),随后用于7AQTL的精细作图定位和如下表达分析。
如上所述,对HIF进行表型分析,所述HIF具有对比存在的7A SPSQTL的高和低贡献等位基因。开发了额外的SNP分析以增加QTL区间内的标记密度。可以进一步将该SPS座位界定到7A上约2.1厘摩的区域(7A染色体上从58.7cM至60.8cM),该区域可以通过侧翼标记(SEQ ID NO:12和SEQ ID NO:13或SEQ ID NO:14)来界定。
将精细作图定位的标记的序列用于对中国春基因组序列的重叠群(contig)和支架(scaffold)进行BLAST。为将SNP定位在部分基因组序列中,使用严格BLAST和解析标准,例如大于98%的序列一致性、比对长度大于158bp、命中7A序列,和其它标准用于非比对的突出端。将支架指派到精细图谱(和其它遗传图谱)上。对通过精细定位定义的区间内的16个注释基因进行如实施例2所描述的表达分析。
实施例2:APO1的表达分析和鉴定
使用全转录组鸟枪法测序对从对比HIF家系制备的RNA样本,进行表达分析,基本上如Wang等人(2009)Nature Review Genetics 10,57-63所述。通过计数定位到实施例1中所定义的QTL区间的读段(reads)的归一化后数目,对表达进行定量。
对于通过精细作图定义的区间内注释的16个基因,已经在作图群体的不同亲本中以及在11个HIF中,进行了表达水平的定量。这些基因中,只有一个候选物,即水稻APO1的直系同源基因,在表现出较高每穗小穗数表型(在本文中有时简称为SPS+(表型))的品系中,相比于在具有较低每穗小穗数(在本文中有时简称为SPS-(表型))的品系中,是显著更高表达的(平均1.8倍增加)。由此,该基因被鉴定为7A染色体上每穗小穗数QTL的基础基因。
图1显示了所分析的春小麦基因型中通过APO1基因的RNAseq转录分析得到的表达水平的详细结果。这些对比品系在APO1转录本丰度上具有最小1.5倍和高达2.75倍的差异。亲本Chara和Yitpi具有较低的每穗小穗数和较低的APO1表达水平,而亲本Westonia和Baxter具有较高的每穗小穗数和较高的APO1表达水平(高1.6至2.6倍)。类似地,具有较低每穗小穗数的HIF品系的APO1表达水平较低,而具有较高每穗小穗数的HIF品系的APO1表达水平较高。
从参考小麦品系中国春以及四个MAGIC亲本品种获得APO1基因的序列。APO1非常保守,在每穗小穗数较低的品种的等位基因序列以及每穗小穗数较高的品种的等位基因序列之间,序列一致性超过99%。表1显示了在所分析的APO1编码序列之间发现的3个单核苷酸多态性。相应的氨基酸序列也具有99%的序列一致性。SEQ ID NOs:2或7上第140位的SNP导致Yitpi和Chara蛋白序列(SEQ ID NO:8)在第47位上具有半胱氨酸,而Baxter、Westonia和中国春蛋白序列(SEQ ID NO:3)在第47位上具有苯丙氨酸。SEQ ID NOs:2或7上第842位的SNP不导致氨基酸序列任何差异,因为其位于内含子中。SEQ ID NOs:2或7上第1284位的SNP导致Yitpi和Chara蛋白序列(SEQ ID NO:8)在第384位上具有天冬酰胺,而Baxter、Westonia和中国春蛋白序列(SEQ ID NO:3)在第384位上具有天冬氨酸。在较高和较低每穗小穗数基因型的蛋白质序列中的这些差异预期或预计不会显著改变APO1蛋白的功能。
表1:在每穗小穗数较低的品种(Yitpi和Chara)和每穗小穗数较高的品种(Baxter和Westonia)的APO1基因序列之间鉴定出的单核苷酸多态性(SNP)。*指内含子中的SNP。
Figure BDA0002578952440000431
也获取了四个亲本品种APO1基因上游约5kb核苷酸序列并对其进行了比较。表2列出了在每穗小穗数较低的基因型的序列和每穗小穗数较高的基因型的序列之间发现的单核苷酸多态性和插入/缺失。令人吃惊的是,每穗小穗数较低品种的基因型的序列与每穗小穗数较高品种的基因型的序列相比,在翻译起始点(对应于参考序列SEQ ID NO:1中的翻译起始点)上游约500bp处缺失了约115bp。该缺失预期可解释在这些品系中测量到的较低的表达。
表2:在每穗小穗数较低的品种(Yitpi和Chara)和每穗小穗数较高的品种(Baxter和Westonia)的APO1约5kb上游序列之间鉴定出的单核苷酸多态性(SNP)和插入/缺失(Indel)。
Figure BDA0002578952440000432
Figure BDA0002578952440000441
在较高和较低每穗小穗数基因型之间鉴别出的SNP和indel也可用作标记,以确定任何特定小麦基因型具有的APO1基因的等位基因。
在不同环境中种植在APO1-7A位点上形成对比的2个春小麦NIL品系(NILs)表明,与在相同遗传背景下携带导致每穗小穗数增加的APO1-7A等位基因(SPS+)的对比NIL(在相同试验中种植)相比,在澳大利亚种植时,导致每穗小穗数减少的APO1-7A等位基因(SPS-)与田间试验中产量显著增加相关(每个测试品系3至6个重复)。当相同的NIL在法国的田间试验种植时(每个测试品系3至6个重复),上述这种相关性被反转,其中与在相同遗传背景下携带APO1 SPS-等位基因的姊妹品系相比(在相同试验中种植),携带导致每穗小穗数增加的APO1等位基因(SPS+)的品系表现出产量显著增加。虽然产量效应被反转,但2个APO1-7A等位基因的每一个对SPS表型的效应在不同环境中是一致的。
实施例3:在具有初始较低每穗小穗数的小麦植物中验证APO1是每穗小穗数的决定基因(GM方法)
使用标准的重组DNA技术,将以下DNA区域可操作地连接:
a.CaMV35S启动子区域(P35S)
b.编码TaAPO1的DNA区域
c.代表3’非翻译序列OCS终止子的DNA区域
将重组基因引入到包含可选择性标记盒的T-DNA载体中,以产生T-DNA载体P35S::APO1。
使用标准的重组DNA技术,将以下DNA区域可操作地连接:
a.泛素启动子区域(PUbi)
b.编码TaAPO1的DNA区域
c.代表3’非翻译序列OCS终止子的DNA区域
将重组基因引入到包含可选择性标记盒的T-DNA载体中,以产生T-DNA载体PUbi::APO1。
使用标准的重组DNA技术,将以下DNA区域可操作地连接:
a.小麦品种Westonia的APO1的约5kb启动子区域(SEQ ID NO:4)
b.编码TaAPO1的DNA区域
c.代表3’非翻译序列OCS终止子的DNA区域
将重组基因引入到包含可选择性标记盒的T-DNA载体中,以产生T-DNA载体Papo1::APO1。
使用标准的技术,将三种T-DNA载体引入到包含辅助Ti质粒的农杆菌中,并用于小麦转化,基本上按Ishida等人2015 Agrobacterium protocols:第1卷,Methods inMolecular Biology,vol.1223:189-198中的描述进行。直接对Chara或Yitpi进行转化,或对任何其他品种进行转化,然后将其用作供体,通过杂交和选择将重组基因引入到Chara或Yitpi品种中。小麦品种Fielder用作转化效率的对照。也测定Fielder转化体的表型,以评估APO1基因过量表达对每穗小穗数的影响。Fielder转化体可用于将重组基因渗入到Chara或Yitpi中。
从每个转化获得独立事件,并按照实施例1中描述的方法分析表型。
实施例4:鉴别小麦中APO1同源基因
利用位于7A染色体上的APO1编码基因的核苷酸序列,可以在中国春小麦参考基因组中检测出分别位于7B和7D染色体上的同源核苷酸序列。这些基因编码区域的核苷酸序列分别包含在序列条目SEQ ID NO:15(7B Apo1)和16(7D Apo1)中。氨基酸序列包含在序列条目SEQ ID NO:17(7B Apo1)和SEQ ID NO:18(7D Apo1)中。根据7B Apo1的较短基因模式,核苷酸序列对应于SEQ ID NO:15中第130至1452位核苷酸,氨基酸序列对应于SEQ ID NO:17中第45至483位氨基酸。
编码序列的核苷酸序列的相应序列一致性显示于表3中,编码蛋白的氨基酸序列的相应序列一致性显示于表4中。
表3:Apo1同源基因之间的序列一致性百分比
Figure BDA0002578952440000471
表4:同源基因编码的Apo1蛋白之间的序列一致性百分比
Figure BDA0002578952440000472
B.冬小麦品系中APO1分析
实施例1:7A染色体上控制每穗小穗数的QTL的粗作图定位
表型分析
在2013/2014田间季节期间,种植来自Mackay等人(2014,G3-GenesGenomesGenetics,4(9):1603-1610)的冬小麦MAGIC群体完全重复试验的784个F7代MAGIC品系和它们的8个建立者。对于田间1600块地的1000块,收集10个代表性小麦穗,在室温下干燥。以200个RIL进行部分重复设计完成收集,MAGIC亲本一式两份重复收集。针对总的每穗小穗数(简称为“SPS”)形态形状,对小麦穗进行筛选。
在2014/2015年,对1091个F8 MAGIC品系和建立者的苗圃,用每块地6个代表性小麦穗样品,筛选了相同的穗性状。
使用Asreml-R 3.0(Gilmour等人1997,Journal of Agricultural Biologicaland Environmental Statistics Vol 2(3),269-293)最小化或消除由于田间变化导致的表型数据的空间效应。虽然mpwgaim QTL分析包允许对QTL进行一步拟合(one stagefitting),但本研究中使用的其他QTL分析包需要事先计算性状BLUPS(最佳线性无偏预测)。
RIL中总的小穗数在每穗18至30个小穗之间变化。MAGIC亲本大致可分为高表型和低表型组,其中与其他五个MAGIC亲本相比,Soissons、Robigus和Brompton具有减少的小穗数(图2)。Soissons的平均表型甚至低于Robigus和Brompton,仅比RIL(重组自交系)中记录的最小表型多2.6个小穗。Soissons的总小穗数减少与如下事实相关:与其他品种不同,它具有光周期不敏感的Ppd-D1等位基因,该基因赋予较早的开花和减少的小穗数(González等人,2005,Euphytica 146(3):253-269)。其他7个MAGIC亲本不携带此等位基因,因此Robigus和Brompton中小穗数量减少的基础与Ppd-D1等位基因无关。
遗传作图定位:
采用三种不同的方法进行QTL分析:(i)使用R包Asreml-R(Gilmour,1997),使用简单线性回归(平均值与标记分值),同时考虑MAGIC交错漏斗结构(MAGIC crossing funnelstructure,Mackay等人2014),(ii)使用R包bnlearn(Scutari等人,2014,Genetics,198(1):129-137))进行贝叶斯网络分析,和(iii)使用R包mpwgaim(Verbyla等人,2014,G3,4(9):1569-1584)进行全基因组平均区间作图定位。
使用来自Gardner等人,2016(2016,Plant Biotechnol J,14(6):1406-1417)的标记基因型及其相应的染色体分组。
所有三种方法都鉴定出了7A染色体上MAGICmapv14.4上257.05厘摩至257.21厘摩之间的主效QTL,以下称为QTsn.jbl-7A(表5)。
表5:使用回归[17]、贝叶斯网络分析[23]或全基因组区间作图定位[22]鉴定的总小穗数(SPS)显著QTL的总结。回归分析中的峰值标记是具有最低或共同最低p值的标记。显著性标记可以从所显示的峰值标记进一步向外延伸。Mpwgaim将p值小于0.0005报告为0。回归q值0为小于2.2E-16。缩写:染色体(chr),厘摩(cM)。
Figure BDA0002578952440000491
标记信息
CAP7_c2350_105(https://triticeaetoolbox.org/wheat/view.php?table=markers&name=CAP7_c2350_105)
TAGTAAGCTCTTCAACGAGGATGGATGTTGTGTAATTTGGACAAGTGCGA[C/T]GTATGTCACATCTTTTTTTTAATGATCCTAATCTATGATCGAAGTTCGTT(SEQ ID NO:23).
wsnp_Ku_rep_c104159_90704469
https://triticeaetoolbox.org/wheat//view.php?table=markers&name=IWA7409
TGCCGGCCTGCAAGCCGATCCTTACTCCAAARTGGGTTGTCTCGGTGTTTTTCCTTGTCGGCGTCGTCTTTGTCCCAGTTGGTGTCGTTTCGCTACTAGC[C/T]gcacaagatgttgttgagatcattgatcggtatgatcatgcatgtgtcccacctaacatgactgataacaagcttgcgtacatccagaatgagactatac(SEQ ID NO:24).
标记BS00021657_51
https://triticeaetoolbox.org/wheat//view.php?table=markers&name=BS00021657_51
TCCACAAGAAAAGAGCAAGACACTCCGGCCGTTGTAGAGCTGATGGTGCG[C/T]GGTGATTTCACCATAGACATGGTAGACGGCGCCCGTCCTCGTGGCATCAT(SEQ ID NO:25).
标记BS00066288_51
https://triticeaetoolbox.org/wheat///view.php?table=markers&name=BS00066288_51
GGCACGTACTCCCTTTCAGGACCCGACGAACAACGGCAATTCAGGTAAAT[A/G]CATACATCACGTACTCTTACATACTTCAATCTTGTAAATCCATAATATAT(SEQ ID NO:26).
标记BS00039502_51
https://triticeaetoolbox.org/wheat//view.php?table=markers&name=BS00039502_51
ATCCCAGGGGGCGAGATTCAGAGCTTCTCGGCCATCCTGCGCAGCAGCGC[A/G]GCCCCTAGTGGCTCCTCGGTCGGGTTCTTGGTGAGCCATGCCTGCGCGGC(SEQ ID NO:27).
使用mpwgaim,在62.64的-log10(p),QTsn.jbl-7A解释了MAGIC群体中显著35%的SPS遗传变异。2015年从MAGIC苗圃收集的小穗表型确认存在该QTL,使用mpwgaim,SPS的-log10(p)为37.82(表6)。
表6:2015年MAGIC苗圃总小穗数的Mpwgaim QTL结果。缩写:LOGP为–log10(p),%Var为所解释的遗传变异的百分比。
Figure BDA0002578952440000501
在2014和2015年,Brompton和Robigus单倍型导致后代的SPS相对减少了大于1.5个小穗数(表7)。
表7:QTsn.jbl-7A的每穗小穗总数QTL总结。采用2014年NIABMAGIC产量试验表型数据。在mpwgaim分析中估计亲本单倍型对RILBLUP的效应。缩写:LOGP为–log10(p)。2和0为所显示的各标记的等位基因代码。
Figure BDA0002578952440000511
该0.16厘摩遗传图谱区间对应于预测的物理长度约2.3Mb和侧翼标记CAP7_c2350_105(SEQ ID NO:23)与wsnp_Ku_rep_c104159_90704469(SEQ ID NO:24)。增加的总小穗数与wsnp_Ku_rep_c104159_90704469标记最紧密共分离。
除了QTsn.jbl-7A之外,使用mpwgaim进行的QTL分析确认了7B上针对2014年总小穗数(LOGP 3.07)的另一个QTL(QTsn.jbl-7B),其位于侧翼标记BS00066288_51(144.34厘摩;SEQ ID NO:26)和BS00039502_51(144.50厘摩;SEQ ID NO:27)之间,定义了与7A QTL直接同源的5Mb区间(参见表8)。
表8:QTsn.jbl-7B每穗小穗总数QTL总结。采用2014年MAGIC产量试验表型数据。在mpwgaim分析中估计亲本单倍型对RIL BLUP的效应。缩写:LOGP为–log10(p)。2和0为所显示的各标记的等位基因代码。
Figure BDA0002578952440000512
Figure BDA0002578952440000521
实施例2:候选基因APO1的鉴定
QTsn.jbl-7A中的25个候选基因
在这2.3Mb的区间内有25个注释的基因。直系同源物鉴定揭示了7个基因具有良好注释的直系同源物和功能:g109255(AtFTT/AtDTX35)、g109235(AtRAN1)、g109240(AtCHLI)、g109250(AtAAH)、g109253(AtSYP132)、g109256(AtALIS4)和g109251(AtUFO)。AtUFO是水稻APO1(ABERRANT PANICLE ORGANIZATION 1)的直系同源基因。另有10个基因具有冗余注释,为At5g07610相关的F盒蛋白。每个都包含一个F盒结构域,它们之间显示出高达72.5%的相当高的DNA序列保守性。
QTsn.jbl-7A的共线性分析揭示了APO1为候选基因
除了QTsn.jbl-7A(表8)之外,使用mpwgaim进行的QTL分析确认了7B上针对2014年总小穗数(LOGP 3.07)的另一个QTL(QTsn.jbl-7B),其位于侧翼标记BS00066288_51(144.34厘摩)和BS00039502_51(144.50厘摩)之间,定义了与7A QTL直接同源的5Mb区间。
在7B上的该QTL(QTsn.jbl-7B)的5Mb区间内鉴别出了39个基因,其中15个与7A同源(图4)。在15个同源基因中,没有一个基因具有PROVEAN预测的可识别的有害编码序列突变,这可以解释该QTL。
QTsn.jbl-7A和QTsn.jbl-7B与水稻6号染色体具有共线性,后者包含四个位置保守的直系同源基因chr7A.g109235(AtRAN1)、g109250(AtAAH)、g109251(APO1/AtUFO)和g109256(AtALIS4)。
与QTsn.jbl-7A共分离的TaAPO1-7A的序列多态性
与Claire和中国春相比,Robigus中TaAPO1-7A在预测的转录起始点上游具有两个大InDel:转录起始点(TSS)565bp上游的115bp缺失和约7Kb上游(转录起始点上游7565bp,起始密码子上游7513bp,参考SEQID NO:1的序列(CS ref.序列))的约5至7.5Kb的插入(7343bp,但排除N/X-runs后为4970bp,大小依所用的参考序列的质量而变化)。115bp的缺失也存在于小麦品种Cadenza和Paragon中,在35k育种者阵列中与BA00589872共分离。由于Robigus、Cadenza和Paragon的TGAC组装中一些丢失的碱基召回(base calls),因此比较难以表征在Robigus、Cadenza和Paragon中TSS上游约7Kb的长片段插入,但类似的大片段(>5Kb)插入也存在于品种Yitpi和Chara中。Claire的启动子在2346bp上游携带一个CArG盒(CC(A/T)6GG),这不存在于Robigus中。约5至7.5kb的插入也携带一个CArG盒(图3)。此外,Robigus具有和表2中品种Yipti/Chara相同的SNP和indel,而Claire具有与表2中Westonia相同的SNP和indel。
当在其它小麦品系中比较APO1基因上游约5kb核苷酸序列时,表2中所示的变异也出现在Robigus、Claire、Cadenza、Paragon和Fielder中。Claire具有与Westonia相同的SNP和indel等位基因,Fielder具有与Baxter相同的SNP和indel等位基因。Robigus、Cadenza和Paragon具有与Yitpi/Chara相同的SNP和indel等位基因。这证实,与具有较高每穗小穗数的冬小麦品种基因型的序列相比,具有较低每穗小穗数的冬小麦品种基因型的序列,在翻译起始点(参考SEQ ID NO:1翻译起始点)上游约500bp,缺失约115bp。该启动子缺失预期可解释这些品系中所测量的较低表达式水平。在Robigus、Cadenza和Paragon中鉴别的约5至7.5Kb的上游插入(TSS上游7565bp)也是Yitpi和Chara中共同的。
与Robigus中TaAPO1-7A的SNP相关的氨基酸变化(F20C,D357N)通过PROVEAN预测为无害的。
实施例3:TaAPO1-7A表达与总小穗数相关
针对MAGIC亲本Alchemy、Brompton、Claire、Hereward、Rialto、Robigus和Xi-19,从生长阶段gS32(Zadoks等人,1974,Weed Research,14(6):415-421)的2017NIAB MAGIC苗圃的分蘖解剖收集了全穗样本,三个重复。在收集日期,Soissons已提前进入gS34。解剖后,将穗立即冷冻在液氮中。使用Geneious中的Primer3(Koressaar等人,2007,Bioinformatics,23(10):1289-1291)插件设计引物。用5毫米不锈钢珠在TissueLyser II(QIAGEN,UK)上以20Hz在冷冻状态下对样品进行两次匀浆化两分钟。使用RNeasy微提取试剂盒(QIAGEN,英国)提取RNA,使用无RNA酶的DNA酶(QIAGEN,英国)在柱子上消化DNA。使用无RNA酶/DNA酶的水洗脱RNA,使用NanoDrop 1000分光光度计(Thermo Scientific,英国)测定浓度。使用ezDNase(Invitrogen,英国)进行第二次DNA消化,然后使用SuperScript IVVilo Master Mix cDNA合成试剂盒(Invitrogen,英国),从500纳克RNA合成cDNA。使用Rotor-Gene SYBR Green PCR试剂盒,在装配有Rotor-Disc 100的Rotor-Gene Q实时PCR仪上,进行RT-qPCR。所有反应在10微升最终反应体积中技术性重复进行,对于APO1,加入终浓度为1M的甜菜碱溶液(Sigma-Aldrich)以克服扩增子高GC含量。通过对cDNA样品进行八个点的两倍系列稀释,确定引物对的扩增效率。为了确认RT-qPCR反应的特异性,检查每个反应的熔解曲线是否只有一个单峰。相对于从Seedstor.ac.uk获得的基因组nullitetrasomic DNA(WPGS1289-PG-1、WPGS1296-PG-1、WPGS1301-PG-1),确认了测定的特异性。使用每次测定计算的扩增效率,相对于看家基因TaRP15(Shaw等人,2012,Plant J,71(1):71-84)和Ta2291(Paolacci等人,2009,BMC Molecular Biology,10(1):11)表达,计算了APO1的表达水平。
发现Xi-19中TaAPO1的表达是所有MAGIC建立者中最高的。Xi-19单倍体也与2014年建立者对QTsn.jbl-7A的正向效应在统计上显著相关(表8)。
图5显示了所研究的基因型中APO1表达水平结果。对比品系Brompton和Xi-19在APO1转录本丰度上具有高达3.8倍的差异。
Figure IDA0002578952500000011
Figure IDA0002578952500000021
Figure IDA0002578952500000031
Figure IDA0002578952500000041
Figure IDA0002578952500000051
Figure IDA0002578952500000061
Figure IDA0002578952500000071
Figure IDA0002578952500000081
Figure IDA0002578952500000091
Figure IDA0002578952500000101
Figure IDA0002578952500000111
Figure IDA0002578952500000121
Figure IDA0002578952500000131
Figure IDA0002578952500000141
Figure IDA0002578952500000151
Figure IDA0002578952500000161
Figure IDA0002578952500000171
Figure IDA0002578952500000181
Figure IDA0002578952500000191
Figure IDA0002578952500000201
Figure IDA0002578952500000211
Figure IDA0002578952500000221
Figure IDA0002578952500000231
Figure IDA0002578952500000241
Figure IDA0002578952500000251
Figure IDA0002578952500000261
Figure IDA0002578952500000271
Figure IDA0002578952500000281
Figure IDA0002578952500000291
Figure IDA0002578952500000301
Figure IDA0002578952500000311
Figure IDA0002578952500000321

Claims (30)

1.参与决定小麦每穗小穗数的蛋白质,该蛋白质与水稻的“Aberrant panicleorganization 1”(APO1)直系同源。
2.根据权利要求1的蛋白质,其包含选自以下的氨基酸序列:
a.SEQ ID NO:3、8或29的氨基酸序列或其功能变体,或
b.与SEQ ID NO:3、8或29的氨基酸序列具有至少85%的序列一致性的氨基酸序列,或其功能变体。
3.编码根据权利要求1或2的蛋白质的分离的核酸。
4.根据权利要求3的核酸,其包含选自以下的核苷酸序列:
a.SEQ ID NO:1或SEQ ID NO:2之任一的核苷酸序列,
b.与SEQ ID NO:1或SEQ ID NO:2之任一的核苷酸序列具有至少80%的一致性的核苷酸序列,
c.SEQ ID NO:6、7或28的核苷酸序列,
d.具有与a)或b)的核酸之任一的互补序列的核酸。
5.根据权利要求3或4的核酸,其位于小麦7A染色体上的一个区间中,该区间包含中国春参考基因组序列的第674,081,462位核苷酸和第674,082,918位核苷酸之间的核苷酸序列。
6.重组基因,其包含植物可表达启动子,如异源植物可表达启动子,可操作地连接的编码权利要求1或2的蛋白质的核酸序列、和可选地转录终止和多聚腺苷酸化序列,优选在植物中起作用的转录终止和多聚腺苷酸化序列。
7.权利要求6的重组基因,其中所述核酸选自:
a.具有SEQ ID NO:1、2或SEQ ID NO:28之任一的核苷酸序列的核酸序列,
b.与SEQ ID NO:1、2或SEQ ID NO:28之任一的核苷酸序列具有至少80%的一致性的核苷酸序列,
c.具有与a)或b)的核酸之任一的互补序列的核酸。
8.权利要求6或7的重组基因,其中所述植物可表达启动子选自组成型启动子、诱导性启动子、组织特异性启动子。
9.权利要求6至8之任一的重组基因,其中所述植物可表达启动子是CaMV35S启动子或泛素启动子。
10.包含权利要求6至9之任一的重组基因的载体。
11.包含权利要求6至9之任一的重组基因或权利要求10的载体的宿主细胞。
12.权利要求11的宿主细胞,其是细菌或小麦植物细胞。
13.由根据权利要求12的植物细胞组成的小麦植物、植物部分或种子。
14.生产具有改变的每穗小穗数的小麦植物的方法,其包括改变所述小麦植物中根据权利要求1或2的蛋白质之丰度的步骤。
15.根据权利要求14的方法,其中所述蛋白质的丰度增加,且与其中所述蛋白质的丰度没有改变的小麦植物的每穗小穗数相比,每穗小穗数增加。
16.根据权利要求14的方法,其中所述蛋白质的丰度减少,且与其中所述蛋白质的丰度没有改变的小麦植物的每穗小穗数相比,每穗小穗数减少。
17.根据权利要求14或15的方法,其中所述蛋白的丰度通过向所述小麦植物提供如下基因来增加:
a.根据权利要求6至9之任一的重组基因,或
b.编码根据权利要求1或2的蛋白质的异源基因,其中所述异源基因的表达高于相应的内源基因。
18.根据权利要求17的方法,其中所述异源基因在翻译起始点上游约500bp包含具有SEQ ID NO:5的第4399位至4513位核苷酸的核苷酸序列或与其具有至少90%的序列一致性的核苷酸序列。
19.根据权利要求14或16的方法,其中所述蛋白的丰度通过向所述小麦植物提供如下基因来降低:
a.编码根据权利要求1或2的蛋白质的异源基因,其中所述异源基因的表达低于内源基因,或
b.编码根据权利要求1或2的蛋白质的内源基因之突变等位基因。
20.根据权利要求19的方法,其中所述异源基因由于缺乏SEQ ID NO:5的第4399位核苷酸至第4513位核苷酸的核苷酸序列,而表达较低。
21.根据权利要求19的方法,其中所述突变等位基因是敲除等位基因。
22.根据权利要求17至21的方法,其中所述提供的步骤包括通过转化、杂交、回交、渗入、靶向基因组编辑或诱变来提供。
23.由权利要求13的种子生产的小麦产品,其中所述小麦产品包括或是粗粉、研磨的种子、面粉、或薄片。
24.权利要求23的小麦产品,其中所述小麦产品包含人工核酸,所述核酸产生对SEQ IDNO:1、2、6、7或28之任一的核苷酸序列或与这些序列之任何具有至少80%一致性的序列具有诊断性或特异性的扩增子。
25.生产权利要求23的小麦产品的方法,其包括获得包含人工核酸的种子和从所述种子生产所述小麦产品,其中所述人工核酸来自SEQ ID NO:1、2、6、7或28之任一的核苷酸序列或与这些序列之任一具有至少80%一致性的序列。
26.生产小麦面粉、全麦粉、淀粉、淀粉粒或小麦麸的方法,该方法包括获得权利要求13的包含人工Apo1核酸的种子,和加工种子以生产面粉、全麦粉、淀粉、淀粉粒或小麦麸。
27.通过权利要求26的方法生产的或包含人工核酸的小麦面粉、全麦粉、淀粉、淀粉粒或小麦麸,其中所述人工核酸来自SEQ ID NO:1、2、6、7或28之任一的核苷酸序列或与这些序列之任一具有至少80%一致性的序列。
28.生产食品的方法,其包括将权利要求13的种子或来自权利要求27的小麦面粉、全麦粉、淀粉、淀粉粒或小麦麸与至少一种其他食品配料混合来生产食品。
29.鉴别和/或选择包含对每穗小穗数有正贡献的基因之等位基因的小麦植物的方法,其包括鉴别所述小麦植物的基因组中存在如下核酸的步骤,其中所述核酸具有SEQ ID NO:5的第4399位核苷酸至第4513位核苷酸的核苷酸序列或与其具有至少90%的序列一致性的核苷酸序列。
30.鉴别和/或选择包含对每穗小穗数有负贡献的基因之等位基因的小麦植物的方法,其包括鉴别所述小麦植物的基因组中缺乏如下核酸的步骤,其中所述核酸具有SEQ ID NO:5的第4399位核苷酸至第4513位核苷酸的核苷酸序列。
CN201980008053.9A 2018-01-12 2019-01-11 小麦7a染色体上决定每穗小穗数QTL的基因 Pending CN111566121A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18151432 2018-01-12
EP18151436 2018-01-12
EP18151436.5 2018-01-12
EP18151432.4 2018-01-12
PCT/EP2019/050711 WO2019138083A1 (en) 2018-01-12 2019-01-11 Gene underlying the number of spikelets per spike qtl in wheat on chromosome 7a

Publications (1)

Publication Number Publication Date
CN111566121A true CN111566121A (zh) 2020-08-21

Family

ID=65023906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980008053.9A Pending CN111566121A (zh) 2018-01-12 2019-01-11 小麦7a染色体上决定每穗小穗数QTL的基因

Country Status (8)

Country Link
US (1) US20200362366A1 (zh)
EP (1) EP3737690A1 (zh)
CN (1) CN111566121A (zh)
AU (1) AU2019207409B2 (zh)
BR (1) BR112020014168A2 (zh)
CA (1) CA3086620A1 (zh)
MX (1) MX2020007466A (zh)
WO (1) WO2019138083A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11866719B1 (en) * 2018-06-04 2024-01-09 Inari Agriculture Technology, Inc. Heterologous integration of regulatory elements to alter gene expression in wheat cells and wheat plants
CN111118191B (zh) * 2019-09-30 2022-04-22 山西农业大学 小麦穗顶部小穗结实性主效qtl的kasp分子标记及其应用
CN112779350A (zh) * 2021-02-07 2021-05-11 四川农业大学 与小麦小穗粒数QTLQGns.sicau-2D紧密连锁的分子标记及其应用
CN114410817B (zh) * 2022-01-10 2022-11-01 河北师范大学 小麦每穗小穗数性状相关snp位点及其应用
CN115044697B (zh) * 2022-05-31 2023-03-21 江苏省农业科学院 与小麦籽粒don毒素积累相关的分子标记及其引物与应用
CN116769961B (zh) * 2023-07-28 2024-01-26 四川农业大学 利用多-筛-混-定四步法开发的小麦每穗小穗数qtl连锁分子标记及应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105525008A (zh) * 2016-01-27 2016-04-27 四川农业大学 小麦小穗数qtl连锁的ssr分子标记及其应用
CN106086034A (zh) * 2016-06-18 2016-11-09 南京农业大学 一个小麦穗型发育调控基因wbh1及其分子标记和应用
CN106509611A (zh) * 2016-11-07 2017-03-22 青州荣美尔生物科技有限公司 一种全麦粉的制作方法
CN106866806A (zh) * 2017-03-15 2017-06-20 中国科学院遗传与发育生物学研究所 蛋白质TaVRS1‑2B及其编码基因与应用

Family Cites Families (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4601978A (en) 1982-11-24 1986-07-22 The Regents Of The University Of California Mammalian metallothionein promoter system
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
DE3484215D1 (de) 1983-01-17 1991-04-11 Monsanto Co Chimaerische gene geeignet zur expression in pflanzenzellen.
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5359142A (en) 1987-01-13 1994-10-25 Monsanto Company Method for enhanced expression of a protein
US5196525A (en) 1987-01-13 1993-03-23 University Of British Columbia DNA construct for enhancing the efficiency of transcription
US5322938A (en) 1987-01-13 1994-06-21 Monsanto Company DNA sequence for enhancing the efficiency of transcription
US5164316A (en) 1987-01-13 1992-11-17 The University Of British Columbia DNA construct for enhancing the efficiency of transcription
DE68918494T2 (de) 1988-05-17 1995-03-23 Lubrizol Genetics Inc Pflanzliches Ubiquitinpromotorsystem.
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
FR2673642B1 (fr) 1991-03-05 1994-08-12 Rhone Poulenc Agrochimie Gene chimere comprenant un promoteur capable de conferer a une plante une tolerance accrue au glyphosate.
ATE382094T1 (de) 1991-09-24 2008-01-15 Keygene Nv Primer, sätze und restriktions fragmente und dessen benutzung in selektive restriktionsfragmentenamplifikation
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
ES2164659T3 (es) 1992-04-13 2002-03-01 Syngenta Ltd Construcciones de dna y plantas que las incorporan.
WO1994018313A1 (en) 1993-02-12 1994-08-18 The Johns-Hopkins University Functional domains in flavobacterium okeanokoites (foki) restriction endonuclease
US5512483A (en) 1993-05-21 1996-04-30 Mcgill University Expression vectors responsive to steroid hormones
US5464758A (en) 1993-06-14 1995-11-07 Gossen; Manfred Tight control of gene expression in eucaryotic cells by tetracycline-responsive promoters
AU689311B2 (en) 1994-08-30 1998-03-26 Commonwealth Scientific And Industrial Research Organisation Plant transcription regulators from circovirus
US6211431B1 (en) 1994-08-30 2001-04-03 Commonwealth Scientific And Industrial Research Organization Plant transcription regulators from circovirus
PL323587A1 (en) 1995-05-26 1998-04-14 Zeneca Ltd Gene changing-over system including edisone receptor
BR9709814A (pt) 1996-06-20 1999-08-10 Scripps Research Inst Promotores do vírus mosaico na nervura da mandioca e usos dos mesmos
FR2771104B1 (fr) 1997-11-17 2000-12-08 Rhone Poulenc Agrochimie Gene chimere ayant un promoteur lumiere dependant conferant la tolerance aux inhibiteurs del'hppd
US6063985A (en) 1998-01-28 2000-05-16 The Rockefeller University Chemical inducible promotor used to obtain transgenic plants with a silent marker
US6784340B1 (en) 1998-01-28 2004-08-31 The Rockefeller University Chemical inducible promoter used to obtain transgenic plants with a silent marker
EP1259537A4 (en) 2000-02-24 2004-05-12 Salk Inst For Biological Studi GENE EXPRESSION SYSTEM BASED ON CHIMERAL RECEPTORS
US6291666B1 (en) 2000-05-12 2001-09-18 The United States Of America As Represented By The Secretary Of Agriculture Spike tissue-specific promoter
DE10131786A1 (de) 2001-07-04 2003-01-16 Sungene Gmbh & Co Kgaa Rekombinationssysteme und Verfahren zum Entfernen von Nukleinsäuresequenzen aus dem Genom eukaryotischer Organismen
NZ514547A (en) 2001-09-28 2004-10-29 Duncan Stanley Plastid alph-amylase protein and nucleic acids encoding same and methods for altering the starch content of a plant
WO2003080809A2 (en) 2002-03-21 2003-10-02 Sangamo Biosciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
FR2848571A1 (fr) 2002-12-12 2004-06-18 Bayer Cropscience Sa Cassette d'expression codant pour une hydroxy-phenyl pyruvate dioxygenase et plantes contenant un tel gene tolerantes aux herbicides
EP3202899B1 (en) 2003-01-28 2020-10-21 Cellectis Custom-made meganuclease and use thereof
US8106180B2 (en) 2003-08-07 2012-01-31 Whitehead Institute For Biomedical Research Methods and products for expression of micro RNAs
CA2541914C (en) 2003-10-09 2012-07-24 E.I. Du Pont De Nemours And Company Gene silencing by using micro-rna molecules
JP2005278499A (ja) * 2004-03-30 2005-10-13 Japan Science & Technology Agency 植物の茎頂分裂組織の転換の時間的制御に関わる新規遺伝子、及びその利用
AU2006203892B2 (en) 2005-01-07 2011-03-24 State Of Oregon Acting By And Through The State Board Of Higher Education On Behalf Of Oregon State University Method to trigger RNA interference
WO2006105946A2 (en) 2005-04-04 2006-10-12 Bayer Bioscience N.V. Methods and means for removal of a selected dna sequence
NZ597299A (en) 2005-08-26 2013-03-28 Dupont Nutrition Biosci Aps Use of a cas gene in combination with CRISPR repeats for modulating resistance in a cell
EP2357226B1 (en) 2005-10-18 2012-03-14 Precision Biosciences Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity
RU2010101882A (ru) 2007-06-22 2011-07-27 Киджин Н.В. (Nl) Направленная нуклеотидная замена при применении улучшенных модифицированных олигонуклеотидов
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
DK2816112T3 (en) 2009-12-10 2018-11-19 Univ Minnesota TAL effector-mediated DNA modification
JP5925701B2 (ja) 2010-03-08 2016-05-25 モンサント テクノロジー エルエルシー 植物における遺伝子調節のためのポリヌクレオチド分子
EP2392208B1 (en) 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
US20130196320A1 (en) 2010-06-15 2013-08-01 Cellectis Method for improving cleavage of dna by endonuclease sensitive to methylation
WO2012093833A2 (en) 2011-01-03 2012-07-12 Toolgen Incorporation Genome engineering via designed tal effector nucleases
ES2728436T3 (es) 2011-04-05 2019-10-24 Cellectis Método para la generación de TALE-nucleasas compactas y usos de la mismas
AU2012354062B2 (en) 2011-12-16 2017-09-07 Targetgene Biotechnologies Ltd Compositions and methods for modifying a predetermined target nucleic acid sequence
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
MA37663B1 (fr) 2012-05-25 2019-12-31 Univ California Procédés et compositions permettant la modification de l'adn cible dirigée par l'arn et la modulation de la transcription dirigée par l'arn
US20160281103A1 (en) * 2012-07-06 2016-09-29 National Institute Of Agrobiological Sciences Wheat with increased number of grains and method for producing the same, and agent for increasing the number of wheat grains
WO2014022702A2 (en) 2012-08-03 2014-02-06 The Regents Of The University Of California Methods and compositions for controlling gene expression by rna processing
KR102182847B1 (ko) 2012-10-23 2020-11-27 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
EP3617309A3 (en) 2012-12-06 2020-05-06 Sigma Aldrich Co. LLC Crispr-based genome modification and regulation
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
KR20150105634A (ko) 2012-12-12 2015-09-17 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작을 위한 개선된 시스템, 방법 및 효소 조성물의 유전자 조작 및 최적화
DK2931898T3 (en) 2012-12-12 2016-06-20 Massachusetts Inst Technology CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS
IL293526A (en) 2012-12-12 2022-08-01 Harvard College Providing, engineering and optimizing systems, methods and compositions for sequence manipulation and therapeutic applications
WO2014093595A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
PT2771468E (pt) 2012-12-12 2015-06-02 Harvard College Engenharia de sistemas, métodos e composições-guia otimizadas para manipulação de sequências
WO2014093709A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP3064585B1 (en) 2012-12-12 2020-02-05 The Broad Institute, Inc. Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
ES2741951T3 (es) 2012-12-17 2020-02-12 Harvard College Modificación por ingeniería genética del genoma humano guiada por ARN
CN113005148A (zh) 2013-01-16 2021-06-22 爱默蕾大学 Cas9-核酸复合物及其相关用途
EP2999788B1 (en) 2013-05-22 2020-07-08 Northwestern University Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
US20160122774A1 (en) 2013-05-29 2016-05-05 Cellectis A method for producing precise dna cleavage using cas9 nickase activity
AU2014281027A1 (en) 2013-06-17 2016-01-28 Massachusetts Institute Of Technology Optimized CRISPR-Cas double nickase systems, methods and compositions for sequence manipulation
IL282489B (en) 2013-07-10 2022-07-01 Harvard College Cas9 proteins are orthogonal to the regulation and editing of guided genes - RNA
US20160298096A1 (en) 2013-11-18 2016-10-13 Crispr Therapeutics Ag Crispr-cas system materials and methods
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
US20150166985A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting von willebrand factor point mutations
US9963689B2 (en) 2013-12-31 2018-05-08 The Regents Of The University Of California Cas9 crystals and methods of use thereof
CN106460003A (zh) 2014-04-08 2017-02-22 北卡罗来纳州立大学 用于使用crispr相关基因rna引导阻遏转录的方法和组合物
EP3129488B1 (en) 2014-04-10 2019-06-12 The Regents of The University of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
CN106922154B (zh) 2014-08-06 2022-01-07 基因工具股份有限公司 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑
WO2016028682A1 (en) 2014-08-17 2016-02-25 The Broad Institute Inc. Genome editing using cas9 nickases
US10450584B2 (en) 2014-08-28 2019-10-22 North Carolina State University Cas9 proteins and guiding features for DNA targeting and genome editing
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105525008A (zh) * 2016-01-27 2016-04-27 四川农业大学 小麦小穗数qtl连锁的ssr分子标记及其应用
CN106086034A (zh) * 2016-06-18 2016-11-09 南京农业大学 一个小麦穗型发育调控基因wbh1及其分子标记和应用
CN106509611A (zh) * 2016-11-07 2017-03-22 青州荣美尔生物科技有限公司 一种全麦粉的制作方法
CN106866806A (zh) * 2017-03-15 2017-06-20 中国科学院遗传与发育生物学研究所 蛋白质TaVRS1‑2B及其编码基因与应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"NCBI Reference Sequence: XP_020154668.1", 《NCBI》 *

Also Published As

Publication number Publication date
CA3086620A1 (en) 2019-07-18
WO2019138083A1 (en) 2019-07-18
AU2019207409A1 (en) 2020-07-09
MX2020007466A (es) 2020-11-12
AU2019207409B2 (en) 2023-02-23
EP3737690A1 (en) 2020-11-18
BR112020014168A2 (pt) 2020-12-08
US20200362366A1 (en) 2020-11-19

Similar Documents

Publication Publication Date Title
AU2019207409B2 (en) Gene underlying the number of spikelets per spike qtl in wheat on chromosome 7a
CN106164272B (zh) 修饰的植物
CA2892012A1 (en) Mutations in solanaceae plants that modulate shoot architecture and enhance yield-related phenotypes
CN107164401A (zh) 一种基于CRISPR/Cas9技术制备水稻OsPIL15突变体的方法及应用
Jiang et al. Re‐acquisition of the brittle rachis trait via a transposon insertion in domestication gene Q during wheat de‐domestication
US20230357788A1 (en) Enhanced disease resistance of crops by downregulation of repressor genes
CA2992799A1 (en) Modified plants
JP2013531502A (ja) グルコシノレート輸送タンパク質及びその使用
JP2018516601A (ja) グルテン減少穀粒及びその組成物
US20190249185A1 (en) Compositions and Methods for Improving Crop Yields Through Trait Stacking
WO2019129145A1 (en) Flowering time-regulating gene cmp1 and related constructs and applications thereof
US11624074B2 (en) Mutations in solanaceae plants that modulate shoot architecture and enhance yield-related phenotypes
US10266840B2 (en) Sorghum yield enhancement gene
JP2020521444A (ja) Madsボックス遺伝子における突然変異及びその使用
WO2020243361A9 (en) Methods and compositions for generating dominant short stature alleles using genome editing
Fiaz et al. Application of genome engineering methods for quality improvement in important crops
CN115843314B (zh) 获得具有增加的白粉病抗性的小麦的方法
US20220298527A1 (en) Compositions and methods for improving crop yields through trait stacking
Gimenez Regulation of (1, 3; 1, 4)-β-glucan Synthesis in Barley (Hordeum Vulgare L.).
CA3229024A1 (en) Wheat with reduced susceptibility to late-maturity alpha-amylase
WO2023187758A1 (en) Compositions and methods comprising plants with modified organ size and/or protein composition
EP4388111A1 (en) Wheat with reduced susceptibility to late-maturity alpha-amylase

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination