CN111989403A - Mads盒蛋白以及在植物中改善农艺特征 - Google Patents

Mads盒蛋白以及在植物中改善农艺特征 Download PDF

Info

Publication number
CN111989403A
CN111989403A CN201980026424.6A CN201980026424A CN111989403A CN 111989403 A CN111989403 A CN 111989403A CN 201980026424 A CN201980026424 A CN 201980026424A CN 111989403 A CN111989403 A CN 111989403A
Authority
CN
China
Prior art keywords
plant
polypeptide
sequence
polynucleotide
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980026424.6A
Other languages
English (en)
Inventor
C·M·拉罗塔
R·梅洛
B·沈
C·西蒙斯
武景瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
Original Assignee
Pioneer Hi Bred International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc filed Critical Pioneer Hi Bred International Inc
Priority claimed from PCT/US2019/027782 external-priority patent/WO2019204373A1/en
Publication of CN111989403A publication Critical patent/CN111989403A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • C12N15/8269Photosynthesis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

提供了包含编码多肽的多核苷酸的组合物。还提供了包含所述多核苷酸的重组DNA构建体、植物、植物细胞、种子、谷物,以及在编码多肽的基因组基因座处包含遗传修饰的植物、植物细胞、种子、谷物。另外,本文还提供了在植物中使用所述多核苷酸和遗传修饰的各种方法,诸如用于在植物中调控表达水平的方法以及用于增加植物产量的方法。

Description

MADS盒蛋白以及在植物中改善农艺特征
以电子方式递交的序列表的引用
所述序列表的官方副本经由EFS-Web以ASCII格式的序列表以电子方式提交,文件名为7845WOPCT_ST25.txt,创建于2019年4月11日,且具有118千字节的大小,并与本说明书同时提交。包含在该ASCII格式的文件中的序列表是本说明书的一部分并且以其全文通过引用并入本文。
技术领域
本公开涉及用于提高植物产量的组合物和方法。
背景技术
全球对农作物的需求和消费正在迅速增长。因此,需要开发新的组合物和方法以增加植物产量。本发明提供此类组合物和方法。本文提供了多种植物MADS盒多肽。
发明内容
本文提供了编码多肽的多核苷酸,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸或全长序列具有至少95%至99%同一性的氨基酸序列。
还提供了重组DNA构建体,其包含可操作地连接到编码多肽的多核苷酸的调节元件,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列或全长序列具有至少80%同一性的氨基酸序列。在某些实施例中,所述调节元件是异源启动子,诸如例如,GOS2中等组成型启动子。
提供了植物细胞、植物、和种子,其包含编码多肽的多核苷酸或重组DNA构建体,所述重组DNA构建体包含可操作地连接到编码多肽的多核苷酸的调节元件。在某些实施例中,所述调节元件是异源启动子。在某些实施例中,所述植物和/或种子来自单子叶植物。在某些实施例中,所述植物是单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。
进一步提供了在基因组基因座处包含靶向遗传修饰的植物细胞、植物、和种子,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少80%同一性的氨基酸序列,其中所述遗传修饰增加所编码的多肽的水平和/或活性。在某些实施例中,所述遗传修饰选自由以下组成的组:插入、缺失、单核苷酸多态性(SNP)、和多核苷酸修饰。在某些实施例中,所述靶向遗传修饰存在于编码多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。在某些实施例中,所述植物和/或种子来自单子叶植物。在某些实施例中,所述植物是单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。
提供了用于通过在可再生植物细胞中表达重组DNA构建体并产生所述植物来增加植物产量的方法,所述重组DNA构建体包含可操作地连接到编码多肽的多核苷酸的调节元件,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少80%同一性的氨基酸序列;其中所述植物在其基因组中包含所述重组DNA构建体。在某些实施例中,所述调节元件是异源启动子。在某些实施例中,所述植物是单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。在某些实施例中,所述产量是籽粒产量。
进一步提供了用于通过在可再生植物细胞中在基因组基因座处引入靶向遗传修饰并产生所述植物来增加植物产量的方法,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列或全长序列具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一性的氨基酸序列;其中所编码的多肽的水平和/或活性在所述植物中增加。在某些实施例中,所述遗传修饰使用基因组修饰技术引入,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。在某些实施例中,所述靶向遗传修饰存在于编码多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。在某些实施例中,所述植物细胞来自单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。在某些实施例中,所述产量是籽粒产量。
提供了用于通过在可再生植物细胞中表达重组DNA构建体并产生所述植物来增加植物中光合作用活性的方法,所述重组DNA构建体包含可操作地连接到编码多肽的多核苷酸的调节元件,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少80%至98%同一性的氨基酸序列;其中所述植物在其基因组中包含所述重组DNA构建体。在某些实施例中,所述调节元件是异源启动子。在某些实施例中,所述植物是单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。
还提供了用于通过在可再生植物细胞中在基因组基因座处引入靶向遗传修饰并产生所述植物来增加植物中光合作用活性的方法,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少80%至约98%同一性的氨基酸序列;其中所编码的多肽的水平和/或活性在所述植物中增加。在某些实施例中,所述遗传修饰使用基因组修饰技术引入,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。在某些实施例中,所述靶向遗传修饰存在于编码多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。在某些实施例中,所述植物细胞来自单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。
附图和序列表的说明
图1表明在多地点产量测试中,来自具有增加的Os-MADS18表达的九个玉蜀黍品系的产量。绘制的值是转基因事件相对于对照的蒲式耳/英亩产量增加。*表示P<0.1。基础产量(对照产量)是184蒲式耳/英亩。数据用跨越8个地点的BLUP分析显示。
图2表明在多地点产量测试中,来自具有增加的SB-MADS28表达的四个玉蜀黍品系的产量。绘制的值是转基因事件相对于对照的蒲式耳/英亩产量增加。*表示P<0.1。基础产量(对照产量)是在低N条件下的142蒲式耳/英亩和在正常氮条件下的172蒲式耳/英亩。数据用BLUP分析显示。
图3显示相关的MADS盒蛋白的系统发育树。具有来自拟南芥和代表性单子叶植物的AP1-FUL进化枝成员的ZMM28(Zm00001d022088)的系统发育分析。突出显示了含有ZMM28的进化枝。
根据下列的详细描述和附图以及序列表,可以更全面地理解本公开,所述详细描述和附图以及序列表形成本申请的一部分。
这些序列描述以及所附序列表遵守如37 C.F.R.§§1.821和1.825所列出的管理专利申请中核苷酸和氨基酸序列公开内容的规则。这些序列描述包含如在37 C.F.R.§§1.821和1.825中所定义的用于氨基酸的三字母代码,将其通过引用结合在此。
表1:序列表
Figure BDA0002728079790000041
Figure BDA0002728079790000051
Figure BDA0002728079790000061
Figure BDA0002728079790000071
I.组合物
A.多核苷酸和多肽
本公开提供编码多肽的多核苷酸。因此,如本文使用的“多肽”、“蛋白质”等是指由SEQ ID NO表示的蛋白质。
本公开的一个方面提供编码多肽的多核苷酸,所述多肽包含与SEQ ID NO:1-10、12-51中的任一个的氨基酸序列具有至少80%-99%%同一性的氨基酸序列)。
图1b显示来自拟南芥属(Arabidopsis)、稻、高粱、大麦、短柄草属(Brachypodium)、和玉蜀黍的具有AP1-FUL进化枝MADS盒基因的ZMM28(Zm00001d022088)的系统发育分析。ZMM28分别与高粱Sb02g038780.1、大麦AK361063和AK361227、和稻LOC_Os07g41370.1(OsMADS18)蛋白质成簇,并且分别于它们共享94%、75%、69%、和76%氨基酸序列同一性。
如本文使用的,关于指定核酸的“编码”(“encoding”、“encoded”等)是指包含用于翻译成指定蛋白质的信息。编码蛋白质的核酸在所述核酸的翻译区之内可以包含非翻译序列(例如,内含子)或可能缺乏此类插入的非翻译序列(例如,在cDNA中)。通过密码子使用来详细说明用来编码蛋白质的信息。典型地,通过核酸使用“通用”遗传密码来编码氨基酸序列。然而,当核酸使用以下这些生物体表达时,可以使用通用密码的变体,诸如存在于一些植物、动物、和真菌线粒体、细菌山羊支原体(Mycoplasma capricolum)(Yamao,等人,(1985)Proc.Natl.Acad.Sci.USA[美国科学院院报]82:2306-9)或纤毛虫大核中的通用密码变体。
当合成地制备或改变核酸时,可以利用要表达核酸的预期宿主的已知密码子偏好性。例如,虽然在单子叶和双子叶植物物种中均可以表达本发明的核酸序列,但是可以修饰序列,以解释单子叶植物或双子叶植物的特定密码子偏好和GC含量偏好,因为这些偏好已经表现出了差异(Murray等人(1989)Nucleic Acids Res.[核酸研究]17:477-98)。
如本文使用的,“多核苷酸”包括提及具有天然核糖核苷酸的基本性质的脱氧核糖多核苷酸、核糖多核苷酸、或其类似物,因为在严格的杂交条件下,它们与和天然存在的核苷酸基本上相同的核苷酸序列杂交和/或允许翻译成与一种或多种天然存在的核苷酸相同的一种或多种氨基酸。多核苷酸可以是结构基因或调控基因的全长或子序列。除非另外指明,所述术语包括提及指定序列以及其互补序列。因此,出于稳定性或其他原因而具有经修饰的主链的DNA或RNA是“多核苷酸”,如该术语在本文中所意指的。此外,仅举两个例子,包含稀有碱基(诸如肌苷)或修饰的碱基(诸如三苯甲基化的碱基)的DNA或RNA是多核苷酸,如该术语在本文中所使用的。应当理解,已经对DNA和RNA进行了多种修饰,所述修饰具有本领域技术人员已知的许多有用目的。如本文采用的术语多核苷酸涵盖诸如多核苷酸的化学修饰形式、酶修饰形式或代谢修饰形式,以及病毒和细胞(尤其包括简单和复杂细胞)所特有的DNA和RNA的化学形式。
术语“多肽”、“肽”和“蛋白”在本文中可互换使用,是指氨基酸残基的聚合物。这些术语适用于其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。
如本文使用的,在两个核酸或多肽序列的上下文中的“序列同一性”或“同一性”包括,当在指定比较窗口上对齐最大对应性时,提及两个序列中的相同残基。当使用关于蛋白质的序列同一性百分比时,认识到不相同的残基位置通常相差保守氨基酸取代,其中氨基酸残基被具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基取代,并且因此不改变分子的功能性质。当序列在保守取代方面不同时,可以向上调节序列同一性百分比,以校正所述取代的保守性质。相差这些保守取代的序列被称为具有“序列相似性”或“相似性”。用于进行此调节的方法是本领域技术人员所熟知的。典型地,这涉及作为部分而不是完全错配对保守取代打分,从而提高百分比序列同一性。因此,例如,当相同的氨基酸得分为1,并且非保守取代的得分为零时,保守取代的得分在零和1之间。例如,根据Meyers和Miller,(1988)Computer Applic.Biol.Sci.[计算机应用生物科学]4:11-17的算法来计算保守取代的得分,例如如在程序PC/GENE(易达利遗传学公司(Intelligenetics),山景城,加利福尼亚州,美国)中实现的。
如本文使用的,“序列同一性百分比”意指通过在比较窗口上比较两个最佳比对序列所确定的值,其中与参比序列(其不包含添加或缺失)相比,该比较窗中的多核苷酸序列部分可以包含添加或缺失(即空位),以进行这两个序列的最佳比对。通过以下方式计算所述百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将所述结果乘以100以产生序列同一性的百分比。
如本文使用的,“参比序列”是用作序列比较的基础的确定序列。参比序列可以是指定序列的子集或整体;例如,作为全长cDNA或基因序列的区段、或完整的cDNA或基因序列。
如本文使用的,“比较窗口”意指包括提及多核苷酸序列的连续且指定的区段,其中所述多核苷酸序列可以与参比序列进行比较,并且其中与用于两个序列的最佳比对的参比序列(其不包含添加或缺失)相比,比较窗口中的多核苷酸序列部分可能包含添加或缺失(即空位)。通常,比较窗口的长度为至少20个连续核苷酸,并且任选地可以是30个、40个、50个、100个或更长。本领域技术人员应当理解,由于多核苷酸序列中含有空位,为了避免与参比序列的高相似性,典型地引入空位罚分,并且将其从匹配数中减去。
用于比较的核苷酸序列和氨基酸序列的比对方法是本领域熟知的。Smith和Waterman(1981)Adv.Appl.Math.[应用数学进展]2:482的局部同源性算法(BESTFIT)可进行比较的序列的最佳比对;通过Needleman和Wunsch,(1970)J.Mol.Biol.[分子生物学杂志]48:443-53的同源性比对算法(GAP);通过Pearson和Lipman,(1988)Proc.Natl.Acad.Sci.USA[美国科学院院报]85:2444的相似性搜索法(Tfasta和Fasta);通过这些算法的计算机化实现,包括但不限于:加利福尼亚州山景城的易达利遗传学公司(Intelligenetics)的PC/基因程序中的CLUSTAL,Wisconsin Genetics Software
Figure BDA0002728079790000101
(版本8)中的GAP、BESTFIT、BLAST、FASTA、和TFASTA(可获得自遗传学计算机集团(Genetics Computer Group)(
Figure BDA0002728079790000102
程序(Accelrys公司,圣地亚哥,加利福尼亚州))。以下充分描述了CLUSTAL程序:Higgins和Sharp,(1988)Gene[基因]73:23744;Higgins和Sharp,(1989)CABIOS[计算机应用生物科学]5:1513;Corpet等人,(1988)Nucleic AcidsRes.[核酸研究]16:10881-90;Huang等人(1992)Computer Applications in theBiosciences[计算机应用生物科学]8:155-65;以及Pearson等人(1994)Meth.Mol.Biol.[分子生物学方法]24:307-31。用于多个序列的最佳全局比对的优选程序是PileUp(Feng和Doolittle,(1987)J.Mol.Evol.[分子进化杂志],25:351-60,其类似于Higgins和Sharp,(1989)CABIOS[计算机应用生物科学]5:151-53描述的方法并且通过引用并入本文)。可用于数据库相似性搜索的BLAST程序家族包括:BLASTN,用于比较核苷酸查询序列与核苷酸数据库序列;BLASTX,用于比较核苷酸查询序列与蛋白质数据库序列;BLASTP,用于比较蛋白质查询序列与蛋白质数据库序列;TBLASTN,用于比较蛋白质查询序列与核苷酸数据库序列;以及TBLASTX,用于比较核苷酸查询序列与核苷酸数据库序列。参见,CURRENTPROTOCOLS IN MOLECULAR BIOLOGY[分子生物学实验指南],第19章,Ausubel等人编辑,Greene Publishing and Wiley-Interscience[格林出版与威利交叉科学出版社],纽约(1995)。
GAP使用上文的Needleman和Wunsch的算法来找到使匹配数目最大化并且使空位数目最小化的两个完整序列的对齐。GAP考虑所有可能的对齐和空位位置,并且产生具有最大匹配碱基数量和最少空位的对齐。它允许以匹配碱基单位提供空位产生罚分和空位延伸罚分。GAP必须为它插入的每个空位获取空位产生罚分匹配数目的收益。如果选择大于零的空位延伸罚分,GAP必须另外地为每个所插入空位获取空位长度乘以空位延伸罚分的收益。在Wisconsin Genetics Software
Figure BDA0002728079790000111
的版本10中,默认空位产生罚分值和空位延伸罚分值分别为8和2。空位产生罚分和空位延伸罚分可以表示为选自下组的整数,该组由0至100组成。因此,例如,空位产生罚分和空位延伸罚分可以为0、1、2、3、4、5、6、7、8、9、10、15、20、30、40、50或更大。
GAP代表最佳对齐家族的一个成员。可以存在这个家族的许多成员,但是其他成员没有更好的品质。GAP展示出用于对齐的四个性能因数:质量、比率、同一性和相似性。为了对齐序列,质量是最大化的度量。比率是质量除以更短区段中的碱基数。同一性百分比是实际匹配的符号的百分比。相似性百分比是相似符号的百分比。空位对面的符号被忽略。当一对符号的评分矩阵值大于或等于相似性阈值0.50时,相似性得分。Wisconsin GeneticsSoftware
Figure BDA0002728079790000112
的版本10中使用的评分矩阵为BLOSUM62(参见Henikoff和Henikoff,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:10915)。
除非另外说明,否则在此提供的序列同一性/相似性值是指使用BLAST2.0程序包、使用默认参数获得的值(Altschul等人,(1997)Nucleic Acids Res.[核酸研究]25:3389-402)。
如本领域技术人员将理解,BLAST搜索假设蛋白质可被建模为随机序列。然而,许多真实蛋白质包含非随机序列的区域,其可是同聚序列段(homopolymeric tracts)、短周期重复序列、或富含一种或多种氨基酸的区域。即使蛋白质的其他区域完全不同,这种低复杂性的区域也可在不相关蛋白质之间对齐。许多低复杂性滤波器程序可用来减少这些低复杂性比对。例如,可单独使用或组合使用SEG(Wooten和Federhen,(1993)Comput.Chem.[计算机化学]17:149-63)和XNU(Claverie和States,(1993)Comput.Chem.[计算机化学]17:191-201)低复杂性滤波器。
因此,在本文所述的任何实施例中,所述多核苷酸可编码与SEQ ID NO:1-10、12-51中的任一个具有至少80%同一性的多肽。例如,所述多核苷酸可编码与SEQ ID NO:1-10、12-51中的任一个的氨基酸序列具有至少81%同一性、至少82%同一性、至少83%同一性、至少84%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、或至少99%同一性的多肽。
B.重组DNA构建体
还提供了包含本文所述的任何多核苷酸的重组DNA构建体。在某些实施例中,所述重组DNA构建体进一步包含至少一种调节元件。在某些实施例中,所述重组DNA构建体的至少一种调节元件包含启动子。在某些实施例中,所述启动子是异源启动子。
如本文使用的,“重组DNA构建体”包含两个或更多个可操作地连接的DNA区段,优选在自然界中不可操作地连接(即,异源)的DNA区段。重组DNA构建体的非限制性实例包括与异源序列(也称为调节元件)可操作地连接的目的多核苷酸,这些异源序列有助于目的序列的表达、自主复制和/或基因组插入。此类调节元件包括例如启动子、终止序列、增强子等,或表达盒的任何组分;质粒、粘粒、病毒、自主复制序列、噬菌体、或线性或环状单链或双链DNA或RNA核苷酸序列;和/或编码异源多肽的序列。
本文所述的多核苷酸能以用于在目的植物或任何目的生物体中表达的表达盒提供。所述盒可以包括可操作地连接到多核苷酸的5′和3′调节序列。“可操作地连接”旨在表示两个或更多个元件之间的功能性连接。例如,目的多核苷酸和调节序列(例如,启动子)之间的可操作连接是允许目的多核苷酸表达的功能性连接。可操作地连接的元件可以是连续的或非连续的。当用于指两个蛋白质编码区的连接时,可操作地连接意指这些编码区处于相同的阅读框中。所述盒可以另外含有至少一个待共转化到生物体中的额外的基因。可替代地,所述一个或多个额外的基因可以在多个表达盒上提供。此类表达盒装备有多个限制性位点和/或重组位点,用于将多核苷酸插入到调节区的转录调节之下。表达盒可另外含有选择性标记基因。
所述表达盒以5′-3′转录的方向包括转录和翻译起始区(例如,启动子)、多核苷酸、和在植物中起作用的转录和翻译终止区(例如,终止区)。所述调节区(例如,启动子、转录调节区、和翻译终止区)和/或多核苷酸对于宿主细胞而言或彼此之间可以是天然的/同功的。可替代地,所述调节区和/或多核苷酸对于宿主细胞或彼此之间可以是异源的。
如本文使用的,关于序列的“异源性”是指该序列源于外来物种,或者,如果源于相同物种的话,则是通过蓄意人为干预从其在组合物和/或基因组基因座中的天然形式进行实质性修饰得到的序列。例如,可操作地连接到异源多核苷酸的启动子来自与从其衍生所述多核苷酸的物种不同的物种,或者,如果来自相同/类似的物种,那么一方或双方基本上由它们的原来形式和/或基因组基因座修饰得到,或者所述启动子不是可操作地连接到多核苷酸的天然启动子。
所述终止区对于转录起始区、对于植物宿主而言可是天然的,或可衍生自对于所述启动子、多核苷酸、植物宿主、或其任何组合而言的另一种来源(即外源的或异源的)。
所述表达盒可以另外含有5′前导序列。此类前导序列可以起到增强翻译的作用。翻译前导子在本领域是已知的并且包括病毒翻译前导序列。
在制备表达盒时,可以操作各种DNA片段,以提供处于适当取向以及合适时,处于适当阅读框中的DNA序列。为此,可采用衔接子(adapter)或接头以连接DNA片段,或可以涉及其他操作以提供方便的限制位点、移除多余的DNA、移除限制位点等。出于这个目的,可以涉及体外诱变、引物修复、限制性酶切(restriction)、退火、再取代(例如转换和颠换)。
如本文使用的“启动子”指DNA的在转录开始的上游并参与RNA聚合酶以及其他蛋白质的识别和结合以启动转录的区域。植物启动子是能够在植物细胞中起始转录的启动子。示例性植物启动子包括但不局限于从植物、植物病毒以及包含在植物细胞中表达的基因的细菌(如农杆菌属(Agrobacterium)或根瘤菌属(Rhizobium))获得的那些启动子。某些启动子类型优先在某些组织(如叶、根、种子、纤维、木质部导管、管胞或厚壁组织)中启动转录。这样的启动子被称为“组织偏好的”。“细胞类型”特异性启动子主要驱动在一个或多个器官中的某些细胞类型(例如,根或叶中的维管细胞)中的表达。“诱导型”或“调节型”启动子是指在环境控制下的启动子。可通过诱导型启动子影响转录的环境条件的实例包括厌氧条件或光照的存在。另一类型的启动子是发育调节启动子,例如在花粉发育期间驱动表达的启动子。组织偏好性启动子、细胞类型特异性启动子、发育调节启动子、和诱导型启动子构成“非组成型”启动子类别。“组成型”启动子是在大多数环境条件下有活性的启动子。组成型启动子包括,例如Rsyn7启动子的核心启动子和其他在WO 99/43838和美国专利号6,072,050中公开的组成型启动子;核心CaMV 35S启动子(Odell等人,(1985)Nature[自然]313:810-812);稻肌动蛋白(McElroy等人,(1990)Plant Cell[植物细胞]2:163-171);泛素(Christensen等人,(1989)Plant Mol.Biol.[植物分子生物学]12:619-632和Christensen等人,(1992)Plant Mol.Biol.[植物分子生物学]18:675-689);pEMU(Last等人(1991)Theor.Appl.Genet.[理论与应用遗传学]81:581-588);MAS(Velten等人,(1984)EMBO J.[欧洲分子生物学学会杂志]3:2723-2730);ALS启动子(美国专利号5,659,026);ZmGOS2(美国专利号6,504,083)等。其他组成型启动子包括例如美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611。
还考虑了包括一种或多种异源调节元件的组合的合成启动子。
C.植物和植物细胞
提供了包含本文所述的多核苷酸序列或本文所述的重组DNA构建体的植物、植物细胞、植物部分、种子、和谷物,于是植物、植物细胞、植物部分、种子、和/或谷物具有增加的多肽表达。在某些实施例中,植物、植物细胞、植物部分、种子、和/或谷物将本文所述的外源多核苷酸稳定地掺入其基因组中。在某些实施例中,植物、植物细胞、植物部分、种子、和/或谷物可以包含多个多核苷酸(即,至少1个、2个、3个、4个、5个、6个或更多个)。
在具体实施例中,植物、植物细胞、植物部分、种子、和/或谷物中的一种或多种多核苷酸可操作地连接到异源调节元件,例如,但不限于组成型启动子、组织偏好性启动子、或用于在植物中表达的合成启动子、或组成型增强子。例如,在某些实施例中,所述异源调节元件是玉蜀黍GOS2启动子。
本文还提供了在基因组基因座处包含引入的遗传修饰的植物、植物细胞、植物部分、种子、和谷物,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少80%同一性的氨基酸序列。
在某些实施例中,所述遗传修饰增加了蛋白质的活性。在某些实施例中,所述遗传修饰增加了蛋白质的水平。在某些实施例中,所述遗传修饰增加了蛋白质的水平和活性两者。
如本文使用的,“基因组基因座”通常指在植物的染色体上的位置,在该位置上发现了基因,诸如编码多肽的多核苷酸。如本文使用的,“基因”包括表达功能性分子的核酸片段,诸如但不限于特定蛋白质编码序列和调节元件,诸如在编码序列之前(5’非编码序列)和之后(3’非编码序列)的那些调节元件。
“调节元件”通常是指参与调节核酸分子(例如基因或靶基因)的转录的转录调节元件。调节元件是核酸,并且可以包括启动子、增强子、内含子、5’-非翻译区(5’UTR,还被称为前导序列)、或3’-UTR或其组合。调节元件能以“顺式”或“反式”起作用,并且通常以“顺式”起作用,即其激活位于调节元件所在的相同核酸分子(例如染色体)上的基因的表达。
“增强子”元件是当功能性连接至启动子时(无论其相对位置如何)都可增加核酸分子的转录的任何核酸分子。
将“阻遏物”(本文中有时也被称为沉默子)定义为当在功能上与启动子连接时(无论相对位置如何)都抑制转录的任何核酸分子。
术语“顺式元件”通常是指影响或调控可操作地连接的可转录的多核苷酸表达的转录调节元件,其中所述可转录的多核苷酸存在于相同DNA序列中。顺式元件可以起到结合转录因子的作用,所述转录因子是调节转录的反式作用多肽。
“内含子”是转录成RNA、但是然后在产生成熟mRNA的过程中被切除的基因中的间插序列。所述术语也用于切除的RNA序列。“外显子”是经转录的基因的序列的一部分,并且在源自所述基因的成熟信使RNA中被发现,但不一定是编码最终基因产物的序列的一部分。
5′非翻译区(5’UTR)(也称为翻译前导序列或前导RNA)是直接位于起始密码子上游的mRNA的区域。该区域涉及通过病毒、原核生物和真核生物中的不同机制对转录物的翻译的调节。
“3′非编码序列”是指位于编码序列下游的DNA序列,并且包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常表征为影响聚腺苷酸片添加到mRNA前体的3′末端。
“遗传修饰”、“DNA修饰”等是指在植物的特定基因组基因座上改变或变更核苷酸序列的位点特异性修饰。本文所述的组合物和方法的遗传修饰可以是本领域已知的任何修饰,诸如,例如,插入、缺失、单核苷酸多态性(SNP)、和或多核苷酸修饰。另外,基因组基因座上的靶向DNA修饰可位于基因组基因座上的任何位置,诸如,例如,所编码的多肽的编码区(例如,外显子)、非编码区(例如,内含子)、调节元件、或非翻译区。
如本文使用的,“靶向”遗传修饰或“靶向”DNA修饰是指对生物体基因的直接操作。所述靶向修饰可以使用本领域已知的任何技术引入,诸如,例如,植物育种、基因组编辑、或单基因座转化。
多核苷酸的DNA修饰的类型和位置不受特别限制,只要DNA修饰导致由相应多核苷酸编码的蛋白质的表达和/或活性增加即可。
在某些实施例中,植物、植物细胞、植物部分、种子、和/或谷物包含存在于编码多肽的内源性多核苷酸的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区,或(e)(a)-(d)的任何组合中的一种或多种核苷酸修饰。
在某些实施例中,所述DNA修饰是在基因组基因座中插入一个或多个核苷酸(优选是连续的)。例如,插入表达调控元件(EME),诸如PCT/US 2018/025446中描述的EME,其与本文所述的目的基因可操作地连接。在某些实施例中,所述靶向DNA修饰可以是用本领域已知的具有较高表达的另一种启动子(诸如,例如,玉蜀黍GOS2启动子)替代内源性启动子。在某些实施例中,所述靶向DNA修饰可以是将本领域已知的具有较高表达的启动子(诸如,例如,玉蜀黍GOS2启动子)插入5’UTR,从而通过插入的启动子控制内源性多肽的表达。在某些实施例中,所述DNA修饰是优化Kozak背景以增加表达的修饰。在某些实施例中,所述DNA修饰是多核苷酸修饰或在调节所表达的蛋白的稳定性的位点上的SNP。
如本文使用的“增加的”、“增加”等是指与对照组(例如,不包含DNA修饰的野生型植物)相比,实验组(例如,具有本文所述的DNA修饰的植物)中的任何可检测的增加。因此,增加的蛋白质表达包含样品中蛋白质总水平的任何可检测的增加,并且可使用本领域的常规方法来确定,例如,蛋白质印迹法和ELISA。
在某些实施例中,所述基因组基因座具有超过一个(例如,2个、3个、4个、5个、6个、7个、8个、9个、或10个)DNA修饰。例如,基因组基因座的翻译区和调节元件可各自包含靶向DNA修饰。在某些实施例中,植物的超过一个基因组基因座可包含DNA修饰。
可以使用本领域已知的或本文所述的任何基因组修饰技术来完成基因组基因座的DNA修饰。在某些实施例中,通过基因组修饰技术进行靶向DNA修饰,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。
在某些实施例中,可以通过在所需改变附近的基因组中的确定位置诱导双链断裂(DSB)或单链断裂来促进基因组修饰。可以使用任何可用的DSB诱导剂诱导DSB,所述诱导剂包括但不限于,TALEN、大范围核酸酶、锌指核酸酶、Cas9-gRNA系统(基于细菌性CRISPR-Cas系统)、指导的cpf1内切核酸酶系统等。在一些实施例中,可以将DSB的引入与多核苷酸修饰模板的引入组合。
本文公开的多核苷酸或重组DNA构建体可用于任何植物物种(包括但不限于单子叶植物和双子叶植物)的转化。另外,本文所述的遗传修饰可用于修饰任何植物物种(包括但不限于单子叶植物和双子叶植物)。
在特定实施例中,本公开的植物是作物植物(例如,玉米、苜蓿、向日葵、芸苔属植物、大豆、棉花、红花、花生、高粱、小麦、粟、烟草等)。在其他实施例中,玉米和大豆植物是最佳的,并且在又其他的实施例中,玉米植物是最佳的。
其他目的植物包括例如提供目的种子的谷物类植物、油料种子植物和豆科植物。目的种子包括例如谷物种子,诸如玉米、小麦、大麦、稻、高粱、黑麦等。油料种子植物包括例如棉花、大豆、红花、向日葵、芸苔属植物、玉蜀黍、苜蓿、棕榈、椰子等。豆科植物包括豆类和豌豆。豆类包括瓜耳豆、槐豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆。
例如,在某些实施例中,提供了玉蜀黍植物,其在其基因组中包含重组DNA构建体,所述重组DNA构建体包含编码多肽的多核苷酸,所述多肽包含与SEQ ID NO:1-10、12-51中的任一个具有至少80%同一性的氨基酸序列。在某些实施例中,所述多肽包含与SEQ IDNO:1-10、12-51中任一个氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施例中,所述多肽包含与SEQ ID NO:1-10、12-51中任一个氨基酸序列具有至少80%同一性的氨基酸序列。
在其他实施例中,提供了玉蜀黍植物,其在基因组基因座处包含遗传修饰,所述基因组基因座编码多肽,所述多肽包含与SEQ ID NO:1-10、12-51中的任一个的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施例中,所述多肽包含与SEQ ID NO:1-10、12-51中任一个氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施例中,所述多肽包含与SEQ ID NO:1-10、12-51中任一个氨基酸序列具有至少80%同一性的氨基酸序列。
D.堆叠其他目的性状
在一些实施例中,本文公开的多核苷酸被工程化为分子堆叠物。因此,本文公开的各种宿主细胞、植物、植物细胞、植物部分、种子、和/或谷物可进一步包含一种或多种目的性状。在某些实施例中,宿主细胞、植物、植物部分、植物细胞、种子、和/或谷物与目的多核苷酸序列的任何组合堆叠,以产生具有所需性状的组合的植物。如本文所使用,术语“堆叠”是指具有存在于同一目的植物或生物体中的多种性状。例如,“堆叠性状”可包含其中序列在物理上彼此相邻的分子堆叠物。如本文所使用的性状是指源自特定序列或序列组群的表型。在一个实施例中,所述分子堆叠物包含赋予对草甘膦的耐受性的至少一种多核苷酸。赋予对草甘膦的耐受性的多核苷酸是本领域已知的。
在某些实施例中,所述分子堆叠物包含赋予对草甘膦的耐受性的至少一种多核苷酸和赋予对第二除草剂的耐受性的至少一种额外的多核苷酸。
在某些实施例中,具有本发明的多核苷酸序列的植物、植物细胞、种子、和/或谷物可与赋予对以下的耐受性的一个或多个序列堆叠:ALS抑制剂;HPPD抑制剂;2,4-D;其他苯氧基生长素除草剂;芳氧基苯氧基丙酸除草剂;麦草畏;草铵膦除草剂;靶向原卟啉原氧化酶(也称为“原卟啉原氧化酶抑制剂”)的除草剂。
具有本发明的多核苷酸序列的植物、植物细胞、植物部分、种子、和/或谷物也可与至少一个其他性状组合,以产生进一步包含多种所需性状组合的植物。例如,具有本发明的多核苷酸序列的植物、植物细胞、植物部分、种子、和/或谷物可以与编码具有杀有害生物活性和/或杀昆虫活性的多肽的多核苷酸堆叠,或具有本发明的多核苷酸序列的植物、植物细胞、植物部分、种子、和/或谷物可以与植物抗病性基因组合。
这些堆叠的组合可以通过如下任何方法产生,该方法包括但不限于,通过任何常规的方法学进行植物育种、或遗传转化。如果通过遗传转化植物来堆叠序列,则目的多核苷酸序列可以在任意时间并以任意顺序组合。可以用共转化方案将所述性状与转化盒的任何组合所提供的目的多核苷酸一起引入。例如,若引入两个序列,则这两个序列可包含在分开的转化盒(反式)或包含在同一个转化盒(顺式)中。所述序列的表达可以通过相同的启动子或通过不同的启动子驱动。在某些情况下,可能需要引入将抑制目的多核苷酸的表达的转化盒。这可以与其他抑制盒或过度表达盒的任何组合进行组合以在所述植物中产生所需性状组合。进一步应当认识到,可以使用位点特异性重组系统在所需的基因组位置堆叠多核苷酸序列。参见例如,WO99/25821、WO 99/25854、WO 99/25840、WO 99/25855、以及WO99/25853,将其全部通过引用并入本文。
可以使用具有本文公开的本发明的多核苷酸序列的任何植物来制造食品或饲料产品。此类方法包括获得包含多核苷酸序列的植物、外植体、种子、植物细胞、或细胞,并且加工所述植物、外植体、种子、植物细胞、或细胞以生产食品或饲料产品。
II.使用方法
A.在植物中增加产量和/或增加多核苷酸活性的方法
提供了用于增加植物产量、改变植物开花时间、和/或增加植物中的本文公开的一种或多种多核苷酸活性的方法,所述方法包括将重组DNA构建体引入植物、植物细胞、植物部分、种子和/或谷物中,借此使多肽在植物中表达,所述重组DNA构建体包含本文所述的任何本发明的多核苷酸。还提供了用于增加植物产量、改变植物开花时间、和/或增加植物中活性的方法,所述方法包括在植物的基因组基因座处引入遗传修饰,所述基因组基因座编码多肽,所述多肽包含与SEQ ID NO:1-10、12-51中的任一个所列出的氨基酸序列具有至少80%-99%或100%同一性的氨基酸序列。
用于在本发明的方法中使用的植物可以是本文所述的任何植物物种。在某些实施例中,所述植物是谷物类植物、油料种子植物和豆科植物。在某些实施例中,所述植物是谷物类植物,诸如玉蜀黍。
如本文使用的,“产量”是指收获的农业产量/单位土地,并且可包括提及收获时农作物的蒲式耳/英亩,如针对籽粒水分进行了调整(例如,玉蜀黍典型地为15%)。在籽粒收获时测量籽粒水分。确定调整后的籽粒测试重量为重量(磅)/蒲式耳,在收获时针对籽粒水分水平进行了调整。
在某些实施例中,在最佳生长条件下生长的植物中测量产量。如本文使用的,“最佳条件”是指在水分充足或无干旱的条件下生长的植物。在某些实施例中,基于实验中野生型对照植物的产量确定最佳生长条件。如本文使用的,当野生型植物提供至少75%的预测籽粒产量时,植物被认为是在最佳条件下生长。
如本文使用的,“改变开花时间”是指植物开花所需的天数或生长热单位的改变。在某些实施例中,在多肽表达增加后,植物的开花时间延迟。还考虑了在多肽表达降低后,开花时间减少的实施例(即,植物开花所需的更少的天数或生长热单位)。
如本文使用的,与合适的对照相比,光合作用活性的增加是指蛋白质功能活性的任何可检测的增加。功能活性可以是本文公开的一种或多种多肽的任何已知的生物特性,并且包括例如蛋白质复合物的形成增加、生化途径的调节、和/或增加的籽粒产量。
可以使用各种方法来将目的序列引入植物、植物部分、植物细胞、种子、和/或谷物。“引入”旨在意指以这样一种方式将本发明的多核苷酸或所得多肽提供给植物、植物细胞、种子、和/或谷物,使得所述序列得以进入所述植物的细胞内部。本公开的方法不取决于将序列引入植物、植物细胞、种子、和/或谷物的具体方法,只要所述多核苷酸或多肽进入植物的至少一个细胞的内部即可。
“稳定转化”旨在表示被引入植物中的多核苷酸整合到目的植物的基因组中,并且能够被其子代遗传。“瞬时转化”旨在表示将多核苷酸引入目的植物中并且不整合到所述植物或生物体的基因组中,或者将多肽引入植物或生物体中。
转化方案连同用于将多肽或多核苷酸序列引入植物中的方案可以取决于被靶向转化的植物或植物细胞的类型(即,单子叶植物或双子叶植物)而变化。
在具体实施例中,可以使用各种瞬时转化方法将本文公开的多核苷酸序列提供给植物。这类瞬时转化法包括但不限于将编码的多肽直接引入植物中。此类方法包括例如显微注射或粒子轰击。参见,例如,Crossway等人,(1986)Mol Gen.Genet.[分子遗传学和普通遗传学]202:179-185;Nomura等人,(1986)Plant Sci.[植物科学]44:53-58;Hepler等人,(1994)Proc.Natl.Acad.Sci.[美国科学院院报]91:2176-2180和Hush等人,(1994)TheJournal of Cell Science[细胞科学杂志]107:775-784,以上所有文献都通过引用并入本文。
在其他实施例中,可以通过使植物与病毒或病毒核酸接触将本文公开的本发明的目的多核苷酸引入植物中。通常,这类方法涉及将本公开的核苷酸构建体并入DNA或RNA分子内。应当认识到,本发明的多核苷酸序列最初可以被合成为病毒多蛋白的一部分,然后可以通过体内或体外蛋白水解而被加工,以产生所需的重组蛋白。此外,应当认识到,本文公开的启动子也涵盖用于通过病毒RNA聚合酶进行转录的启动子。涉及病毒DNA或RNA分子、用于将多核苷酸引入植物中并表达其中所编码的蛋白质的方法是本领域已知的。参见,例如,美国专利号5,889,191、5,889,190、5,866,785、5,589,367、5,316,931,以及Porta等人(1996)Molecular Biotechnology[分子生物技术]5:209-221;通过引用并入本文。
可以使用各种方法来将编码和多肽的基因组基因座上的遗传修饰引入植物、植物部分、植物细胞、种子、和/或谷物。在某些实施例中,通过基因组修饰技术进行靶向DNA修饰,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。
在一些实施例中,可以通过在所需改变附近的基因组中的确定位置诱导双链断裂(DSB)或单链断裂来促进基因组修饰。可以使用任何可用的DSB诱导剂诱导DSB,所述诱导剂包括但不限于,TALEN、大范围核酸酶、锌指核酸酶、Cas9-gRNA系统(基于细菌性CRISPR-Cas系统)、指导的cpf1内切核酸酶系统等。在一些实施例中,可以将DSB的引入与多核苷酸修饰模板的引入组合。
可以通过本领域已知的任何方法将多核苷酸修饰模板引入细胞中,所述方法例如但不限于瞬时引入方法、转染、电穿孔、显微注射、粒子介导的递送、局部施用、晶须介导的递送、经由细胞穿透肽的递送或介孔二氧化硅纳米粒子(MSN)介导的直接递送。
可以将多核苷酸修饰模板作为单链多核苷酸分子、双链多核苷酸分子或作为环状DNA(载体DNA)的一部分引入细胞中。所述多核苷酸修饰模板还可以与指导RNA和/或Cas内切核酸酶进行系链。系链的DNA可以允许共定位靶标和模板DNA,可用于基因组编辑和靶向的基因组调控,并且还可以用于靶向有丝分裂后期细胞,在这些细胞中内源性HR机制的功能预计会大大降低(Mali等人2013Nature Methods[自然方法]第10卷:957-963)。所述多核苷酸修饰模板可以瞬时地存在于细胞中,或可以经由病毒复制子引入。
“经修饰的核苷酸”或“经编辑的核苷酸”是指当与其非修饰的核苷酸序列相比时,包含至少一个改变的目的核苷酸序列。此类“改变”包括,例如:(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。
术语“多核苷酸修饰模板”包括,当与待编辑的核苷酸序列相比时,包含至少一个核苷酸修饰的多核苷酸。核苷酸修饰可以是至少一个核苷酸取代、添加或缺失。任选地,多核苷酸修饰模板可以进一步包含位于至少一个核苷酸修饰侧翼的同源核苷酸序列,其中侧翼同源核苷酸序列为待编辑的希望的核苷酸序列提供了充足同源性。
编辑组合有DSB和修饰模板的基因组序列的过程通常包括:向宿主细胞提供DSB诱导剂或编码DSB诱导剂的核酸(识别染色体序列中的靶序列并且能够诱导基因组序列中的DSB),和与待编辑的核苷酸序列相比时包含至少一个核苷酸变化的至少一个多核苷酸修饰模板。多核苷酸修饰模板还可以包含侧翼于所述至少一个核苷酸变化的核苷酸序列,其中侧翼序列与侧翼于DSB的染色体区域基本同源。
内切核酸酶可以通过本领域已知的任何方法提供给细胞,所述方法例如但不限于瞬时引入方法、转染、显微注射、和/或局部施用、或间接经由重组构建体。内切核酸酶可以作为蛋白质或作为指导多核苷酸复合物直接提供给细胞或经由重组构建体间接提供。使用本领域已知的任何方法,可以瞬时地将内切核酸酶引入细胞中,或可以将内切核酸酶并入宿主细胞的基因组中。在CRISPR-Cas系统的情况下,如2016年5月12日公开的WO2016073433中所述的,可以用细胞穿透肽(CPP)促进内切核酸酶和/或指导多核苷酸摄入进细胞。
除通过双链断裂技术进行修饰之外,无此类双链断裂的一种或多种碱基的修饰使用碱基编辑技术实现,参见例如,Gaudelli等人,(2017)Programmable base editing ofA*T to G*C in genomic DNA without DNA cleavage.[在无DNA切割时基因组DNA中A*T至G*C的可编程碱基编辑]Nature[自然]551(7681):464-471;Komor等人,(2016)Programmable editing of a target base in genomic DNA without double-strandedDNA cleavage[在无双链DNA切割时基因组DNA中靶碱基的可编程编辑],Nature[自然]533(7603):420-4。
这些融合物含有dCas9或Cas9切口酶和合适的脱氨酶,并且它们例如可以将胞嘧啶转化为尿嘧啶而不引起靶DNA的双链断裂。然后尿嘧啶通过DNA复制或修复被转化为胸腺嘧啶。具有目的灵活性和特异性的改善的碱基编辑器被用于编辑内源基因座以产生靶标变异并且提高籽粒产量。类似地,腺嘌呤碱基编辑器能使腺嘌呤向肌苷变化,然后通过修复或复制将其转化为鸟嘌呤。因此,使用适当的位点特异性碱基编辑器在一个多个位置上进行靶向性基因改变,即,C·G至T·A转化和A·T至G·C转化。
在一个实施例中,碱基编辑是基因组编辑方法,其可在靶基因组基因座上将一个碱基对直接转化为另一个碱基对,而无需双链DNA断裂(DSB)、同源定向修复(HDR)过程、或外部供体DNA模板。在一个实施例中,碱基编辑器包括(i)催化受损的CRISPR-Cas9突变体,其是突变的,这样使得其核酸酶结构域中的一个无法产生DSB;(ii)单链特异性胞苷/腺嘌呤脱氨酶,其可在通过Cas9产生的单链DNA气泡中的适当核苷酸窗口内将C转化成U或将A转化成G;(iii)尿嘧啶糖基化酶抑制剂(UGI),其阻止尿嘧啶切除以及降低碱基编辑效率和产物纯度的下游过程;以及(iv)切口酶活性以切割未编辑的DNA链,然后细胞DNA修复过程以替代含G的DNA链。
如本文使用的,“基因组区域”是存在于靶位点任一例上的细胞的基因组中的染色体的区段,或者可替代地,还包含靶位点的一部分。基因组区域可以包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800。5-2900、5-3000、5-3100或更多个碱基,这样使得基因组区域具有足够的同源性以与相应的同源区域进行同源重组。
TAL效应子核酸酶(TALEN)是一类序列特异性核酸酶,其可以被用于在植物或其他生物体的基因组中特异性靶序列处造成双链断裂。(Miller等人(2011)NatureBiotechnology[自然生物技术]29:143-148)。
内切核酸酶是在多核苷酸链内切割磷酸二酯键的酶。内切核酸酶包括限制性内切核酸酶,其在特异性位点处切割DNA而不损坏碱基;并且包括大范围核酸酶,也称为归巢内切核酸酶(HE酶),其相似于限制性内切核酸酶,在特异性识别位点处结合并且切割,然而对于大范围核酸酶,识别位点典型地更长,约18bp或更长(于2012年3月22日提交的专利申请PCT/US 12/30061)。基于保守序列基序,大范围核酸酶已被分为四个家族。这些基序参与金属离子的配位和磷酸二酯键的水解。HE酶的显著之处在于它们的长识别位点,并且还在于耐受其DNA底物中的一些序列多态性。对于大范围核酸酶的命名约定相似于对其他限制性内切核酸酶的约定。大范围核酸酶还分别表征为针对由独立的ORF、内含子、和内含肽编码的酶的前缀F-、I-、或PI-。在重组过程中的一个步骤涉及在识别位点处或在所述识别位点附近的多核苷酸切割。可以将切割活性用于产生双链断裂。对于位点特异性重组酶和它们的识别位点的综述,参见,Sauer(1994)Curr Op Biotechnol[生物技术新见]5:521-7;以及Sadowski(1993)FASEB[美国实验生物学学会联合会杂志]7:760-7。在一些实例中,重组酶来自整合酶(Integrase)或解离酶(Resolvase)家族。
锌指核酸酶(ZFN)是由锌指DNA结合结构域和双链-断裂-诱导剂结构域组成的工程化双链断裂诱导剂。识别位点特异性由锌指结构域赋予,所述锌指结构域典型地包含两个、三个、或四个锌指,例如具有C2H2结构,然而其他锌指结构是已知的并且已经被工程化。锌指结构域适于设计特异性结合所选择的多核苷酸识别序列的多肽。ZFN包括连接至非特异性内切核酸酶结构域(例如来自IIs型内切核酸酶例如FokI的核酸酶结构域)的工程化DNA结合锌指结构域。额外的功能性可以融合到锌指结合结构域中,所述额外的功能性包括转录激活子结构域、转录阻遏物结构域、和甲基化酶。在一些实例中,核酸酶结构域的二聚化是切割活性所需的。每个锌指在靶DNA中识别三个连续的碱基对。例如,3指结构域识别9个连续核苷酸的序列,由于所述核酸酶的二聚化需要,因此两组锌指三联体用于结合18个核苷酸的识别序列。
例如在2015年3月19日公开的美国专利申请US 2015-0082478A1、2015年2月26日公开的WO 2015/026886 A1、2016年1月14日公开的WO 2016007347、以及2016年2月18日公开的WO201625131(将其全部通过引用并入本文)中已经描述了使用DSB诱导剂(例如Cas9-gRNA复合物)进行的基因组编辑。
指导多核苷酸/Cas内切核酸酶复合物可以切割DNA靶序列的一条或两条链。可以切割DNA靶序列的两条链的指导多核苷酸/Cas内切核酸酶复合物典型地包含具有处于功能状态的所有其内切核酸酶结构域的Cas蛋白(例如野生型内切核酸酶结构域或其变体在每个内切核酸酶结构域中保留一些或全部活性)。适用于本文使用的Cas9切口酶的非限制性实例公开于美国专利申请公开号2014/0189896中,将其通过引用并入本文。
其他Cas内切核酸酶系统已经在2016年5月12日提交的PCT专利申请PCT/US 16/32073和2016年5月12日提交的PCT/US16/32028中描述,将这两个申请通过引用并入本文中。
术语“靶位点”、“靶序列”、“靶位点序列”、“靶DNA”、“靶基因座”、“基因组靶位点”、“基因组靶序列”、“基因组靶基因座”和“前间区”在本文中可互换地使用,并且意指多核苷酸序列,例如,但不限于,在细胞的染色体、附加体,或基因组中的任何其他DNA分子(包括染色体DNA、叶绿体DNA、线粒体DNA、质粒DNA)上的核苷酸序列,在所述序列处指导多核苷酸/Cas内切核酸酶复合物可以进行识别、结合并任选地产生切口或进行切割。靶位点可以是细胞的基因组中的内源位点,或者可替代地,靶位点对于该细胞可以是异源的并且从而不是天然存在于细胞的基因组中,或者与在自然界发生的位置相比,可以在异质基因组位置中找到靶位点。如本文使用的,术语“内源性靶序列”和“天然靶序列”在本文中可互换使用,是指对细胞基因组来说是内源的或天然的、并且位于细胞的基因组中该靶序列的内源或天然位置处的靶序列。细胞包括但不限于人、非人、动物、细菌、真菌、昆虫、酵母、非常规酵母和植物细胞,以及通过本文所述的方法产生的植物和种子。“人工靶位点”或“人工靶序列”在本文中可互换使用,并且是指已经引入细胞的基因组中的靶序列。这种人工靶序列可以在序列上与细胞的基因组中的内源或天然靶序列相同,但是位于细胞的基因组中的不同位置(即,非内源的或非天然的位置)处。
“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”、“修饰的靶序列”在本文中可互换使用,并且是指如本文公开的靶序列,当与非改变的靶序列相比时,所述靶序列包含至少一个改变。此类“改变”包括,例如:(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。
用于“修饰靶位点”和“改变靶位点”的方法在本文中可互换使用,并且是指用于产生改变的靶位点的方法。
靶DNA序列(靶位点)的长度可以变化,并且包括例如为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸长度的靶位点。还有可能靶位点可以是回文的,即,一条链上的序列与在互补链上以相反方向的读取相同。切口/切割位点可以在靶序列内,或者切口/切割位点可以在靶序列之外。在另一种变异中,切割可以发生在彼此正好相对的核苷酸位置处,以产生平端切割,或者在其他情况下,切口可以交错以产生单链突出端,也称为“粘性端”,其可以是5′突出端抑或3′突出端。还可以使用基因组靶位点的活性变体。此类活性变体可以包含与给定靶位点至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,其中所述活性变体保留生物活性,因此能够被Cas内切核酸酶识别和切割。测量由内切核酸酶引起的靶位点的单链或双链断裂的测定是本领域已知的,并且通常测量试剂在含有识别位点的DNA底物上的总体活性和特异性。
本文中的“前间隔子邻近基序”(PAM)指与由本文所述的指导多核苷酸/Cas内切核酸酶系统识别的(靶向的)靶序列(前间隔子序列)邻近的短核苷酸序列。如果靶DNA序列不在PAM序列后面,则Cas内切核酸酶可能无法成功识别所述靶DNA序列。本文中的PAM的序列和长度可以取决于所使用的Cas蛋白或Cas蛋白复合物而不同。所述PAM序列可以是任何长度,但典型地是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸长度。
术语“靶向”、“基因靶向”和“DNA靶向”在本文中可互换地使用。本文中的DNA靶向可能是在特异性的DNA序列(例如细胞的染色体或质粒)中特异性引入敲除、编辑、或敲入。通常,本文中可以通过在具有与合适的多核苷酸组分缔合的内切核酸酶的细胞中的特异性DNA序列处切割一条或两条链来进行DNA靶向。这种DNA切割,如果是双链断裂(DSB),可以促进NHEJ或HDR过程,这可能导致靶位点处的修饰。
本文的靶向方法能以例如在该方法中靶向两个或更多个DNA靶位点的这样的方式进行。这种方法可以任选地被表征为多重方法。在某些实施例中,可以同时靶向两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个靶位点。多路复用方法典型地通过本文的靶向方法进行,其中提供了多个不同的RNA组分,每一个被设计成将多核苷酸/Cas内切核酸酶复合物引导到唯一的DNA靶位点。
术语“敲除”、“基因敲除”和“遗传敲除”在本文中可互换使用。敲除表示已经通过用Cas蛋白进行靶向使得细胞的DNA序列部分或完全无效;例如,这种DNA序列在敲除之前可能已编码氨基酸序列,或可能已具有调节功能(例如启动子)。可以通过插入缺失(通过NHEJ在靶DNA序列中插入或缺失核苷酸碱基),或通过特异性去除在靶向位点处或其附近处降低或完全破坏序列功能的序列来产生敲除。
指导多核苷酸/Cas内切核酸酶系统可以与共同递送的多核苷酸修饰模板组合使用以允许编辑(修饰)目的基因组核苷酸序列。(还参见于2015年3月19日公开的美国专利申请US 2015-0082478 A1和2015年2月26日公开的WO 2015/026886 A1,两者均通过引用以其全文特此并入)。
术语“敲入”、“基因敲入”、“基因插入”和“遗传敲入”在本文中可互换使用。敲入代表通过用Cas蛋白靶向在细胞中的特异性DNA序列处进行的DNA序列的替代或插入(通过HR,其中还使用合适的供体DNA多核苷酸)。敲入的实例是异源氨基酸编码序列在基因的编码区中的特异性插入,或转录调节元件在遗传基因座中的特异性插入。
以下是本发明一些方面的具体实施例的实例。提供这些实例仅出于说明目的,而无意以任何方式限制本发明所要求的范围。
实例1
OsMADS18的表达增加和扩展提高了玉蜀黍籽粒产量
本实例表明,在玉蜀黍中,在ZmGOS2启动子下稻MADS转录因子OsMADS18(SEQ IDNO:1)的表达增加和扩展增加了在田间条件下的籽粒产量。在玉蜀黍中,OsMADS18 DNA与Zm-Gos2启动子的重组表达提高了正常生长条件下田间产量效力试验中的籽粒产量。如图1所示,当与不具有重组OsMADS18的对照相比时,九个独立转基因事件在跨越8个地点的大田产量测试中具有增加的产量(p<0.1)。所述事件的产量高于非转基因对照约5.7蒲式耳/英亩至约10.4蒲式耳/英亩。
如表明的,Os-MADS18的九个转基因玉蜀黍事件表明在多地点产量测试中增加的产量(图1)。绘制的值是转基因事件相对于对照的蒲式耳/英亩产量增加。*表示P<0.1。基础产量(对照产量)是184蒲式耳/英亩。数据用跨越8个地点的BLUP分析显示。
因此,本实例表明,当与缺乏OsMADS18的此类增加和扩展的表达的对照玉蜀黍植物相比,OsMADS18的表达水平在中等组成型启动子下增加时,OsMADS18(玉蜀黍MADS盒蛋白ZMM28的直向同源物并且表现出与玉蜀黍MADS盒直向同源物的全长具有约76%的氨基酸同一性)在玉蜀黍的田间生长条件下令人惊讶地表现出增加的籽粒产量。
实例2
SbMADS28的表达增加和扩展提高了玉蜀黍籽粒产量
在玉蜀黍中,Sb-MADS28基因组DNA与Zm-Gos2启动子的转基因表达提高了田间产量效力试验中的籽粒产量。如图2所述,四个转基因事件表明阳性产量效力。其中,在跨越两个地点的低氮产量测试下,一个事件显示显著的产量增加(4蒲式耳/英亩,p<0.1),并且在正常氮产量测试条件下,三个事件显示显著的产量增加。在正常氮条件下,所述3个事件分别比非转基因对照多产生6蒲式耳/英亩、7蒲式耳/英亩、和8蒲式耳/英亩(p<0.1)。
SB-MADS28的四个转基因玉蜀黍事件表明在多地点产量测试中增加的产量。绘制的值是转基因事件相对于对照的蒲式耳/英亩产量增加。*表示P<0.1。基础产量(对照产量)是在低N条件下的142蒲式耳/英亩和在正常氮条件下的172蒲式耳/英亩。数据用BLUP分析显示。
因此,本实例表明,当与不具有SbMADS28蛋白的此类增加的表达的对照玉蜀黍植物相比,SbMADS28的表达水平在中等组成型启动子下增加时,SbMADS28(玉蜀黍MADS盒蛋白ZMM28的直系同源物并且表现出与全长玉蜀黍蛋白具有约94%的氨基酸同一性)在玉蜀黍的田间生长条件下令人惊讶地表现出增加的籽粒产量。
实例3
分析多种MADS盒蛋白的表达增加对玉蜀黍产量的影响
该实例证实了这一分析:多种单子叶植物MADS盒蛋白的表达增加对玉蜀黍产量的影响。与实例1和实例2中所述的分析相似,使用其他单子叶植物直向同源物评估不同启动子对玉蜀黍产量的影响。产量结果列于表2中。所述田间测试结果基于一年的测试。
表2:单子叶作物MADS盒多肽的分析
Figure BDA0002728079790000331
如表2所示,评估了作为ZmM28的直向同源物的几种单子叶作物MADS盒蛋白,并且示出了基于一年的田间测试的、显示阳性/中性/阴性产量信号的那些线索。不同的启动子或调节元件如表达强度(量级)或特异性(例如,组织偏好性)可被进一步评估和产量增加的目的,并且在各种应激环境(诸如干旱和/或低氮生长条件)下测试。评估了来自草香碗蕨(Dennstaedtia punctilobula)、三齿蒿(Artemisia tridentate)、金边吊兰(Chlorophytum comosum“Variegatum”)、加利福尼亚花菱草(Eschscholzia california)、宝盖草(Lamium amplexicaule)、莫愁菊(Delosperma nubigenum)、皱叶椒草(Peperomiacaperata)、海韭菜(Triglochin maritima)的与ZmM28具有某些结构相似性的遥远直系同源物或蛋白,并且当在中等组成型启动子下与有限的产量测试中的野生型对照相比时,所有玉蜀黍产量信号是阴性或中性的。
除非另有指定,否则权利要求书和说明书中使用的术语如下文阐述定义。必须注意,除非上下文另外清楚地指明,否则如本说明书及所附权利要求书中所用,单数形式“一个/一种(a/an)”和“所述(the)”包括复数指示物。
本说明书中的所有出版物和专利申请都指示了本发明所属领域的普通技术人员的水平。将所有出版物和专利申请通过引用并入本文,其程度就像明确且单独指出通过引用每个单独出版物或专利申请一样。
除非另外定义,本文所使用的全部技术术语和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同意义。除非另外提及,否则本文采用或考虑的技术是本领域普通技术人员熟知的标准方法。材料、方法和实例仅为说明性的并且不是限制性的。
借助前面的描述和随附的附图中给出的教导,这些发明所属领域的技术人员将会想到本发明的许多修改及其他实施例。因此,应当理解,本发明不限于所公开的特定实施例,并且修改和其他实施例旨在包括在所附权利要求的范围内。尽管本文中采用了具体的术语,但这些术语仅在一般性和描述性意义上使用而并非用于限制目的。
单位、前缀和符号可以按它们SI接受的形式来表示。除非另外指明,否则核酸从左向右以5’至3’方向书写;氨基酸序列都从左向右以氨基到羧基方向书写。数值范围包括限定所述范围的数值在内。本文氨基酸可以通过它们普遍已知的三字母符号或通过IUPAC-IUB生物化学术语委员会推荐的单字母符号来表示。同样,核酸可以通过它们普遍接受的单个字母代码来表示。
Figure IDA0002728079870000011
Figure IDA0002728079870000021
Figure IDA0002728079870000031
Figure IDA0002728079870000041
Figure IDA0002728079870000051
Figure IDA0002728079870000061
Figure IDA0002728079870000071
Figure IDA0002728079870000081
Figure IDA0002728079870000091
Figure IDA0002728079870000101
Figure IDA0002728079870000111
Figure IDA0002728079870000121
Figure IDA0002728079870000131
Figure IDA0002728079870000141
Figure IDA0002728079870000151
Figure IDA0002728079870000161
Figure IDA0002728079870000171
Figure IDA0002728079870000181
Figure IDA0002728079870000191
Figure IDA0002728079870000201
Figure IDA0002728079870000211
Figure IDA0002728079870000221
Figure IDA0002728079870000231
Figure IDA0002728079870000241
Figure IDA0002728079870000251
Figure IDA0002728079870000261
Figure IDA0002728079870000271
Figure IDA0002728079870000281
Figure IDA0002728079870000291
Figure IDA0002728079870000301
Figure IDA0002728079870000311
Figure IDA0002728079870000321
Figure IDA0002728079870000331
Figure IDA0002728079870000341
Figure IDA0002728079870000351
Figure IDA0002728079870000361
Figure IDA0002728079870000371
Figure IDA0002728079870000381
Figure IDA0002728079870000391
Figure IDA0002728079870000401
Figure IDA0002728079870000411
Figure IDA0002728079870000421
Figure IDA0002728079870000431
Figure IDA0002728079870000441
Figure IDA0002728079870000451
Figure IDA0002728079870000461
Figure IDA0002728079870000471
Figure IDA0002728079870000481
Figure IDA0002728079870000491
Figure IDA0002728079870000501
Figure IDA0002728079870000511
Figure IDA0002728079870000521
Figure IDA0002728079870000531
Figure IDA0002728079870000541
Figure IDA0002728079870000551
Figure IDA0002728079870000561
Figure IDA0002728079870000571
Figure IDA0002728079870000581
Figure IDA0002728079870000591
Figure IDA0002728079870000601
Figure IDA0002728079870000611
Figure IDA0002728079870000621
Figure IDA0002728079870000631
Figure IDA0002728079870000641
Figure IDA0002728079870000651
Figure IDA0002728079870000661
Figure IDA0002728079870000671
Figure IDA0002728079870000681
Figure IDA0002728079870000691

Claims (58)

1.一种编码多肽的多核苷酸,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列。
2.如权利要求1或2所述的多核苷酸,其中所述多核苷酸编码多肽,所述多肽包含与选自由SEQ ID NO:1-10和12组成的组的氨基酸序列具有至少99%同一性的氨基酸序列。
3.一种重组DNA构建体,其包含可操作地连接到调节元件的如权利要求1-2中任一项所述的多核苷酸。
4.如权利要求4所述的重组DNA构建体,其中所述调节元件是异源启动子。
5.一种植物细胞,所述植物细胞包含如权利要求1-2中任一项所述的多核苷酸或如权利要求4所述的重组DNA构建体。
6.如权利要求5所述的植物细胞,其中所述植物细胞来自单子叶植物。
7.如权利要求6所述的植物细胞,其中所述单子叶植物是玉蜀黍。
8.一种植物细胞,所述植物细胞在基因组基因座处包含靶向遗传修饰,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列,其中所述靶向遗传修饰调控所编码的多肽的表达水平和/或活性。
9.如权利要求9所述的植物细胞,其中所述靶向修饰导致所述多核苷酸的表达水平增加。
10.如权利要求8或9所述的植物细胞,其中所述靶向遗传修饰选自由以下组成的组:插入、缺失、单核苷酸多态性(SNP)、和多核苷酸修饰。
11.如权利要求8或9所述的植物细胞,其中所述靶向遗传修饰存在于编码所述多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。
12.如权利要求9-11中任一项所述的植物细胞,其中所述植物细胞来自单子叶植物。
13.如权利要求12所述的植物细胞,其中所述单子叶植物是玉蜀黍。
14.一种植物,所述植物在其基因组中包含如权利要求1-2中任一项所述的多核苷酸或如权利要求3所述的重组DNA构建体。
15.如权利要求14所述的植物,其中所述植物是单子叶植物。
16.如权利要求15所述的植物,其中所述单子叶植物是玉蜀黍。
17.一种玉蜀黍、水稻、或高粱植物,所述植物在基因组基因座处包含靶向遗传修饰,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10和12组成的组的氨基酸序列具有至少95%同一性的氨基酸序列,其中与不包含遗传修饰的对照植物相比,所述靶向遗传修饰调控所编码的多肽的表达水平和/或活性。
18.如权利要求17所述的玉蜀黍、水稻、或高粱植物,其中所述靶向修饰导致编码所述多肽的多核苷酸的表达水平增加。
19.如权利要求17所述的玉蜀黍、水稻、或高粱植物,其中所述靶向遗传修饰选自由以下组成的组:插入、缺失、单核苷酸多态性(SNP)、和多核苷酸修饰。
20.如权利要求18或19所述的玉蜀黍、水稻、或高粱植物,其中所述靶向遗传修饰存在于编码所述多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。
21.如权利要求18-20中任一项所述的植物,其中当与对照植物相比时,所述植物表现出增加的多核苷酸表达,所述多核苷酸编码与选自由SEQ ID NO:1或2组成的组的氨基酸序列具有至少95%同一性的多肽。
22.如权利要求21所述的植物,其中所述植物表现出增加的籽粒产量。
23.一种种子,所述种子在其基因组中包含如权利要求1-2中任一项所述的多核苷酸或如权利要求4所述的重组DNA构建体。
24.如权利要求23所述的种子,其中所述种子来自单子叶植物。
25.如权利要求24所述的种子,其中所述单子叶植物是玉蜀黍。
26.一种玉蜀黍种子,所述玉蜀黍种子在基因组基因座处包含靶向遗传修饰,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:3-5、10和12组成的组的氨基酸序列具有至少95%同一性的氨基酸序列,其中所述靶向遗传修饰调控所编码的多肽的表达水平和/或活性。
27.如权利要求27所述的玉蜀黍种子,其中所述靶向修饰导致多核苷酸的表达水平增加,所述多核苷酸编码包含与SEQ ID NO:10具有至少95%同一性的氨基酸序列的多肽。
28.如权利要求26或27所述的玉蜀黍种子,其中所述靶向遗传修饰选自由以下组成的组:插入、缺失、单核苷酸多态性(SNP)、和多核苷酸修饰。
29.如权利要求26或27所述的玉蜀黍种子,其中所述靶向遗传修饰存在于编码所述多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。
30.如权利要求27-30中任一项所述的玉蜀黍种子,其中所述种子进一步包含编码除草剂耐受性和/或抗昆虫性的多肽。
31.如权利要求30所述的玉蜀黍种子,其中当与对照植物相比时,所述植物表现出编码SEQ ID NO:10的多肽的多核苷酸的表达增加。
32.一种用于增加植物中籽粒或种子或生物量产量的方法,所述方法包括:
a.在可再生植物细胞中表达重组DNA构建体,所述重组DNA构建体包含可操作地连接到编码多肽的多核苷酸的调节元件,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列;以及
b.产生所述植物,其中所述植物在其基因组中包含所述重组DNA构建体。
33.如权利要求32所述的方法,其中所述调节元件是异源启动子。
34.如权利要求32所述的方法,其中所述多肽与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少98%同一性。
35.如权利要求32所述的方法,其中所述多核苷酸编码多肽,所述多肽包含与选自由SEQ ID NO:1-10和12组成的组的氨基酸序列具有至少98%同一性的氨基酸序列。
36.如权利要求32-35中任一项所述的方法,其中所述植物细胞来自单子叶植物。
37.如权利要求36所述的方法,其中所述单子叶植物是玉蜀黍。
38.一种用于增加植物产量的方法,所述方法包括:
a.在可再生植物细胞中引入在基因组基因座处的靶向遗传修饰,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列;以及
b.产生所述植物,其中当与不包含所述遗传修饰的对照植物相比时,所编码的多肽的水平和/或活性在所述植物中被调控。
39.如权利要求38所述的方法,其中当与对照植物相比时,所述靶向修饰导致编码所述多肽的多核苷酸的表达增加。
40.如权利要求38所述的方法,其中所述多核苷酸编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少98%同一性的氨基酸序列。
41.如权利要求38所述的方法,其中所述靶向遗传修饰使用基因组修饰技术引入,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。
42.如权利要求38所述的方法,其中所述靶向遗传修饰存在于编码所述多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。
43.如权利要求39-43中任一项所述的方法,其中所述植物细胞来自单子叶植物。
44.如权利要求44所述的方法,其中所述单子叶植物是玉蜀黍。
45.一种用于增加植物中光合作用活性的方法,所述方法包括:
a.在可再生植物细胞中表达重组DNA构建体,所述重组DNA构建体包含可操作地连接到编码多肽的多核苷酸的调节元件,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列;以及
b.产生所述植物,其中所述植物在其基因组中包含所述重组DNA构建体。
46.如权利要求45所述的方法,其中所述调节元件是异源启动子。
47.如权利要求45所述的方法,其中当与对照植物相比时,其中所述植物表现出编码所述多肽的多核苷酸的表达增加。
48.如权利要求45或47所述的方法,其中所述多核苷酸编码多肽,所述多肽包含与选自由SEQ ID NO:1-10和12组成的组的氨基酸序列具有至少98%同一性的氨基酸序列。
49.如权利要求47-48中任一项所述的方法,其中所述植物细胞来自单子叶植物。
50.如权利要求49所述的方法,其中所述单子叶植物是玉蜀黍。
51.一种用于增加植物中光合作用活性的方法,所述方法包括:
a.在可再生植物细胞中引入在基因组基因座处的靶向遗传修饰,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少90%同一性的氨基酸序列;以及
b.产生所述植物,其中所编码的多肽的水平和/或活性在所述植物中增加。
52.如权利要求51所述的方法,其中所述多核苷酸编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列。
53.如权利要求51所述的方法,其中所述靶向遗传修饰使用基因组修饰技术引入,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。
54.如权利要求51所述的方法,其中所述靶向遗传修饰存在于编码所述多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。
55.如权利要求51-54中任一项所述的方法,其中所述植物细胞来自单子叶植物。
56.如权利要求55所述的方法,其中所述单子叶植物是玉蜀黍。
57.如权利要求32所述的方法,其中所述产量是籽粒产量。
58.如权利要求38所述的方法,其中所述产量是籽粒产量。
CN201980026424.6A 2018-04-18 2019-04-17 Mads盒蛋白以及在植物中改善农艺特征 Pending CN111989403A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862659579P 2018-04-18 2018-04-18
US62/659579 2018-04-18
US201862741529P 2018-10-04 2018-10-04
US62/741529 2018-10-04
US201862783309P 2018-12-21 2018-12-21
US62/783309 2018-12-21
PCT/US2019/027782 WO2019204373A1 (en) 2018-04-18 2019-04-17 Mads box proteins and improving agronomic characteristics in plants

Publications (1)

Publication Number Publication Date
CN111989403A true CN111989403A (zh) 2020-11-24

Family

ID=73442045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980026424.6A Pending CN111989403A (zh) 2018-04-18 2019-04-17 Mads盒蛋白以及在植物中改善农艺特征

Country Status (3)

Country Link
US (1) US20210155951A1 (zh)
CN (1) CN111989403A (zh)
BR (1) BR112020021399A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114835788A (zh) * 2022-05-11 2022-08-02 西南大学 蜡梅CpFUL-like基因及其编码的蛋白与应用
CN116640199A (zh) * 2023-06-12 2023-08-25 西南大学 促进枇杷开花和结果时间提前的EjFUL基因及其编码蛋白与应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070270578A1 (en) * 2004-11-25 2007-11-22 Cropdesign N.V. Plants Having Increased Yield and a Method for Making the Same
CN101629184A (zh) * 2009-08-19 2010-01-20 中国科学院植物研究所 水稻e类基因在培育早花和矮化转基因植物中的应用
US20100175146A1 (en) * 2007-06-06 2010-07-08 Cropdesign N.V. Yield enhancement in plants by modulation of maize mads box transcription factor zmm28
CN107287208A (zh) * 2016-03-31 2017-10-24 未名生物农业集团有限公司 花期调控基因和相关载体及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070270578A1 (en) * 2004-11-25 2007-11-22 Cropdesign N.V. Plants Having Increased Yield and a Method for Making the Same
US20100175146A1 (en) * 2007-06-06 2010-07-08 Cropdesign N.V. Yield enhancement in plants by modulation of maize mads box transcription factor zmm28
CN101629184A (zh) * 2009-08-19 2010-01-20 中国科学院植物研究所 水稻e类基因在培育早花和矮化转基因植物中的应用
CN107287208A (zh) * 2016-03-31 2017-10-24 未名生物农业集团有限公司 花期调控基因和相关载体及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
佚名: "XM_002460944.2", 《GENBANK》, pages 1 - 3 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114835788A (zh) * 2022-05-11 2022-08-02 西南大学 蜡梅CpFUL-like基因及其编码的蛋白与应用
CN116640199A (zh) * 2023-06-12 2023-08-25 西南大学 促进枇杷开花和结果时间提前的EjFUL基因及其编码蛋白与应用

Also Published As

Publication number Publication date
BR112020021399A2 (pt) 2021-01-19
US20210155951A1 (en) 2021-05-27

Similar Documents

Publication Publication Date Title
US20240110197A1 (en) Expression modulating elements and use thereof
WO2019204373A1 (en) Mads box proteins and improving agronomic characteristics in plants
WO2019204266A1 (en) Interactors and targets for improving plant agronomic characteristics
US20220119827A1 (en) Genome editing to increase seed protein content
US20200123562A1 (en) Compositions and methods for improving yield in plants
US20210403933A1 (en) Soybean gene and use for modifying seed composition
CN111989403A (zh) Mads盒蛋白以及在植物中改善农艺特征
WO2020023258A1 (en) Methods and compositions to increase yield through modifications of fea3 genomic locus and associated ligands
US20240018533A1 (en) Targeting microrna to regulate native gene function by genome editing
US20230024164A1 (en) Compositions and genome editing methods for improving grain yield in plants
CN111988989A (zh) 通过修饰内源性mads盒转录因子改善玉蜀黍中的农艺特征
WO2018228348A1 (en) Methods to improve plant agronomic trait using bcs1l gene and guide rna/cas endonuclease systems
US11286496B1 (en) Modified genes to increase seed protein content
US20230220409A1 (en) Alteration of seed composition in plants
US20210388369A1 (en) Expression modulating elements and methods of use
WO2021183753A1 (en) Modulating nucleotide expression using expression modulating elements and modified tata and use thereof
WO2020237524A1 (en) Abiotic stress tolerant plants and methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination