CN117677286A - 用于选择包含修饰的dwarf14基因的西瓜植物和植物部分的方法 - Google Patents

用于选择包含修饰的dwarf14基因的西瓜植物和植物部分的方法 Download PDF

Info

Publication number
CN117677286A
CN117677286A CN202280046305.9A CN202280046305A CN117677286A CN 117677286 A CN117677286 A CN 117677286A CN 202280046305 A CN202280046305 A CN 202280046305A CN 117677286 A CN117677286 A CN 117677286A
Authority
CN
China
Prior art keywords
allele
protein
mutant
plant
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280046305.9A
Other languages
English (en)
Inventor
J·阿卢瓦达
M·马扎赫里
E·基亚帕里诺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nunhems BV
Original Assignee
Nunhems BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nunhems BV filed Critical Nunhems BV
Priority claimed from PCT/EP2022/067731 external-priority patent/WO2023275048A1/en
Publication of CN117677286A publication Critical patent/CN117677286A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明涉及用于西瓜、黄瓜或甜瓜中命名为DWARF14的基因的基因分型方法,该基因在突变时赋予增加的二级分枝表型。本文还提供了包含DWARF14基因中的修饰的植物。

Description

用于选择包含修饰的DWARF14基因的西瓜植物和植物部分的 方法
技术领域
本发明涉及西瓜中修饰(或突变型)基因的鉴定以及用于生成和/或选择包含该基因的修饰(或突变型)等位基因或该基因的野生型等位基因的植物和植物部分的方法。因为野生型基因被认为是拟南芥(Arabidopsis thaliana)AtDWARF14(AtD14)基因的直向同源物,因此该基因被称为DWARF14或ClDWARF14或ClD14。在正常西瓜植物中,在8号染色体上发现野生型ClD14基因,并且该基因编码267个氨基酸的ClD14蛋白。在多分枝西瓜植物中发现该基因的修饰等位基因,该修饰等位基因含有8个氨基酸的重复,并且因此含有275个氨基酸的蛋白质,参见图1。针对ClD14基因的这种修饰等位基因纯合的植物具有多分枝表型,其中二级枝的平均数量等于或高于45个二级枝。相反,针对修饰等位基因杂合或针对野生型等位基因纯合的西瓜植物具有正常的分枝表型,其中二级枝的平均数量显著低于45,诸如大约低于30个二级枝,例如平均大约20个二级枝。
其他葫芦科(Cucurbitaceae),诸如甜瓜和黄瓜,也含有编码与西瓜ClD14蛋白具有高序列同一性的D14蛋白的基因。这些被称为例如CmD14(甜瓜(Cucumis melo))或CsD14(黄瓜(Cucumis sativus))基因和蛋白。西瓜、黄瓜和甜瓜的基因和蛋白质在本文中也可以仅称为D14基因、D14等位基因或D14蛋白。
还令人惊讶地发现,包含8个氨基酸重复的突变型等位基因实际上编码非功能性ClD14蛋白。这是出乎意料的,因为D14蛋白是复合蛋白质,该蛋白质与各种其他蛋白质相互作用,并且预期8个氨基酸重复不会完全破坏蛋白质功能。当筛选西瓜TILLING群体时,编码截短的非功能性蛋白质(缺少267个氨基酸中的113个氨基酸)的突变型等位基因令人惊讶地产生与包含8个氨基酸重复的突变型等位基因相同的多分枝表型。相对于野生型植物中二级枝的平均数量(设定为100%的二级分枝),两个突变型等位基因均产生约240%的二级枝的平均数量。这种由非功能性蛋白质引起的强表型在本文中称为“强多分枝”或“完全多分枝”。此外,该发现允许生成不产生“完全多分枝”但产生“中等多分枝”的突变型等位基因,由此ClD14蛋白功能降低,但未丧失功能。
因此,在一个方面,本发明涉及西瓜植物,该西瓜植物包含产生非功能性ClD14蛋白和完全多分枝(当突变型等位基因呈纯合形式时)的ClD14基因的突变型等位基因,或包含产生功能降低的ClD14蛋白和中等多分枝(当突变型等位基因呈纯合形式时)的ClD14基因的突变型等位基因。在一个方面,不涵盖包含编码SEQ ID NO:1的非功能性蛋白质(ClD14ins)的突变型等位基因的西瓜植物。
在另一个方面,本发明涉及用于确定葫芦科植物、尤其是西瓜、甜瓜或黄瓜植物或植物部分是否包含D14基因的野生型等位基因和/或D14基因的突变型等位基因的方法。D14基因的野生型等位基因编码SEQ ID NO:2的西瓜D14蛋白(或与SEQ ID NO:2具有至少95%序列同一性的蛋白质)、SEQ ID NO:8的黄瓜D14蛋白(或与SEQ ID NO:8具有至少95%序列同一性的蛋白质)、或SEQ ID NO:9的甜瓜蛋白(或与SEQ ID NO:9具有至少95%序列同一性的蛋白质)。在一个方面,突变型等位基因是编码SEQ ID NO:2(西瓜)、SEQ ID NO:8(黄瓜)或SEQ ID NO:9(甜瓜)的氨基酸94至氨基酸101的重复的等位基因。在另一个方面,突变型等位基因是编码蛋白质的等位基因,该蛋白质与SEQ ID NO:2(西瓜)、SEQ ID NO:9(甜瓜)或SEQ ID NO:8(黄瓜)的野生型蛋白相比包含插入、重复、置换或缺失的一个或多个氨基酸,并且是当等位基因呈纯合形式时产生中等多分枝的功能降低的蛋白质,或者是当等位基因呈纯合形式时产生完全多分枝的非功能性蛋白质。
还提供了一种用于检测D14基因的野生型等位基因或突变型等位基因的方法,由此使用引物对或寡核苷酸探针来扩增或检测西瓜、甜瓜或黄瓜的基因组DNA中的D14等位基因。寡核苷酸引物或探针包含SEQ ID NO:5或6(或这些序列中任一个序列的互补DNA链)或SEQ ID NO:15或16(或这些序列中任一个序列的互补DNA链)的至少10、11、12、13、14、15、16、17、18、19、20或更多个连续核苷酸。特别地,提供了一种至少一个正向引物和一个反向引物的引物对,这些引物在PCR反应中杂交并扩增基因组D14等位基因的一部分。
在另一个方面,用于生成和/或选择葫芦科植物、尤其是西瓜、甜瓜或黄瓜植物或植物部分的方法包括D14基因的突变型等位基因。在一个方面,突变型等位基因是编码SEQID NO:2(西瓜)、SEQ ID NO:8(黄瓜)或SEQ ID NO:9(甜瓜)的氨基酸94至氨基酸101的重复的等位基因。在另一个方面,突变型等位基因是编码蛋白质的等位基因,该蛋白质与SEQ IDNO:2(西瓜)、SEQ ID NO:9(甜瓜)或SEQ ID NO:8(黄瓜)的野生型蛋白相比包含插入、重复、置换或缺失的一个或多个氨基酸,并且是当等位基因呈纯合形式时产生中等多分枝的功能降低的蛋白质,或者是当等位基因呈纯合形式时产生完全多分枝的非功能性蛋白质。
在一个方面,还提供了包含D14基因的突变型等位基因的西瓜、黄瓜或甜瓜植物和植物部分。在一个方面,突变型等位基因编码包含SEQ ID NO:2(西瓜)、SEQ ID NO:8(黄瓜)或SEQ ID NO:9(甜瓜)的氨基酸94至氨基酸101的重复的蛋白质。在另一个方面,突变型等位基因是编码蛋白质的等位基因,该蛋白质与SEQ ID NO:2(西瓜)、SEQ ID NO:9(甜瓜)或SEQ ID NO:8(黄瓜)的野生型蛋白相比包含插入、重复、置换或缺失的一个或多个氨基酸,并且是当等位基因呈纯合形式时产生中等多分枝的功能降低的蛋白质,或者是当等位基因呈纯合形式时产生完全多分枝的非功能性蛋白质。
在一个方面,提供了一种西瓜植物,该西瓜植物是针对ClD14基因的突变型等位基因杂合的。在一个方面,突变型等位基因编码包含SEQ ID NO:2(西瓜)的氨基酸94至氨基酸101的重复的蛋白质。在另一个方面,突变型等位基因是编码蛋白质的等位基因,该蛋白质与SEQ ID NO:2(西瓜)、SEQ ID NO:9(甜瓜)或SEQ ID NO:8(黄瓜)的野生型蛋白相比包含插入、重复、置换或缺失的一个或多个氨基酸,并且是当等位基因呈纯合形式时产生中等多分枝的功能降低的蛋白质,或者是当等位基因呈纯合形式时产生完全多分枝的非功能性蛋白质。
背景技术
专利US7314979B2描述了称为HMBN等位基因的隐性等位基因,该等位基因以纯合形式增加二级分枝并将平均果实重量减少至0.87kg。
WO2006/060425也描述了称为HMBN等位基因的隐性等位基因。在第15页的[0090],HMBN等位基因被描述为‘由西瓜培育项目产生的意想不到的突变型等位基因’。
专利申请US2020093086描述了由于纯合形式的HMBN等位基因和2号染色体上的突变型ts基因等位基因的组合而产生小于0.9kg的小果实的西瓜植物。
HMBN等位基因的基因和基因位点是迄今未知的。因此,该基因的功能也是未知的。
本文已经鉴定了HMBN等位基因的基因,并已发现该基因编码包含SEQ ID NO:2的氨基酸94至氨基酸101的重复的ClD14蛋白(野生型ClD14蛋白)。该突变型蛋白在SEQ IDNO:1中示出,并且在本文中也称为ClD14ins(用于‘插入’)。
野生型蛋白ClD14(SEQ ID NO:2)被认为是拟南芥属(Arabidopsis)DWARF14蛋白的直向同源物。AtDWARF14是已经显示在拟南芥属中具有独脚金内酯信号传导和独脚金内酯水解的双重功能的蛋白质,这是因为制备了影响这些功能中任一种功能的突变体,参见Seto等人。(2019年,Nature Communications第10卷第191期,Strigolactone perceptionand deactivation by a hydrolase receptor DWARF14)。在该出版物中,作者在图5中描述了拟南芥属DWARF14(AtD14)蛋白参与独脚金内酯信号传导途径和水解的模型。生物活性独脚金内酯分子被AtD14蛋白感知并诱导AtD14蛋白的构象变化,从而导致与其他信号传导蛋白(诸如D53)形成蛋白复合物。信号转导导致例如抑制分枝。在信号传导后,AtD14蛋白变回其原始构象并水解独脚金内酯分子。因此,AtD14参与例如抑制分枝的信号转导和植物中独脚金内酯水平的稳态二者。AtD14蛋白含有3个被称为‘催化三联体’的氨基酸,即S97(丝氨酸97)、D218(天冬酰胺218)和H247(组氨酸247)。这些在图2中针对拟南芥属D14蛋白和修饰的西瓜ClD14蛋白中相应的氨基酸示出。
SEQ ID NO:1的西瓜蛋白(ClD14ins)被鉴定为多分枝表型基础(由HMBN等位基因引起),发现该蛋白包含8个氨基酸的重复。如图2中所示,重复包含催化三联体的氨基酸中的一种氨基酸,即S97是重复的。AtD14蛋白中的S97似乎位于该蛋白质的表面上并且似乎参与配体结合。
最初,申请人推测,在不受任何理论束缚的情况下,ClD14蛋白中8个氨基酸的重复可能会改变ClD14构象以减少或防止与其他蛋白质/配体的相互作用,或者可能会以使得独脚金内酯分子的结合袋受到影响的方式改变ClD14构象,从而减少或防止信号转导。
然而,进一步的分析令人惊讶地发现,8个氨基酸的重复效果是ClD14ins蛋白在体内是非功能性的并且不能实现其在西瓜中的信号转导作用。因此,当突变型等位基因呈纯合形式时观察到的表型是最极端的二级枝形成,在本文中称为“完全多分枝”或“强多分枝”。这是从其中氨基酸W155的密码子突变为终止密码子(W155STOP或W155*)的TILLING突变体得出的结论,从而产生仅包含SEQ ID NO:2的氨基酸1至氨基酸154的截短蛋白。W155*蛋白必须是非功能性的,因为野生型蛋白的113个氨基酸缺失。在针对突变型等位基因W155*纯合的植物中对(平均)二级枝形成的影响与在包含编码ClD14ins蛋白的突变型等位基因的植物中所观察到的相同。参见实施例。
因此,令人惊讶地发现,ClD14ins蛋白(包含8个氨基酸重复)是体内非功能性的,即该蛋白在独脚金内酯信号传导途径中丧失其功能并且不再传递任何信号,由此不诱导二级枝形成的抑制并且多分枝表型被最大限度地表达。
为了果实生产而生长的西瓜植物是二倍体(2n),在用雄花的花粉对雌花授粉后产生有籽果实,或者是三倍体(3n),在用来自另一西瓜植物(称为授粉植物)的花粉对雌花授粉后产生无籽果实,因为三倍体植物的花不产生可育花粉。
HMBN等位基因迄今已被用于开发含有纯合形式的HMBN等位基因并具有多分枝表型的授粉植物。这些授粉者之一是品种Sidekick(Harris Moran,参见万维网hmclause.com/wp-content/uploads/2014/11/USACANADA_Watermelon_Sidekick_Techsheet_2014_ENG.pdf)。Sidekick是不可收获的授粉者,因为有籽果实具有粉色果肉并被丢弃。
商业授粉者可以被区分为可收获的或不可收获的授粉者(也参见McGregor和Waters,2014年,同)。可收获的授粉者是二倍体授粉者,其在对雌花授粉后产生可销售的有籽果实。不可收获的授粉者是二倍体授粉者,其在对雌花授粉后产生农艺学上不期望的果实,诸如白肉果实、具有脆皮的果实等。因此,种植者可以选择在一块田地中生产三倍体无籽果实和二倍体有籽果实,或者仅生产三倍体无籽果实并丢弃授粉者的二倍体有籽果实。明显地,授粉者在田地中占据了大量空间,该空间可以其他方式被三倍体植物占据,并且因此已经开发了几种产生紧凑植物的授粉者。
本发明人已经发现,与SEQ ID NO:2的野生型蛋白相比,存在于Sidekick中并且构成Sidekick的多分枝表型的基础的单隐性基因编码包含8个氨基酸的重复的蛋白质。修饰的(或突变型)蛋白质在本文中包括为SEQ ID NO:1。野生型蛋白和突变型蛋白的比对显示在图1中(‘D14Ins’是SEQ ID NO:1的突变型蛋白,并且‘WT’是SEQ ID NO:2的野生型蛋白)。因此,相对于野生型基因组DNA和cDNA/mRNA(如SEQ ID NO:6和SEQ ID NO:4所示),突变型ClD14基因的基因组DNA和cDNA/mRNA(如SEQ ID NO:5和SEQ ID NO:3所示)包含24个核苷酸的重复。
本发明人还发现,Sidekick的多分枝表型是由于与SEQ ID NO:2的野生型蛋白相比包含8个氨基酸的重复的蛋白质是体内非功能性的,并且该表型是‘完全多分枝’,即没有发生抑制二级枝形成的信号转导。因此,本发明人第一次能够产生当突变型等位基因呈纯合形式时产生完全多分枝的不同的突变型等位基因(不同于存在于Sidekick中的突变型等位基因),而且能够产生保留体内功能但与野生型蛋白相比功能降低,并且当突变型等位基因呈纯合形式时产生更中度或中等多分枝的突变型等位基因。
通过BLAST分析,鉴定了黄瓜(CsD14)和甜瓜(CmD14)的相应蛋白质。这些彼此具有非常高的序列同一性(使用Emboss Needle成对比对,默认参数),如下表1所示。
表1
考虑到高蛋白质序列同一性,预期西瓜、黄瓜和甜瓜D14蛋白的体内功能是相同的。
因此,相应地,在纯合形式的ClD14(SEQ ID NO:2)、CsD14(SEQ ID NO:8)和CmD14(SEQ ID NO:9)中氨基酸94至氨基酸101的重复应导致比在针对编码野生型蛋白的野生型等位基因纯合的植物中形成显著更多的二级枝(“完全多分枝”)。同样,导致D14蛋白功能丧失的其他突变型等位基因应产生“完全多分枝”,并且导致D14蛋白功能降低的突变型等位基因应产生“中等多分枝”。图3显示了突变型西瓜ClD14蛋白(图3中的SEQ ID NO:1,ClD14ins)与野生型黄瓜和甜瓜蛋白的多序列比对。
在一个方面,本文涵盖这些突变型等位基因以及包含这些纯合或杂合形式的突变型等位基因的植物和植物部分(诸如果实)。
因此,本文涵盖ClD14、CsD14或CmD14基因中的任何突变型等位基因和包含此类突变型等位基因的植物,尤其是由此相对于SEQ ID NO:2(西瓜ClD14)、SEQ ID NO:8(黄瓜CsD14)或SEQ ID NO:9(甜瓜CmD14)的野生型蛋白插入、缺失、重复或置换一个或多个氨基酸的突变型等位基因。在一个方面,一个或多个氨基酸的插入、缺失、重复或置换导致所编码的蛋白质是体内功能降低的D14蛋白或功能丧失的D14蛋白。在一个方面,突变型等位基因编码包含SEQ ID NO:2、SEQ ID NO:8或SEQ ID NO:9的氨基酸94至氨基酸101中的至少1、2、3、4、5、6、7或所有8个氨基酸的重复的蛋白质。在一个方面,ClD14、CsD14或CmD14的位置97处的至少Ser(S)是重复的。
本发明还涵盖用于在ClD14、CsD14或CmD14基因中生成突变型等位基因的方法。尤其是用于生成编码蛋白质的突变型等位基因的方法,当突变型等位基因呈纯合形式时,该蛋白质具有体内功能降低或功能丧失并且产生完全多分枝(在体内丧失功能的情况下)或中等多分枝(在体内降低功能的情况下)。
在一个方面,还涵盖一种用于生成编码蛋白质的突变型等位基因的方法,该蛋白质包含SEQ ID NO:2、SEQ ID NO:8或SEQ ID NO:9的氨基酸94至氨基酸101中的至少1、2、3、4、5、6、7或所有8个氨基酸的重复。在一个方面,一种用于生成突变型等位基因的方法,由此等位基因编码蛋白质,其中野生型ClD14、CsD14或CmD14蛋白的位置97处的至少Ser(S)是重复的。
本文还提供了用于针对ClD14、CsD14或CmD14基因的突变型和/或野生型等位基因的存在来筛选(例如,基因分型)和/或选择植物或植物部分或种子的方法。
突变型ClD14、CsD14或CmD14等位基因可以包含编码蛋白质的等位基因,其中与野生型ClD14、CsD14或CmD14蛋白相比,一个或多个氨基酸被插入、重复、缺失和/或置换,或者突变型ClD14、CsD14或CmD14等位基因可以在诸如启动子或增强子的基因的调节区中包含一个或多个突变(一个或多个核苷酸的插入、重复、缺失和/或置换),从而产生减少的或非功能性的野生型蛋白。
在一个方面,突变型等位基因编码包含置换、插入和/或缺失一个或多个氨基酸的蛋白质,由此该蛋白质是体内非功能性的并且针对突变型等位基因纯合的植物显示完全多分枝。因此,完全多分枝完全缺乏对二级枝形成的抑制,因为在植物中不存在功能性D14。例如,相对于野生型植物(设定为100%二级分枝),西瓜中的完全多分枝被视为二级枝的平均数量的约240%,参见实施例。优选地,在相同的遗传背景中比较包含呈纯合形式的突变型等位基因的植物和包含呈纯合形式的野生型等位基因的植物的表型,使得背景基因组高度相似并且使基因型差异最小化。
在一个方面,突变型等位基因编码野生型D14蛋白,并且由于例如调节区中的突变(诸如启动子),突变型等位基因不在体内表达,并且针对突变型等位基因纯合的植物显示完全多分枝。
可以容易地从头生成D14的敲除等位基因或D14的突变型等位基因,由此突变导致D14蛋白的体内功能丧失,如将在本文其它地方解释的。
在一个方面,突变型等位基因编码包含置换、插入和/或缺失一个或多个氨基酸的蛋白质,由此该蛋白质具有降低的体内功能并且针对突变型等位基因纯合的植物显示中等多分枝。因此,中等多分枝未完全缺乏对植物中二级枝形成的抑制,但是突变型D14蛋白保留一些体内功能性并部分抑制二级枝形成。西瓜中的中等多分枝例如被视为在野生型植物(针对功能性D14等位基因纯合)的平均数量与针对非功能性D14蛋白或敲除等位基因纯合的植物的平均数量之间发展的二级枝的平均数量。例如,如果针对功能性D14等位基因纯合的植物产生设定为100%的二级枝的平均数量,并且针对编码非功能性D14蛋白的等位基因纯合(或针对敲除等位基因纯合)的植物产生相对于野生型240%的二级枝,则‘中等多分枝’产生在100%(纯合野生型)和240%(纯合非功能性)之间的二级枝的平均数量,因此为相对于野生型植物(设定为100%二级分枝)约至少110%、120%、130%、140%、150%、160%、170%、180%、190%或200%但小于完全多分枝的二级枝的平均数量,参见实施例。可以容易地从头生成D14基因中的突变型等位基因,由此突变导致D14蛋白的体内功能降低,如将在本文其它地方解释的。
在一个方面,突变型等位基因编码包含在IPR000073结构域中起始于SEQ ID NO:2(西瓜)、SEQ ID NO:8(黄瓜)或SEQ ID NO:9(甜瓜)的氨基酸22处并且结束于氨基酸259处置换、插入和/或缺失一个或多个氨基酸的蛋白质。
在一个方面,突变型等位基因编码如表2或图6中所示的突变型D14蛋白。
在一个方面,突变型等位基因编码包含在SEQ ID NO:2(野生型西瓜蛋白)或SEQID NO:8(野生型黄瓜蛋白)或SEQ ID NO:9(野生型甜瓜蛋白)的氨基酸94至氨基酸101的区域中置换、插入和/或缺失一个或多个氨基酸的蛋白质。
在一个方面,突变型等位基因编码包含选自SEQ ID NO:2(野生型西瓜蛋白)或SEQID NO:8(野生型黄瓜蛋白)或SEQ ID NO:9(野生型甜瓜蛋白)的氨基酸94至氨基酸101的一个或多个重复的氨基酸的蛋白质。
在一个方面,突变型等位基因编码包含选自SEQ ID NO:2(野生型西瓜蛋白ClD14)或SEQ ID NO:8(野生型黄瓜蛋白CsD14)或SEQ ID NO:9(野生型甜瓜蛋白CmD14)的氨基酸94至氨基酸101的1、2、3、4、5、6、7或所有8个重复的氨基酸的蛋白质。在一个方面,突变型等位基因编码包含SEQ ID NO:2(野生型西瓜蛋白)或SEQ ID NO:8(野生型黄瓜蛋白)或SEQID NO:9(野生型甜瓜蛋白)的丝氨酸97(S97)的至少一个重复的蛋白质。在一个方面,一个或多个重复的氨基酸与野生型氨基酸相邻。
在一个方面,当突变型等位基因呈纯合形式时,与针对野生型等位基因(编码ClD14、CsD14和CmD14的野生型蛋白)纯合的植物相比,上述突变型等位基因导致西瓜、黄瓜或甜瓜植物的二级分枝增加。在一个方面,突变型等位基因是敲除等位基因或编码非功能性D14蛋白,当突变型等位基因呈纯合形式时产生完全多分枝。在一个方面,突变型等位基因产生与野生型D14蛋白相比功能降低但仍保留体内功能的突变型D14蛋白,当突变型等位基因呈纯合形式时产生中等多分枝。
通过例如靶向基因编辑技术诸如基于CRISPR的技术,或通过诱变诸如辐射诱导的诱变或化学诱导的诱变,可以容易地从头生成上述突变型等位基因。针对突变型等位基因纯合的植物可以通过使植物自交,并且然后使纯合植物生长以确定与野生型对照(例如,未突变型植物)相比纯合突变型植物中二级枝数量是否更高来生成。
在另一个方面,突变型ClD14、CmD14或CsD14等位基因编码截短蛋白,由此野生型ClD14、CsD14或CmD14蛋白的C末端的至少10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200或更多个氨基酸缺失或任选地被不同的氨基酸置换,使得该蛋白质具有降低的体内功能或没有体内功能。
在一个不同的方面,突变型ClD14、CmD14或CsD14等位基因编码蛋白质,由此至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200或更多个氨基酸被插入野生型ClD14、CsD14或CmD14蛋白中或被重复或被从该蛋白质置换或缺失,使得该蛋白质具有降低的体内功能或没有体内功能。
如前所述,多分枝的程度由突变型蛋白的功能性决定,因此非功能性的突变型蛋白将导致最大水平的多分枝(本文称为完全或强多分枝),而功能降低的突变型蛋白将导致较低程度的多分枝(本文称为中等多分枝)。因此,在D14功能性和多分枝程度之间存在直接关系。技术人员可以容易地生成不同的突变型等位基因和包含该突变型等位基因的纯合植物,并且然后使该植物生长并选择导致期望的多分枝程度的突变型等位基因。
在本发明的一个方面,提供了植物或植物细胞,其特征在于,与相应的野生型植物细胞相比,植物或植物细胞具有减少的ClD14蛋白、CsD14蛋白或CmD14蛋白活性,其中野生型植物细胞的ClD14、CsD14或CmD14蛋白由选自由以下组成的组的核酸分子编码:
a)核酸分子,其编码具有SEQ ID NO:2(西瓜ClD14)、SEQ ID NO:8(黄瓜CsD14)或SEQ ID NO:9(甜瓜CmD14)给出的氨基酸序列的蛋白质;
b)编码蛋白质的核酸分子,该蛋白质的序列与SEQ ID NO:2(西瓜ClD14)、SEQ IDNO:8(黄瓜CsD14)或SEQ ID NO:9(甜瓜CmD14)给出的氨基酸序列具有至少95%、96%、97%、98%或99%的同一性;
c)SEQ ID NO:4或SEQ ID NO:6的核酸分子,或者与SEQ ID NO:4或SEQ ID NO:6具有至少95%、96%、97%、98%或99%序列同一性并编码ClD14蛋白的序列;
d)SEQ ID NO:17或SEQ ID NO:15的核酸分子,或者与SEQ ID NO:17或SEQ ID NO:15具有至少95%、96%、97%、98%或99%序列同一性并编码CsD14蛋白的序列;
e)SEQ ID NO:18或SEQ ID NO:16的核酸分子,或者与SEQ ID NO:18或SEQ ID NO:16具有至少95%、96%、97%、98%或99%序列同一性并编码CmD14蛋白的序列。
ClD14、CsD14或CmD14蛋白的活性减少是由突变型ClD14、CsD14或CmD14等位基因引起的。
减少的活性可以由突变型等位基因表达的敲低或敲除(例如通过启动子或其他调节序列中的突变)或通过编码功能丧失或功能减少的ClD14、CsD14或CmD14蛋白的突变型等位基因引起。编码功能丧失蛋白或敲除等位基因的突变型等位基因将呈纯合形式,产生具有强多分枝表型的植物,而编码功能降低蛋白或敲低等位基因的突变型等位基因将呈纯合形式,产生在针对野生型等位基因纯合的植物和针对功能丧失(或敲除)等位基因纯合的植物之间的中等多分枝表型。
在一个方面,突变型ClD14、CsD14或CmD14等位基因编码与野生型蛋白相比功能减少或功能丧失的突变型ClD14、CsD14或CmD14蛋白,例如,突变型蛋白包含与野生型蛋白相比置换、缺失和/或插入或重复的一个或多个氨基酸。在一个方面,突变型等位基因编码包含相对于SEQ ID NO:2、8或9的野生型蛋白置换、缺失或插入一个或多个氨基酸的蛋白质,由此突变型蛋白功能丧失并产生强多分枝(当呈纯合形式时)或功能降低并产生中等多分枝(当呈纯合形式时)。
产生截短的D14蛋白的突变型等位基因通常会产生功能丧失,诸如本文在西瓜中生成的W155*突变体。此外,Q255*可以导致功能丧失或功能降低,因为蛋白质的最后13个氨基酸(包括高度保守的IPR000073结构域的5个氨基酸)缺失。
编码截短蛋白或包含一个或多个被另一个氨基酸置换或缺失或插入的氨基酸的蛋白质的等位基因可以容易地生成并在体内测试,以观察当等位基因呈纯合形式时对多分枝的影响。表2和下表A中所述的突变体也可以容易地在西瓜、甜瓜或黄瓜中生成,或者其他突变体可以使用已知方法生成,诸如随机诱变,随后进行例如TILLING、靶向诱变方法等。
软件程序(诸如SIFT或PROVEAN分析)也可以用于预测氨基酸插入、缺失或置换对蛋白质功能的影响,尽管这仅是预测并且仍需要在体内确认。例如,P245L通过SIFT分析预测是‘不耐受的’并且通过Provean分析预测是‘有害的’,这意味着预测该蛋白质的功能将丧失或降低。对于使用SIFT预测为‘耐受’或使用Provean分析预测为‘中性’的变化,预测功能不会改变。然而,如所提及的,预测不需要是真实的(基于统计模型)并且需要体内分析。此外,该工具可以用于集中对于预测对蛋白质功能有影响的突变型等位基因的进一步分析。
表A
因此,本文的一个方面是一种包含命名为ClD14(西瓜(Citrullus lanatus)Dwarf14)的基因的突变型等位基因的西瓜植物,其中突变型等位基因包含在一个或多个调节序列中的突变,从而导致与相应的野生型等位基因相比减少的基因表达或无基因表达,或者其中突变型等位基因编码包含与由野生型等位基因编码的蛋白质相比一个或多个氨基酸的缺失、截短、插入或置换的蛋白质,从而导致ClD14蛋白的功能降低或功能丧失,其中当突变型等位基因呈纯合形式时,该突变型等位基因导致所述植物发展增加的二级枝的平均数量,并且其中该突变型等位基因不是编码SEQ ID NO:1的蛋白质的突变型等位基因,
其中野生型等位基因的ClD14蛋白由选自由以下组成的组的核酸分子编码:
a)核酸分子,其编码具有SEQ ID NO:2给出的氨基酸序列的蛋白质;
b)核酸分子,其包含SEQ ID NO:6显示的核苷酸序列或其互补序列。
本发明的另一个方面是一种包含命名为CsD14(黄瓜Dwarf14)的基因的突变型等位基因的黄瓜植物,其中突变型等位基因包含在一个或多个调节序列中的突变,从而导致与相应的野生型等位基因相比减少的基因表达或无基因表达,或者其中突变型等位基因编码包含与由野生型等位基因编码的蛋白质相比一个或多个氨基酸的缺失、截短、插入或置换的蛋白质,从而导致CsD14蛋白的功能降低或功能丧失,其中当突变型等位基因呈纯合形式时,该突变型等位基因导致所述植物发展增加的二级枝的平均数量,
其中野生型等位基因的CsD14蛋白由选自由以下组成的组的核酸分子编码:
a)核酸分子,其编码具有SEQ ID NO:8给出的氨基酸序列的蛋白质;
b)核酸分子,其包含SEQ ID NO:15显示的核苷酸序列或其互补序列。
本发明的又一个方面是一种包含命名为CmD14(甜瓜Dwarf14)的基因的突变型等位基因的甜瓜植物,其中突变型等位基因包含在一个或多个调节序列中的突变,从而导致与相应的野生型等位基因相比减少的基因表达或无基因表达,或者其中突变型等位基因编码包含与由野生型等位基因编码的蛋白质相比一个或多个氨基酸的缺失、截短、插入或置换的蛋白质,从而导致CmD14蛋白的功能降低或功能丧失,其中当突变型等位基因呈纯合形式时,该突变型等位基因导致所述植物发展增加的二级枝的平均数量,
其中野生型等位基因的CmD14蛋白由选自由以下组成的组的核酸分子编码:
a)核酸分子,其编码具有SEQ ID NO:9给出的氨基酸序列的蛋白质;
b)核酸分子,其包含SEQ ID NO:16显示的核苷酸序列或其互补序列。
特别地,西瓜植物、黄瓜植物或甜瓜植物包含编码其中插入、置换或缺失一个或多个氨基酸的蛋白质的突变型等位基因,其中所述突变型蛋白包含功能降低但不丧失功能的蛋白质,由此二级枝的平均数量高于针对野生型D14等位基因纯合的植物中的二级枝的平均数量,但不如针对编码非功能性蛋白质的突变型D14等位基因纯合的植物中的二级枝的平均数量高。
还在一个方面,西瓜植物、黄瓜植物或甜瓜植物包含编码其中插入、置换或缺失一个或多个氨基酸的蛋白质的突变型等位基因,其中所述突变型蛋白包含功能丧失的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2、8或9的V14被不同的氨基酸、尤其是被I或被终止密码子置换的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2、8或9的P44被不同的氨基酸、尤其是被S或被终止密码子置换的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2、8或9的L72被不同的氨基酸、尤其是被F或被终止密码子置换的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2、8或9的H89被不同的氨基酸、尤其是被Y或被终止密码子置换的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2、8或9的G121被不同的氨基酸、尤其是被S或被终止密码子置换的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2或9的S139被不同的氨基酸、尤其是被N或被终止密码子置换的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2、8或9的W155被不同的氨基酸或被终止密码子置换的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2、8或9的G235被不同的氨基酸、尤其是被V或被终止密码子置换的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2、8或9的P254被不同的氨基酸、尤其是被L或被终止密码子置换的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2、8或9的Q255被不同的氨基酸或被终止密码子置换的蛋白质。
在一个方面,突变型等位基因编码包含选自SEQ ID NO:2、8或9的氨基酸94至氨基酸101的至少1、2、3、4、5、6、7或所有8个氨基酸的重复的蛋白质。在一个方面,至少S97是重复的。在一个方面,氨基酸94至氨基酸101是重复的。
在另一个方面,突变型等位基因编码包含选自SEQ ID NO:2、8或9的氨基酸94至氨基酸101的至少1、2、3、4、5、6、7或所有8个氨基酸的缺失或置换的蛋白质。在一个方面,至少S97缺失或被另一个氨基酸置换。在一个方面,氨基酸94至氨基酸101缺失或被其他氨基酸置换。
因此,在一个方面,突变型等位基因分别编码SEQ ID NO:2、8或9的ClD14、CsD14、CmD14蛋白,其中至少S97是重复的,或其中以下氨基酸的至少1、2、3、4、5、6、7或所有8个连续氨基酸是重复的V94(缬氨酸94)、G95(甘氨酸95)、H96(组氨酸96)、S97(丝氨酸97)、V98(缬氨酸98)、S99(丝氨酸99)、A100(丙氨酸100)、M101(甲硫氨酸101)。在一个方面,至少1、2、3、4或更多个连续氨基酸包括S97。
在一个方面,至少1、2、3、4或更多个氨基酸的重复的位置邻近原始氨基酸,即在重复的氨基酸之间没有其他氨基酸的间隔。
在另一个方面,突变型等位基因分别编码SEQ ID NO:2、8或9的ClD14、CsD14、CmD14蛋白,其中至少一个氨基酸,例如选自SEQ ID NO:2、8或9的氨基酸94至氨基酸101的至少一个氨基酸,或SEQ ID NO:2、8或9的IPR000073结构域中的至少一个氨基酸,或螺旋盖结构域的至少一个氨基酸被另一个氨基酸或被终止密码子置换,从而导致当等位基因呈纯合形式时(当在二倍体植物或植物细胞中不存在野生型等位基因时),蛋白质功能丧失或功能减少以及表型改变(二级分枝增加)。IPR000073结构域起始于SEQ ID NO:2、8和9的氨基酸22,并且结束于SEQ ID NO:2、8和9的氨基酸259。螺旋盖结构域起始于SEQ ID NO:2、8和9的氨基酸136,并且结束于SEQ ID NO:2、8和9的氨基酸193。当提及起始或结束时,包括所提及的氨基酸或核苷酸。
在又一个方面,突变型等位基因分别编码SEQ ID NO:2、8或9的ClD14、CsD14、CmD14蛋白,其中催化三联体的至少一个氨基酸或催化三联体的氨基酸之前或之后1、2、3、4、5、6、7或8个位置处的至少一个氨基酸被另一个氨基酸或终止密码子置换,从而导致当等位基因呈纯合形式时(当在二倍体植物或植物细胞中不存在野生型等位基因时),蛋白质功能丧失或功能减少以及表型改变(二级分枝增加)。催化三联体的氨基酸是SEQ ID NO:2、8或9的S97、D218和H247。
在另一个方面,一个或多个氨基酸缺失,例如通过引起提前终止密码子的突变来缺失,从而导致当等位基因呈纯合形式时(当在二倍体植物或植物细胞中不存在野生型等位基因时),蛋白质功能丧失或功能减少以及表型改变(二级分枝增加)。特别地,在一个方面,选自SEQ ID NO:2、8或9的氨基酸94至氨基酸101的一个或多个氨基酸缺失,例如通过在序列中存在于编码所述氨基酸的密码子之前的提前终止密码子突变来缺失。或者IPR000073结构域的一个或多个氨基酸缺失,或者螺旋盖结构域的一个或多个氨基酸缺失,或者催化三联体的一个或多个氨基酸和/或在催化三联体的氨基酸之前或之后1、2、3、4、5、6、7或8个位置处的一个或多个氨基酸缺失,例如通过在序列中存在于编码所述氨基酸的密码子之前的提前终止密码子突变来缺失。
当突变型等位基因将体内表型从野生型表型、即当野生型等位基因以纯合形式存在时的正常二级分枝改变为当突变型等位基因在二倍体植物中呈纯合形式时的增加的二级分枝时,存在功能降低或功能丧失的蛋白质。因此,与野生型功能性D14等位基因相比,术语‘增加的二级分枝’或‘增加的二级枝的平均数量’涵盖由功能丧失D14蛋白或敲除D14等位基因表达引起的‘完全多分枝’表型和由功能降低的D14蛋白或降低的D14等位基因表达引起的‘中等多分枝’表型。二级枝的绝对平均数量在基因型之间可以稍微不同,但是相对效果在不同基因型中应该是相同的。因此,在特定遗传背景或基因型中,野生型具有二级枝的某个平均数量,功能丧失蛋白或敲除等位基因具有二级枝的最大或‘完全’平均数量,并且功能降低或敲低等位基因在这两个极端值之间。例如,如果野生型中二级枝的平均数量设定为100%并且功能丧失为相对于野生型240%,则高于100%且低于240%的平均二级分枝是‘中等多分枝’表型。在一个方面,相对于野生型(为100%),‘增加的平均二级分枝’为至少110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%。在一个方面,‘增加的平均二级分枝’低于‘完全多分枝’,‘增加的平均二级分枝’为例如‘完全多分枝’(为100%)的95%或更少、90%或更少、85%或更少、80%或更少、70%或更少、60%或更少、50%或更少。
在一个方面,与针对编码SEQ ID NO:2的蛋白质的野生型等位基因纯合的西瓜植物(产生平均约20个二级枝)相比,增加的二级分枝是二级枝的平均数量等于或大于45,如在针对编码SEQ ID NO:1的蛋白质的等位基因纯合的西瓜植物(包含SEQ ID NO:2的氨基酸94至氨基酸101的重复)中所观察到的。也参见实施例。
在西瓜和其他葫芦中,主茎生长并形成一级侧枝。在一级侧枝上,植物产生二级侧枝。这些二级枝在例如距主茎上的端/冠90cm处开始到端/冠计数。因此,在一个方面中,通过计数在距离植物冠90cm开始到端/冠的二级枝的数量来测量二级分枝。对一个品系的几株(至少4、5、6、7、8、9、10株)进行该操作,并且然后计算每个品系的二级枝的平均数量。然而,二级分枝也可以通过计数在距冠较短距离(例如,40cm)处开始的二级枝的数量来测量。
发明内容
提供了一种栽培的西瓜、黄瓜或甜瓜植物或植物部分,该植物或植物部分包含至少一个拷贝的在西瓜中命名为ClD14、在黄瓜中命名为CsD14或在甜瓜中命名为CmD14的基因的突变型等位基因,当突变型等位基因在二倍体植物中呈纯合形式时,所述突变型等位基因赋予平均增加数量的二级枝。
在一个方面,西瓜ClD14基因位于西瓜基因组的8号染色体上,尤其是基因位于Charleston Grey染色体(cucurbitgenomics.org)的8号染色体的起始于碱基28794281并结束于碱基28795173的区域中。启动子序列位于基因组编码序列的上游,例如在碱基28794281上游的1000或2000个碱基内。
在一个方面,当呈纯合形式时,突变型ClD14、CsD14或CmD14等位基因赋予完全多分枝,该完全多分枝是所形成的二级枝的最高平均数量,这是由于所编码的突变型蛋白是非功能性的或由于突变型等位基因未被表达,即为敲除等位基因。
在另一个方面,当呈纯合形式时,突变型ClD14、CsD14或CmD14等位基因赋予中等多分枝,与野生型植物相比,该中等多分枝是所形成的二级枝的增加的平均数量,但不是在完全多分枝植物中能够形成的枝的最高平均数量。中等多分枝是由于所编码的突变型蛋白与野生型蛋白相比功能降低,或者由于突变型等位基因以低于野生型等位基因的水平表达,即为敲低等位基因。
在一个实施方案中,包含ClD14基因的突变型等位基因的植物或植物部分或种子是西瓜植物或植物部分或种子,并且是二倍体、四倍体、三倍体或多倍体。优选地,突变型等位基因以一个或两个拷贝存在于二倍体植物或植物部分或种子中。任选地,突变型等位基因可以以两个或四个拷贝存在于四倍体植物或植物部分或种子中,或以一个、两个或三个拷贝存在于三倍体植物或植物部分或种子中。
植物、植物部分或种子可以是包含至少一个拷贝的命名为ClD14的基因的突变型等位基因的西瓜,由此野生型基因编码SEQ ID NO:2的野生型蛋白(或与SEQ ID NO:2具有至少95%、96%、97%或98%序列同一性的野生型蛋白),或者可以是包含至少一个拷贝的命名为CsD14的基因的突变型等位基因的黄瓜,由此野生型基因编码SEQ ID NO:8的野生型蛋白(或与SEQ ID NO:8具有至少95%、96%、97%或98%序列同一性的野生型蛋白),或者可以是包含至少一个拷贝的命名为CmD14的基因的突变型等位基因的甜瓜,由此野生型基因编码SEQ ID NO:9的野生型蛋白(或与SEQ ID NO:9具有至少95%、96%、97%或98%序列同一性的野生型蛋白)。
包含ClD14、CsD14或CmD14基因的突变型等位基因的植物部分可以是细胞、花、叶、茎、插条、花粉、根、砧木、接穗、果实、原生质体、胚、花药。
还涵盖从包含ClD14、CsD14或CmD14基因的至少一个突变型等位基因的此类植物部分繁殖的营养繁殖西瓜、黄瓜或甜瓜植物。
同样地,提供一种可以由其生长本发明植物的种子。
此外,提供了由根据本发明的植物产生的雄花或雌花、子房、花药和花粉或小孢子。
提供了一种生产西瓜、黄瓜或甜瓜果实的方法,所述方法包括生长包含一个或两个拷贝的ClD14、CsD14或CmD14基因的突变型等位基因的二倍体植物。突变型等位基因在本文别处描述,并且是D14等位基因,该D14等位基因呈纯合形式时,与正常二级分枝(针对野生型D14等位基因纯合)相比,赋予增加的二级分枝(针对突变型等位基因纯合)。
提供了一种生产无籽西瓜果实的方法,所述方法包括生长三倍体植物和二倍体授粉植物,由此授粉植物包含两个拷贝的ClD14基因的突变型等位基因,从而允许对三倍体植物的花授粉并且任选地收获无籽三倍体果实。
提供了一种生产无籽西瓜果实的方法,所述方法包括生长三倍体植物和二倍体授粉植物,由此三倍体植物包含一个、两个或三个拷贝的ClD14基因的突变型等位基因,从而允许对三倍体植物的花授粉并且任选地收获无籽三倍体果实。
还提供了生产有籽西瓜果实的方法,所述方法包括生长二倍体植物,由此二倍体植物包含一个或两个拷贝的ClD14基因的突变型等位基因,从而允许对花授粉并且任选地收获有籽二倍体果实。
提供了一种用于生长西瓜、黄瓜或甜瓜植物的方法,该方法包括生长包含一个或两个拷贝的ClD14、CsD14或CmD14基因的突变型等位基因的二倍体西瓜、黄瓜或甜瓜植物,尤其是在田地中或在温室或隧道中生长该植物。
提供了一种用于生产栽培西瓜、黄瓜或甜瓜植物的方法,该植物产生(平均)增加数量的二级枝(与针对野生型D14基因纯合的植物相比),该方法包括以下步骤:
a)将随机或靶向突变引入一种或多种西瓜、黄瓜或甜瓜植物、植物部分或种子中;或者提供突变型植物或种子的群体(例如,TILLING群体),
b)选择包含ClD14,CsD14或CmD14基因的突变型等位基因的植物,例如产生显著降低的或不产生野生型ClD14、CsD14或CmD14蛋白的突变型等位基因(例如敲低或敲除等位基因)或编码包含与野生型蛋白相比缺失、置换、插入或重复的一个或多个氨基酸的蛋白质的突变型等位基因,
c)任选地从植物中去除任何转基因构建体(例如,CRISPR构建体),以及/或者
d)任选地生成针对突变型等位基因纯合的植物,并且分析与针对野生型等位基因纯合的植物相比,由植物产生的二级枝的平均数量。
提供了一种用于选择或鉴定西瓜、黄瓜或甜瓜植物、种子或植物部分的方法,该方法包括以下步骤:
a)分析植物或植物部分的基因组DNA在其基因组中是否包含突变型等位基因和/或包含ClD14,CsD14或CmD14基因的野生型等位基因,以及任选地
b)选择在基因组中包含一个或两个拷贝的ClD14,CsD14或CmD14基因的突变型等位基因的植物或植物部分,
其中ClD14基因的野生型等位基因编码SEQ ID NO:2的蛋白质,Cs14基因的野生型等位基因编码SEQ ID NO:8的蛋白质,并且CmD14基因的野生型等位基因编码SEQ ID NO:9的蛋白质。
步骤a)可以以多种方式进行,使用例如基于PCR的方法、基于测序的方法、基于核酸杂交的方法、基因表达水平等进行。在一个方面,例如可以使用KASP测定,参见例如实施例。
提供了一种用于筛选(例如,基因分型)西瓜、黄瓜或甜瓜植物、种子或植物部分的基因组DNA的方法,该方法包括以下步骤:
a)提供西瓜、甜瓜或黄瓜植物或多个植物(例如,F2群体、近交品系、回交群体、培育群体、杂种植物等)的基因组DNA的样品(或多个样品),
b)提供PCR引物对或寡核苷酸探针,该引物或(寡核苷酸)探针包含ClD14、CsD14或CmD14基因的基因组D14等位基因的至少10、11、12、13、14、15、16、17、18、19、20、21、22或更多个连续核苷酸,并且可以在PCR测定中与基因组等位基因杂交和/或扩增基因组等位基因的部分,以及
c)在步骤a)的样品上使用步骤b)的引物对进行PCR测定或使用步骤b)的探针进行杂交测定,以及任选地
d)选择在基因组中包含一个或两个拷贝的ClD14,CsD14或CmD14基因的等位基因(例如,野生型等位基因和/或突变型等位基因)的植物或植物部分或种子,
其中ClD14基因的野生型等位基因编码SEQ ID NO:2的蛋白质,Cs14基因的野生型等位基因编码SEQ ID NO:8的蛋白质,并且CmD14基因的野生型等位基因编码SEQ ID NO:9的蛋白质。
在步骤b)中,PCR引物对是与D14等位基因的DNA链中的一个DNA链互补的至少一个正向引物和与D14等位基因的另一DNA链互补的一个反向引物,该引物对在PCR反应中与变性的基因组DNA杂交并且扩增D14等位基因的一部分。可以使用引物设计工具设计引物以扩增野生型或任何突变型D14等位基因。在一个方面,使用两个正向引物以及一个共同的反向引物,一个正向引物设计用于扩增野生型等位基因,并且一个正向引物设计用于扩增D14基因的突变型等位基因。这三个引物可以用于KASP测定以对步骤a)的样品进行基因分型。因此,在一个方面,步骤c)中的测定是KASP测定,但也可以使用其他基因分型测定,诸如在万维网biosearchtech.com/sectors/agrigenomics/agrigenomics-pcr-qpcr-technologies中描述的那些。
在一个方面,该测定区分D14基因的野生型和突变型等位基因,例如区分SEQ IDNO:6的野生型ClD14等位基因和SEQ ID NO:5的突变型ClD14ins等位基因或另一突变型等位基因。其他突变型等位基因的实例在表A和表2中给出,但也涵盖任何其他突变型等位基因,例如与对照植物(例如,包含呈纯合形式的野生型等位基因的植物)相比,呈纯合形式的显著增加发展二级枝的平均数量的任何突变型等位基因。在一个方面,突变型等位基因是敲除等位基因或编码导致强多分枝的功能丧失蛋白的突变型等位基因,并且在另一个方面,突变型等位基因是敲低等位基因或编码导致中等多分枝的功能降低蛋白的突变型等位基因。因此,在测定中可以检测D14基因的任何野生型和/或突变型等位基因。
为了分析基因组DNA,至少粗基因组DNA提取可能是必需的。基因组DNA中突变型等位基因或野生型等位基因的存在可以直接或间接检测。直接可以例如通过例如寡核苷酸探针的核酸杂交进行。间接可以例如通过使用例如PCR引物的核酸扩增进行,该PCR引物包含例如附着于引物的尾序列,并且在PCR期间,等位基因特异性引物与模板DNA结合并延长,从而将尾序列附着于新合成的链,并且在随后的PCR循环中,FRET盒(荧光共振能量转移盒)与尾结合并发射荧光。然后可以检测荧光信号。这用于例如KASP测定中。
突变型等位基因可以在多个方面不同于野生型等位基因,例如在启动子序列中或在蛋白质编码序列中或在内含子/外显子剪接位点中不同于野生型等位基因。突变型等位基因可以具有降低的基因表达或无基因表达,或者突变型等位基因可以产生包含与野生型蛋白相比缺失、置换或插入或重复的一个或多个氨基酸的蛋白质。
在一个方面,突变型等位基因是编码包含相对于SEQ ID NO:2、8或9的功能蛋白置换、插入或缺失一个或多个氨基酸的蛋白质的等位基因,由此突变型蛋白具有体内功能降低或无功能。
在一个方面,突变型等位基因是编码包含相对于SEQ ID NO:2、8或9的功能蛋白置换、插入或缺失一个或多个氨基酸的蛋白质的等位基因,该氨基酸选自:保守IPR00073结构域的任何一个或多个氨基酸和/或螺旋盖结构域的任何一个或多个氨基酸和/或催化三联体氨基酸的任何一个或多个氨基酸和/或催化三联体氨基酸之前或之后的8个氨基酸中的任何一个或多个氨基酸,由此突变型蛋白具有体内功能降低或无功能。因此,本文不仅涵盖包含一个或多个本文所述突变型等位基因的植物和植物部分,还涵盖能够检测包含至少一个本文所述突变型等位基因的植物或植物部分的测定。因此,可以针对野生型D14等位基因的存在或本文所述的任何突变型D14等位基因中的至少一种等位基因的存在来分析任何西瓜、黄瓜或甜瓜植物、种子或植物部分或它们的DNA。对于任何突变型等位基因,可以容易地开发测定,因为熟知如何制备用于特定突变型等位基因的引物或探针。例如,对于W155*等位基因,可以容易地设计测定以检测源于西瓜植物的基因组DNA中等位基因的存在。
在一个方面,突变型等位基因是编码包含SEQ ID NO:2、8或9的氨基酸94至氨基酸101的1、2、3、4、5、6、7或8个氨基酸的重复的蛋白质的等位基因。在一个方面,突变型等位基因包含SEQ ID NO:2、8或9的至少Ser 97的重复。在一个方面,突变型等位基因包含SEQ IDNO:2、8或9的氨基酸94至氨基酸101的所有氨基酸的重复。
在一个方面,植物或植物部分是西瓜并且突变型等位基因编码SEQ ID NO:1的蛋白质(D14ins)。编码如本文所述的8个氨基酸重复的这种突变型等位基因可以如本文所述进行检测。
在另一个方面,植物或植物部分是西瓜,并且突变型等位基因编码包含插入、置换或缺失的一个或多个氨基酸从而导致功能降低或功能丧失的突变型蛋白,但该突变型蛋白不是SEQ ID NO:1的蛋白质(D14ins),即该突变型等位基因不是存在于品种Sidekick中的等位基因。因此,该植物在其基因组中不包含SEQ ID NO:5的序列。在一个方面,该植物在其基因组中仅包含一个拷贝的SEQ ID NO:5的序列。
还提供了生成和/或选择在其基因组中包含西瓜ClD14基因或黄瓜CsD14基因或甜瓜CmD14基因的至少一个突变型等位基因的植物或植物部分的方法。
在一个方面,还提供了一种用于检测基因组中西瓜ClD14基因或黄瓜CsD14基因或甜瓜CmD14基因的野生型等位基因和/或突变型等位基因的存在的方法。
在一个方面,提供了一种用于检测西瓜植物或植物部分或种子是否包含至少一个拷贝的编码SEQ ID NO:2的蛋白质的野生型等位基因和/或包含至少一个拷贝的编码例如SEQ ID NO:1的蛋白质或包含相对于SEQ ID NO:2的蛋白质置换、插入或缺失一个或多个氨基酸的任何蛋白质(如别处所述)的突变型等位基因,并且任选地选择包含至少一个拷贝的突变型等位基因的植物、植物部分或种子的方法,所述突变型等位基因编码例如SEQ IDNO:1的蛋白质,或包含相对于SEQ ID NO:2的蛋白质置换、插入或缺失一个或多个氨基酸的任何蛋白质(如别处所述)。
在另一个方面,用于检测西瓜植物或植物部分或种子是否包含至少一个拷贝的包含SEQ ID NO:6的野生型等位基因和/或包含至少一个拷贝的包含相对于SEQ ID NO:6插入、置换或缺失一个或多个核苷酸的突变型等位基因的方法,由此所编码的蛋白质具有体内功能降低或功能丧失。
在一个方面,提供了一种用于检测和任选地选择西瓜植物、种子或植物部分的方法,该西瓜植物、种子或植物部分包含至少一个拷贝的命名为ClD14(西瓜Dwarf14)的基因的突变型等位基因,该方法包括以下步骤:
a)提供一种或多种西瓜植物、种子或植物部分的一种或多种基因组DNA样品,
b)使用a)的DNA样品作为模板进行区分野生型ClD14等位基因和突变型ClD14等位基因的基因分型测定,其中所述基因分型测定基于利用ClD14等位基因特异性寡核苷酸引物的核酸扩增,和/或其中所述基因分型测定基于利用ClD14等位基因特异性寡核苷酸探针的核酸杂交,以及任选地
c)选择包含一个或两个拷贝的突变型等位基因的植物、种子或植物部分,
其中突变型ClD14等位基因包含相对于SEQ ID NO:6的序列插入、重复、缺失或置换的一个或多个核苷酸,从而产生包含相对于SEQ ID NO:2的序列插入、重复、缺失或置换一个或多个氨基酸的突变型ClD14蛋白。
在一个方面,在该方法中,所述ClD14等位基因特异性寡核苷酸引物或所述ClD14等位基因特异性寡核苷酸探针是包含SEQ ID NO:6或SEQ ID NO:6的互补链的至少10个核苷酸的引物或探针。
在一个方面,在该方法中,突变型等位基因包含在等位基因的编码区中插入或重复的至少一个密码子,或者改变为另一个密码子的至少一个密码子,或者缺失或改变为终止密码子的至少一个密码子。例如,突变型等位基因是如本文表A或表2中所述的突变型等位基因。突变型等位基因可以是编码功能丧失或功能降低的突变型D14蛋白的等位基因,当突变型等位基因呈纯合形式时,分别产生强多分枝或中等多分枝。
还提供了KASP测定(Kbioscience Kompetitive等位基因特异性PCR基因分型测定),该测定包括两个等位基因特异性正向引物,例如SEQ ID NO:10的FAM引物和SEQ IDNO:11的VIC引物,以及共同的反向引物,例如SEQ ID NO:12的反向引物。也参见实施例。明显地,可以开发其他等位基因特异性引物以检测和/或区分野生型等位基因(编码SEQ IDNO:2的蛋白质)和包含24个核苷酸的重复(编码8个氨基酸)并编码SEQ ID NO:1的蛋白质的突变型等位基因或包含例如相对于野生型蛋白置换、重复、缺失或插入一个或多个氨基酸的任何其他突变型等位基因。例如,提供检测突变型等位基因的KASP测定,其中W155的密码子被改变为终止密码子,或提供检测表2的任何突变型等位基因,以及导致D14蛋白体内功能丧失或功能降低的任何其他突变型等位基因的KASP测定。
同样地,本文涵盖(野生型或突变型)基因组序列、cDNA或mRNA序列、蛋白质序列的分离序列或分子,以及用于检测西瓜ClD14基因或黄瓜CsD14基因或甜瓜CmD14基因的野生型或突变型等位基因的寡核苷酸引物或探针。
还提供了一种用于生成西瓜、黄瓜或甜瓜植物、种子或植物部分的基因组DNA(的一部分)的PCR扩增产物和/或寡核苷酸杂交产物的方法,该方法包括以下步骤:
a)提供西瓜、甜瓜或黄瓜植物或多个植物(例如,F2群体、近交品系、回交群体、培育群体、杂种植物等)的基因组DNA的样品(或多个样品),
b)提供至少PCR引物对或至少一个寡核苷酸探针,该引物或(寡核苷酸)探针包含ClD14、CsD14或CmD14基因的基因组D14等位基因的至少10、11、12、13、14、15、16、17、18、19、20、21、22或更多个连续核苷酸,并且可以在PCR测定中与基因组等位基因杂交和/或扩增基因组等位基因的部分,以及
c)在步骤a)的样品上使用步骤b)的引物对进行PCR测定或使用步骤b)的探针进行杂交测定,以生成PCR扩增产物和/或寡核苷酸杂交产物,以及任选地
d)选择在基因组中包含一个或两个拷贝的ClD14,CsD14或CmD14基因的等位基因(例如,野生型等位基因和/或突变型等位基因)的植物或植物部分或种子,
其中ClD14基因的野生型等位基因编码SEQ ID NO:2的蛋白质(或包含SEQ ID NO:6的基因组DNA),Cs14基因的野生型等位基因编码SEQ ID NO:8的蛋白质(或包含SEQ IDNO:15的基因组DNA),并且CmD14基因的野生型等位基因编码SEQ ID NO:9的蛋白质(或包含SEQ ID NO:16的基因组DNA)。
还提供了一种用于扩增和/或杂交西瓜、黄瓜或甜瓜植物、种子或植物部分的基因组DNA(的一部分)的方法,该方法包括以下步骤:
a)提供西瓜、甜瓜或黄瓜植物或多个植物(例如,F2群体、近交品系、回交群体、培育群体、杂种植物等)的基因组DNA的样品(或多个样品),
b)提供至少PCR引物对或至少一个寡核苷酸探针,该引物或(寡核苷酸)探针包含ClD14、CsD14或CmD14基因的基因组D14等位基因的至少10、11、12、13、14、15、16、17、18、19、20、21、22或更多个连续核苷酸,并且可以在PCR测定中与基因组等位基因杂交和/或扩增基因组等位基因的部分,以及
c)在步骤a)的样品上使用步骤b)的引物对进行PCR测定或使用步骤b)的探针进行杂交测定,以生成PCR扩增产物和/或寡核苷酸杂交产物,以及任选地
d)选择在基因组中包含一个或两个拷贝的ClD14,CsD14或CmD14基因的等位基因(例如,野生型等位基因和/或突变型等位基因)的植物或植物部分或种子,
其中ClD14基因的野生型等位基因编码SEQ ID NO:2的蛋白质(或包含SEQ ID NO:6的基因组DNA),Cs14基因的野生型等位基因编码SEQ ID NO:8的蛋白质(或包含SEQ IDNO:15的基因组DNA),并且CmD14基因的野生型等位基因编码SEQ ID NO:9的蛋白质(或包含SEQ ID NO:16的基因组DNA)。
还提供了一种基因分型试剂盒,该试剂盒包括扩增和/或杂交D14基因的基因组DNA的一部分的引物和/或探针以及反应组分。
引物和探针优选通过例如尾序列或标记来标记或修饰,以能够检测扩增或杂交反应产物。
一般定义
动词“包括”及其词形变化以其非限制性意义使用,意味着包括该词之后的项目,但不排除未具体提及的项目。此外,不定冠词“一”或“一个/种”对元件的引用不排除存在多于一个/种元件的可能性,除非上下文清楚地要求存在一个且仅一个/种元件。因此,不定冠词“一”或“一个/种”通常是指“至少一个/种”,例如,“植物”也指若干细胞植物等。类似地,“果实”或“植物”也指若干果实和植物。
如本文所用,术语“植物”包括完整植物或其任何部分或衍生物(优选具有与获得其的植物相同的遗传组成),诸如植物器官(例如,收获或未收获的果实、叶、花、花药等)、植物细胞、植物原生质体、可以再生完整植物的植物细胞组织培养物、植物愈伤组织、植物细胞团块、植物移植物、幼苗、植物中完整的植物细胞、植物克隆或微体繁殖,或植物部分,诸如植物插条、胚、花粉、花药、胚珠、果实(例如,收获的组织或器官)、花、叶、籽、克隆繁殖的植物、根、茎、根尖、移植物(接穗和/或砧木)等。还包括任何发育阶段,诸如幼苗、生根前或生根后的插条等。当提及“植物的种子”时,这些是指植物可由其生长的种子或在自体受精或异体受精后在植物上产生的种子。
如本文所用,术语“品种”或“栽培品种”意指在最低已知等级的单个植物学分类群内的植物分组,其可以通过由给定基因型或基因型组合产生的特征的表达来定义。
术语“等位基因”意指特定基因座(例如D14基因所位于的D14基因座处的基因的一种或多种可替代形式中的任一种形式;基因的等位基因可以是命名为ClD14(西瓜中)或CsD14(黄瓜中)或CmD14(甜瓜中)的野生型等位基因,或突变型等位基因,该等位基因涉及特定基因座处的一个性状或特征(例如二级分枝)。在生物体的二倍体细胞中,给定基因的等位基因位于染色体上的特定位置或基因座(多个基因座)。一个等位基因存在于同源染色体对的每个染色体上。二倍体植物物种可以包含在特定基因座处的大量不同的等位基因。这些可以是基因的相同等位基因(纯合的)或两个不同的等位基因(杂合的),例如,两个相同拷贝的突变体或者一个拷贝的突变型等位基因和一个拷贝的野生型等位基因。同样地,如果三倍体植物具有基因的三个相同等位基因(例如,三个拷贝的突变型等位基因),则该三倍体植物被称为针对该基因纯合的,并且如果四倍体植物具有基因的四个相同等位基因(例如,四个拷贝的突变型等位基因),则该四倍体植物被称为针对该基因纯合的。
“ClD14基因”是在栽培的西瓜中在8号染色体上鉴定的单个隐性基因,与针对野生型非突变型ClD14基因纯合的植物相比,该基因在突变时导致当突变型等位基因呈纯合形式时发展二级枝的(平均)数量增加的表型变化。但是,在黄瓜和甜瓜中的CsD14基因和CmD14基因则是ClD14基因的直向同源物。
“F1、F2、F3等”是指在两个亲本植物或亲本品系之间的杂交后的连续相关世代。由通过使两个植物或品系杂交产生的种子生长的植物称为F1代。F1植物自交产生F2代等。
“F1杂种”植物(或F1杂种种子)是从使两个近交亲本品系杂交获得的世代。因此,F1杂种种子是F1杂种植物从其生长的种子。由于杂种优势,F1杂种更强烈并且产率更高。近交品系在基因组的大多数基因座处基本上是纯合的。
“植物品系”或“培育品系”是指植物及其后代。如本文所用,术语“近交品系”是指已经重复自交并且几乎纯合的植物品系。因此,“近交品系”或“亲本品系”是指已经历几代(例如,至少4、5、6、7或更多代)近亲交配的植物,从而产生具有高度一致性的植物品系。
术语“基因”意指包含在细胞中转录成信使RNA分子(mRNA)的区域(转录区)和可操作地连接的调节区(例如,启动子)的(基因组)DNA序列。实例是本发明的D14基因。基因的不同等位基因因此是基因的不同可替代形式,该可替代形式可以呈例如基因组DNA序列(例如,启动子序列、外显子序列、内含子序列等)中的一个或多个核苷酸的差异、mRNA和/或编码蛋白质的氨基酸序列的形式。
“突变型ClD14等位基因”在本文中是指西瓜中基因的突变型等位基因,当突变型等位基因呈纯合形式时,该突变型等位基因导致西瓜植物发展增加(平均)数量的二级枝,例如等于或大于45个二级枝(也称为“多分枝”)。类似地,“突变型CsD14等位基因或突变型CmD14等位基因”是指黄瓜和甜瓜中导致这些作物中二级分枝增加的直向同源基因的突变型等位基因。突变型等位基因中的突变可以是任何突变或突变组合,包括缺失、截短、插入、重复、点突变、无义突变、错义突变或非同义突变、剪接位点突变、移码突变和/或在一个或多个调节序列(诸如启动子序列或者增强子或沉默子序列)中的突变。突变型ClD14等位基因可以导致‘完全多分枝’或‘强多分枝’,这是指由于突变型等位基因编码非功能性蛋白质或突变型等位基因是敲除等位基因而在植物中不传递抑制二级枝形成的信号的突变型等位基因。突变型ClD14等位基因可以导致‘中等多分枝’,这是指由于突变型等位基因编码功能降低的蛋白质或突变型等位基因是敲低等位基因而在植物中传递一些在一定程度上抑制二级枝形成的信号的突变型等位基因,该抑制程度显著低于在野生型植物中的抑制程度。因此,‘中等多分枝’表型在针对野生型、非突变型等位基因纯合的植物的二级枝的平均数量和具有‘完全多分枝’表型的植物的二级枝的平均数量之间。
“野生型ClD14或CsD14或CmD14等位基因”在本文中是指基因的功能性等位基因,该功能性等位基因引起植物发展正常数量的二级枝。野生型ClD14等位基因存在于西瓜的任何商业品种中(例如Nunhems品种Premium F1、Montreal F1等)。在一个方面,野生型ClD14等位基因是ClD14基因的野生型等位基因,由此ClD14基因是编码SEQ ID NO:2的蛋白质或编码与SEQ ID NO:2具有至少95%、96%、97%、98%或99%序列同一性(当例如使用Needle进行成对比对时)的蛋白质的基因。在一个方面,野生型CsD14等位基因是CsD14基因的野生型等位基因,由此CsD14基因是编码SEQ ID NO:8的蛋白质或编码与SEQ ID NO:8具有至少95%、96%、97%、98%或99%序列同一性(当例如使用Needle进行成对比对时)的蛋白质的基因。在一个方面,野生型CmD14等位基因是CmD14基因的野生型等位基因,由此CmD14基因是编码SEQ ID NO:9的蛋白质或编码与SEQ ID NO:9具有至少95%、96%、97%、98%或99%序列同一性(当例如使用Needle进行成对比对时)的蛋白质的基因。
术语“基因座”(多个基因座)意指染色体上例如发现基因或遗传标志物的一个或多个特定位置或位点。因此,ClD14基因座是西瓜基因组中发现ClD14基因的突变型等位基因和/或野生型等位基因的位置。ClD14基因座是栽培的西瓜8号染色体上的基因座(使用在万维网cucurbitgenomics.org在“西瓜:基因组”、“Charleston Grey”或“97103V1或V2”下发现的公开西瓜基因组的染色体分配)。
“诱导的突变型等位基因”是突变型等位基因,其中突变(已)由人为干预诱导,例如通过经由物理或化学诱变方法进行诱变或经由例如组织培养(如例如Zhang等人,Plos,第9卷,第5期,e96879中所述)(还包括靶向基因编辑技术(诸如基于Crispr的技术、TALENS等))来诱导。
“二倍体植物”是指具有两组染色体的可以由它们生长二倍体植物的植物、营养植物部分或种子,本文命名为2n。
“DH植物”或“双单倍体植物”是通过使用例如体外技术使二倍体植物的单倍体基因组加倍而产生的二倍体植物。因此,DH植物在所有基因座处是纯合的。
“三倍体植物”是指具有三组染色体的可以由它们生长三倍体植物的植物、营养植物部分或种子,本文命名为3n。
“四倍体植物”是指具有四组染色体的可以由它们生长四倍体植物的植物、营养植物部分或种子,本文命名为4n。
“多倍体植物”是指具有比二倍体更高倍性的植物,即三倍体(3n)、四倍体(4n)、六倍体(6n)、八倍体(8n)等。
“授粉植物”或“授粉者”是指适合作为用于诱导三倍体植物上的结果的授粉者的(近交或杂种)二倍体植物或其部分(例如,其花粉或接穗)。因此,授粉植物能够通过在适当的白天并持续适当的时间段产生适当量的花粉而导致正常三倍体植物的良好的结果(和良好的三倍体果实产量)。
“杂种三倍体植物”或“F1三倍体”或“三倍体杂种”是从杂种三倍体种子生长的三倍体植物,该杂种三倍体种子是从使雄性二倍体亲本与雌性四倍体亲本杂交授粉获得的。雄性亲本用于在四倍体雌性亲本上诱导结果和种子生产,从而产生含有F1杂种三倍体种子的果实。用于生产F1三倍体种子的雄性亲本和雌性亲本都是近交的,使得每个亲本品系几乎呈纯合的和稳定的。
“无籽果实”是不含活的成熟种子的果实。果实可以含有一个或多个小的、可食用的、白色胚珠。任选地,果实可以含有少量褐色或黑色种子,但这些种子不是活的。活的成熟种子是可以在适当条件下在土壤中发芽并生长成植物的种子。
“间种”是指在相同田地上播种或移植的两种或更多种类型的种子和/或移植物的组合,尤其是在与三倍体杂种植物相同的田地中播种和/或移植授粉者(用于三倍体植物上的无籽果实生产和授粉植物上的二倍体果实生产)。例如,授粉者可以种植在分开的行中或与三倍体植物在同一行(例如,在每一行中的小山中)间种。授粉者也可以种植在三倍体的行间。授粉者和三倍体杂种的种子也可以在接种前混合,从而导致随机接种。三倍体杂种植物和/或授粉植物的移植物还可以包含不同植物的砧木。合适的砧木是本领域已知的。具有不同砧木的西瓜植物被称为“嫁接的”。
“种植”或“种植的”是指通过机器或手工将幼苗(小植物)接种(直接播种)或移植到田地中。
“营养繁殖”或“克隆繁殖”是指例如通过体外繁殖或嫁接方法(使用接穗和砧木)从营养组织繁殖植物。体外繁殖涉及体外细胞或组织培养和由体外培养再生整个植物。嫁接涉及通过嫁接到砧木上繁殖原始植物。因此可以通过体外培养或嫁接生成原始植物的克隆(即遗传相同的营养繁殖)。“细胞培养”或“组织培养”是指植物细胞或组织的体外培养。“再生”指由细胞培养或组织培养或营养繁殖发育植物。“非繁殖细胞”指不能再生成完整植物的细胞。
“隐性”是指当显性等位基因不存在于二倍体基因组中时,即当该显性等位基因在二倍体中为纯合的时,表达其表型(例如,多分枝)的等位基因。突变型ClD14等位基因当在二倍体植物中以两个拷贝、任选地在四倍体植物中以四个拷贝或在三倍体植物中以两个或三个拷贝或在另一多倍体中以相应拷贝数存在时,产生具有表型变化的植物(在别处描述)。显性等位基因在本文中也被称为野生型(WT)等位基因。
“栽培西瓜”或“西瓜”在本文中是指Citrullus lanatus ssp.vulgaris或Citrullus lanatus(Thunb.)Matsum.&Nakai subsp.vulgaris(Schrad.),并且具有良好的农艺学特征,尤其是生产具有良好的果实质量和果实一致性的可销售的果实的特征。这排除了野生西瓜。
“野生西瓜”在本文中是指产生质量差并且一致性差的果实的Citrullus lanatusssp.lanatus和Citrullus lanatus ssp.mucosospermus。
“栽培黄瓜”或“栽培甜瓜”是指具有良好农艺学特征的黄瓜或甜瓜,该农艺学特征尤其是生产具有良好果实质量和果实一致性的可销售的果实。这排除了生产质量差并且一致性差的果实的野生黄瓜或野生甜瓜。
“SNP标志物”是指例如突变型ClD14、CsD14或CmD14等位基因与野生型等位基因之间的单核苷酸多态性。可以使用可以区分基因的突变型和野生型等位基因的SNP标志物测定(即等位基因特异性测定),针对突变型等位基因和/或野生型等位基因的存在来筛选裤子、植物部分或它们的DNA。
“INDEL标志物”是指例如突变型ClD14、CsD14或CmD14等位基因与野生型ClD14、CsD14或CmD14等位基因之间的插入/缺失多态性。例如,标志物mWM23349015_k2是INDEL标志物,其区分编码SEQ ID NO:2的蛋白质的野生型ClD14等位基因与编码SEQ ID NO:1的蛋白质的突变型ClD14等位基因(包含8个氨基酸的重复)。可以使用可以区分基因的突变型与野生型等位基因的INDEL标志物测定(即等位基因特异性测定),针对突变型等位基因的存在来筛选裤子、植物部分或它们的DNA。
“基因分型”方法是可以由其确定植物或植物部分或种子的基因型或等位基因组成的方法。双等位基因基因分型测定(诸如KASP测定)可以区分基因座处的两个等位基因。
“栽培西瓜基因组”和“栽培西瓜基因组上的物理位置”以及“8号染色体”是指栽培西瓜的物理基因组和物理染色体以及染色体上的物理位置,在万维网cucurbitgenomics.org上在“西瓜:基因组”(例如,“西瓜(Charleston Grey)”)下发现参照基因组。
“包含突变型ClD14等位基因的染色体区域”是指例如栽培西瓜的8号染色体的基因组区域,该区域携带突变型ClD14等位基因。等位基因的存在可以通过表型和/或通过检测区分不同ClD14等位基因的标志物或通过等位基因序列本身的基因组序列来确定(例如,通过对等位基因进行测序来确定)。“等位基因特异性标志物”是对特定等位基因(例如,特定突变型等位基因)具有特异性,并且因此区分例如突变型等位基因与野生型等位基因的标志物。
如果赋予性状(诸如突变型D14等位基因的表型特征)的遗传元件、渐渗片段或者基因或等位基因可以使用传统培育技术从其存在的植物或种子转移到其不存在的另一植物或种子(诸如野生型品系或品种)中,除了添加由遗传元件、基因座、渐渗片段、基因或等位基因赋予的性状之外不导致受体植物的表型改变,则称该遗传元件、渐渗片段或者基因或等位基因“能够”或“可以”从植物或种子或组织或细胞获得,或者“能够”或“可以”从植物或种子或组织或细胞衍生,或者“存在于”或“发现于”植物或种子或组织或细胞。这些术语可互换使用,并且因此遗传元件、基因座、渐渗片段、基因或等位基因可以转移到任何其他缺乏该性状的遗传背景中。可以例如通过诱变(例如,化学诱变、CRISPR-Cas诱导等)并且然后例如与其他栽培西瓜杂交从头生成含有遗传元件、基因座、渐渗片段、基因或等位基因(例如,突变型ClD14等位基因)的栽培西瓜。类似地,可以从头生成含有遗传元件、基因座、渐渗片段、基因或等位基因(例如,突变型CsD14或CmD14等位基因)的栽培黄瓜或甜瓜。
“均值”或“平均值”在本文中是指算术平均值,并且两个术语可互换使用。因此,术语“均值”或“平均值”是指几次测量的算术平均值。技术人员理解,植物品系或品种的表型在某种程度上取决于生长条件,并且因此优选在具有几个重复的随机实验设计中和在相同实验中在相同条件下生长的合适对照植物中,测量至少4、5、6、7、8、9、10、15、20、30、40、50个或更多个植物(或植物部分)的算术平均值。“统计学显著的”或“统计学显著地”不同或“显著地”不同是指植物品系或品种的特征,当与合适的对照比较时,该特征显示出该特征与对照(平均值)的统计学显著差异(例如,使用ANOVA的p值小于0.05,p<0.05)。例如,当在本文中提及二级枝的平均数量的差异时,应理解所提及的差异是统计学显著的差异,例如‘中等多分枝’植物基因型具有统计学上显著高于对照植物基因型的二级枝的平均数量,该对照植物基因型包含呈纯合形式的野生型D14等位基因。
术语“传统培育技术”在本文中涵盖杂交、回交、自交、选择、双单倍体生产、染色体加倍、胚拯救、原生质体融合、标记辅助选择、突变培育等,所有这些技术都是培育者已知的,通过这些技术例如可以获得、鉴定和/或转移包含突变型ClD14等位基因的8号染色体。
“回交”是指培育方法,通过该方法,(单个)性状(诸如由突变型ClD14等位基因赋予的表型改变)可以从一个(通常是较差的)遗传背景(也称为“供体”)转移到另一个(通常是较优的)遗传背景(也称为“轮回亲本”中。杂交的后代(例如,通过将例如供体与轮回亲本西瓜杂交获得的F1植物,或从F1自交获得的F2植物或F3植物等)与具有例如较优的遗传背景的亲本“回交”。在重复回交后,一个(通常是较差的)遗传背景的性状将被掺入到另一个(通常是较优的)遗传背景中。
“标记辅助选择”或“MAS”是使用分子标志物(诸如SNP标志物或INDEL标志物)的存在来针对特定基因组或区域或等位基因的存在选择植物的过程,该分子标志物在遗传上和物理上与特定基因座或特定染色体区域或等位基因特异性标志物相关联。例如,在遗传上和物理上与突变型ClD14等位基因或等位基因特异性标志物相关联的分子标志物可以用于检测和/或选择例如包含突变型ClD14等位基因的西瓜植物或植物部分。等位基因特异性标志物是优选的标志物,因为它们直接针对等位基因进行选择。
“转基因”或“嵌合基因”是指包含DNA序列(诸如重组基因)的遗传基因座,该DNA序列已经通过转化(诸如农杆菌属(Agrobacterium)介导的转化)引入到植物的基因组中。包含稳定整合到其基因组中的转基因的植物称为“转基因植物”。
“分离的核酸序列”或“分离的DNA”是指不再存在于分离其的天然环境中的核酸序列,例如细菌宿主细胞中或植物核或质体基因组中的核酸序列。当在本文中提及“序列”时,应理解具有此类序列的分子是指例如核酸分子。
“宿主细胞”或“重组宿主细胞”或“转化细胞”为是指由于至少一种核酸分子被引入所述细胞而产生的新的单个细胞(或生物体)的术语。宿主细胞优选为植物细胞或细菌细胞。宿主细胞可以含有作为染色体外(附加型)重复分子的核酸,或包含整合在宿主细胞的核或质体基因组中的核酸,或作为引入的染色体(例如微型染色体)的核酸。
“序列同一性”和“序列相似性”可以通过使用全局或局部比对算法比对两个肽或两个核苷酸序列来确定。当序列通过例如程序GAP或BESTFIT或Emboss程序“Needle”(使用默认参数,见下文)进行最佳比对时,则序列可以被称为“基本上相同”或“基本上相似”,共享至少某一最小百分比的序列同一性(如下文进一步定义)。这些程序使用Needleman和Wunsch全局比对算法在两个序列的整个长度上比对两个序列,使匹配的数量最大化并且使缺口的数量最小化。通常,使用默认参数,其中缺口产生罚分=10,并且缺口延伸罚分=0.5(对于核苷酸和蛋白质比对两者)。对于核苷酸,使用的默认评分矩阵是DNAFULL,并且对于蛋白质,默认评分矩阵是Blosum62(Henikoff和Henikoff,1992年,PNAS,第89卷,第10915-10919页)。序列比对和序列同一性百分比的评分可以例如使用计算机程序(诸如在万维网上在ebi.ac.uk/Tools/psa/emboss_needle/下可获得的EMBOSS)来确定。可替代地,序列相似性或同一性可以通过搜索数据库诸如FASTA、BLAST等来确定,但应检索命中并成对比对以比较序列同一性。如果序列同一性百分比为至少95%、96%、97%、98%、99%或更多,则两个蛋白质或两个蛋白质结构域或两个核酸序列具有“基本序列同一性”(如通过Emboss“needle”使用默认参数(即缺口产生罚分=10,缺口延伸罚分=0.5),对于核酸使用评分矩阵DNAFULL和对于蛋白质使用Blosum62所确定的)。
当提及与参考序列具有“基本序列同一性”或与参考序列具有至少95%,例如至少96%、97%、98%或99%核酸序列同一性的序列同一性的核酸序列(例如,DNA或基因组DNA)时,在一个实施方案中,认为所述核苷酸序列与给定核苷酸序列基本相同,并且可以使用严格杂交条件鉴定。在另一个实施方案中,与给定的核苷酸序列相比,核酸序列包含一个或多个突变,但仍可以使用严格杂交条件鉴定。
“严格杂交条件”可以用于鉴定与给定核苷酸序列基本上相同的核苷酸序列。严格条件取决于序列,并且在不同情况下会有所不同。通常,严格条件被选择为在限定的离子强度和pH下比特异性序列的热熔点(Tm)低约5℃。Tm是(在限定的离子强度和pH下)50%的靶序列与完全匹配的探针杂交时的温度。通常选择严格条件,其中在pH 7下盐浓度为约0.02摩尔并且温度为至少60℃。降低盐浓度和/或增加温度增加了严格性。用于RNA-DNA杂交(使用例如100nt的探针的Northern印迹)的严格条件是例如包括在63℃下在0.2X SSC中至少一次洗涤20分钟的那些,或等同条件。用于DNA-DNA杂交(使用例如100nt的探针的Southern印迹)的严格条件是例如包括在0.2X SSC中在至少50℃、通常约55℃的温度下至少一次(通常2次)洗涤20分钟的那些,或等同条件。
在本发明的上下文中,“M1代”或“M1植物”是指直接从诱变处理产生的第一代。例如从用诱变剂处理的种子生长的植物是M1代的代表。
“M2代”或“M2植物”在本文中是指从M1代的自花传粉获得的代。由从自花传粉的M1植物获得的种子生长的植物代表M2植物。M3、M4等是指自花传粉后获得的其他代。
“mRNA编码序列”在本文中具有通常含义。除了胸腺嘧啶(T)被尿嘧啶(U)置换之外,mRNA编码序列对应于基因/等位基因的相应DNA编码(cDNA)序列。
核酸分子(DNA或RNA)中的“突变”是例如通过一个或多个核苷酸的置换、缺失或插入而与相应的野生型序列相比一个或多个核苷酸的改变。此类突变的实例是点突变、无义突变、错义突变、剪接位点突变、移码突变或调节序列中的突变。
“核酸分子”具有本领域的通常理解。其由包含糖脱氧核糖(DNA)或核糖(RNA)中的任一者的核苷酸构成。
“点突变”是单个核苷酸的置换,或者单个核苷酸的插入或缺失。
“无义突变”是编码蛋白质的核酸序列中的(点)突变,由此核酸分子中的密码子改变为终止密码子。这导致mRNA中存在提前终止密码子,并导致截短蛋白的翻译。截短蛋白可以功能减少或功能丧失。
“错义或非同义突变”是编码蛋白质的核酸序列中的(点)突变,由此密码子被改变为编码不同的氨基酸。所得蛋白质可以功能减少或功能丧失。
“剪接位点突变”是编码蛋白质的核酸序列中的突变,由此改变前mRNA的RNA剪接,从而产生具有与野生型不同的核苷酸序列的mRNA和具有与野生型不同的氨基酸序列的蛋白质。所得蛋白质可以功能减少或功能丧失。
“移码突变”是编码蛋白质的核酸序列中的突变,通过该突变改变mRNA的阅读框,从而产生不同的氨基酸序列。所得蛋白质可以功能减少或功能丧失。
在本发明上下文中的“缺失”意指在给定核酸序列中的任何地方与相应野生型序列的核酸序列相比缺失至少一个核苷酸,或者在给定氨基酸序列中的任何地方与相应(野生型)序列的氨基酸序列相比缺失至少一个氨基酸。
“截短”应理解为意指与相应野生型序列的核酸序列相比,在核苷酸序列的3'端或5'端缺失至少一个核苷酸,或者与相应野生型蛋白的氨基酸序列相比,在蛋白质的N末端或C末端缺失至少一个氨基酸,但优选至少10、20、30、40、50、60、70、80、90、100或更多个氨基酸。5'端由在相应野生型核酸序列的翻译中用作起始密码子的ATG密码子确定。
“置换”意指核酸序列中的至少一个核苷酸或蛋白质序列中的至少一个氨基酸与相应的野生型核酸序列或相应的野生型氨基酸序列相比分别是不同的,这是由于相应蛋白质的编码序列中核苷酸的交换。
“插入”意指核酸序列或蛋白质的氨基酸序列分别与相应的野生型核酸序列或相应的野生型氨基酸序列相比包含至少一个额外的核苷酸或氨基酸。
“重复”意指一个或多个(连续)核苷酸或一个或多个(连续)氨基酸在核苷酸或氨基酸序列中至少存在两次,而不是在野生型序列中存在一次。因此,重复是已经在野生型序列中存在一次的一个或多个连续核苷酸或一个或多个连续氨基酸的插入。插入可以与原始序列相邻,或者它可以被一个或多个核苷酸或氨基酸分开,即它可以进一步远离原始序列重复。
本发明上下文中的“提前终止密码子”意指与相应野生型编码序列的终止密码子相比,终止密码子更接近5'端的起始密码子存在于编码序列(cds)中。
“调节序列中的突变”,例如在基因的启动子或增强子中的突变,是例如通过一个或多个核苷酸的置换、缺失或插入而与野生型序列相比一个或多个核苷酸的改变,从而导致例如产生减少的或不产生基因的mRNA转录物。
“蛋白质中的突变”是例如通过一个或多个氨基酸残基的置换、缺失、截短或插入或重复而与野生型序列相比一个或多个氨基酸残基的改变。
“突变型蛋白”在本文中是包含在编码蛋白质的核酸序列中的一个或多个突变的蛋白质,由此突变例如通过由突变型等位基因赋予的表型产生(编码的突变型核酸分子)“功能降低”或“功能丧失”的蛋白质,如例如可测量的体内“功能降低”或“功能丧失”的蛋白质。
“野生型3维结构”或“野生型蛋白折叠”是指野生型蛋白的体内折叠以执行其正常体内功能。“修饰的3维结构或修饰的蛋白质折叠”是指具有与野生型蛋白不同的折叠的突变型蛋白,该折叠降低或消除其正常体内功能或活性,即该蛋白质功能降低或功能丧失。蛋白质截短也导致修饰3三维结构。可以使用例如程序诸如RaptorX并将预测的野生型蛋白结构与预测的修饰的蛋白结构比较来预测被修饰的3-D结构。
在本发明的上下文中,蛋白质的“活性减少”意指当与相应的野生型植物细胞或相应的野生型植物相比时,D14蛋白的活性减少。在一个方面,减少包括基因表达的完全敲除或敲低,或功能丧失或功能降低的D14蛋白的产生,例如,与野生型功能性D14蛋白相比,突变型D14蛋白可能已丧失功能或减少功能。活性减少可以是编码D14蛋白的基因表达的减少(也称为敲低),或编码D14蛋白的基因表达的敲除和/或细胞中D14蛋白的量的减少,或细胞中D14蛋白活性的功能降低或功能丧失。因为发现D14蛋白功能直接反映(并引起)二级分枝的程度,所以可以在针对突变型等位基因纯合的植物中在表型上确定功能丧失蛋白(或敲除等位基因)或功能减少蛋白(或敲低等位基因),并且将在‘完全多分枝’表型或‘中等多分枝’表型中观察到。
在本发明的上下文中,术语“野生型植物细胞”或“野生型植物”意指它们包含野生型D14等位基因并且不是突变型D14等位基因。因此,野生型植物或野生型植物细胞是包含全功能性D14基因的植物或植物细胞,该基因编码全功能性ClD14、CsD14或CmD14蛋白(也称为野生型D14蛋白),例如,就西瓜植物或植物细胞而言,二倍体西瓜植物在其基因组中包含SEQ ID NO:6和/或产生SEQ ID NO:2的蛋白质(或与SEQ ID NO:2具有至少95%序列同一性的蛋白质)并且具有正常分枝表型。
“敲除”或“完全敲除”应理解为相应基因的表达不再可检测到。
在本发明的上下文中,“功能丧失”或“功能降低”或“功能减少”意指尽管可能以等于或类似于相应野生型蛋白的量存在,但蛋白质不再引起其正常作用,即对于编码此类蛋白质的突变型等位基因,当以纯合形式存在于二倍体植物中时,该植物产生本文别处所述的表型变化。如所提及的,发现D14蛋白功能直接反映(并引起)二级分枝的程度,功能丧失蛋白或功能减少蛋白可以在针对突变型等位基因纯合的植物中在表型上确定,并且将在‘完全多分枝’表型或‘中等多分枝’表型中观察到。
“催化三联体”是指野生型ClD14、CsD14和CmD14蛋白中的3个保守氨基酸,即SEQID NO:2(ClD14)、SEQ ID NO:8(CsD14)和SEQ ID NO:9(CmD14)的S97、D218和H247。“靶向基因编辑”是指可以由其修饰内源靶基因的技术,例如可以在例如启动子或编码序列中插入、置换和/或缺失一个或多个核苷酸。例如,基于CRISPR的技术,诸如Crispr-Cas9基因编辑、Crispr-CpfI基因编辑或更近的称为‘碱基编辑’或‘引物编辑’的技术可用于修饰内源靶基因,诸如西瓜中的内源野生型ClD14基因(编码SEQ ID NO:2的蛋白质或与SEQ ID NO:2具有至少95%序列同一性的野生型蛋白)、黄瓜中的内源野生型CsD14基因(编码SEQ ID NO:8的蛋白质或与SEQ ID NO:8具有至少95%序列同一性的野生型蛋白)和甜瓜中的内源野生型CmD14基因(编码SEQ ID NO:9的蛋白质或与SEQ ID NO:9具有至少95%序列同一性的野生型蛋白)。
“寡核苷酸”或“低聚核苷酸”或“寡核苷酸引物或探针”是短的单链核酸聚合物,例如长度为至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或更多个核苷酸。低聚核苷酸可以是未修饰的或用多种化学修饰的,这取决于它们的预期用途,例如添加5'或3'磷酸基团以分别实现连接或阻断延伸,用放射性核素或荧光团和/或淬灭剂标记以用作探针,掺入硫醇、氨基或其他反应性部分以实现功能性分子(诸如酶)的共价偶联,以及用不同功能性的其他连接子和间隔子延伸。DNA低聚核苷酸是最常用的,但RNA低聚核苷酸也是可用的。低聚核苷酸的长度通常通过添加后缀-mer来命名。例如,具有19个核苷酸(碱基)的寡核苷酸被称为19-mer。对于大多数应用,寡核苷酸被设计成与DNA或RNA链进行碱基配对。寡核苷酸最常用作PCR(聚合酶链式反应)的引物。设计引物,使其序列的至少一部分与靶向扩增的序列互补。互补序列的最佳引物长度是例如18至22个核苷酸。用于PCR的最佳引物序列通常由引物设计软件确定。
“DNA微阵列”是具有许多结合在固体支持物上的DNA(通常是寡核苷酸)的微观斑点的阵列。测定靶标可以是DNA、cDNA或cRNA。根据系统,靶标与特定斑点的杂交通过荧光、化学发光或胶体银或金来检测。微阵列用于多种应用,诸如大量基因表达的同时测量,使得能够进行全基因组基因表达分析,以及使用例如单核苷酸多态性(SNP)或InDel分析进行的基因分型研究。
“互补链”是指互补序列的两条链,并且对于双链DNA可以称为有义(或正)和反义(或负)链。有义/正链通常是DNA的转录序列(或在转录中生成的mRNA),而反义/负链是与有义序列互补的链。对于本文提供的任何序列,仅给出了序列的一条链,但本文也涵盖了给定链的互补链。DNA的互补核苷酸是与T互补的A和与C互补的G。RNA的互补核苷酸是与U互补的A和与C互补的G。
附图说明
图1:SEQ ID NO:2的野生型(WT)ClD14蛋白与SEQ ID NO:1的突变型ClD14ins蛋白之间的成对氨基酸序列比对。8个重复的氨基酸以粗体突出显示。
图2:拟南芥属AtD14蛋白(SEQ ID NO:7)与SEQ ID NO:1的ClD14ins蛋白之间的成对氨基酸序列比对。催化三联体的氨基酸以粗体突出显示。
图3:SEQ ID NO:1的西瓜ClD14ins蛋白与野生型黄瓜CsD14蛋白(SEQ ID NO:8)和野生型甜瓜CmD14蛋白(SEQ ID NO:9)的多序列比对。
图4:编码SEQ ID NO:2的野生型西瓜ClD14蛋白的野生型基因组序列(SEQ ID NO:6)和包含24个重复/插入的核苷酸并编码SEQ ID NO:1的突变型蛋白(包含8个氨基酸的重复,包括催化三联体的氨基酸中的一种氨基酸S97)的突变型基因组序列(SEQ ID NO:5)的成对比对。内含子序列以粗体表示。
图5:InDel标志物mWM23349015_k2的等位基因鉴别图,其中X轴上为Fam等位基因(突变型插入等位基因),并且Y轴上为VIC等位基因(野生型/缺失等位基因)。
图6:在野生型ClD14蛋白中鉴定的TILLING突变体以粗体和下划线显示,其中氨基酸取代如下所示。加框的氨基酸是催化三联体的氨基酸。浅灰色条显示氨基酸136至氨基酸193的螺旋盖结构域(描述于Seto等人,2019年,Nature Communications,第10卷第191期中)。两个黑色三角形(带有箭头)显示保守结构域IPR00073(氨基酸22至氨基酸259)的起始和结束,其是被描述为‘α/β水解酶折叠-1’或‘AB_水解酶_1’结构域的InterPro结构域。该结构域描述如下。α/β水解酶折叠对于许多具有广泛不同的系统发生起源和催化功能的水解酶是共有的。每种酶的核心是α/β-片(而不是桶),含有通过螺旋连接的8条链。该酶被认为是从共同的祖先中分离出来的,保留了催化残基的排列。所有酶都具有催化三联体,其元件承载在环上,该环是折叠的最佳保守结构特征。催化三联体残基存在于环上。这些环中的一个环是亲核的肘部,并且是折叠的最保守的特征。
图7:右侧照片为W155终止TILLING突变体(针对W155终止等位基因纯合),显示了多分枝表型。左侧照片为不成对的植物(针对野生型等位基因纯合),其中功能性ClD14蛋白结合独脚金内酯并抑制二级分枝。
具体实施方式
本发明的第一个实施方案涉及栽培的西瓜、黄瓜或甜瓜植物,其包含至少一个拷贝的基因(本文称为D14基因(ClD14、CsD14或CmD14))的突变型等位基因,该突变型等位基因赋予(当呈纯合形式时)与针对该基因的功能性野生型等位基因纯合的植物相比发展二级枝的平均数量的变化。
ClD14基因是栽培西瓜的内源基因,当突变时并且呈纯合形式时导致由该植物产生的二级枝的显著增加。
在多分枝西瓜中,发现ClD14基因的内源等位基因的两个拷贝在编码序列中都含有24个核苷酸的重复,这又导致8个氨基酸的重复。该蛋白质在本文中被称为ClD14ins,并且示于SEQ ID NO:1中。重复包括催化三联体的氨基酸中的一种氨基酸(S97)。最初,发明人推测这种重复可能降低体内催化三联体的功能或消除体内催化三联体的正确运行。
D14是在植物中具有若干功能并且在蛋白质中具有若干功能性结构域的复合蛋白质,该功能包括独脚金内酯结合、水解、与各种其他蛋白质和配体的相互作用、构象变化和信号转导。
因此,非常令人惊讶的是,产生截短的非功能性D14蛋白(称为W155*蛋白)的TILLING突变体具有与包含8个氨基酸重复的蛋白质相同的表型。这意指包含8个氨基酸重复(包括催化三联体氨基酸S97)的蛋白质实际上是功能丧失的蛋白质,并且观察到的表型是最强的二级分枝(在本文中称为‘完全多分枝’或‘强多分枝’)。这还意指可以生成未完全功能丧失的引起‘中等多分枝’表型的突变型蛋白,即抑制二级枝形成的信号传导途径仍然被功能降低的D14蛋白诱导和传递,使得二级分枝仅被部分抑制。
因此,在一个方面,提供了一种包含命名为ClD14(西瓜Dwarf14)的基因的突变型等位基因的西瓜植物,其中突变型等位基因包含在一个或多个调节序列中的突变,从而导致与相应的野生型等位基因相比减少的基因表达或无基因表达,或者其中突变型等位基因编码包含与由野生型等位基因编码的蛋白质相比一个或多个氨基酸的缺失、截短、插入或置换的蛋白质,从而导致ClD14蛋白的功能降低或功能丧失,其中当突变型等位基因呈纯合形式时,该突变型等位基因导致所述植物发展增加的二级枝的平均数量,并且其中该突变型等位基因不是编码SEQ ID NO:1的蛋白质(ClD14ins蛋白)的突变型等位基因,
其中野生型等位基因的ClD14蛋白由选自由以下组成的组的核酸分子编码:
a)核酸分子,其编码具有SEQ ID NO:2给出的氨基酸序列的蛋白质
b)核酸分子,其包含SEQ ID NO:6显示的核苷酸序列或其互补序列。
在一个方面,突变型等位基因编码其中插入、置换或缺失一个或多个氨基酸的蛋白质,从而导致蛋白质的功能丧失,由此二级枝的平均数量处于其最高水平(完全多分枝),例如为包含呈纯合形式的野生型等位基因的野生型对照植物的至少200%、210%、215%、220%或更多,例如与针对编码非功能性蛋白质ClD14ins蛋白或W155*蛋白的突变型ClD14等位基因纯合的植物中一样高,但该突变型等位基因不是编码SEQ ID NO:1的ClD14ins蛋白的等位基因。因此,植物的基因组在8号染色体上不包含SEQ ID NO:5,其是编码ClD14ins蛋白的基因组序列。
编码功能丧失的D14蛋白的ClD14等位基因可以容易地从头生成。例如通过随机或靶向诱变。两个特异性突变型等位基因是实施例中生成的W155*突变体和Q255*突变体。然而,导致ClD14蛋白功能丧失的任何其他突变型等位基因都被涵盖在内,并且可以容易地生成并测试其表型。
在另一个方面,突变型等位基因编码其中插入、置换或缺失一个或多个氨基酸的蛋白质,从而导致蛋白质的功能降低,而不导致蛋白质的功能丧失,由此二级枝的平均数量高于针对野生型ClD14等位基因纯合的植物中的二级枝的平均数量,但不如针对编码非功能性蛋白质诸如例如ClD14ins蛋白或W155*蛋白的突变型ClD14等位基因纯合的植物中的二级枝的平均数量高。
在一个方面,西瓜植物是针对突变型等位基因纯合的,并且与针对野生型等位基因纯合的植物相比,发展增加的二级枝的平均数量(完全多分枝或中等多分枝)。还涵盖可以生长具有增加的平均二级分枝(完全多分枝或中等多分枝)的植物的种子。
对于原始多分枝突变体(包含8个氨基酸重复,本文称为ClD14ins蛋白),开发了基于突变型等位基因中的INDEL标志物(插入/缺失)的高通量基因分型测定,即在突变型/修饰的等位基因中插入24个额外的核苷酸并且在野生型等位基因中“缺失”(缺乏)这24个核苷酸,以筛选用于INDEL的植物、种子或植物部分群体的基因组DNA。图4显示了ClD14野生型等位基因(SEQ ID NO:6;‘24个核苷酸的缺失’)和突变型/修饰的等位基因(SEQ ID NO:5,‘24个核苷酸的插入’)的基因组序列。
SEQ ID NO:13(‘缺失’序列,即野生型等位基因)和SEQ ID NO:14(‘插入序列’,即突变型等位基因)中显示了包含INDEL并且用于设计两个正向和一个反向PCR引物的两个序列。这些是等位基因的反向链(-链)的序列。正向链(正链)示于SEQ ID NO:6(野生型基因组序列)和SEQ ID NO:5(具有插入的突变型基因组序列)以及图4中。
然而,对于D14基因的任何突变型等位基因,例如表A或表2中所示的任何突变体或ClD14基因的其他突变型等位基因,可以开发(并涵盖在本文中)类似的基因分型测定。
因此,在一个方面,提供了一种用于对西瓜植物、种子、植物部分、细胞或组织进行基因分型的基因分型测定,该测定包括以下步骤:
a)提供一种或多种西瓜植物或植物群体的基因组DNA,和
b)进行基因分型测定,其检测SEQ ID NO:6(或其互补链)的野生型等位基因的存在和/或突变型等位基因的存在,其中该突变型等位基因包含相对于SEQ ID NO:6插入、缺失、置换或重复的一个或多个核苷酸,以及任选地
c)选择包含两个拷贝的野生型等位基因或者一个拷贝的野生型等位基因的和一个拷贝的突变型等位基因或者两个拷贝的突变型等位基因的植物、种子、植物部分、细胞或组织。
在步骤b)中,突变型等位基因中的突变优选地导致相对于野生型蛋白插入、缺失或置换一个或多个氨基酸。
在一个方面,提供了一种对西瓜植物、植物部分、细胞或组织进行基因分型的基因分型测定,该测定包括以下步骤:
a)提供一种或多种西瓜植物或植物群体(例如,培育群体、F2群体、回交群体等)的基因组DNA,和
b)进行基因分型测定,其检测编码SEQ ID NO:2的蛋白质的野生型等位基因的存在和/或突变型等位基因的存在,其中该突变型等位基因包含相对于SEQ ID NO:2插入、缺失、置换或重复的一个或多个氨基酸,以及任选地
c)选择包含两个拷贝的野生型等位基因或者一个拷贝的野生型等位基因的和一个拷贝的突变型等位基因或者两个拷贝的突变型等位基因的植物、种子、植物部分、细胞或组织。
步骤a)可以包括从待在基因分型测定中分析的植物、种子、植物部分、细胞或组织中分离基因组DNA。如本领域已知的,通常可以使用粗DNA提取方法。
步骤b)优选包括双等位基因基因分型测定,其利用等位基因特异性引物和/或等位基因特异性探针。
可以使用例如化学或辐射诱变剂或基因编辑技术来诱变步骤a)的植物。因此,在步骤a)之前,可以存在用诱变剂处理植物、种子或植物部分或诱导ClD14等位基因中的靶向突变的步骤。
可以使用各种基因分型测定,只要它们可以检测INDEL和SNP并且可以区分存在于基因组DNA中(在8号染色体上的ClD14基因座处)的SEQ ID NO:6的野生型等位基因或存在于基因组DNA中的ClD14基因的突变型等位基因。基因分型测定通常基于在PCR或热循环反应(聚合酶链式反应)中使用的等位基因特异性引物以扩增野生型或突变型等位基因并检测扩增产物,或者基于与野生型等位基因或突变型等位基因或两者杂交的等位基因特异性寡核苷酸探针。例如,使用BHQplus探针的基因分型使用两个等位基因特异性探针和位于多态性区域两侧的两个引物,并且在热循环期间,聚合酶遇到与DNA结合的等位基因特异性探针并释放荧光信号。等位基因鉴别涉及两种等位基因特异性BHQPlus探针(也参见biosearchtech.com)的竞争结合。
基因分型测定的实例是基于竞争性等位基因特异性PCR和终点荧光检测的KASP测定(通过LGC进行,参见www.LGCgenomics.com以及www.biosearchtech.com/products/pcr-kits-and-reagents/genotyping-assays/kasp-genotyping-chemistry)、也基于PCR的TaqMan测定(Applied Biosytstems)、其中使用实时PCR检测等位基因特异性探针的HRM测定(高分辨率熔解测定)或基于RNA酶H2依赖性PCR的rhAmp测定、BHQplus基因分型、BHQplexCoPrimer基因分型等。
KASP测定也描述于通过引用并入的He C,Holme J,Anthony J.‘SNP genotyping:the KASP assay.Methods Mol Biol.2014年;第1145卷第75-86页和EP1726664B1或US7615620 B2中。KASP基因分型测定利用独特形式的竞争性等位基因特异性PCR结合新的、均质的、基于荧光的报告系统来鉴定和测量在核苷酸级别发生的遗传变异,以检测单核苷酸多态性(SNP)或插入和缺失(InDel)。KASP技术适用于多种设备平台,并且在SNP的数量和能够分析的样品的数量方面提供灵活性。KASP化学在96孔、384孔和1,536孔微量滴定板形式中同样良好地发挥作用,并且已被用户在大型和小型实验室中在人、动物和植物遗传学领域中使用了多年。
TaqMan基因分型测定也描述于通过引用并入本文的Woodward J.‘Bi-allelicSNP genotyping using theassay.’Methods Mol Biol.2014年;第1145卷第67-74页、US5210015和US5487972中。通过利用/>技术,等位基因特异性探针用于已知多态性位点的快速和可靠的基因分型。TaqMan测定在对多种变体类型(包括单核苷酸多态性、插入/缺失和存在/不存在变体)进行基因分型方面是稳健的。为了查询单个双等位基因多态性,设计用不同荧光团标记的两个TaqMan探针,使得它们在周围靶区域的基于PCR的扩增期间与不同等位基因杂交。在PCR的引物延伸阶段期间,Taq聚合酶的5'-3'核酸外切酶活性从结合的探针切割并释放荧光团。在PCR结束时,测量每个荧光团的发射强度,并且可以在所查询的位点进行等位基因确定。
因此,可以使用各种基因分型测定,其可以区分编码SEQ ID NO:2的蛋白质的ClD14基因的野生型等位基因的存在,或ClD14基因的突变型等位基因的存在。可以检测ClD14基因的各种突变型等位基因。因此,不仅是编码SEQ ID NO:1的蛋白质(由于24个核苷酸的重复而包含8个额外的氨基酸)的突变型等位基因,该测定还可以被设计成检测ClD14基因的任何其他突变型等位基因,诸如例如表A或表2等中所述的任何突变型等位基因。
如所提及的,优选使用双等位基因基因分型测定,例如KASP测定、TaqMan测定、BHQplus测定、PACE基因分型(参见万维网idtdna.com/pages/products/qpcr-and-pcr/genotyping/pace-snp-genotyping-assays)或任何其他双等位基因基因分型测定。
在一个方面,上述方法的步骤b)中的基因分型测定是KASP测定。因此,在步骤b)中,使用两个正向引物和一个共同的反向引物进行竞争性PCR。两个正向引物包含与SEQ IDNO:6(或其互补链)互补的至少10、11、12、13、14、15、16、17、18、19或20个核苷酸。此外,两个正向引物包含1、2、3或更多个核苷酸(优选在引物的3'端),其提供对区分野生型序列与等位基因的突变型序列的SNP或INDEL的特异性。因此,两个正向引物对野生型等位基因或对突变型等位基因具有不同的结合特异性(或偏好)。例如,Fam-引物包含野生型序列的17个核苷酸和对插入等位基因具有特异性的1个核苷酸,并且实施例中的VIC-引物包含野生型等位基因的18个核苷酸和对‘缺失’等位基因具有特异性的1个核苷酸。可以容易地设计KASP测定以区分SEQ ID NO:6的野生型等位基因和ClD14基因的任何突变型等位基因,该突变型等位基因与野生型等位基因的区别在于插入、缺失或置换的一个或多个核苷酸,因此例如该测定可以被设计成用于区分两种等位基因的任何SNP或INDEL。
应注意,也可以进行基因分型测定,诸如例如实施例中所述的KASP测定,以与对二倍体西瓜植物和植物部分所述的相同方式检测三倍体或四倍体西瓜植物和植物部分中的突变型和/或野生型ClD14等位基因。
在一个方面,ClD14基因的突变型等位基因编码包含相对于SEQ ID NO:2的野生型蛋白插入、重复、置换或缺失一个或多个氨基酸的蛋白质。
在一个方面,ClD14基因的突变型等位基因编码与SEQ ID NO:2的蛋白质相比截短的蛋白质,例如在C末端或任选地在N末端缺失至少8、10、15、20、30、40、50、60、70、80、90、100或更多个氨基酸。
在一个方面,ClD14基因的突变型等位基因编码包含与SEQ ID NO:2的蛋白质相比缺失或置换一个或多个氨基酸的蛋白质,例如至少1、2、3、4、5、6、7、8、9、10个或更多个氨基酸缺失或被一个或多个不同氨基酸置换。
在另一个方面,ClD14基因的突变型等位基因编码包含与SEQ ID NO:2的蛋白质相比插入或重复一个或多个氨基酸的蛋白质,例如至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个氨基酸被插入或重复。在一个方面,SEQ ID NO:2的氨基酸94至氨基酸101中的至少一个或多个氨基酸是重复的,优选至少S97是重复的。在一个方面,SEQ ID NO:2的氨基酸94至氨基酸101中的至少2、3、4、5、6、7或8个连续氨基酸是重复的,优选地其中该连续氨基酸包括S97。
因此,在一个实施方案中,提供了一种用于检测和任选地选择西瓜植物、种子或植物部分的方法,该西瓜植物、种子或植物部分包含至少一个拷贝的名称为ClD14(西瓜Dwarf14)的基因的野生型等位基因和/或突变型等位基因,该方法包括:
a)提供西瓜植物或多种植物(例如,培育群体、F2、回交等)的基因组DNA,
b)基于核酸扩增(例如,包括使用等位基因特异性寡核苷酸引物)和/或核酸杂交(例如,包括使用等位基因特异性寡核苷酸探针),进行区分或可以区分a)的基因组DNA中等位基因的存在的测定(例如,双等位基因基因分型测定),以检测基因的野生型等位基因和/或基因的突变型等位基因的存在,其中野生型等位基因包含SEQ ID NO:6的序列(或其中野生型等位基因编码SEQ ID NO:2的蛋白质),并且突变型等位基因包含相对于SEQ ID NO:6的序列插入、重复、缺失或置换的一个或多个核苷酸(或突变型等位基因编码包含相对于SEQ ID NO:2的野生型蛋白插入、重复、缺失或置换一个或多个氨基酸的蛋白质),以及任选地
c)选择包含一个或两个拷贝的突变型等位基因的植物、种子或植物部分。
在步骤b)中,基因分型测定基于利用例如寡核苷酸引物(诸如PCR(聚合酶链式反应)和PCR引物,优选等位基因特异性引物)的核酸(尤其是DNA)扩增反应和/或利用作为寡核苷酸的探针(优选等位基因特异性探针)的核酸杂交来区分野生型等位基因和突变型等位基因。
引物或探针优选经修饰以包含标记,例如荧光标记,或包含尾序列或其他修饰。
在一个方面,在上述方法中的任一种方法中,测定使用一种或多种ClD14等位基因特异性引物或者一种或多种ClD14等位基因特异性探针。如所提及的,基于SEQ ID NO:6的基因组序列或编码SEQ ID NO:2的蛋白质的其他(例如,简并)基因组序列或编码例如包含与SEQ ID NO:2相比插入、重复、缺失或置换一个或多个氨基酸的蛋白质的突变型等位基因的基因组序列,可以使用用于寡核苷酸设计的已知方法或软件程序设计PCR引物和核酸探针。引物和探针的长度可以是例如至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或更多个核苷酸(碱基)并且与模板DNA序列退火(或杂交),即它们优选与靶序列具有至少95%、96%、97%、98%、99%或100%的序列同一性。引物或探针对野生型等位基因或突变型等位基因的特异性是由于引物或探针的至少1、2、3或更多个核苷酸对任一等位基因具有特异性。因此,围绕靶基因的两个等位基因之间的多态性(例如SNP或InDel)设计引物或探针,使得它们区分这些等位基因。在一个方面,测定是选自例如KASP测定、TaqMan测定、BHQplus探针测定或任何其他双等位基因基因分型测定的双等位基因基因分型测定。
在一个方面,突变型等位基因包含在等位基因的编码区中插入或重复的至少一个密码子,或者改变为另一个密码子(例如通过单核苷酸改变)的至少一个密码子,或者缺失或改变为终止密码子的至少一个密码子。
在上述方法中的任一种方法中,在一个方面,突变型等位基因包含SEQ ID NO:5的序列,即包含24个核苷酸的插入/重复,从而导致蛋白质中8个氨基酸的重复。因此,在一个方面,该方法可以用于区分包含两个拷贝的编码SEQ ID NO:2的蛋白质的野生型ClD14等位基因、两个拷贝的编码SEQ ID NO:1的蛋白质的突变型ClD14等位基因或一个拷贝的每个等位基因(杂合)的植物、种子或植物部分。任选地,可以选择包含这些基因型中的任一种基因型的植物、植物部分或种子用于例如进一步培育或用于西瓜生产。
在上述方法中的任一种方法中,在另一个方面,突变型等位基因编码本文所述的突变型蛋白,例如表A或表2中的突变型蛋白。因此,在一个方面,该方法可以用于区分包含两个拷贝的编码SEQ ID NO:2的蛋白质的野生型ClD14等位基因、两个拷贝的编码本文(例如在表A或表2中)所述的突变型蛋白的突变型ClD14等位基因或一个拷贝的每个等位基因(杂合)的植物、种子或植物部分。任选地,可以选择包含这些基因型中的任一种基因型的植物、植物部分或种子用于例如进一步培育或用于西瓜生产。
因此,在一个方面,在上述方法中的任一种方法中,突变型等位基因编码如所述的功能丧失蛋白或功能降低蛋白。
尽管在上述方法中可以使用基于PCR(使用PCR引物)和/或基于杂交(使用探针)的任何DNA基因分型测定,但是在一个方面,使用KASP测定来区分野生型等位基因和突变型等位基因。该测定可以以高通量方式使用,例如在96孔板或更多孔板(例如,384孔板)中使用。
根据野生型和突变型ClD14等位基因之间的SNP或INDEL,可以设计各种等位基因特异性引物和探针用于测定中。
在一个方面,在KASP测定中使用两个正向引物(一个用于野生型等位基因,并且一个用于突变型等位基因)和一个共同的反向引物(用于野生型和突变型等位基因二者)。在一个方面,两个正向引物和反向引物包含SEQ ID NO:6或SEQ ID NO:6的互补序列中的至少10、11、12、13、14、15、16、17、18、19或更多个核苷酸。正向引物还包含至少1、2或3个核苷酸(优选在引物的3'端),其为野生型等位基因的扩增或突变型等位基因的扩增赋予特异性(或偏好)。每个正向引物与共同的反向引物形成引物对,以在热循环期间扩增引物对之间的靶等位基因的DNA序列。使用用于热循环的标准组分和用于KASP测定的标准组分。
在一个方面,KASP测定区分在ClD14等位基因中发现的InDel,即KASP测定可以区分在基因组DNA中呈纯合形式的SEQ ID NO:6(ClD14野生型,正常分枝等位基因)的存在、呈纯合形式的SEQ ID NO:5(具有插入的ClD14等位基因,多分枝等位基因)的存在以及西瓜基因组中SEQ ID NO:6和SEQ ID NO:5两者的存在。可以设计不同的正向和反向引物以实现测定中的等位基因鉴别。
在一个方面,正向引物包含SEQ ID NO:10和/或SEQ ID NO:11的序列,或这些序列中任一个序列的互补序列。在一个方面,共同引物任选地包含SEQ ID NO:12的序列或其互补序列。
在一个方面,引物包含SEQ ID NO:10(正向引物)、SEQ ID NO:11(正向引物)和SEQID NO:12(共同引物)中的一者或多者,或与SEQ ID NO:10、SQ ID NO:11或SEQ ID NO:12具有至少95%、96%、97%、98%、99%序列同一性的序列,或这些序列中任一个序列的互补序列。
在另一个实施方案中,提供了一种用于生产名称为ClD14(西瓜Dwarf14)的基因的野生型等位基因和/或突变型等位基因的杂交产物或扩增产物的方法,该方法包括:
a)提供西瓜植物或多种植物(例如,培育群体、F2、回交等)的基因组DNA,
b)进行区分或可以区分a)的基因组DNA中等位基因的存在的测定(例如双等位基因基因分型测定),该测定生成核酸扩增产物(例如,通过使用等位基因特异性寡核苷酸引物来生成产物)和/或该测定生成核酸杂交产物(例如,通过使用等位基因特异性寡核苷酸探针来生成杂交产物),由此扩增产物或杂交产物指示DNA中基因的野生型等位基因和/或基因的突变型等位基因的存在,其中野生型等位基因包含SEQ ID NO:6的序列(或其中野生型等位基因编码SEQ ID NO:2的蛋白质)并且突变型等位基因包含相对于SEQ ID NO:6的序列插入、重复、缺失或置换的一个或多个核苷酸(或突变型等位基因编码相对于SEQ ID NO:2的野生型蛋白插入、重复、缺失或置换的一个或多个氨基酸的蛋白质),以及任选地
c)选择包含一个或两个拷贝的突变型等位基因的植物、种子或植物部分。
还提供了一种扩增来自源自西瓜植物、植物部分或种子的基因组DNA样品的突变型和/或野生型ClD14等位基因中的全部或部分等位基因的方法,该方法包括使基因组DNA与扩增样品中突变型ClD14或野生型ClD14等位基因中的全部或部分等位基因的引物对接触,以及检测扩增产物。
还提供了一种使探针与源自西瓜植物、植物部分或种子的基因组DNA样品中的突变型和/或野生型ClD14等位基因杂交的方法,该方法包括将基因组DNA与和样品中的突变型ClD14或野生型ClD14等位基因杂交的寡核苷酸探针接触,以及检测杂交产物。
上述和本文其它地方描述的所有实施方案也适用于这些实施方案。因此,扩增产物可以是PCR扩增产物,例如在例如KASP测定或其他测定中生成的竞争性PCR扩增产物,以检测DNA样品中的突变型和/或野生型等位基因。因此,杂交产物可以是与DNA样品中的核酸杂交的寡核苷酸探针的杂交产物,以检测DNA样品中的突变型和/或野生型等位基因。引物对或探针优选是等位基因特异性的,并且因此产物可区分为存在于西瓜植物、植物部分或种子的基因组DNA中的两个拷贝的野生型等位基因、两个拷贝的突变型等位基因或一个拷贝的野生型等位基因和一个拷贝的突变型等位基因。
优选对引物或探针进行修饰,例如通过尾序列或荧光标记来标记进行修饰,或以其他方式相对于引物或探针扩增或杂交的野生型序列进行修饰。
由于所述方法需要检测植物、植物部分或种子的基因组DNA中的突变型和/或野生型等位基因,因此基因组DNA需要是易于检测的,例如其可以使用DNA提取方法从植物细胞中提取或至少从受损细胞中洗脱到溶液(例如缓冲溶液)中。
由于本文提供了其他葫芦科中的直向同源基因,所以上述方法也可以应用于其他物种、尤其是黄瓜和甜瓜中的其他D14基因和等位基因。
因此,在一个方面,提供了一种用于对西瓜、黄瓜或甜瓜的植物、种子、植物部分、细胞或组织进行基因分型的基因分型测定,该测定包括以下步骤:
a)提供一种或多种西瓜、黄瓜或甜瓜的植物或植物群体(例如,培育群体、F2群体、回交群体等)的基因组DNA,和
b)进行能够检测或检测SEQ ID NO:6或与其具有至少95%同一性(西瓜基因)或SEQ ID NO:15或与其具有至少95%同一性(黄瓜基因)或SEQ ID NO:16或与其具有至少95%同一性(甜瓜基因)的野生型等位基因的存在和/或突变型等位基因的存在的基因分型测定,其中突变型等位基因包含相对于SEQ ID NO:6(或相对于与其具有至少95%同一性的野生型序列)、SEQ ID NO:15(或相对于与其具有至少95%同一性的野生型序列)或SEQ IDNO:16(或相对于与其具有至少95%同一性的野生型序列)插入、缺失、置换或重复的一个或多个核苷酸,以及任选地
c)选择包含两个拷贝的野生型等位基因或者一个拷贝的野生型等位基因的和一个拷贝的突变型等位基因或者两个拷贝的突变型等位基因的植物、种子、植物部分、细胞或组织。
在一个方面,提供了一种对西瓜、甜瓜或黄瓜的植物、种子、植物部分、细胞或组织进行基因分型的基因分型测定,该测定包括以下步骤:
a)提供一种或多种西瓜、黄瓜或甜瓜的植物或植物群体(例如,培育群体、F2群体、回交群体等)的基因组DNA,和
b)进行能够检测(或检测)编码SEQ ID NO:2的蛋白质或与其具有至少95%序列同一性的蛋白质(西瓜野生型ClD14蛋白)或SEQ ID NO:8的蛋白质或与其具有至少95%序列同一性的蛋白质(黄瓜野生型ClD14蛋白)或SEQ ID NO:9的蛋白质或与其具有至少95%序列同一性的蛋白质(甜瓜野生型ClD14蛋白)的野生型等位基因的存在和/或突变型等位基因的存在的基因分型测定,其中该突变型等位基因包含相对于SEQ ID NO:2(或相对于与其具有至少95%同一性的野生型序列)或SEQ ID NO:8(或相对于与其具有至少95%同一性的野生型序列)或SEQ ID NO:9(或相对于与其具有至少95%同一性的野生型序列)插入、缺失、置换或重复的一个或多个氨基酸,以及任选地
c)选择包含两个拷贝的野生型等位基因或者一个拷贝的野生型等位基因的和一个拷贝的突变型等位基因或者两个拷贝的突变型等位基因的植物、种子、植物部分、细胞或组织。
因此,本发明提供了一种用于检测和任选地选择西瓜、黄瓜或甜瓜的植物、种子或植物部分的方法,该西瓜、黄瓜或甜瓜的植物、种子或植物部分包含至少一个拷贝的名称为ClD14(西瓜Dwarf14)、CsD14(黄瓜Dwarf14)或CmD14(甜瓜Dwarf14)的基因的野生型等位基因和/或突变型等位基因,该方法包括:
a)对从至少一种植物获得的基因组DNA样品进行测定,该测定基于核酸扩增和/或核酸杂交检测或区分D14等位基因,以检测基因的野生型等位基因和/或基因的突变型等位基因的存在,其中该野生型等位基因编码SEQ ID NO:2的蛋白质或与其具有至少95%序列同一性的蛋白质(在西瓜中)、SEQ ID NO:8的蛋白质或与其具有至少95%序列同一性的蛋白质(在黄瓜中)和SEQ ID NO:9的蛋白质或与其具有至少95%序列同一性的蛋白质(在甜瓜中),并且该突变型等位基因包含相对于SEQ ID NO:2(或相对于与其具有至少95%同一性的野生型序列)、SEQ ID NO:8(或相对于与其具有至少95%同一性的野生型序列)或SEQID NO:9(或相对于与其具有至少95%同一性的野生型序列)插入、缺失或置换的一个或多个氨基酸,以及任选地
b)选择包含一个或两个拷贝的突变型等位基因的植物、种子或植物部分。
还提供了一种用于确定D14基因的基因型以及任选地选择西瓜、黄瓜或甜瓜的植物、种子或植物部分的方法,该西瓜、黄瓜或甜瓜的植物、种子或植物部分包含特定基因型,例如,至少一个拷贝的名称为ClD14(西瓜Dwarf14)、CsD14(黄瓜Dwarf14)或CmD14(甜瓜Dwarf14)的基因的野生型等位基因和/或突变型等位基因,该方法包括:
a)对从一种或多种植物获得的一种或多种基因组DNA样品进行双等位基因基因分型测定,其中所述基因分型测定基于D14等位基因特异性引物和/或D14等位基因特异性探针检测或区分D14等位基因,该等位基因特异性引物或等位基因特异性探针检测基因的野生型等位基因或基因的突变型等位基因的存在,其中该野生型等位基因编码SEQ ID NO:2的蛋白质或与其具有至少95%序列同一性的蛋白质(在西瓜中)、SEQ ID NO:8的蛋白质或与其具有至少95%序列同一性的蛋白质(在黄瓜中)和SEQ ID NO:9的蛋白质或与其具有至少95%序列同一性的蛋白质(在甜瓜中),并且该突变型等位基因包含相对于SEQ ID NO:2(或相对于与其具有至少95%同一性的野生型序列)、SEQ ID NO:8(或相对于与其具有至少95%同一性的野生型序列)或SEQ ID NO:9(或相对于与其具有至少95%同一性的野生型序列)插入、缺失或置换的一个或多个氨基酸,以及任选地
b)选择包含一个或两个拷贝的突变型等位基因的一种或多种植物、种子或植物部分。
此类测定可以用于例如培育程序中的植物的标记辅助选择(MAS)以选择包含特定基因型的植物,例如针对D14基因的野生型等位基因纯合(具有正常的二级分枝)的植物,针对D14等位基因的突变型等位基因纯合或杂合的植物。
因此,本文还提供了一种培育西瓜、黄瓜或甜瓜植物的方法,所述方法包括针对基因组中D14基因座处的等位基因组成对一种或多种植物进行基因分型,以及任选地选择在D14基因座处具有特定基因型的一种或多种植物。在一个方面,还可以对D14基因进行通过测序进行的基因分型。
如所提及的,任选地,可以使包含两个拷贝的突变型D14等位基因的植物或种子生长并且对二级分枝表型进行表型分析。在一个方面,突变型等位基因是呈纯合形式的赋予多分枝/增加的二级分枝的突变型等位基因。在一个方面,当呈纯合形式时,突变型等位基因赋予‘完全多分枝’。在另一个方面,当呈纯合形式时,突变型等位基因赋予‘中等多分枝’。因此,突变型等位基因可以包含被置换、插入或缺失的一个或多个核苷酸,由此编码的蛋白质功能丧失或由此等位基因不在植物中表达,从而当突变型等位基因呈纯合形式时导致‘完全多分枝’,或者突变型等位基因可以包含被置换、插入或缺失的一个或多个核苷酸,由此编码的蛋白质功能降低或由此等位基因在植物中具有降低的表达,从而当突变型等位基因呈纯合形式时导致‘中等多分枝’。
在一个方面,突变型等位基因编码体内功能降低或功能丧失的蛋白质,这是由于蛋白质包含的SEQ ID NO:2、SEQ ID NO:8和SEQ ID NO:9的IPR000073结构域的至少一个氨基酸(或与这些序列中的任一序列具有至少95%同一性的蛋白质中的等同氨基酸)缺失或被不同氨基酸或终止密码子置换。在另一个方面,突变型等位基因编码体内功能降低或功能丧失的蛋白质,这是由于蛋白质包含在SEQ ID NO:2、SEQ ID NO:8和SEQ ID NO:9的IPR000073结构域中插入或重复的至少一个氨基酸(或与这些序列中的任一序列具有至少95%同一性的蛋白质中的等同氨基酸)。
在不同的方面,突变型等位基因编码体内功能降低或功能丧失的蛋白质,这是由于蛋白质包含的SEQ ID NO:2、SEQ ID NO:8和SEQ ID NO:9的螺旋盖结构域的至少一个氨基酸(或与这些序列中的任一序列具有至少95%同一性的蛋白质中的等同氨基酸)缺失或被不同氨基酸或终止密码子置换。在另一个方面,突变型等位基因编码体内功能降低或功能丧失的蛋白质,这是由于蛋白质包含在SEQ ID NO:2、SEQ ID NO:8和SEQ ID NO:9的结构域的螺旋盖结构域中插入或重复的至少一个氨基酸(或与这些序列中的任一序列具有至少95%同一性的蛋白质中的等同氨基酸)。
在另一个方面,突变型等位基因编码体内功能降低或功能丧失的蛋白质,这是由于蛋白质包含的SEQ ID NO:2、SEQ ID NO:8和SEQ ID NO:9的催化三联体的至少一个氨基酸(或与这些序列中的任一序列具有至少95%同一性的蛋白质中的等同氨基酸)或催化三联体氨基酸之前或之后的1、2、3、4、5、6、7或8个氨基酸中的至少一个氨基酸缺失或被不同氨基酸或终止密码子置换。在另一个方面,突变型等位基因编码体内功能降低或功能丧失的蛋白质,这是由于蛋白质包含的SEQ ID NO:2、SEQ ID NO:8和SEQ ID NO:9的催化三联体的至少一个氨基酸(或与这些序列中的任一序列具有至少95%同一性的蛋白质中的等同氨基酸)重复,或催化三联体氨基酸之前或之后的1、2、3、4、5、6、7或8个氨基酸中的至少一个氨基酸重复,或催化三联体氨基酸之前或之后的8个氨基酸的区段中插入至少一个氨基酸。
在又一个方面,突变型等位基因编码表A或表2的蛋白质。
在一个方面,突变型等位基因编码包含选自SEQ ID NO:2、SEQ ID NO:8和SEQ IDNO:9的氨基酸94至氨基酸101的至少一个氨基酸(或与这些序列中的任一序列具有至少95%同一性的蛋白质中的等同氨基酸)的重复的蛋白质。
在一个方面,突变型等位基因编码包含SEQ ID NO:2、SEQ ID NO:8和SEQ ID NO:9的至少丝氨酸97(或与这些序列中的任一序列具有至少95%同一性的蛋白质中的等同氨基酸)的重复的蛋白质。
在又一方面,突变型等位基因编码包含SEQ ID NO:2、SEQ ID NO:8或SEQ ID NO:9的氨基酸94至氨基酸101(或与这些序列中的任一序列具有至少95%同一性的蛋白质中的等同氨基酸)的重复的蛋白质。
以上进一步描述的用于检测西瓜ClD14野生型和/或突变型等位基因的测定的方面也适用于用于检测黄瓜CsD14野生型和/或突变型等位基因或甜瓜CmD14野生型和/或突变型等位基因的测定。
在一个不同的方面,提供了一种西瓜、黄瓜或甜瓜的植物、种子或植物部分,其包含至少一个拷贝的西瓜中名称为ClD14、黄瓜中名称为CsD14和甜瓜中名称为CmD14的基因的突变型等位基因,其中所述突变型等位基因
a)包含在调节元件中的一个或多个突变,从而导致与野生型等位基因相比不表达等位基因或降低表达等位基因,和/或
b)编码包含与野生型蛋白相比置换、插入、重复或缺失的一个或多个氨基酸的突变型蛋白,
其中当突变型等位基因呈纯合形式时,所述a)或b)的突变型等位基因赋予增加的发展二级枝的平均数量(与包含呈纯合形式的野生型等位基因的植物相比),并且其中野生型西瓜ClD14等位基因编码SEQ ID NO:2的蛋白质或与SEQ ID NO:2具有至少95%、96%、97%、98%、99%或更多序列同一性的蛋白质,其中野生型黄瓜CsD14等位基因编码SEQ IDNO:8的蛋白质或与SEQ ID NO:8具有至少95%、96%、97%、98%、99%或更多序列同一性的蛋白质,其中野生型甜瓜CmD14等位基因编码SEQ ID NO:9的蛋白质或与SEQ ID NO:9具有至少95%、96%、97%、98%、99%或更多序列同一性的蛋白质。
西瓜的野生型功能性D14蛋白在SEQ ID NO:2中提供,黄瓜的野生型功能性D14蛋白在SEQ ID NO:8中提供,并且甜瓜的野生型功能性D14蛋白在SEQ ID NO:9中提供。然而,西瓜、黄瓜和甜瓜中可能存在一些氨基酸序列变异,并且功能性D14蛋白可以包含例如不同于本文提供的SEQ ID NO:2、SEQ ID NO:8或SEQ ID NO:9的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个氨基酸,或者由此蛋白质与SEQ ID NO:2、8或9的蛋白质具有至少95%、96%、97%、98%、99%或99.3%、99.4%、99.5%或99.6%、99.7%、99.8%或99.9%序列同一性(当使用例如Emboss-Needle进行成对比对时)。SEQ ID NO:2、8或9的D14蛋白的此类功能性变体可以存在于其他品系或品种中。因此,这些等位基因的序列可能不同,但植物的表型与野生型表型相同。此类功能性变异等位基因(等位基因变体)可以通过例如对具有正常二级分枝模式的许多不同西瓜、黄瓜或甜瓜品系或品种的D14基因进行测序来发现。
因此,在一个方面,SEQ ID NO:2、8或9的蛋白质的功能性变体是当成对比对(使用例如具有默认参数的Needle)时与SEQ ID NO:2、8或9的蛋白质具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.3%、99.4%、99.5%或99.6%、99.7%、99.8%或99.9%序列同一性的蛋白质。
在一个方面,提供一种包含至少一个拷贝的名称为D14的基因的突变型等位基因的西瓜、黄瓜或甜瓜的植物、种子或植物部分,其中所述突变型等位基因编码包含在选自以下的蛋白质区域中插入、重复、缺失或置换的一个或多个氨基酸的突变型蛋白:
a)SEQ ID NO:2、8或9的起始于氨基酸94且结束于氨基酸101的区域,或与SEQ IDNO:2、8或9具有至少95%序列同一性的变体D14蛋白中的等同氨基酸,
b)SEQ ID NO:2、8或9的起始于氨基酸22且结束于氨基酸259的IPR000073结构域的区域,或与SEQ ID NO:2、8或9具有至少95%序列同一性的变体D14蛋白中的等同氨基酸,
c)SEQ ID NO:2、8或9的起始于氨基酸136且结束于氨基酸193的螺旋盖结构域结构域的区域,或与SEQ ID NO:2、8或9具有至少95%序列同一性的变体D14蛋白中的等同氨基酸,
d)催化三联体氨基酸或SEQ ID NO:2、8或9的催化三联体氨基酸S97、D218和H247之前或之后的1、2、3、4、5、6、7或8个氨基酸,或与SEQ ID NO:2、8或9具有至少95%序列同一性的变体D14蛋白中的等同氨基酸,
并且其中当突变型等位基因呈纯合形式时,所述突变型等位基因赋予(显著)增加的发展二级枝的平均数量,当突变型等位基因呈纯合形式时,优选赋予中等多分枝或完全多分枝表型。
术语‘起始于’和‘结束于’或‘从’和‘至’包括所提及的第一个和最后一个氨基酸。
在a)下,在SEQ ID NO:2、8或9的起始于氨基酸94且结束于氨基酸101的蛋白质区域中一个或多个氨基酸的插入、重复、缺失和/或置换可以是至少1、2、3、4、5、6、7或8个氨基酸、优选至少S97的插入、重复、缺失和/或置换。
在一个方面,氨基酸94至氨基酸101中的至少1、2、3、4、5、6、7或8个连续氨基酸被重复、缺失或置换,优选地包括至少S97的重复、缺失或置换。在一个方面,突变型等位基因包含H96(组氨酸96)和S97(丝氨酸97)的重复或缺失或置换;或S97(丝氨酸97)和V98(缬氨酸98)的重复或缺失或置换;或H96(组氨酸96)、S97(丝氨酸97)和V98(缬氨酸98)的重复或缺失或置换;或G95(甘氨酸95)、H96(组氨酸96)、S97(丝氨酸97)、V98(缬氨酸98)和S99(丝氨酸99)的重复或缺失或置换;或V94(缬氨酸94)、G95(甘氨酸95)、H96(组氨酸96)、S97(丝氨酸97)、V98(缬氨酸98)、S99(丝氨酸99)和A100(丙氨酸100)的重复或缺失或置换;或V94(缬氨酸94)、G95(甘氨酸95)、H96(组氨酸96)、S97(丝氨酸97)、V98(缬氨酸98)、S99(丝氨酸99)、A100(丙氨酸100)和M101(甲硫氨酸101)的重复或缺失或置换。
在另一个方面,提供了一种包含至少一个拷贝的名称为D14的基因的突变型等位基因的西瓜、黄瓜或甜瓜的植物、种子或植物部分,其中所述突变型等位基因编码包含在SEQ ID NO:2、8或9的起始于氨基酸197且结束于氨基酸249的蛋白质区域中插入、重复、缺失或置换的一个或多个氨基酸,或与SEQ ID NO:2、8或9具有至少95%序列同一性的变体D14蛋白中的等同氨基酸的突变型蛋白,并且其中当突变型等位基因呈纯合形式时,所述突变型等位基因赋予增加的发展二级枝的平均数量。因此,一个方面是在SEQ ID NO:2、8或9的起始于氨基酸197且结束于氨基酸249的蛋白质区域中一个或多个氨基酸的插入、重复、缺失和/或置换可以是至少1、2、3、4、5、6、7或8个氨基酸、优选至少D218或H247的插入、重复、缺失和/或置换。
在又一方面,提供了一种包含至少一个拷贝的名称为D14的基因的突变型等位基因的西瓜、黄瓜或甜瓜的植物、种子或植物部分,其中所述突变型等位基因编码包含在SEQID NO:2、8或9中或在变体D14蛋白或与SEQ ID NO:2、8或9具有至少95%序列同一性的蛋白质中插入、重复、缺失和/或置换的至少4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200或更多个氨基酸的突变型蛋白,并且其中当突变型等位基因呈纯合形式时,所述突变型等位基因赋予修饰表型。因此,突变型D14蛋白可以例如在N-末端或C-末端截短,在N-末端或C-末端缺少所述至少4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、超过200个氨基酸,或者与野生型功能性D14蛋白相比,任何其他至少4、5、6、7、8、9、10个氨基酸可以被缺失、置换或插入或重复。在一个方面,缺失、重复或置换至少1、2、3、4、5、6、7或8个氨基酸(优选连续氨基酸),由此缺失、重复或置换包括选自SEQ ID NO:2、8或9的S97、D218和H247的催化三联体的氨基酸,或这些序列中的任一序列的变体序列中的等同氨基酸。
突变型等位基因可以通过各种技术生成,诸如随机诱变或靶向基因编辑,并且然后可以在针对突变型等位基因纯合的植物中分析突变型等位基因的表型。使用随机或靶向诱变技术,可以生成或重建任何突变,例如可以容易地从头制备本文所述的突变体。TILLING引物可以例如针对等位基因中的特定突变设计,使得能够从头鉴定例如包含本文所述突变体的M2植物。也可以从头制备存在于品种Sidekick F1中的突变型等位基因。当公开基因序列时,实现不需要种子保藏。类似地,靶向基因编辑可以用于在等位基因中生成任何期望的突变。
TILLING描述于例如McCallum等人(2000年6月).“Targeting induced locallesions IN genomes(TILLING)for plant functional genomics”.Plant Physiol.第123卷第2期,第439–42页中。
在一个方面,ClD14基因的突变型等位基因不是存在于品种Sidekick F1中的突变型等位基因,而是不同的突变型等位基因,例如一个或多个核苷酸可以是不同的,但是例如由于遗传密码的简并性,编码的突变型蛋白可以仍然是相同的(即SEQ ID NO:1的蛋白质),或者与SEQ ID NO:1相比,一个或多个氨基酸可以是不同的(即突变型蛋白的成对比对没有给出与SEQ ID NO:1的100%序列同一性)。例如,代替8个氨基酸的重复,可以只重复5、6或7个氨基酸;或者可以重复9、10或11个氨基酸。在另一个方面,ClD14基因的突变型等位基因与存在于品种Sidekick F1中的突变型等位基因相同,但通过诱变技术(诸如基于CRISPR的技术)从头诱导。
导致野生型功能性蛋白的一个或多个氨基酸的插入、缺失和/或置换的ClD14、CsD14或CmD14基因中的任何突变型等位基因可以产生功能降低或无功能的突变型蛋白,并且因此可以导致当突变型等位基因呈纯合形式时显著更多的发展二级枝的表型。包含此类突变型等位基因的植物和植物部分是本文的一个实施方案。
使用例如Emboss Needle(默认参数),通过成对氨基酸序列比对可以容易地确定‘等同氨基酸’。
在一个方面,突变型等位基因编码蛋白质,其包含SEQ ID NO:2、8或9的氨基酸编号S97、D218或H247的密码子的重复或插入,或与SEQ ID NO:2、8或9具有至少95%、96%、97%、98%或99%序列同一性的蛋白质中的等同氨基酸的密码子的重复或插入。
在一个方面,突变型等位基因编码蛋白质,其包含SEQ ID NO:2、8或9的氨基酸编号94至101中的一个或多个氨基酸的密码子的重复或插入,或与SEQ ID NO:2、8或9具有至少95%、96%、97%、98%或99%序列同一性的蛋白质中的等同氨基酸的密码子的重复或插入。
密码子中的突变可以是密码子中的(至少一个)核苷酸插入、缺失或置换,从而产生例如不同的阅读框或不同的密码子,从而例如编码不同的氨基酸或终止密码子。完整密码子也可以缺失或被不同的密码子(或任选地终止密码子)置换,从而导致编码的氨基酸的缺失或其置换。
在一个方面,突变型等位基因编码蛋白质,其包含SEQ ID NO:2、8或9的氨基酸编号S97、D218或H247的氨基酸取代(置换)或缺失或终止密码子,或与SEQ ID NO:2、8或9具有至少95%、96%、97%、98%或99%序列同一性的蛋白质中的等同氨基酸的氨基酸取代(置换)或缺失或终止密码子。
在一个方面,突变型等位基因编码突变型ClD14、CsD14或CmD14蛋白,其包含SEQID NO:2、8或9的蛋白质的C末端或与SEQ ID NO:2、8或9具有至少95%、96%、97%、98%或99%序列同一性的蛋白质的C末端的至少10、20、30、40、50、60、70、80、90、100、110、113、115、120、130、140、150、160、170、180、190或200个氨基酸的截短。在一个方面,SEQ ID NO:2、8或9的起始于(且包括)氨基酸94、95、96或97或起始于(且包括)氨基酸218且或起始于(且包括)氨基酸247的所有氨基酸,或与SEQ ID NO:2、8或9具有至少95%、96%、97%、98%或99%序列同一性的蛋白质中的等同氨基酸缺失或被一个或多个不同氨基酸置换。
如所提及的,西瓜、黄瓜或甜瓜的植物或植物部分可以包含突变型D14等位基因,其中突变型等位基因通过随机诱变或靶向诱变(诸如基于CRISPR的方法)产生。随机诱变可以是例如化学诱导的(例如,EMS处理)或辐射诱导的诱变或其他方法,通过该方法在基因组中随机诱导突变,并且然后可以筛选和鉴定包含内源D14基因的突变的植物或植物部分。靶向诱变是使用例如Crispr-Cas9或Crispr-CpfI或其他已知方法将突变特异性引入靶基因诸如D14基因的方法。
在一个方面,包含突变型等位基因的植物不是仅仅通过基本上生物学的过程产生的,这意指突变型等位基因在某一处通过人为干预生成。如果通过杂交和选择将此类人类生成的突变型等位基因从一种植物转移到另一种植物,则该专利涵盖包含突变型等位基因的植物,即使该植物本身仅通过杂交和选择生成。
在一个方面,西瓜、黄瓜或甜瓜植物是二倍体并且包含至少一个拷贝的如上所述的突变型D14等位基因,即该植物是杂合的。由于仅当突变型等位基因呈纯合形式时才看到表型,因此这些植物具有正常的二级分枝。此类杂合植物的自交将生成纯合的并且包含两个拷贝的突变型等位基因的植物。在一个方面,西瓜植物是二倍体并且包含两个拷贝的如上所述的突变型D14等位基因,即该植物是纯合的。因此,该植物还具有如本文所述的修饰表型。
包含至少一个拷贝的突变型D14等位基因的植物和植物部分优选是栽培植物,而不是野生植物。因此优选栽培的西瓜、黄瓜或甜瓜。该植物可以是近交品系、F1杂种或培育品系。
在一个方面,植物是西瓜植物,并且西瓜植物是二倍体、三倍体或四倍体,其包含至少一个拷贝的突变型ClD14等位基因。在一个方面,二倍体植物或植物部分包含两个拷贝,三倍体植物或植物部分包含一个、两个或三个拷贝,并且四倍体植物或植物部分包含两个或四个拷贝的突变型ClD14等位基因。注意到本文描述的用于二倍体植物、种子和植物部分的基因分型方法或测定同样适用于三倍体或四倍体植物、种子或组织/植物部分。可以选择包含1、2或3个拷贝的突变型ClD14等位基因或野生型等位基因的三倍体植物、种子或部分,并且可以选择包含1、2、3或4个拷贝的突变型ClD14等位基因或野生型等位基因的四倍体植物。例如,KASP测定可以用于针对存在的ClD14等位基因及其拷贝数来分析三倍体和四倍体基因组DNA。
本文还涵盖可以生长上述植物或植物部分的种子。
包含至少一个拷贝的突变型D14等位基因的植物部分可以是细胞、花、叶、茎、插条、胚珠、花粉、根、砧木、接穗、果实、原生质体、胚、花药。
此外,提供了从植物部分繁殖并且在其基因组中包含至少一个拷贝的突变型D14等位基因的营养繁殖植物。
在一个方面,还提供了一种生产二倍体、有籽西瓜果实的方法,所述方法包括生长包含一个或两个拷贝的突变型ClD14等位基因的二倍体西瓜植物,允许对花授粉,以及任选地收获在植物上发育的二倍体、有籽果实,由此果实组织还包含一个或两个拷贝的突变型ClD14等位基因。
在一个方面,还提供了一种生产无籽西瓜果实的方法,所述方法包括在三倍体西瓜植物附近生长包含两个拷贝的突变体ClD14等位基因的二倍体西瓜植物,允许用二倍体植物的花粉对三倍体植物的花授粉,以及任选地收获在三倍体植物上发育的无籽果实和/或在二倍体植物自花传粉后在二倍体植物上发育的有籽果实。
当提及‘在附近生长’时,这意指二倍体授粉植物足够接近三倍体植物,以允许可以访问授粉植物的昆虫将花粉从授粉植物的雄花转移到三倍体植物。授粉者可以在与三倍体植物相同的田地中成行或在行间或随机地间种。也可以将授粉者嫁接到与三倍体植物相同的砧木上,以生成双嫁接植物。此类双嫁接植物然后可以在三倍体植物附近生长,以便向那些植物提供花粉。
在一个方面,突变型ClD14等位基因可以与不同的基因组合,诸如2号染色体上的Ts基因(番茄种子大小基因),如WO2021/165091中所述。通过将本文所述的突变型ClD14等位基因与Ts基因缺失或编码例如功能降低或功能丧失的Ts蛋白的突变型等位基因组合,具有如本文所述的‘强多分枝’或‘中等多分枝’表型的植物可以产生具有小种子的果实。由于种子大小由2号染色体和6号染色体基因座决定(如WO2021/165091中所述),因此本文所述植物的果实实际上可以具有任何种子大小,即从大到中到非常小。
然而,本文所述的ClD14等位基因也可以与赋予单性结实或无籽果实的基因组合,使得可以在具有‘强多分枝’或‘中等多分枝’表型的植物上产生无籽果实,如本文所述。参见WO2022/096451、WO2022/078792、WO2019238832、WO2018060444或WO2017202715,全部通过引用并入本文。
还提供了一种用于针对命名为ClD14、CsD14或CmD14的基因的突变型等位基因的存在来筛选植物、植物部分或其DNA的方法,或用于选择包含命名为ClD14、CsD14或CmD14的基因的突变型等位基因的植物或植物部分的方法,或用于生成包含命名为ClD14、CsD14或CmD14的基因的突变型等位基因的植物或植物部分的方法,其中所述突变型等位基因
a)包含在调节元件中的一个或多个突变,从而导致与野生型等位基因相比不表达等位基因或降低表达等位基因,和/或
b)编码包含与野生型蛋白相比置换、插入、重复和/或缺失的一个或多个氨基酸的突变型蛋白,
其中野生型西瓜等位基因编码SEQ ID NO:2的蛋白质或与SEQ ID NO:2具有至少95%序列同一性的蛋白质,其中野生型黄瓜等位基因编码SEQ ID NO:8的蛋白质或与SEQID NO:8具有至少95%序列同一性的蛋白质,其中野生型甜瓜等位基因编码SEQ ID NO:9的蛋白质或与SEQ ID NO:9具有至少95%序列同一性的蛋白质。
如所提及的,本文的方法优选涉及本文所述的突变型等位基因,当其呈纯合形式时,导致植物的‘完全多分枝’或‘中等多分枝’表型。
用于筛选植物、植物部分或其DNA的方法涉及提供基因组DNA或基因组DNA的序列信息,测定基因组DNA中的D14基因序列,以及将该基因序列与野生型基因序列比较,或对基因组DNA针对D14基因座处的等位基因进行基因分型,例如使用例如PCR引物扩增全部或部分基因序列或cDNA(mRNA),或对基因组区域进行测序(例如通过测序进行的基因分型),以及将D14等位基因序列与野生型序列比较。
用于生成突变体的方法包括例如诱变西瓜、黄瓜或甜瓜的一种或多种种子、植物或植物部分(使用例如辐射或化学诱变剂),或提供诱变的植物群体,以及筛选M1或M2或存在的突变型D14等位基因的其他代。然后可以使包含突变型等位基因的植物针对突变型等位基因为纯合的以分析表型。
在一个方面,突变型ClD14、CsD14或CmD14等位基因包含基因组DNA中的突变,从而导致包含如本文别处所述插入、重复、缺失或置换的一个或多个氨基酸的突变型D14蛋白的表达,例如SEQ ID NO:2、8或9的氨基酸94至氨基酸101的重复(或与SEQ ID NO:2、8或9具有至少95%同一性的序列中的等同氨基酸)。
因此,ClD14、CsD14或CmD14基因的任何突变型等位基因在呈纯合形式时引起至少(显著地)更高的发展二级枝的平均数量是本发明的实施方案。此类突变型ClD14、CsD14或CmD14等位基因可以由技术人员生成而无过度负担。例如,技术人员可以在ClD14、CsD14或CmD14基因中生成突变体,并且确定该突变体当在二倍体植物中呈纯合形式时,与例如针对野生型等位基因纯合的二倍体植物相比,是否导致至少更高平均数量的二级枝。技术人员还可以生成编码非功能性蛋白质的突变体,该植物可以例如充当比较。因此,可以将新突变体与野生型分枝表型和‘完全多分枝表型’进行比较,以确定突变型等位基因的作用是例如‘中等多分枝’还是‘完全多分枝’。优选比较相同遗传背景品系(因此例如在非诱变品系(对照,野生型))中突变型等位基因的表型,并且优选还比较在相同背景品系中具有完全多分枝表型的突变体品系。这样,最低分枝和最强分枝表型处于相同的背景中,并且任何新的突变体可以在最宽的范围中进行比较和定位。
鉴定了基因的核苷酸序列后,技术人员可以通过各种方法,例如诱变、TILLING或CRISPR-Cas或本领域已知的其他方法生成包含D14基因突变体的西瓜、黄瓜或甜瓜植物。尤其是在使用靶向基因修饰技术时,诸如Crispr-Cas、TALENS等,本领域技术人员可以进行靶向突变。然后技术人员可以确认针对突变型D14等位基因纯合的植物的表型,即发展更高平均数量的二级枝。因此,技术人员不限于本文公开的特定D14突变体,而是技术人员可以同样地在西瓜、黄瓜或甜瓜的D14等位基因中生成其他突变,并且由此生成当呈纯合形式时导致多分枝的其他突变体。可以生成各种突变并测试所得表型,例如可以使调节元件突变以降低等位基因的表达(敲低)或消除等位基因的表达(敲除),并且因此降低或消除细胞或植物中存在的野生型D14蛋白的量。可替代地,可以生成导致D14蛋白功能降低或功能丧失的突变,即导致一个或多个氨基酸被取代、插入、重复和/或缺失的突变(诸如错义突变或移码突变),或由此通过在编码序列中引入提前终止密码子来截短蛋白质(无义突变)。
由于D14蛋白包含催化三联体的保守氨基酸,因此在一个方面涵盖催化三联体或包含催化三联体的氨基酸的一个或多个氨基酸被置换、缺失、重复和/或插入,因为此类突变将可能导致功能丧失。
然后D14等位基因中的任何突变是否导致期望的表型可以通过生成针对突变纯合的植物并紧邻野生型植物品系生长该植物品系并分析两个品系的表型(例如,多分枝表型)来测试。
可替代地,技术人员可以实施用于生产能够产生更高平均数量的二级枝(多分枝)的栽培西瓜、黄瓜或甜瓜植物的方法和/或用于生成包含突变型D14等位基因的西瓜、黄瓜或甜瓜植物的方法,该方法包括以下步骤:
a)在西瓜、黄瓜或甜瓜的植物、植物部分或种子、尤其是栽培植物的群体中引入突变,或提供突变型植物或其后代的群体;
b)选择当生长时发展更高平均数量的二级枝的植物;
c)任选地确定在b)中选择的植物是否包含D14基因的突变型等位基因;并且
d)任选地生长在c)中获得的植物。
步骤b)和c)也可以互换,使得步骤b)是选择包含D14基因的突变型等位基因的植物,并且步骤c)是任选地确定植物(或其后代)是否产生更高的平均二级分枝/多分枝表型。
步骤a)可以通过例如诱变西瓜、黄瓜或甜瓜的一个或多个品系或品种的种子来进行,例如通过用诱变剂(诸如化学诱变剂,例如EMS(乙基甲烷磺酸盐))处理,或用UV辐射、X-射线或γ-射线等照射来进行。例如,群体可以是TILLING群体。优选地,在进行步骤b)之前,使诱变的植物群体自交至少一次(例如,为了产生M2代,或M3、M4等)。
步骤b)的表型可以在视觉上容易地进行,例如通过计数二级枝进行。
可以通过表型分析(例如,二级分枝)和/或通过针对D14基因中的突变和所编码的蛋白质对植物进行基因分型,或通过D14基因的表达、测序和技术人员已知的其他方法来测试此类植物或其后代的突变型D14基因的存在。因此,存在用于验证表型选择的植物是否包含D14基因的突变型等位基因的多种方法或方法的组合。
如果步骤b)是包含D14基因的突变型等位基因的植物的选择,则技术人员还可以使用用于检测D14基因的DNA、mRNA或蛋白质的各种方法以便鉴定包含突变型D14等位基因的植物。编码功能性ClD14蛋白(SEQ ID NO:2)的野生型西瓜ClD14基因的基因组DNA是SEQID NO:6的DNA,并且编码SEQ ID NO:2的蛋白质的cDNA(mRNA)在SEQ ID NO:4中给出。启动子位于该序列的上游,并且可以例如通过测序检索或从西瓜基因组数据库中检索。例如,ATG起始上游的至少1000个或至少2000个碱基包括启动子序列。
编码功能性CsD14蛋白(SEQ ID NO:8)的野生型黄瓜CsD14基因的基因组DNA是SEQID NO:15的DNA,并且编码SEQ ID NO:8的蛋白质的cDNA(mRNA)在SEQ ID NO:17中给出。启动子位于该序列的上游,并且可以例如通过测序检索或从黄瓜基因组数据库中检索。例如,ATG起始上游的至少1000个或至少2000个碱基包括启动子序列。
编码功能性CmD14蛋白(SEQ ID NO:9)的野生型甜瓜CmD14基因的基因组DNA是SEQID NO:16的DNA,并且编码SEQ ID NO:9的蛋白质的cDNA(mRNA)在SEQ ID NO:18中给出。启动子位于该序列的上游,并且可以例如通过测序检索或从黄瓜基因组数据库中检索。例如,ATG起始上游的至少1000个或至少2000个碱基包括启动子序列。
在一个方面,D14基因的突变型等位基因是导致D14基因表达降低或不表达的突变型等位基因,或者是导致与野生型D14蛋白相比,所编码的D14蛋白的一个或多个氨基酸被置换、插入、重复或缺失的突变型等位基因。
在一个方面,D14基因的突变型等位基因可以通过在基因中诱导靶向或随机突变(启动子或其他调节元件、剪接位点、编码区等)并例如从后代中选择包含突变型D14等位基因的植物来获得。在一个方面,选择包含在密码子中的突变,或包含一个或多个密码子(例如,编码SEQ ID NO:2、8或9的氨基酸94至氨基酸101的密码子中的一个或多个密码子)的插入、缺失或重复的等位基因。在一个方面,突变型等位基因导致编码的西瓜、黄瓜或甜瓜D14蛋白的截短。
在一个方面,在西瓜植物或植物部分的基因组或其DNA中检测INDEL标志物(标志物mWM23349015_k2)。该INDEL标志物在实施例中描述并检测西瓜中的插入等位基因(包含插入/重复的24个核苷酸,导致8个氨基酸的重复)和/或野生型等位基因。
注意到提及INDEL标志物mWM23349015_k2不限于本文提供的特定正向和反向PCR引物,而是涉及可以区分SEQ ID NO:6的野生型ClD14等位基因和SEQ ID NO:5的突变型ClD14等位基因(包含24个重复/插入的核苷酸)的任何双等位基因标志物。技术人员可以容易地制备其他等位基因特异性引物或等位基因特异性探针以用作用于检测这两种ClD14等位基因的基因型的双等位基因标志物。
在一个方面,在西瓜植物或植物部分的基因组或者其基因组DNA或cDNA中检测INDEL标志物(标志物mWM23349015_k2)。因此,本文提供了一种用于检测24个核苷酸的插入的存在的方法。因此,可以针对野生型ClD14等位基因和/或插入等位基因的存在来筛选西瓜的基因组DNA或cDNA/mRNA,并且可以任选地选择该西瓜的基因组DNA或cDNA/mRNA。
在另一个方面,在西瓜植物或植物部分的基因组或其DNA中检测到赋予单个氨基酸被另一个氨基酸或被表A或表2中所示的终止密码子置换的SNP。因此,本文提供了一种用于检测那些SNP中的任一种SNP的存在的方法。因此,可以针对野生型ClD14等位基因和/或表A或表2的突变型等位基因的存在来筛选西瓜的基因组DNA或cDNA/mRNA,并且可以任选地选择该西瓜的基因组DNA或cDNA/mRNA。
对于西瓜、黄瓜或甜瓜的其他突变型D14等位基因,可以容易地设计INDEL或SNP标志物(或其他标志物)以及INDEL或SNP基因分型(或其他基因分型)测定。因此,本文涵盖等位基因特异性标志物和检测方法,尤其是对于导致西瓜、黄瓜或甜瓜的D14蛋白的氨基酸插入、重复、缺失或置换的任何突变型等位基因。
尤其是在一个方面,可以确定INDEL标志物(例如,标志物mWM23349015_k2)的基因型,并将其用于选择包含SEQ ID NO:6的野生型等位基因和/或SEQ ID NO:5的突变型ClD14等位基因的植物或后代植物。
针对突变型ClD14等位基因杂合的二倍体植物将包含在基因组中的SEQ ID NO:5和SEQ ID NO:6两者。针对突变型ClD14等位基因纯合的二倍体植物将仅包含在8号染色体上的基因座处的SEQ ID NO:5。针对野生型等位基因纯合的二倍体植物将仅包含在基因组中的SEQ ID NO:6。
如所提及的,对于任何突变型D14等位基因,可以同样容易地开发突变型等位基因特异性标志物和标志物测定,因为基础基因组变化(例如,在密码子中)可以用于设计标志物测定以检测基因组变化,例如本文公开的基础氨基酸变化或与野生型D14等位基因相比的突变型D14等位基因中的其他基因组变化。
使用此类检测特定突变型D14等位基因的等位基因特异性标志物,可以进行基因分型以检测植物和植物材料中等位基因(或由其衍生的DNA)的存在和拷贝数。
关于本发明的实施方案,D14基因的突变型等位基因中的突变可以是任何突变,包括缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变和/或调节序列中的突变。在一个方面,D14基因的突变型等位基因中的突变是点突变。突变可以发生在包含D14基因编码序列的DNA序列中,或者可以发生在编码D14蛋白的RNA序列中,或者它可以发生在D14蛋白的氨基酸中。关于编码D14蛋白的基因的DNA序列,突变可以在编码序列中发生,或者它可以在非编码序列如D14基因的5'-和3'-非翻译区、启动子、增强子等中发生。关于编码D14蛋白的RNA,突变可在前mRNA或mRNA中发生。在一个方面,突变型等位基因导致蛋白质由于一个或多个氨基酸被置换、插入、重复和/或缺失而功能丧失或功能减少,例如导致在蛋白质的C末端、在IPR000073结构域中、在螺旋盖结构域中或包含催化三联体的氨基酸中的一种氨基酸的一个或多个氨基酸被置换、插入、重复和/或缺失。
因此,本发明的一个实施方案涉及包含D14基因的突变型等位基因的根据本发明的植物细胞或植物,其特征在于突变型等位基因包含或影响选自由以下组成的组的突变中的一种或多种突变:
a)基因组序列中的缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变;
b)一个或多个调节序列中的突变;
c)编码序列中的缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变;
d)前mRNA或mRNA中的缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变;并且/或者
e)D14蛋白中一个或多个氨基酸的缺失、截短、插入、重复或置换。
在一个方面,突变型等位基因导致D14基因的表达降低或不表达,或者突变型等位基因编码功能降低或功能丧失的蛋白质。特别地,与针对野生型等位基因纯合的对照植物相比,突变型等位基因的纯合形式导致针对突变型等位基因纯合的植物中二级枝的平均数量显著增加。当等位基因是敲除等位基因或产生非功能性蛋白质时,平均二级分枝的显著增加是‘完全多分枝’,或者当等位基因是敲低等位基因或产生功能降低蛋白时,平均二级分枝的显著增加是‘中等多分枝’。
表达降低(敲低等位基因)或不表达(敲除等位基因)意指在D14基因的调节区,诸如启动子中存在突变,由此与包含野生型D14等位基因的植物和植物部分相比,产生D14等位基因的mRNA转录物降低或无mRNA转录物。表达的减少可以例如通过测量编码D14蛋白的mRNA转录物的量来确定,例如使用Northern印迹分析或RT-PCR来确定。此处,降低优选意指与包含野生型D14基因的植物或植物部分相比,RNA转录物的量降低至少50%,特别是至少70%,任选地至少85%或至少95%,或甚至100%(无表达)。可以分析例如在花组织或叶组织中的表达。
在一个方面,与野生型蛋白相比,蛋白质包含被置换、插入、重复或缺失的一个或多个氨基酸。因此,对于西瓜、黄瓜或甜瓜,与SEQ ID NO:2、8或9的野生型D14蛋白或与SEQID NO:2、8或9具有至少95%、96%、97%或98%或99%序列同一性的野生型D14蛋白相比,插入、缺失或置换一个或多个氨基酸;由此当突变型等位基因以纯合形式存在于二倍体植物中时,突变型蛋白与野生型蛋白相比功能降低或功能丧失,并且因此导致(中等或强)多分枝。
在一个方面,上述野生型等位基因的突变型等位基因是表达降低或不表达(通过例如启动子或增强子元件中的突变)或产生与野生型蛋白相比包含插入、重复、缺失或置换的一个或多个氨基酸的突变型蛋白的突变型等位基因,由此突变型蛋白体内功能降低或无功能,如当突变型等位基因在植物中呈纯合形式时并且通过分析与针对野生型等位基因纯合的植物相比针对突变型等位基因纯合的植物的表型所确定的。可以基因表达降低或无基因表达的突变型等位基因进行相同的表型分析。因此,可以使任何突变型等位基因在植物中为纯合的,并且可以将表型与包含原始非突变型等位基因的对照植物和/或与包含编码非功能性蛋白质的突变型等位基因(诸如例如ClD14ins或W155*,或黄瓜或甜瓜D14蛋白中的相同突变体)的对照植物比较。
当本文提及从一个氨基酸到另一个氨基酸的氨基酸时,这包括所提及的起始/第一个氨基酸和结束/最后一个氨基酸。
当提及氨基酸被‘缺失’时,这包括由此密码子变为终止密码子或密码子缺失的突变,或者由此存在导致氨基酸不被编码的移码的突变。同样地,当提及氨基酸被‘置换’时,这包括由此密码子编码不同氨基酸或密码子被插入的突变,或者由此存在导致不同氨基酸被编码的移码的突变。
西瓜可以是任何类型的西瓜。在一个方面,包含一个或两个拷贝的突变型ClD14等位基因,例如编码SEQ ID NO:1的蛋白质的突变型等位基因,或不同的突变型等位基因的西瓜植物不是授粉植物,即它不适合作为用于三倍体果实生产的授粉者,例如因为开花时间与三倍体开花不同步和/或花粉生产不够高而不适合作为花粉生产者。在一个方面,其用于果实生产本身而不用于花粉生产。因此,它不与三倍体植物间种(并且不适合于间种),而是经由自花传粉单独生长以用于果实生产。自花传粉后产生的果实也不是‘不可收获的’(即具有粉色或白色果肉和低白利糖度),而是非常适合于收获和消费(即具有高白利糖度、红色果肉等)。
包含至少一个拷贝的突变型D14等位基因的西瓜植物及其部分可以是二倍体、四倍体或三倍体。二倍体植物可以是针对突变型等位基因杂合的或针对突变型等位基因纯合的,例如针对编码SEQ ID NO:1的蛋白质的突变型等位基因或所述的任何其他突变型等位基因。在一个方面,包含呈纯合形式的突变型D14等位基因的二倍体植物是双单倍体植物(DH),例如双单倍体西瓜、黄瓜或甜瓜植物或植物细胞或植物部分。
三倍体西瓜植物可以具有一个、两个或三个拷贝的突变型ClD14等位基因。具有一个拷贝的突变型等位基因的三倍体植物可以通过将野生型雌性四倍体(具有4个野生型拷贝)与针对突变型等位基因纯合的二倍体雄性杂交来制备。具有两个突变型等位基因的三倍体植物可以通过将包含四个拷贝的突变型等位基因的雌性四倍体与针对野生型等位基因纯合的二倍体雄性杂交来制备。
四倍体西瓜植物可以具有一个、两个、三个或四个拷贝的突变型ClD14等位基因。包含两个拷贝的突变型等位基因的基因型可以通过使针对突变型等位基因杂合的二倍体的染色体加倍来制备。包含四个拷贝的突变型等位基因的基因型可以通过使针对突变型等位基因纯合的二倍体的染色体加倍来制备。
本文所涵盖的西瓜、黄瓜或甜瓜植物也可以营养繁殖(克隆),并且此类营养繁殖的植物或‘营养繁殖’是本发明的实施方案。它们可以通过突变型D14等位基因的存在和/或在表型上(任选地在自交后)容易地与其他植物区分。一个或多个突变型D14等位基因的存在可以如本文别处所述来确定。
营养繁殖可通过不同方法进行。例如,可以将本发明植物的一个或多个接穗嫁接到不同的砧木上,例如生物或非生物胁迫耐受砧木。
其他方法包括体外细胞或组织培养方法和从此类培养物再生营养繁殖。此类细胞或组织培养物包含本发明植物的各种细胞或组织或由它们组成。在一个方面,此类细胞或组织培养物包含本发明植物的营养细胞或营养组织或由它们组成。
在另一个方面,细胞或组织培养物包含生殖细胞或组织或由它们组成,诸如本发明植物的花药、花粉、小孢子或胚珠。此类培养物可以用染色体加倍剂处理以制备例如双单倍体植物,或者它们可以可替代地用于制备单倍体植物(例如从四倍体制备二倍体或从二倍体制备单倍体)。
因此,体外细胞或组织培养物可以包含来自选自由以下组成的组的植物部分的细胞或原生质体或植物组织或由它们组成:果实、胚、分生组织、子叶、花粉、小孢子、胚珠、叶、花药、根、根尖、雌蕊、花、种子、茎。还包括这些中任一种的部分,诸如例如仅种皮(母体组织)。
因此,在本发明的一个方面,提供了一种包含一个或两个拷贝的均如上所述的突变型D14等位基因的植物细胞的细胞培养物或组织培养物。如所提及的,包含来自包含突变型D14等位基因的植物的植物部分的细胞或原生质体或植物组织的细胞培养物或组织培养物可以包含选自由以下组成的组的细胞或组织或由它们组成:胚、分生组织、子叶、花粉、小孢子、叶、花药、根、根尖、雌蕊、花、种子、茎;或者这些中任一种的部分。
还提供了一种从此类细胞培养物或组织培养物再生的西瓜、黄瓜或甜瓜植物,其中再生的植物(或其后代,例如在使再生的植物杂交或自交之后获得)包含突变型D14等位基因。因此,在一个方面,包含一个或多个拷贝的突变型D14等位基因的西瓜、黄瓜或甜瓜植物是营养繁殖的植物。
在不同的方面,包含一个或多个拷贝的突变型D14等位基因的本发明的细胞和组织(以及任选地还有细胞或组织培养物)是非繁殖细胞或组织。
其他方法
还提供了一种用于生产能够产生增加的二级枝的平均数量的西瓜、黄瓜或甜瓜植物的方法,或一种用于生产D14基因的突变型等位基因的方法,该方法包括以下步骤:
a)在西瓜、黄瓜或甜瓜植物群体中引入突变,或提供西瓜、黄瓜或甜瓜植物的突变型群体;或提供包含在D14靶基因中的随机诱导的突变或靶向诱导的突变的西瓜、黄瓜或甜瓜植物,
b)选择包含D14基因的突变型等位基因的植物;
c)任选地验证当突变型D14等位基因呈纯合形式时,与包含D14基因的野生型等位基因的对照植物相比,在b)中选择的植物是否产生增加的二级枝的平均数量。
还提供了一种用于生产能够产生完全多分枝表型的西瓜、黄瓜或甜瓜植物的方法,或一种用于生产当呈纯合形式时赋予完全多分枝表型的D14基因的突变型等位基因的方法,该方法包括以下步骤:
a)在西瓜、黄瓜或甜瓜植物群体中引入突变,或提供西瓜、黄瓜或甜瓜植物的突变型群体;或提供包含在D14靶基因中的随机诱导的突变或靶向诱导的突变的西瓜、黄瓜或甜瓜植物,
b)选择包含D14基因的突变型等位基因的植物,其中突变型D14等位基因是敲除等位基因或编码功能丧失的D14蛋白的等位基因;
c)任选地验证当突变型D14等位基因呈纯合形式时,与包含D14基因的野生型等位基因的对照植物相比,在b)中选择的植物是否产生增加的二级枝的平均数量。
还提供了一种用于生产能够产生中等多分枝表型的西瓜、黄瓜或甜瓜植物的方法,或一种用于生产当呈纯合形式时赋予中等多分枝表型的D14基因的突变型等位基因的方法,该方法包括以下步骤:
a)在西瓜、黄瓜或甜瓜植物群体中引入突变,或提供西瓜、黄瓜或甜瓜植物的突变型群体;或提供包含在D14靶基因中的随机诱导的突变或靶向诱导的突变的西瓜、黄瓜或甜瓜植物,
b)选择包含D14基因的突变型等位基因的植物,其中突变型D14等位基因是敲低等位基因或编码功能降低的D14蛋白的等位基因;
c)任选地验证当突变型D14等位基因呈纯合形式时,与包含D14基因的野生型等位基因的对照植物相比,在b)中选择的植物是否产生增加的二级枝的平均数量。
涵盖包含至少一个拷贝的通过上述方法生产的突变型D14等位基因和/或通过上述方法诱导和鉴定的突变型D14等位基因的西瓜、甜瓜或黄瓜植物。在一个方面,通过上述方法生产的并且包含呈纯合形式的赋予完全多分枝的突变型等位基因的西瓜植物不包含SEQ ID NO:5的突变型等位基因。在另一个方面,通过上述方法生产的并且包含呈纯合形式的赋予完全多分枝的突变型等位基因的西瓜植物在其编码与由授粉者Sidekick编码的蛋白质(SEQ ID NO:1中显示的蛋白ClD14ins)相同的蛋白质的情况下,在与品种Sidekick不同的西瓜背景中,并且与品种Sidekick在一个或多个特征上有所不同。例如,该植物与Sidekick的不同之处可能在于不适于作为授粉者,和/或生产具有红色果肉的果实,和/或具有较高的平均果实重量,或区分该植物与Sidekick的其他特征。
a)中西瓜、黄瓜或甜瓜植物的群体优选是被/已经被(或经受)诱变剂处理的栽培西瓜、黄瓜或甜瓜培育品系或品种的单一基因型,或此类群体的后代,例如在使群体的个体自交以生产M2、M3或其他代植物之后获得。这例如可以是TILLING群体。它还可以是已经经受使用例如基于Crispr的方法进行的靶向基因修饰的西瓜、黄瓜或甜瓜品系。
在步骤b)中,包含D14基因的突变型等位基因的植物的选择可以在表型上进行和/或通过针对D14基因的突变型等位基因的存在筛选植物(或其植物部分或DNA)来进行,该突变型等位基因即野生型D14等位基因的表达降低(在敲低等位基因的情况下)或不表达(在敲除等位基因的情况下)的等位基因或编码突变型D14蛋白的等位基因。
关于针对表型进行的筛选,应当理解,只有当突变型D14等位基因呈纯合形式时,并且当突变型等位基因表达降低或不表达或编码功能降低或功能丧失的蛋白质时,才可以选择这些等位基因,从而观察到表型。表型或表型组合的筛选可以如所述进行,例如在与包含纯合形式的野生型D14等位基因的对照品系或品种相同的生长条件下生长包含纯合形式的突变型D14等位基因的品系,并且然后分析二级分枝。
关于针对D14基因的突变型等位基因的存在来筛选或选择植物,这可以通过检测D14 DNA、RNA或蛋白质的各种方法来进行,例如通过例如设计扩增编码区的部分或编码区的全部的PCR引物以扩增基因组DNA从而确定植物是否包含在基因组DNA中的突变,或其他方法。
因此,为了确定存在或选择包含突变型D14等位基因的植物,可以使用各种方法。例如,可以进行等位基因或包含D14基因座的染色体区域的标志物分析或序列分析,或者可以使用PCR或RT-PCR来扩增D14等位基因(或其部分)或mRNA(cDNA)或者可以进行测序。此外,可以进行确定隐性遗传的遗传分析。因此,等位基因可以例如被测序(例如其基因组DNA或cDNA)以确定存在什么突变。在步骤b)中,还可以使用Provean和/或SIFT分析来选择具有预测降低或消除D14蛋白功能的突变型等位基因的植物。参见实施例。
如果已使用基因编辑方法,则优选从包含突变型D14等位基因的植物品系中去除已引入植物中来诱导内源等位基因突变的载体/构建体,使得植物品系不包含此类载体或构建体。
在一个方面,植物不含有通过转化插入基因组的遗传构建体。
在一个方面,突变型等位基因通过诱变(例如,化学或辐射诱变)或通过靶向诱变生成,尤其是使用CRISPR系统(例如,Crispr/Cas9或Crispr/CpfI或其他核酸酶)来生成。在一个方面,包含突变型D14等位基因的栽培植物不是转基因植物,即选择不包含例如CRISPR构建体的非转基因后代。
在一个方面,D14基因的突变型等位基因包含人诱导的突变,即通过诱变技术(诸如化学诱变或辐射诱变)或靶向诱变技术(诸如基于Crispr的技术)引入的突变。
本文提供了一种使用任何靶向基因修饰方法诸如基于CRISPR的方法(例如,Crispr/Cas9或Crispr/CpfI)、TALENS、锌指或其他方法来靶向诱变西瓜、黄瓜或甜瓜中的内源D14基因的方法。
在一个方面,提供了一种分离的突变型D14蛋白和分离的野生型D14蛋白或编码突变型D14蛋白或野生型D14蛋白的分离的核酸分子。本文还涵盖能够结合突变型或野生型D14蛋白的抗体。在一个方面,分离的突变型蛋白是SEQ ID NO:1的蛋白质,其包含8个氨基酸的重复,但也可以是本文描述的任何其他突变型D14等位基因的分离的蛋白质。在一个方面,分离的突变型蛋白是表A或表2中描述的蛋白质。在一个方面,分离的核酸是编码表A或表2中描述的突变型蛋白的DNA或RNA。
在另一个方面,涵盖本文提供的核苷酸序列或核酸分子的片段(和/或序列或分子的互补链的片段),因为这些可以用作PCR引物或探针来检测DNA或RNA样品中的序列。片段包括例如SEQ ID NO:5或6、SEQ ID NO:13或14、SEQ ID NO:15或16、SEQ ID NO:10、11或12或这些中任一种的互补链或反向互补链的基因组序列,或者SEQ ID NO:3或4或者SEQ IDNO:17或18或这些中任一种的互补链或反向互补链的mRNA或cDNA序列或分子中的至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65或更多个核苷酸的区段。还涵盖编码表A或表2中描述的突变型蛋白的分离的核酸分子或序列(DNA或RNA)的片段。
检测方法
在一个方面,提供了一种用于鉴定和/或选择种子、植物或植物部分或来自此类种子、植物或植物部分的DNA的筛选方法,该种子、植物或植物部分或DNA在它们的基因组中包含编码D14蛋白的基因的突变型等位基因和/或野生型等位基因。
该方法包括使用已知方法在DNA(尤其是基因组DNA)、RNA(或cDNA)或蛋白质水平上进行筛选,以便检测突变型等位基因和/或野生型等位基因的存在。存在许多方法来检测基因的突变型和/或野生型等位基因的存在。
因此,提供了一种用于针对突变型D14等位基因和/或野生型D14等位基因的存在来筛选和/或选择植物或植物材料或植物部分、或由它们衍生的DNA或RNA或蛋白质的方法,该方法包括以下步骤中的一个或多个步骤:
a)确定内源D14基因的基因表达,例如以检测其是否降低或消除;
b)确定野生型D14蛋白的量,例如以检测其是否降低或消除;
c)确定是否存在编码突变型或野生型D14蛋白的突变型和/或野生型mRNA、cDNA或基因组DNA;
d)确定是否存在突变型和/或野生型D14蛋白;
e)确定植物或其后代是否显示突变型表型(如所述,例如强多分枝或中等多分枝)或野生型表型(正常分枝)。
可以使用常规方法,诸如RT-PCR、PCR、基于抗体的测定、测序、基因分型测定(例如,等位基因特异性基因分型)、通过测序进行的基因分型、表型分型等。
植物或植物材料或植物部分可以是西瓜、黄瓜或甜瓜植物或植物材料或植物部分,诸如叶、叶部分、细胞、果实、果实部分、卵巢、茎、下胚轴、种子、种子部分、种皮、胚等。
例如,如果在野生型等位基因和突变型等位基因之间存在单核苷酸差异(单核苷酸多态性SNP,或插入缺失多态性InDel),则SNP或InDel基因分型测定可以用于检测植物或植物部分或细胞在其基因组中是否包含一个野生型核苷酸(或多个核苷酸)或一个突变型核苷酸(或多个核苷酸)。例如,SNP或INDEL可以使用KASP测定(参见万维网kpbioscience.co.uk)或其他基因分型测定、尤其是双等位基因基因分型测定容易地检测。为了开发KASP测定,例如可以选择SNP或INDEL上游约70个碱基对和下游约70个碱基对,并且可以设计两个等位基因特异性正向引物和一个反向引物。参见例如Allen等人,2011年,Plant Biotechnology J.第9卷,第1086-1099页,尤其是关于KASP测定方法的第097-1098页。
同样可以使用其他基因分型测定。例如,同样可以使用TaqMan SNP基因分型测定、高分辨率熔解(HRM)测定、SNP基因分型阵列例如微阵列(例如,Fluidigm、Illumina等)或DNA测序(例如,通过测序进行的基因分型)。
因此,基于野生型等位基因和突变型等位基因的基因组序列之间的差异,技术人员可以容易地开发可以用于检测特定等位基因的标志物或测定。
本文还提供了一种用于鉴定包含突变型D14等位基因的西瓜、黄瓜或甜瓜植物(或植物部分)的方法,该方法包括检测植物(或植物部分)中突变型D14等位基因的存在,其中该存在通过D14等位基因内的至少一种标志物(例如,SNP标志物或InDel标志物)或通过检测由D14等位基因编码的蛋白质来检测。用于检测突变型D14等位基因的方法选自由以下组成的组:包括PCR扩增、核酸测序、核酸杂交和用于检测由等位基因编码的D14蛋白的基于抗体的测定(例如,免疫测定)的方法。
本文还提供了一种用于鉴定包含含有调节元件中的突变的突变型D14等位基因的西瓜、黄瓜或甜瓜植物(或植物部分)的方法,该方法包括检测植物(或植物部分)中突变型D14等位基因的基因表达的降低或基因表达的缺失,其中该存在通过野生型D14等位基因的mRNA水平(cDNA)或通过检测野生型D14蛋白的蛋白质水平来检测。用于检测突变型D14等位基因的方法选自由以下组成的组:PCR扩增(例如,RT-PCR)、核酸测序、western印迹和用于检测由等位基因编码的D14蛋白的基于抗体的测定(例如,免疫测定)。
还提供了一种用于确定、或检测或测定西瓜、黄瓜或甜瓜植物或植物部分的细胞是否包含编码SEQ ID NO:2、8或9的蛋白质或与本文提供的SEQ ID NO:2、8或9具有至少95%、96%、97%、98%、99%或100%序列同一性的蛋白质的名称为D14的基因的突变型等位基因的方法。在一个方面,该方法包括确定等位基因的表达,和/或确定等位基因的编码序列,和/或确定等位基因的编码序列的一部分(例如,等位基因的SNP或INDEL基因型),和/或确定所产生的蛋白质的氨基酸序列和/或所产生的蛋白质的量。
多种方法可以用于确定植物或其部分是否包含本发明的突变型D14等位基因。如所提及的,可以确定野生型等位基因的mRNA(或cDNA)水平,或可以确定野生型蛋白水平,以观察是否存在野生型等位基因的表达降低或无表达。还可以分析编码序列或其部分,例如如果已经知道可能存在哪个突变型等位基因,则可以开发检测突变的测定,例如,SNP或INDEL基因分型测定可以例如区分突变型等位基因和野生型等位基因的存在,例如,标志物mWM23349015_k2(参见实施例)的基因分型或表A或表2的突变型等位基因中的任一种突变型等位基因或其他突变型等位基因的基因分型。
一种用于选择植物的方法,该方法包括以下步骤:
a)鉴定具有在编码D14蛋白编码基因的等位基因中的突变的植物,其中该基因的野生型等位基因编码与选自SEQ ID NO:2、8或9的组的蛋白质中的任一种蛋白质具有至少95%、96%、97%、98%、99%或100%序列同一性的D14蛋白,以及任选地
b)确定植物或后代植物是否生产多分枝表型,以及任选地
c)选择包含至少一个拷贝的步骤a)的突变型等位基因的植物。
一种用于生产植物的方法,该方法包括以下步骤:
a)在植物群体中引入突变或提供突变型植物群体(例如,TILLING群体),
b)选择生产多分枝表型和/或包含突变型D14等位基因的植物,
c)任选地验证在b)中选择的植物是否具有在编码D14蛋白编码基因的等位基因中的突变,并且选择包含此类突变的植物,以及任选地
d)生长/栽培c)中获得的植物,
其中该基因的野生型等位基因编码与SEQ ID NO:2、8或9的蛋白质具有至少95%序列同一性的D14蛋白。
一种用于选择包含强多分枝表型或中等多分枝表型的植物的方法,该方法包括以下步骤:
a)针对D14基因的突变型等位基因的存在来筛选植物(或其DNA),其中该基因的野生型等位基因编码与选自SEQ ID NO:2、8或9的组的蛋白质中的任一种蛋白质具有至少95%、96%、97%、98%、99%或100%序列同一性的D14蛋白,以及
b)选择包含突变型等位基因的植物,该突变型等位基因i)是敲除等位基因或编码非功能性D14蛋白,该纯合形式的等位基因生产强多分枝表型,或该突变型等位基因ii)是敲低等位基因或编码功能降低的D14蛋白,该纯合形式的等位基因生产中等多分枝表型,以及任选地
c)确认包含呈纯合形式的突变型等位基因的植物或后代植物生产i)的所述强多分枝表型或ii的所述中等多分枝表型。
在一个方面,步骤b)包括通过例如进行氨基酸变化对蛋白质功能的影响的SIFT或Provean分析来预测突变型等位基因是否编码功能降低或功能丧失的D14蛋白。在步骤b)中选择包含在Provean分析中被预测为‘有害的’和/或在SIFT分析中被预测为‘不耐受的’的等位基因的一种或多种植物。
一种用于生产或选择包含强多分枝表型或中等多分枝表型的植物的方法,该方法包括以下步骤:
a)在植物群体中引入突变或提供突变型植物群体(例如,TILLING群体),
b)选择包含突变型D14等位基因的植物,该突变型等位基因i)是敲除等位基因或编码非功能性D14蛋白,该纯合形式的等位基因生产强多分枝表型,或该突变型等位基因ii)是敲低等位基因或编码功能降低的D14蛋白,该纯合形式的等位基因生产中等多分枝表型,
c)选择包含i)或ii)的突变型等位基因的植物,
其中该基因的野生型等位基因编码与SEQ ID NO:2、8或9的蛋白质具有至少95%序列同一性的D14蛋白。
所选择的植物可以自交以生产包含呈纯合形式的突变型等位基因的植物,并且该纯合植物可以生长以确定表型。
一种用于生产植物的方法,该方法包括以下步骤:
a)将外源核酸分子引入植物中,其中外源核酸分子选自由以下组成的组:
i)编码至少一种反义RNA的DNA分子,该反义RNA造成编码D14蛋白的内源基因的表达降低;
ii)DNA分子,其通过共抑制作用导致编码D14蛋白的内源基因的表达降低;
iii)编码至少一种核酶的DNA分子,该核酶裂解编码D14蛋白的内源基因的特定转录物;
iv)同时编码至少一种反义RNA和至少一种有义RNA的DNA分子,其中所述反义RNA和所述有义RNA形成双链RNA分子,该双链RNA分子造成编码D14蛋白的内源基因的表达降低(RNAi技术);
v)通过体内诱变引入的核酸分子,该核酸分子导致编码D14蛋白的内源基因中的突变或异源序列的插入,其中该突变或插入造成编码D14蛋白的基因的表达降低或导致功能丧失或功能降低的D14蛋白的合成;
vi)编码抗体的核酸分子,其中由于该抗体与内源D14蛋白的结合,该抗体导致编码D14蛋白的内源基因的活性降低;
vii)含有转座子的DNA分子,其中这些转座子的整合导致编码D14蛋白的内源基因中的突变或插入,从而造成编码D14蛋白的内源基因的表达降低,或导致失活蛋白的合成;
viii)T-DNA分子,其由于编码D14蛋白的内源基因中的插入而造成编码D14蛋白的内源基因的表达降低,或导致功能丧失或功能降低的D14蛋白的合成;
ix)编码稀有切割核酸内切酶或定制的稀有切割核酸内切酶的核酸分子,优选大范围核酸酶、TALEN或CRISPR/Cas系统。
b)选择植物或植物的后代,其中该植物或植物的后代产生更高百分比的雄花和/或具有融合花瓣和/或叶的花,任选地
c)验证b)中选择的植物或后代与其基因组例如没有整合入外源核酸分子的野生型植物相比是否具有减少的D14蛋白活性,任选地
d)生长/栽培在c)中获得的植物。
本文涵盖通过上述方法中的任一方法获得的植物。
在一个方面,提供了一种遗传修饰的植物和植物部分,由此该植物例如通过内源D14基因的沉默而具有内源D14基因的降低表达或无表达。此类植物可以是任何植物,在一个方面,它是西瓜、黄瓜或甜瓜。
在另一个方面,提供了一种西瓜、黄瓜或甜瓜的植物和植物部分,其包含内源D14基因中的突变,例如,通过例如靶向诱变生成的诱导突变,由此与野生型蛋白相比,基因表达降低或消除,或者表达的基因编码功能降低或功能丧失的D14蛋白。
在另一个方面,提供了一种用于检测和任选地选择西瓜植物、种子或植物部分的方法,该西瓜植物、种子或植物部分包含至少一个拷贝的名称为ClD14(西瓜Dwarf14)的基因的野生型等位基因和/或突变型等位基因,该方法包括以下步骤:
a)提供一种或多种西瓜植物、种子或植物部分的一种或多种基因组DNA样品,
b)使用a)的DNA样品作为模板进行区分野生型ClD14等位基因和突变型ClD14等位基因的基因分型测定,其中所述基因分型测定基于利用ClD14等位基因特异性寡核苷酸引物的核酸扩增,和/或其中所述基因分型测定基于利用ClD14等位基因特异性寡核苷酸探针的核酸杂交,以及任选地
c)选择包含一个或两个拷贝的突变型等位基因的植物、种子或植物部分,
其中野生型ClD14等位基因包含SEQ ID NO:6的序列,并且突变型ClD14等位基因包含相对于SEQ ID NO:6的序列插入、重复、缺失或置换的一个或多个核苷酸。
在上述方法中,可以使用ClD14等位基因特异性寡核苷酸引物或所述ClD14等位基因特异性寡核苷酸探针,其包含SEQ ID NO:6或SEQ ID NO:6的互补链的至少10、11、12、13、14、15或更多个核苷酸。
在上述方法的一个方面,突变型等位基因包含在等位基因的编码区中插入或重复的至少一个密码子,或者改变为另一个密码子的至少一个密码子,或者缺失或改变为终止密码子的至少一个密码子。
在上述方法的一个方面,突变型等位基因包含SEQ ID NO:5的序列。
在上述方法的另一个方面,突变型等位基因是编码如表A或表2中所述的蛋白质的等位基因。
在上述方法的另一个方面,突变型等位基因是编码功能丧失的D14蛋白或功能降低的D14蛋白的等位基因,如本文别处所述。
在上述方法的一个方面,寡核苷酸引物或寡核苷酸探针包含与SEQ ID NO:6或与SEQ ID NO:6的互补序列互补的至少15、16、17或更多个核苷酸。
优选地,在上述方法中使用的基因分型测定是KASP测定,所述KASP测定包括检测DNA样品中SEQ ID NO:6的野生型等位基因的第一正向引物,检测DNA样品中包含相对于SEQID NO:6插入、缺失或置换的一个或多个核苷酸的突变型等位基因的第二正向引物,以及一个共同的反向引物。
在一个方面,第二正向引物检测DNA样品中SEQ ID NO:5的突变型等位基因。
在另一个方面,第二正向引物检测突变型等位基因,其是编码如表A或表2中所述的蛋白质的等位基因。
在另一个方面,第二正向引物检测突变型等位基因,其是编码功能丧失的D14蛋白或功能降低的D14蛋白的等位基因,如本文别处所述。
在KASP测定的一个方面,第一正向引物包含SEQ ID NO:11或其互补序列和/或第二正向引物包含SEQ ID NO:10或其互补序列。
本文还涵盖所合成的或合成核酸引物或探针,其中所述引物或探针包含例如SEQID NO:5(或另一突变型等位基因)或SEQ ID NO:6或这些序列中任一序列的互补序列的至少15个核苷酸。此类低聚核苷酸可以使用低聚核苷酸合成的常用方法合成。引物或探针优选是DNA低聚核苷酸,并且例如在缓冲溶液中提供,以用于例如基因分型测定。
还提供了一种用于检测和任选地选择西瓜、黄瓜或甜瓜的植物、种子或植物部分的方法,该西瓜、黄瓜或甜瓜的植物、种子或植物部分包含至少一个拷贝的名称为ClD14(西瓜Dwarf14)、CsD14(黄瓜Dwarf14)或CmD14(甜瓜Dwarf14)的基因的野生型D14等位基因和/或突变型D14等位基因,该方法包括以下步骤:
a)提供一种或多种西瓜、黄瓜或甜瓜的植物、种子或植物部分的一种或多种基因组DNA样品,
b)使用a)的DNA样品作为模板进行基因分型测定,其中所述基因分型测定基于利用D14等位基因特异性寡核苷酸引物的核酸扩增,和/或其中所述基因分型测定基于利用D14等位基因特异性寡核苷酸探针的核酸杂交,以及任选地
c)选择包含一个或两个拷贝的突变型等位基因的植物、种子或植物部分,
其中野生型D14等位基因编码SEQ ID NO:2(在西瓜中)、SEQ ID NO:8(在黄瓜中)和SEQ ID NO:9(在甜瓜中)的蛋白质,并且突变型D14等位基因包含相对于SEQ ID NO:2、SEQ ID NO:8或SEQ ID NO:9插入、缺失或置换的一个或多个氨基酸。
在一个方面,突变型D14等位基因是编码功能丧失的D14蛋白或功能降低的D14蛋白的等位基因,如本文别处所述。
在该方法的一个方面,所述D14等位基因特异性寡核苷酸引物或所述D14等位基因特异性寡核苷酸探针包含SEQ ID NO:6、或SEQ ID NO:15、或SEQ ID NO:16、或这些序列中任一序列的互补链的至少10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。
在上述方法的另一个方面,突变型等位基因编码包含选自SEQ ID NO:2、SEQ IDNO:8和SEQ ID NO:9的氨基酸94至氨基酸101的至少一个氨基酸的重复的蛋白质。在一个方面,突变型等位基因编码包含SEQ ID NO:2、SEQ ID NO:8和SEQ ID NO:9的至少丝氨酸97的重复的蛋白质。在另一个方面,突变型等位基因编码包含SEQ ID NO:2、SEQ ID NO:8或SEQID NO:9的氨基酸94至氨基酸101的重复的蛋白质。
还提供了一种用于西瓜的培育方法,该方法包括使用InDel标志物来选择西瓜品系的标记辅助选择(MAS),其中所述InDel标志物在一种或多种基因组DNA样品中检测SEQID NO:6的序列(缺失等位基因,或其互补序列)和/或SEQ ID NO:5的序列(插入等位基因,或其互补序列)。
还提供了一种用于西瓜的培育方法,该方法包括使用InDel标志物或SNP标志物来选择西瓜品系的标记辅助选择(MAS),其中所述InDel标志物或SNP标志物在一种或多种基因组DNA样品中检测编码SEQ ID NO:2的野生型蛋白的等位基因和/或编码突变型蛋白的等位基因,该突变型蛋白包含相对于SEQ ID NO:6的野生型蛋白缺失、插入、重复或置换的一个或多个氨基酸。在一个方面,突变型蛋白是功能丧失的D14蛋白或功能降低的D14蛋白,如本文别处所述。在一个方面,突变型蛋白是表A或表2的蛋白质。
在一个方面,突变型蛋白包含SEQ ID NO:2的SEQ ID NO:94至101的一个或多个氨基酸的重复。在一个方面,突变型蛋白包含SEQ ID NO:1的序列。
在一个方面,InDel标志物是标志物mWM23349015_k2。
还提供了一种用于黄瓜或甜瓜的培育方法,该方法包括使用InDel标志物或SNP标志物来选择黄瓜或甜瓜品系的标记辅助选择(MAS),其中所述InDel标志物或SNP标志物在一种或多种基因组DNA样品中检测编码SEQ ID NO:8或9的野生型蛋白的等位基因和/或编码突变型蛋白的等位基因,该突变型蛋白包含相对于SEQ ID NO:8或9的野生型蛋白缺失、插入、重复或置换的一个或多个氨基酸。在一个方面,突变型蛋白包含SEQ ID NO:8或9的SEQ ID NO:94至101的一个或多个氨基酸的重复。
上述这些方法可以用于选择或检测或培育本文别处所述的任何突变型D14等位基因。
在一个不同的方面,提供了一种用于生产植物、尤其是西瓜植物、黄瓜植物或甜瓜植物的方法,该方法包括:
-提供具有两个拷贝的野生型D14等位基因的第一近交植物,
-提供具有两个拷贝的突变型D14等位基因的第二近交植物,例如西瓜的SEQ IDNO:5的突变型等位基因,或本文所述的任何其他突变型等位基因,
-使第一植物与第二植物杂交以生产F1杂种种子,
-任选地收集F1杂种种子。
在一个不同的方面,提供了一种用于生产植物、尤其是西瓜植物、黄瓜植物或甜瓜植物的方法,该方法包括:
-提供具有两个拷贝的突变型D14等位基因的第一近交植物,
-提供具有两个拷贝的突变型D14等位基因的第二近交植物,例如西瓜的SEQ IDNO:5的突变型等位基因,或本文所述的任何其他突变型等位基因,
-使第一植物与第二植物杂交以生产F1杂种种子,
-任选地收集F1杂种种子。
在一个不同的方面,提供了一种用于生产植物、尤其是西瓜植物、黄瓜植物或甜瓜植物的方法,该方法包括:
-提供具有两个拷贝的野生型D14等位基因的第一植物,
-提供具有一个或两个拷贝的突变型D14等位基因的第二植物,例如西瓜的SEQ IDNO:5的突变型等位基因或本文所述的任何其他突变型等位基因,
-使第一植物与第二植物杂交以生产F1植物的种子,
-使F1植物自交以生产F2植物或使F1植物与另一植物杂交以生产后代植物,
-任选地进一步使F2植物自交或进一步使F2植物或前一步骤的后代植物(回交)杂交以生产进一步自交或回交的植物,
-任选地选择具有至少一个拷贝的突变型D14等位基因的植物。
在另一个实施方案中,一种用于将突变型D14等位基因渐渗到西瓜、黄瓜或甜瓜的培育品系或品种中的方法,该方法包括使包含突变型D14等位基因的植物与缺乏突变型D14等位基因的植物杂交,使F1、F2或其他代的后代与轮回亲本回交,并且最终选择包含突变型D14等位基因的轮回亲本。
任选地,MAS可以用于在第一或第二植物中或在任何其他代(诸如F2、F3等)或回交世代中选择突变型和/或野生型D14等位基因。
上述这些方法可以用于选择或检测或培育本文别处所述的任何突变型D14等位基因。
本文涵盖通过上述方法中的任一方法生产并且包含至少一个、任选两个拷贝的突变型D14等位基因的种子和/或植物。
序列描述
SEQ ID NO:1:包含插入的西瓜的突变型D14蛋白(ClD14ins)
SEQ ID NO:2:西瓜的野生型D14蛋白(ClD14)
SEQ ID NO:3:编码SEQ ID NO:1的突变型ClD14ins蛋白的cDNA
SEQ ID NO:4:编码SEQ ID NO:2的野生型D14蛋白的cDNA
SEQ ID NO:5:包含插入/重复的24个核苷酸的编码SEQ ID NO:1的突变型ClD14ins蛋白的基因组DNA
SEQ ID NO:6:编码野生型ClD14蛋白的基因组DNA,核苷酸375至463的内含子
SEQ ID NO:7:拟南芥D14蛋白
SEQ ID NO:8:黄瓜的野生型D14蛋白,CsD14蛋白
SEQ ID NO:9:甜瓜的野生型D14蛋白,CmD14蛋白
SEQ ID NO:10:标志物mWM23349015_k2的KASP测定的FAM引物
SEQ ID NO:11:标志物mWM23349015_k2的KASP测定的VIC引物
SEQ ID NO:12:标志物mWM23349015_k2的KASP测定的共同的反向引物
SEQ ID NO:13:用于设计KASP引物的ClD14野生型等位基因的负链
SEQ ID NO:14:用于设计KASP引物的ClD14ins突变型等位基因的负链(包含插入/重复的24个核苷酸)
SEQ ID NO:15:黄瓜野生型CsD14基因的基因组DNA
SEQ ID NO:16:甜瓜野生型CmD14基因的基因组DNA
SEQ ID NO:17:黄瓜野生型CsD14基因的cDNA
SEQ ID NO:18:甜瓜野生型CmD14基因的cDNA
提供以下非限制性实施例。
实施例
实施例1
对通过使多分枝品种Sidekick F1与专有的正常分枝西瓜植物杂交而开发的F2群体进行二级分枝(也称为‘多分枝’)的QTL作图。
通过计数从距冠90cm处的主茎开始到茎末端的二级枝的数量来进行表型分析。针对5-7株植物品系/基因型进行计数,并且计算平均二级分枝。
发现8号染色体上的基因在Sidekick F1中引起多分枝表型。该基因含有存在于正常分枝亲本中的24个核苷酸的重复,与野生型基因相比,其编码8个额外的氨基酸。该基因在本文中称为ClD14。仅当基因的突变型等位基因(包含24个核苷酸的重复)以纯合形式存在时才观察到多分枝表型。
被称为mWM23349015_k2的KASP标志物被开发用于区分SEQ ID NO:6所示的基因的野生型等位基因和SEQ ID NO:5所示的包含24个额外核苷酸(插入是野生型序列的24个核苷酸的重复)的基因的突变型等位基因。参见图4(内含子序列为粗体)。
分析F3群体的mWM23349015_k2和二级枝的平均数量,结果如下
因此,该基因的突变型等位基因(SEQ ID NO:5;ClD14ins,包含24个核苷酸的插入)负责将包含呈纯合形式的突变型等位基因的西瓜植物的平均分枝模式改变为形成45个或更多个二级枝。
使用两个正向引物和共同/反向引物进行KASP测定mWM23349015_k2:
SEQ ID NO:10(Fam引物,5'GAGACGGAGTGGCCGACC3')和
SEQ ID NO:11(VIC引物,5'GGAGACGGAGTGGCCGACA3')
SEQ ID NO:12(共同引物5'CACGTCCACCGCTGCGCCTT3')。
Fam和Vic引物还在5'端含有尾序列,如针对KASP测定所述。
注意到用于KASP测定的DNA序列是在反向DNA链(负链)上设计的,但同样可以基于等位基因的正链来设计。正链和负链是双链DNA的互补链。核苷酸G是互补链中的C,并且核苷酸A是互补链中的T。
用于KASP测定引物设计的DNA序列,mWM23349015_k2(FAM和VIC引物为灰色阴影)
根据KASP手册,来自LGC,Biosearch TechnologiesTM的KASPTM基因分型技术利用独特形式的竞争性等位基因特异性PCR(聚合酶链式反应),其使得能够跨宽范围的基因组DNA样品在特定基因座处高度准确地对SNP(单核苷酸多态性)和indel(插入/缺失)进行双等位基因评分。双等位基因鉴别是通过两个等位基因特异性正向引物的竞争性结合来实现的,每个引物具有对应于两个通用探针中的一个通用探针的独特尾序列;一个引物用FAMTM染料标记,并且另一引物用HEXTM染料标记。
除了如上所述的DNA模板(源于与Sidekick杂交的各种西瓜品系或群体的基因组DNA)和PCR引物之外,在如LGC,Biosearch TechnologiesTM,万维网biosearchtech.com/products/pcr-kit-and-reagents/genotyping-assay/kasp-genotyping-chemistry所述的测定中使用标准组分(例如,KASP测定混合物、KASP主混合物等)和测定方案。
等位基因鉴别图(图5)区分了针对ClD14ins等位基因纯合野生型、杂合和纯合的样品。注意到由于ClD14ins等位基因中重复序列/重复的存在,与野生型样品(ClD14/ClD14)相比,含有ClD14ins等位基因的样品(ClD14ins/ClD14或ClD14ins/ClD14ins)生成更多的信号,由此信号的分布偏离等位基因鉴别图中的经典分布,但基因型在不同的簇中被清楚地区分。图5中的左上簇是针对野生型等位基因纯合的植物的簇,右上簇是针对包含插入/重复的突变型等位基因纯合的植物的簇,并且中间簇是杂合植物的簇。
在图4中,显示了两个基因组序列(正链)的比对,其中SEQ ID NO:6是野生型基因组序列(缺少插入),并且SEQ ID NO:5是突变型ClD14序列,其包含24个核苷酸的插入,这又导致ClD14蛋白中8个氨基酸的插入(重复),也称为ClD14ins(参见图1和图3)。
因此,上述KASP测定可以用于检测SEQ ID NO:6的野生型ClD14等位基因(缺少24个核苷酸的插入/重复)或在基因组序列中包含24个核苷酸的插入(重复)的SEQ ID NO:5的突变型ClD14等位基因,即在SEQ ID NO:5中核苷酸280至核苷酸303被插入,参见图4,实际上是SEQ ID NO:6的野生型序列的核苷酸281至核苷酸304的重复(图4中以斜体显示)。
这种KASP测定或其他测定可以用于检测SEQ ID NO:6的ClD14基因的野生型等位基因,和/或包含相对于野生型等位基因插入、缺失或置换一个或多个核苷酸的ClD14基因的突变型等位基因,诸如例如SEQ ID NO:5的突变型等位基因。
进行针对Uniprot/Swiss-prot的ClD14蛋白的BLAST分析以鉴定其他物种中ClD14基因的直向同源物,并且鉴定了两个直向同源物,即编码SEQ ID NO:8的蛋白质的黄瓜CsD14基因和编码SEQ ID NO:9的蛋白质的甜瓜CmD14基因。
实施例2
筛选西瓜TILLING群体,并且在ClD14基因中发现若干突变体,从而导致氨基酸取代或终止密码子。突变体列于下表2中,并且也示于图6中。
表2
当突变呈纯合形式(W155*/W155*)时,W155终止突变体具有多分枝表型。表型看起来像包含8个氨基酸的重复的原始突变体(ClD14ins/ClD14ins)的表型。在距冠40cm处确定二级枝的平均数量并示于下表3中。
表3
由于表型是相同的并且由于W155*蛋白必须是非功能性的(它是截短的并且缺乏C-末端的113个氨基酸),可以令人惊讶地得出结论,ClD14ins突变型等位基因也必须编码非功能性蛋白,其不传递抑制二级分枝的信号。因此,得出以下结论:导致非功能性ClD14蛋白的ClD14基因的敲除或突变体不再传递任何信号,并且因此不再抑制二级分枝。这也可以称为“完全多分枝”或“强多分枝”。
现在,还清楚地是可以生成其他突变体,由此多分枝表型较不强,二级分枝的一些抑制仍然是积极的,使得多分枝表型在正常的野生型分枝与在ClD14ins/ClD14ins和W155*/W155*植物中观察到的强多分枝表型之间,这导致相对于野生型植物约240%的二级枝的平均数量。
由于该蛋白质是高度保守的,几乎整个蛋白质是保守结构域(IPR00073,参见www.ebi.ac.uk/interpro/entry/InterPro/IPR000073/),所以可以例如在IPR00073结构域中生成单个氨基酸取代、缺失和/或插入,这仍然使得一些独脚金内酯与蛋白质口袋结合并且使得一些独脚金内酯信号传导途径的信号传递。例如,上表2中的TILLING突变体中的任一突变体可以呈纯合形式,产生功能降低的ClD14蛋白和‘中等多分枝’,例如相对于野生型植物至少约110%、120%、130%、140%、150%、160%、170%、180%、190%的二级枝,但不是如在ClD14蛋白已经丧失其功能并且不再抑制二级分枝的植物中观察到的“完全多分枝”。
此类更“中度多分枝”或“中等多分枝”是期望的,因为在强多分枝植物中,叶子下的湿度变高并且诸如真菌的病害容易发展。
因此,除已经存在的ClD14ins突变体(包含8个氨基酸重复,如SEQ ID NO:1所示)之外,本文还涵盖ClD14基因中的任何新诱导的突变体(以及包含呈杂合或纯合形式的这些突变体的植物),尤其是导致比ClD14ins突变体或W155*突变体更少的强多分枝(‘中等多分枝’)的突变体。
然而,除了已经存在的ClD14ins突变体(包含8个氨基酸重复,如SEQ ID NO:1所示)之外,本文还涵盖产生非功能性ClD14蛋白的任何敲除突变体或突变型等位基因,以及包含呈杂合或纯合形式的此类突变体的植物。
实施例3-靶向诱变
使用工程化核酸酶的靶标特异性基因组编辑在各种领域中已经变得广泛。在西瓜中,Crispr已经成功地用于修饰靶基因,参见例如Wang,Y.,Wang,J.,Guo,S.等人CRISPR/Cas9-mediated mutagenesis of ClBG1decreased seed size and promoted seedgermination in watermelon.Hortic Res,第8卷第70期(2021年)https://doi.org/10.1038/s41438-021-00506-1,该方法和载体也可以用于生成D14基因中的突变。
可以通过同源重组(HR)进行一个或多个核苷酸的单碱基取代或缺失。
可以使用二元CRISPR/Cas9载体,例如如Wang等人(同上)所述。根据CRISPR-P(http://cbi.hzau.edu.cn/crispr/)的评估,可以选择靶向D14的特异性单向导RNA(sgRNA)。将靶序列克隆到载体中,然后将其用于转化西瓜栽培品种。
西瓜外植体可以根据Yu等人(2011年,Plant Cell Rep,第30卷第359-371页)的修饰方法转化。简言之,将表面灭菌的西瓜种子播种在补充有3%Suc的基本Murashige和Skoog固体培养基上3天。然后将没有胚的子叶切成2×2mm的片。含有该载体的冠状土壤杆菌(Agrobacterium tumefaciens)菌株EHA105可以用于转化。将子叶外植体在黑暗中共栽培4天,并且然后转移到含有1.5mg/L 6BA、2mg/L Basta的选择性诱导培养基上。将再生的不定芽切除并转移到含有0.1mg/L 6BA、0.01mg/L NAA、2mg/L Basta的选择性延伸培养基上。
质粒载体含有表达CAS9和两个向导RNA(gRNA)的盒以及作为同源定向修复(HDR)模板的供体片段。Cas9基因和gRNA的表达由强启动子驱动,诸如泛素启动子。gRNA被设计在两个靶向位点的相反链上。
供体片段在对应于靶D14基因(突变除外)的序列的片段的中间含有期望的突变。任选地,一旦成功实现HDR,不改变供体片段中氨基酸残基的其它同义突变就将防止Cas9再次切割供体片段。该片段的侧面分别为包括PAM基序在内的两个gRNA靶序列,使得供体DNA可以被Cas9/gRNA从质粒载体中释放;参见例如Sun等人,(2016年)Molecular Plant,第9卷,第628-631页,DOI:10.1016/j.molp.2016.01.001。
为了增加HDR,可以在外植体中共引入额外的游离DNA供体片段。转化后,使基于例如质粒载体编码的抗生素抗性而选择的再生芽生长并分析突变的存在。这可以通过引物进行以由PCR扩增来自DNA的靶基因序列。设计引物使得它们不能扩增来自质粒的片段。扩增产物可以被测序以验证突变的存在。
可以使用标准方法从包含所需突变的转化植物材料再生植物。
例如,如Wang等人(同上)所述,基因组DNA可以从T0-T4转基因植物的幼叶中提取,然后将其用于创建模板以使用侧面为两个靶位点的引物来扩增靶基因中的特定片段。PCR可以在以下条件下进行:94℃/5分钟;94℃/30秒、56℃/30秒和72℃/1分钟(35个循环);以及作为最终延伸的72℃/10分钟。可以使用标准方法直接对PCR产物进行测序。
转基因植物也可以用对Cas9具有特异性的引物验证为不含Cas9。PCR可以在以下条件下进行:94℃/5分钟;94℃/30秒、60℃/30秒和72℃/1分钟(29个循环);以及作为最终延伸的72℃/10分钟。
序列表
<110> Nunhems B.V.
<120> 用于选择包含修饰的DWARF14基因的西瓜植物和植物部分
的方法
<130> 210534WO01
<150> US63217071
<151> 2021-06-30
<150> EP21194565.4
<151> 2021-09-02
<160> 18
<170> PatentIn 3.5版
<210> 1
<211> 275
<212> PRT
<213> 西瓜
<400> 1
Met Val Asn Asn Ala Leu Leu Glu Ala Leu Asn Val Arg Val Leu Gly
1 5 10 15
Thr Gly Asp Arg Ser Leu Val Leu Ala His Gly Phe Gly Thr Asp Gln
20 25 30
Ser Ala Trp Gln Leu Ile Tyr Pro Ser Phe Thr Pro Tyr Tyr Arg Val
35 40 45
Ile Leu Tyr Asp Leu Val Cys Ala Gly Ser Val Asn Pro Asp Phe Phe
50 55 60
Asp Phe Ser Arg Tyr Thr Thr Leu Asp Ala Phe Val Asp Asp Leu Ile
65 70 75 80
Ser Ile Leu Asp Ser Leu His Val His Arg Cys Ala Phe Val Gly His
85 90 95
Ser Val Ser Ala Met Val Gly His Ser Val Ser Ala Met Val Gly Ile
100 105 110
Leu Ala Ser Ile Arg Arg Pro Glu Leu Phe Ser Lys Leu Ile Leu Ile
115 120 125
Gly Ala Ser Pro Arg Phe Leu Asn Asp Gly Asp Tyr His Gly Gly Phe
130 135 140
Glu Gln Ser Glu Ile Asp Arg Val Phe Ala Ala Met Lys Ala Asn Tyr
145 150 155 160
Gln Ser Trp Val Asn Gly Phe Ala Pro Leu Ala Val Gly Ala Asp Val
165 170 175
Pro Ala Ala Val Gln Glu Phe Ser Arg Thr Leu Phe Asn Met Arg Pro
180 185 190
Asp Ile Ser Leu Phe Val Ser Lys Val Ile Phe Ser Ser Asp Leu Arg
195 200 205
Gly Val Leu Gly Leu Val Lys Val Pro Cys Cys Ile Ile Gln Thr Ala
210 215 220
Gln Asp Val Ser Val Pro Ala Ser Val Ala Ile Tyr Leu Arg Asp His
225 230 235 240
Leu Gly Gly Arg Asn Thr Val Glu Met Leu Asp Thr Glu Gly His Leu
245 250 255
Pro His Leu Ser Ala Pro Gln Leu Leu Val Arg Lys Leu Arg Arg Ala
260 265 270
Leu Ser Arg
275
<210> 2
<211> 267
<212> PRT
<213> 西瓜
<400> 2
Met Val Asn Asn Ala Leu Leu Glu Ala Leu Asn Val Arg Val Leu Gly
1 5 10 15
Thr Gly Asp Arg Ser Leu Val Leu Ala His Gly Phe Gly Thr Asp Gln
20 25 30
Ser Ala Trp Gln Leu Ile Tyr Pro Ser Phe Thr Pro Tyr Tyr Arg Val
35 40 45
Ile Leu Tyr Asp Leu Val Cys Ala Gly Ser Val Asn Pro Asp Phe Phe
50 55 60
Asp Phe Ser Arg Tyr Thr Thr Leu Asp Ala Phe Val Asp Asp Leu Ile
65 70 75 80
Ser Ile Leu Asp Ser Leu His Val His Arg Cys Ala Phe Val Gly His
85 90 95
Ser Val Ser Ala Met Val Gly Ile Leu Ala Ser Ile Arg Arg Pro Glu
100 105 110
Leu Phe Ser Lys Leu Ile Leu Ile Gly Ala Ser Pro Arg Phe Leu Asn
115 120 125
Asp Gly Asp Tyr His Gly Gly Phe Glu Gln Ser Glu Ile Asp Arg Val
130 135 140
Phe Ala Ala Met Lys Ala Asn Tyr Gln Ser Trp Val Asn Gly Phe Ala
145 150 155 160
Pro Leu Ala Val Gly Ala Asp Val Pro Ala Ala Val Gln Glu Phe Ser
165 170 175
Arg Thr Leu Phe Asn Met Arg Pro Asp Ile Ser Leu Phe Val Ser Lys
180 185 190
Val Ile Phe Ser Ser Asp Leu Arg Gly Val Leu Gly Leu Val Lys Val
195 200 205
Pro Cys Cys Ile Ile Gln Thr Ala Gln Asp Val Ser Val Pro Ala Ser
210 215 220
Val Ala Ile Tyr Leu Arg Asp His Leu Gly Gly Arg Asn Thr Val Glu
225 230 235 240
Met Leu Asp Thr Glu Gly His Leu Pro His Leu Ser Ala Pro Gln Leu
245 250 255
Leu Val Arg Lys Leu Arg Arg Ala Leu Ser Arg
260 265
<210> 3
<211> 828
<212> DNA
<213> 西瓜
<400> 3
atggttaaca acgcccttct tgaagccctt aatgtccgtg tcctcggcac cggcgaccgt 60
tctctggtcc tggcccatgg cttcggcacc gaccagtccg cttggcaact catttaccct 120
tcctttactc cttactaccg cgtcatcctt tacgaccttg tctgcgccgg tagcgtcaac 180
cccgacttct tcgatttctc ccgctacacc actctcgacg ccttcgtcga cgatctcatc 240
tccatcctag actctctcca cgtccaccgc tgcgcctttg tcggccactc cgtctccgcc 300
atggtcggcc actccgtctc cgccatggtc ggcatcctcg cctccatccg ccgtcccgaa 360
ctcttctcta agctcatctt aatcggcgcc tccccaaggt tcctcaacga cggcgactac 420
cacggtgggt tcgaacagag cgagattgac agggtcttcg ctgcaatgaa ggctaattac 480
caatcctggg tcaacggctt tgcccctctt gctgtcggtg ccgatgttcc cgctgccgtt 540
caggaattca gccggactct cttcaatatg agacccgaca tttccctctt cgtctctaag 600
gtcatcttca gcagcgatct ccggggagtc ctcggtctcg tcaaagtccc ctgttgcata 660
attcaaaccg cccaagacgt ctctgttccg gcctccgtcg ctatctacct ccgagaccac 720
ctcggcggcc ggaacaccgt ggagatgctc gacaccgaag gccacctacc ccatctgagt 780
gcccctcagc tactcgtacg gaaactccgc cgtgctcttt cccggtga 828
<210> 4
<211> 804
<212> DNA
<213> 西瓜
<400> 4
atggttaaca acgcccttct tgaagccctt aatgtccgtg tcctcggcac cggcgaccgt 60
tctctggtcc tggcccatgg cttcggcacc gaccagtccg cttggcaact catttaccct 120
tcctttactc cttactaccg cgtcatcctt tacgaccttg tctgcgccgg tagcgtcaac 180
cccgacttct tcgatttctc ccgctacacc actctcgacg ccttcgtcga cgatctcatc 240
tccatcctag actctctcca cgtccaccgc tgcgcctttg tcggccactc cgtctccgcc 300
atggtcggca tcctcgcctc catccgccgt cccgaactct tctctaagct catcttaatc 360
ggcgcctccc caaggttcct caacgacggc gactaccacg gtgggttcga acagagcgag 420
attgacaggg tcttcgctgc aatgaaggct aattaccaat cctgggtcaa cggctttgcc 480
cctcttgctg tcggtgccga tgttcccgct gccgttcagg aattcagccg gactctcttc 540
aatatgagac ccgacatttc cctcttcgtc tctaaggtca tcttcagcag cgatctccgg 600
ggagtcctcg gtctcgtcaa agtcccctgt tgcataattc aaaccgccca agacgtctct 660
gttccggcct ccgtcgctat ctacctccga gaccacctcg gcggccggaa caccgtggag 720
atgctcgaca ccgaaggcca cctaccccat ctgagtgccc ctcagctact cgtacggaaa 780
ctccgccgtg ctctttcccg gtga 804
<210> 5
<211> 917
<212> DNA
<213> 西瓜
<400> 5
atggttaaca acgcccttct tgaagccctt aatgtccgtg tcctcggcac cggcgaccgt 60
tctctggtcc tggcccatgg cttcggcacc gaccagtccg cttggcaact catttaccct 120
tcctttactc cttactaccg cgtcatcctt tacgaccttg tctgcgccgg tagcgtcaac 180
cccgacttct tcgatttctc ccgctacacc actctcgacg ccttcgtcga cgatctcatc 240
tccatcctag actctctcca cgtccaccgc tgcgcctttg tcggccactc cgtctccgcc 300
atggtcggcc actccgtctc cgccatggtc ggcatcctcg cctccatccg ccgtcccgaa 360
ctcttctcta agctcatctt aatcggcgcc tccccaaggt cctttccact tccacactct 420
gtttttctaa ctactctgtt tttttcccct gtttttataa aattcttttt atttttattt 480
ttttcaggtt cctcaacgac ggcgactacc acggtgggtt cgaacagagc gagattgaca 540
gggtcttcgc tgcaatgaag gctaattacc aatcctgggt caacggcttt gcccctcttg 600
ctgtcggtgc cgatgttccc gctgccgttc aggaattcag ccggactctc ttcaatatga 660
gacccgacat ttccctcttc gtctctaagg tcatcttcag cagcgatctc cggggagtcc 720
tcggtctcgt caaagtcccc tgttgcataa ttcaaaccgc ccaagacgtc tctgttccgg 780
cctccgtcgc tatctacctc cgagaccacc tcggcggccg gaacaccgtg gagatgctcg 840
acaccgaagg ccacctaccc catctgagtg cccctcagct actcgtacgg aaactccgcc 900
gtgctctttc ccggtga 917
<210> 6
<211> 893
<212> DNA
<213> 西瓜
<400> 6
atggttaaca acgcccttct tgaagccctt aatgtccgtg tcctcggcac cggcgaccgt 60
tctctggtcc tggcccatgg cttcggcacc gaccagtccg cttggcaact catttaccct 120
tcctttactc cttactaccg cgtcatcctt tacgaccttg tctgcgccgg tagcgtcaac 180
cccgacttct tcgatttctc ccgctacacc actctcgacg ccttcgtcga cgatctcatc 240
tccatcctag actctctcca cgtccaccgc tgcgcctttg tcggccactc cgtctccgcc 300
atggtcggca tcctcgcctc catccgccgt cccgaactct tctctaagct catcttaatc 360
ggcgcctccc caaggtcctt tccacttcca cactctgttt ttctaactac tctgtttttt 420
tcccctgttt ttataaaatt ctttttattt ttattttttt caggttcctc aacgacggcg 480
actaccacgg tgggttcgaa cagagcgaga ttgacagggt cttcgctgca atgaaggcta 540
attaccaatc ctgggtcaac ggctttgccc ctcttgctgt cggtgccgat gttcccgctg 600
ccgttcagga attcagccgg actctcttca atatgagacc cgacatttcc ctcttcgtct 660
ctaaggtcat cttcagcagc gatctccggg gagtcctcgg tctcgtcaaa gtcccctgtt 720
gcataattca aaccgcccaa gacgtctctg ttccggcctc cgtcgctatc tacctccgag 780
accacctcgg cggccggaac accgtggaga tgctcgacac cgaaggccac ctaccccatc 840
tgagtgcccc tcagctactc gtacggaaac tccgccgtgc tctttcccgg tga 893
<210> 7
<211> 267
<212> PRT
<213> 拟南芥
<400> 7
Met Ser Gln His Asn Ile Leu Glu Ala Leu Asn Val Arg Val Val Gly
1 5 10 15
Thr Gly Asp Arg Ile Leu Phe Leu Ala His Gly Phe Gly Thr Asp Gln
20 25 30
Ser Ala Trp His Leu Ile Leu Pro Tyr Phe Thr Gln Asn Tyr Arg Val
35 40 45
Val Leu Tyr Asp Leu Val Cys Ala Gly Ser Val Asn Pro Asp Tyr Phe
50 55 60
Asp Phe Asn Arg Tyr Thr Thr Leu Asp Pro Tyr Val Asp Asp Leu Leu
65 70 75 80
Asn Ile Val Asp Ser Leu Gly Ile Gln Asn Cys Ala Tyr Val Gly His
85 90 95
Ser Val Ser Ala Met Ile Gly Ile Ile Ala Ser Ile Arg Arg Pro Glu
100 105 110
Leu Phe Ser Lys Leu Ile Leu Ile Gly Phe Ser Pro Arg Phe Leu Asn
115 120 125
Asp Glu Asp Tyr His Gly Gly Phe Glu Glu Gly Glu Ile Glu Lys Val
130 135 140
Phe Ser Ala Met Glu Ala Asn Tyr Glu Ala Trp Val His Gly Phe Ala
145 150 155 160
Pro Leu Ala Val Gly Ala Asp Val Pro Ala Ala Val Arg Glu Phe Ser
165 170 175
Arg Thr Leu Phe Asn Met Arg Pro Asp Ile Ser Leu Phe Val Ser Arg
180 185 190
Thr Val Phe Asn Ser Asp Leu Arg Gly Val Leu Gly Leu Val Arg Val
195 200 205
Pro Thr Cys Val Ile Gln Thr Ala Lys Asp Val Ser Val Pro Ala Ser
210 215 220
Val Ala Glu Tyr Leu Arg Ser His Leu Gly Gly Asp Thr Thr Val Glu
225 230 235 240
Thr Leu Lys Thr Glu Gly His Leu Pro Gln Leu Ser Ala Pro Ala Gln
245 250 255
Leu Ala Gln Phe Leu Arg Arg Ala Leu Pro Arg
260 265
<210> 8
<211> 267
<212> PRT
<213> 黄瓜
<400> 8
Met Val Asn Asn Ala Leu Leu Glu Ala Leu Asn Val Arg Val Leu Gly
1 5 10 15
Thr Gly Asp Arg Phe Leu Val Leu Ala His Gly Phe Gly Thr Asp Gln
20 25 30
Ser Ala Trp Gln Leu Val Tyr Pro Ser Phe Thr Pro Tyr Tyr Arg Val
35 40 45
Ile Leu Tyr Asp Leu Val Cys Ala Gly Ser Val Asn Pro Asp Phe Phe
50 55 60
Asp Phe Ser Arg Tyr Thr Thr Leu Asp Ala Phe Val Asp Asp Leu Ile
65 70 75 80
Ser Ile Leu Asp Ser Leu His Val His Arg Cys Ala Phe Val Gly His
85 90 95
Ser Val Ser Ala Met Val Gly Ile Leu Ala Ser Ile Arg Arg Pro Glu
100 105 110
Leu Phe Ser Lys Leu Ile Leu Ile Gly Ala Ser Pro Arg Phe Leu Asn
115 120 125
Asp Gly Asp Tyr His Gly Gly Phe Glu Gln Asn Glu Ile Asp Arg Val
130 135 140
Phe Ala Ala Met Lys Ala Asn Tyr Gln Ser Trp Val Asn Gly Phe Ala
145 150 155 160
Pro Leu Ala Val Gly Ala Asp Val Pro Ala Ala Val Gln Glu Phe Ser
165 170 175
Arg Thr Leu Phe Asn Met Arg Pro Asp Ile Ser Leu Phe Val Ser Lys
180 185 190
Val Ile Phe Ser Ser Asp Leu Arg Gly Val Leu Gly Leu Val Lys Val
195 200 205
Pro Cys Cys Ile Ile Gln Thr Ala Gln Asp Val Ser Val Pro Thr Ser
210 215 220
Val Ala Ile Tyr Leu Arg Asp His Leu Gly Gly Arg Asn Thr Ile Glu
225 230 235 240
Met Leu Asp Thr Glu Gly His Leu Pro His Leu Ser Ala Pro Gln Leu
245 250 255
Leu Val Arg Lys Leu Arg Arg Ala Leu Ser Arg
260 265
<210> 9
<211> 267
<212> PRT
<213> 甜瓜
<400> 9
Met Val Asn Asn Ala Leu Leu Glu Ala Leu Asn Val Arg Val Leu Gly
1 5 10 15
Thr Gly Asp Arg Phe Leu Val Leu Ala His Gly Phe Gly Thr Asp Gln
20 25 30
Ser Ala Trp Gln Leu Val Tyr Pro Ser Phe Thr Pro Tyr Tyr Arg Val
35 40 45
Ile Leu Tyr Asp Leu Val Cys Ala Gly Ser Val Asn Pro Asp Phe Phe
50 55 60
Asp Phe Ser Arg Tyr Thr Thr Leu Asp Ala Phe Val Asp Asp Leu Ile
65 70 75 80
Ser Ile Leu Asp Ser Leu His Val His Arg Cys Ala Phe Val Gly His
85 90 95
Ser Val Ser Ala Met Val Gly Ile Leu Ala Ser Ile Arg Arg Pro Glu
100 105 110
Leu Phe Ser Lys Leu Ile Leu Ile Gly Ala Ser Pro Arg Phe Leu Asn
115 120 125
Asp Gly Asp Tyr His Gly Gly Phe Glu Gln Ser Glu Ile Asp Arg Val
130 135 140
Phe Ala Ala Met Lys Ala Asn Tyr Gln Ser Trp Val Asn Gly Phe Ala
145 150 155 160
Pro Leu Ala Val Gly Ala Asp Val Pro Ala Ala Val Gln Glu Phe Ser
165 170 175
Arg Thr Leu Phe Asn Met Arg Pro Asp Ile Ser Leu Phe Val Ser Lys
180 185 190
Val Ile Phe Ser Ser Asp Leu Arg Gly Val Leu Gly Leu Val Lys Val
195 200 205
Pro Cys Cys Ile Ile Gln Thr Ala Gln Asp Val Ser Val Pro Thr Ser
210 215 220
Val Ala Ile Tyr Leu Arg Asp His Leu Gly Gly Arg Asn Thr Ile Glu
225 230 235 240
Met Leu Asp Thr Glu Gly His Leu Pro His Leu Ser Ala Pro Gln Leu
245 250 255
Leu Val Arg Lys Leu Arg Arg Ala Leu Ser Arg
260 265
<210> 10
<211> 18
<212> DNA
<213> 人工
<220>
<223> Fam引物
<400> 10
gagacggagt ggccgacc 18
<210> 11
<211> 19
<212> DNA
<213> 人工
<220>
<223> Vic引物
<400> 11
ggagacggag tggccgaca 19
<210> 12
<211> 20
<212> DNA
<213> 人工
<220>
<223> 共同的引物
<400> 12
cacgtccacc gctgcgcctt 20
<210> 13
<211> 121
<212> DNA
<213> 人工
<220>
<223> 具有缺失的用于KASP测定的DNA序列
<400> 13
gagttcggga cggcggatgg aggcgaggat gccgaccatg gcggagacgg agtggccgac 60
aaaggcgcag cggtggacgt ggagagagtc kaggatggag atgagatcgt cracgaaggc 120
g 121
<210> 14
<211> 145
<212> DNA
<213> 人工
<220>
<223> 具有插入的用于KASP测定的DNA序列
<400> 14
gagttcggga cggcggatgg aggcgaggat gccgaccatg gcggagacgg agtggccgac 60
catggcggag acggagtggc cgacaaaggc gcagcggtgg acgtggagag agtckaggat 120
ggagatgaga tcgtcracga aggcg 145
<210> 15
<211> 885
<212> DNA
<213> 黄瓜
<400> 15
atggttaaca acgcccttct tgaagccctt aatgtccgcg tccttggcac cggcgatcgc 60
ttcctcgtct tagcccatgg cttcggcacc gaccaatccg cttggcaact cgtttaccct 120
tccttcactc cctactaccg tgtcatactc tacgaccttg tctgcgccgg cagcgtcaac 180
cccgacttct tcgatttctc ccgttacacc actctcgacg ccttcgtcga cgacctcatc 240
tccatcctcg actccctcca cgtccaccgc tgcgccttcg tcggccactc cgtctccgcc 300
atggtcggca tcctcgcctc catccgccgt cccgaactct tctccaaact catcttaatc 360
ggcgcatccc caaggtcgtc ctttttcatt tctaccctct actactctgt gtttccccct 420
gttttcttct aaaattctct tctcatttct tttaggtttc tcaacgacgg cgactaccat 480
ggtgggttcg aacagaatga gatagacagg gttttcgctg caatgaaggc taattaccaa 540
tcttgggtca acgggtttgc ccctctcgct gtcggtgccg atgttcccgc tgccgtacag 600
gaattcagcc gaactctctt caatatgaga cccgacattt ccctctttgt ttctaaggtt 660
atcttcagca gcgatctccg gggagtgctc ggtctcgtca aagtcccctg ctgtataatt 720
caaaccgccc aagacgtgtc tgttccgacc tctgtcgcca tctacctgag agaccacctc 780
gggggccgga acaccattga gatgctggac acggaagggc acctacccca tctgagtgcc 840
cctcagcttc tcgttcggaa acttcgccgt gctctttctc ggtga 885
<210> 16
<211> 880
<212> DNA
<213> 甜瓜
<400> 16
atggttaaca acgcccttct tgaagccctt aatgtccgtg tccttggcac cggcgaccgc 60
ttcctcgtct tagcccatgg cttcggcacc gaccaatccg cttggcaact cgtttaccct 120
tccttcactc cttactaccg tgtcatactc tacgaccttg tctgcgccgg cagcgtcaac 180
cccgacttct tcgatttctc tcgttacacc actctcgacg ccttcgtcga cgacctcatc 240
tccatcctcg actccctcca cgtccaccgc tgcgccttcg tcggccactc cgtctccgcc 300
atggtcggca tccttgcctc catccgccgc cccgaactct tctccaaact catcttaatc 360
ggcgcatccc caaggtgctt tccgtttcta ccctattcta ctctgttttc cccctgtttt 420
cttctaaaat tctcttctca tttcttttag gtttctcaac gacggcgact accatggtgg 480
gttcgaacag agtgagattg acagggtttt cgctgcaatg aaagctaatt accaatcttg 540
ggtcaacggc tttgcccctc tcgctgtcgg tgccgatgtt cccgctgccg tacaggaatt 600
cagccggact ctcttcaata tgagacccga catttccctc tttgtttcta aagttatctt 660
cagcagcgat ctccggggag tcctcggtct cgtcaaagtc ccctgttgta taattcaaac 720
cgcccaagac gtctctgttc cgacctccgt cgccatctac ctcagagatc acctcggcgg 780
ccggaacacc attgagatgc tcgacaccga aggccaccta cctcatctca gtgcccctca 840
gctactcgtg cggaaactcc gccgtgctct ttctcggtga 880
<210> 17
<211> 804
<212> DNA
<213> 黄瓜
<400> 17
atggttaaca acgcccttct tgaagccctt aatgtccgcg tccttggcac cggcgatcgc 60
ttcctcgtct tagcccatgg cttcggcacc gaccaatccg cttggcaact cgtttaccct 120
tccttcactc cctactaccg tgtcatactc tacgaccttg tctgcgccgg cagcgtcaac 180
cccgacttct tcgatttctc ccgttacacc actctcgacg ccttcgtcga cgacctcatc 240
tccatcctcg actccctcca cgtccaccgc tgcgccttcg tcggccactc cgtctccgcc 300
atggtcggca tcctcgcctc catccgccgt cccgaactct tctccaaact catcttaatc 360
ggcgcatccc caaggtttct caacgacggc gactaccatg gtgggttcga acagaatgag 420
atagacaggg ttttcgctgc aatgaaggct aattaccaat cttgggtcaa cgggtttgcc 480
cctctcgctg tcggtgccga tgttcccgct gccgtacagg aattcagccg aactctcttc 540
aatatgagac ccgacatttc cctctttgtt tctaaggtta tcttcagcag cgatctccgg 600
ggagtgctcg gtctcgtcaa agtcccctgc tgtataattc aaaccgccca agacgtgtct 660
gttccgacct ctgtcgccat ctacctgaga gaccacctcg ggggccggaa caccattgag 720
atgctggaca cggaagggca cctaccccat ctgagtgccc ctcagcttct cgttcggaaa 780
cttcgccgtg ctctttctcg gtga 804
<210> 18
<211> 804
<212> DNA
<213> 甜瓜
<400> 18
atggttaaca acgcccttct tgaagccctt aatgtccgtg tccttggcac cggcgaccgc 60
ttcctcgtct tagcccatgg cttcggcacc gaccaatccg cttggcaact cgtttaccct 120
tccttcactc cttactaccg tgtcatactc tacgaccttg tctgcgccgg cagcgtcaac 180
cccgacttct tcgatttctc tcgttacacc actctcgacg ccttcgtcga cgacctcatc 240
tccatcctcg actccctcca cgtccaccgc tgcgccttcg tcggccactc cgtctccgcc 300
atggtcggca tccttgcctc catccgccgc cccgaactct tctccaaact catcttaatc 360
ggcgcatccc caaggtttct caacgacggc gactaccatg gtgggttcga acagagtgag 420
attgacaggg ttttcgctgc aatgaaagct aattaccaat cttgggtcaa cggctttgcc 480
cctctcgctg tcggtgccga tgttcccgct gccgtacagg aattcagccg gactctcttc 540
aatatgagac ccgacatttc cctctttgtt tctaaagtta tcttcagcag cgatctccgg 600
ggagtcctcg gtctcgtcaa agtcccctgt tgtataattc aaaccgccca agacgtctct 660
gttccgacct ccgtcgccat ctacctcaga gatcacctcg gcggccggaa caccattgag 720
atgctcgaca ccgaaggcca cctacctcat ctcagtgccc ctcagctact cgtgcggaaa 780
ctccgccgtg ctctttctcg gtga 804

Claims (10)

1.一种包含命名为ClD14(西瓜Dwarf14)的基因的突变型等位基因的西瓜植物,其中所述突变型等位基因包含在一个或多个调节序列中的突变,从而导致与相应的野生型等位基因相比减少的基因表达或无基因表达,或者其中所述突变型等位基因编码包含与由所述野生型等位基因编码的蛋白质相比一个或多个氨基酸的缺失、截短、插入或置换的蛋白质,从而导致ClD14蛋白的功能降低或功能丧失,其中当所述突变型等位基因呈纯合形式时,所述突变型等位基因导致所述植物发展增加的二级枝的平均数量,并且其中所述突变型等位基因不是编码SEQ ID NO:1的蛋白质的突变型等位基因,
其中所述野生型等位基因的ClD14蛋白由选自由以下组成的组的核酸分子编码:
a)核酸分子,其编码具有SEQ ID NO:2给出的氨基酸序列的蛋白质
b)核酸分子,其包含SEQ ID NO:6显示的核苷酸序列或其互补序列。
2.根据权利要求1所述的西瓜植物,其中所述突变型等位基因编码其中插入、置换或缺失一个或多个氨基酸的蛋白质,从而导致所述蛋白质的功能降低,但不导致所述蛋白质的功能丧失,由此二级枝的平均数量高于针对所述野生型ClD14等位基因纯合的植物中的二级枝的平均数量,但不如针对编码非功能性蛋白质的突变型ClD14等位基因纯合的植物中的二级枝的平均数量高。
3.根据权利要求1或2所述的西瓜植物,其中所述植物针对所述突变型等位基因是纯合的,并且发展与针对所述野生型等位基因纯合的所述植物相比增加的二级枝的平均数量。
4.一种种子,根据权利要求1至3中任一项所述的植物可以从所述种子生长。
5.一种用于检测以及任选地选择西瓜植物、种子或植物部分的方法,所述西瓜植物、种子或植物部分包含至少一个拷贝的命名为ClD14(西瓜Dwarf14)的基因的突变型等位基因,所述方法包括以下步骤:
a)提供一种或多种西瓜植物、种子或植物部分的一种或多种基因组DNA样品,
b)使用a)的所述DNA样品作为模板进行区分所述野生型ClD14等位基因和所述突变型ClD14等位基因的基因分型测定,其中所述基因分型测定基于利用ClD14等位基因特异性寡核苷酸引物的核酸扩增,并且/或者其中所述基因分型测定基于利用ClD14等位基因特异性寡核苷酸探针的核酸杂交,以及任选地
c)选择包含一个或两个拷贝的所述突变型等位基因的植物、种子或植物部分,
其中所述突变型ClD14等位基因包含相对于SEQ ID NO:6的序列插入、重复、缺失或置换的一个或多个核苷酸,从而产生包含相对于SEQ ID NO:2的序列插入、重复、缺失或置换一个或多个氨基酸的突变型ClD14蛋白。
6.根据权利要求5所述的方法,其中所述ClD14等位基因特异性寡核苷酸引物或所述ClD14等位基因特异性寡核苷酸探针包含SEQ ID NO:6或SEQ ID NO:6的互补链的至少10个核苷酸。
7.根据权利要求5或6所述的方法,其中所述突变型等位基因包含在所述等位基因的编码区中插入或重复的至少一个密码子,或者改变为另一个密码子的至少一个密码子,或者缺失或改变为终止密码子的至少一个密码子。
8.根据前述权利要求中任一项所述的方法,其中所述突变型等位基因包含SEQ ID NO:5的序列。
9.根据权利要求5至8中任一项所述的方法,其中所述寡核苷酸引物或寡核苷酸探针包含与SEQ ID NO:6或与SEQ ID NO:6的互补序列互补的至少15个核苷酸。
10.根据权利要求5至9中任一项所述的方法,其中所述基因分型测定是KASP测定,所述KASP测定包括检测所述DNA样品中SEQ ID NO:6的野生型等位基因的第一正向引物,检测所述DNA样品中包含相对于SEQ ID NO:6插入、缺失或置换的一个或多个核苷酸的所述突变型等位基因的第二正向引物,以及一个共同的反向引物。
CN202280046305.9A 2021-06-30 2022-06-28 用于选择包含修饰的dwarf14基因的西瓜植物和植物部分的方法 Pending CN117677286A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202163217071P 2021-06-30 2021-06-30
US63/217,071 2021-06-30
EP21194565.4 2021-09-02
PCT/EP2022/067731 WO2023275048A1 (en) 2021-06-30 2022-06-28 Methods for selecting watermelon plants and plant parts comprising a modified dwarf14 gene

Publications (1)

Publication Number Publication Date
CN117677286A true CN117677286A (zh) 2024-03-08

Family

ID=90077308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280046305.9A Pending CN117677286A (zh) 2021-06-30 2022-06-28 用于选择包含修饰的dwarf14基因的西瓜植物和植物部分的方法

Country Status (1)

Country Link
CN (1) CN117677286A (zh)

Similar Documents

Publication Publication Date Title
AU2017336342B2 (en) Parthenocarpic watermelon plants
KR20230098337A (ko) 단위결과성 수박 식물
US20230371453A1 (en) Parthenocarpic watermelon plants
CN113365494B (zh) 能够发生种子败育型的果实形成的茄子科植物
CN117677286A (zh) 用于选择包含修饰的dwarf14基因的西瓜植物和植物部分的方法
CN112654234A (zh) Aco2基因的突变等位基因
KR20240029040A (ko) 변형된 dwarf14 유전자를 포함하는 수박 식물 및 식물 부분을 선택하는 방법
US20240164270A1 (en) Watermelon gene conferring a high number of male flowers
US20230404007A1 (en) Parthenocarpic watermelon plants
US11795469B2 (en) Scaevola plants with radially symmetrical flowers
EP4278891A1 (en) Clubroot resistance and markers in brassica
US20230189732A1 (en) Didymella bryoniae internal fruit rot resistance in cucumis sativus plants
US20230323385A1 (en) Plants with improved nematode resistance
CN116615098A (zh) 单性结实西瓜植物
OA21301A (en) Parthenocarpic watermelon plants.
OA21227A (en) Parthenocarpic watermelon plants.
WO2024094578A1 (en) Melon plants producing seedless fruit
EP3975700A1 (en) Downy mildew resistance in cucurbitaceae plants
US20190153456A1 (en) Brassica plants with altered properties in seed production

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication