CN116615098A - 单性结实西瓜植物 - Google Patents

单性结实西瓜植物 Download PDF

Info

Publication number
CN116615098A
CN116615098A CN202180075405.XA CN202180075405A CN116615098A CN 116615098 A CN116615098 A CN 116615098A CN 202180075405 A CN202180075405 A CN 202180075405A CN 116615098 A CN116615098 A CN 116615098A
Authority
CN
China
Prior art keywords
allele
plant
mutant
protein
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180075405.XA
Other languages
English (en)
Inventor
D·普格利西
A·西里佐蒂
C·胡
M·马扎赫里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nunhems BV
Original Assignee
Nunhems BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nunhems BV filed Critical Nunhems BV
Priority claimed from PCT/EP2021/080366 external-priority patent/WO2022096451A1/en
Publication of CN116615098A publication Critical patent/CN116615098A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明涉及产生无籽果实的西瓜植物。本发明还包含产生所述植物的方法和产生无籽西瓜的方法。

Description

单性结实西瓜植物
技术领域
本发明涉及单性结实西瓜植物,由于存在被称为WAP7.1的隐性基因的突变型等位基因,其在无雌花授粉时产生无籽果实。当突变型等位基因是纯合形式时,未授粉的花产生无籽果实。然而,当花被授粉时,产生正常的有籽果实。这种性状被称为兼性单性结实。本发明还包含产生所述植物的方法和称为wap7.1的突变型等位基因用于产生无籽西瓜果实的用途。
背景技术
大多数商业无籽果实已从植物中开发出来,这些植物的果实通常含有分布在其整个果肉中的许多相对较大的坚硬种子。例如,西瓜、番茄、黄瓜、茄子、葡萄、香蕉、柑橘类水果(如橙子、柠檬和酸橙)的无籽果实是众所周知的。由于无籽果实的食用通常更容易且更方便,它们被认为是有价值的。
果实发育通常在花的胚珠室中的一个或更多个卵细胞受到来自花粉的精核受精时开始。
无籽果实可能由两种不同的现象导致。在一些情况下,果实在胚珠没有花粉受精的情况下发育,这种现象称为单性结实。在其他情况下,无籽果实发生于授粉后,此时种子(胚和/或胚乳)生长受到抑制或种子在早期死亡,而果实的其余部分继续生长(种子败育(stenospermocarpy))。与单性结实相比,种子败育需要授粉以开始果实生长。
无籽橙子果实是单性结实的一个实例。一些橙子品种(例如脐橙)不产生有活力的花粉。但是,它们可以与来自其他品种的花粉进行异花授粉。如果只有雄性不育品种被种植在果园中,则不会发生授粉,并且将产生单性结实无籽果实。各橙子树的繁殖通常通过插条和随后嫁接到另一个根茎(rootstock)上来进行。
无籽香蕉是三倍体。虽然在某些情况下授粉可能是正常的,但绝大多数果实都是无籽的。这是由于染色体组不均匀(3x)导致在减数分裂期间染色体的不正常分裂以及由此产生无活力花粉。没有受精,三倍体香蕉也能够结出和形成无籽果实。甚至在授粉发生时,至多三百分之一的果实包含一些种子。基于所解释过的原因,这可能是因为三倍体花粉不能存活。因此,香蕉植物可以被视为单性结实。香蕉植物通常由主茎基部的侧枝或根出条(sucker)——其可被移出并再种植以继续栽培品种——来进行无性繁殖。种植者还通过组织培养的方式繁殖香蕉,特别是用于产生无病害材料。
无籽黄瓜、无籽南瓜和无籽茄子是没有授粉(例如,在授粉受损的条件(例如,低温)下)而可以产生无籽果实(单性结实)的作物的实例。但是,在这些条件下可产生商业品质的果实。但是,所有这些作物在授粉后都可以产生结果实的种子。因此,这些作物是兼性单性结实的。所述作物的繁殖可以通过自花授粉或异花授粉、体外繁殖和嫁接来完成。
从番茄突变型中还已知它们可以在正常授粉/受精受损的条件下(例如,在低温环境下)产生无籽果实。因此,这些突变型也是兼性单性结实的。已知用于显示该表型的突变型是pat、pat-2和pat-3/pat-4系统。这些突变背后的基因尚不清楚,并且pat-3/pat-4系统似乎依赖于多个基因座。
单性结实也已被通过遗传修饰引入到几种植物物种中。在胚珠和胎座特异性DefH9启动子控制下,赋予生长素合成的细菌色氨酸单加氧酶(iaaM)的表达确实诱导以下植物中的单性结实:黄瓜(Yin et al.,2006,Clular&molecular Biotech.Letters 11,279-290)、茄子(Acciarri et al.,2002,BMC Biotech.2(4))、番茄(Rotino et al.,2005,BMC Biotech.5(32))和烟草。
这些转基因植物证明了植物激素在种子和果实发育中的重要性。除其他因素以外种子和果实发育受到几种植物激素的强烈控制是本领域公知的。例如,也可通过外源施用植物激素(特别是生长素或赤霉素)来诱导单性结实(包括果实无籽的逻辑结果)(Ruan etal.,Trends in Plant Sci.17(11),1360-1385)。
育种者目前产生的无籽西瓜是种子败育作物的实例。正常的西瓜植物是二倍体(2n)。产无籽果实的西瓜是通过将雄性二倍体(2n)西瓜植物与雌性四倍体(4n)西瓜植物杂交产生的杂种。所得的F1杂交种子是三倍体(3n)。三倍体F1杂种植物的诱导结实需要授粉。由于三倍体(3n)F1杂种植物不产生可育的花粉,必须在同一田地中种植所谓的授粉者或传粉者植物。所述授粉者植物是二倍体(2n)。通常,必须在给定方案中种植比例为约1/3的授粉者植物与杂种植物,以提供足够的花粉用于授粉所有F1杂种植物。二倍体(2n)授粉者与雌性三倍体(3n)杂种植物的花之间的异花授粉诱导结实,并导致在三倍体杂种植物上产生无籽三倍体果实。F1杂种的二倍体(2n)和四倍体(4n)亲本各自产生结实的种子,并且都可以通过自花授粉彼此独立繁殖。
无籽葡萄可以由单性结实或种子败育的植物产生。品种Black Corinth是单性结实,而Sultanina是种子败育。藤本植物通常通过插条和相继嫁接到另一种根茎上来繁殖。
减数分裂中的不规则性可以是导致植物产无籽果实的一个因素。产无籽果实的植物的实例在Zhang et al.,(2012,Scientia Horticulture140,107-114)中给出,其公开了无籽西瓜。在用γ-射线照射F1杂种的后代的种子后,获得雄性和雌性不育(MFS)突变型。来自MFS突变型的花粉根本不能存活。当用来自雄性可育植物的花粉授粉时,MFS植物产生无籽果实。因此,MFS西瓜植物可被归类为是种子败育的。胚珠也几乎完全不能存活,因为MFS突变型与来自不同雄性可育植物的花粉异花授粉时几乎不产生种子。减数分裂过程中不完全的染色体结合和染色单体的异常分离在MFS突变型中观察到,并且被认为是雄性和雌性不育的原因。尚未鉴定出导致MFS突变型中存在的负责该效应的基因,但似乎MFS突变型中的表型可能是由于单个隐性基因。
从以上讨论中可以明显看出,决定植物是否产生无籽果实的因素本质上是多种多样的,并且可存在于几种(例如形态学、生理学和/或遗传学)原因中。
为了在种子败育作物(例如三倍体(3n)西瓜植物)中产生无籽果实,必须对植物的雌花部分授粉。当今种植的种子败育作物是雄性不育的。因此,除了雌性植物外,还必须在同一田地中另外种植不同的雄性可育植物(授粉植物或传粉植物)。由于用于授粉植物的区域是以产无籽果实的雌性植物可用的区域为代价的,因此每单位栽培面积的产量降低。通常,授粉植物是也可以自花授粉的正常植物。然而,由授粉植物产生的果实确实会产生种子。在西瓜中,所述授粉者植物通常是二倍体(2n),其在自花授粉时产生有籽果实,该果实在某些情况下也可被收获并单独出售(参见WO2012069539)。出于商业原因,这些来自授粉植物的有籽果实必须不能与无籽果实混合。因此,必须确保在收获时或收获后分离所述无籽果实和有籽果实,这可能使机器收获变得困难或不可能,或在收获后需要进一步的加工步骤。那些待采取的额外预防措施增加了无籽果实产生的投入成本。此外,培育了授粉植物,使得它们开花并产生足够的有活力的花粉,与此同时,雌性植物开花并且其柱头可接受用于花粉以诱导结实。因此,在开花和受精时间方面,授粉植物必须与产无籽果实的雌性植物相适应。如果授粉植物和相应的雌性植物的开花时间不充分同步,则授粉不会发生或仅在不足量的情况下发生。因此,种子败育的雌性植物产生很少的果实。此外,本领域公知,气候条件(如雨,热等)可影响传粉植物的花粉产生,使其不同于基因型不同的雌性植物的柱头受精时间。因此,气候条件也会导致授粉植物和雌性植物的受精时间不同步,其效果是降低了产量。
本发明人已经发现,在栽培西瓜中突变单个隐性基因(本文称为WAP7.1基因)导致西瓜植物在花未授粉时发育无籽果实,即单性结实。如果花被授粉,发育的果实产生正常的有活力的种子。因此,这种类型的单性结实被称为兼性单性结实,因为它只在没有授粉的情况被看到。因此,WAP7.1基因负责西瓜的兼性单性结实。因此,当突变型wap7.1等位基因以纯合形式存在于二倍体西瓜植物中时,在本文中表示为wap7.1/wap7.1,所述植物是兼性单性结实的(parthenocarp),并从未授粉的花中产生无籽果实和从授粉的花中产生正常的有籽果实。
该基因在二倍体西瓜中具有很大的优势,特别是如果与雄性不育(MS)结合,以确保没有雌花的授粉(因为植物上产生的雄花是不育的),或与emb1突变型(例如以纯合形式,emb1/emb1)结合,以确保在授粉确实发生的情况下,由于植物中纯合的emb1突变型的存在,果实是无籽的。所述emb1突变型是种子败育突变型,导致授粉时产生无籽果实。含有emb1突变型等位基因的种子已于2016年1月27日由Nunhems B.V.保藏,登录号为NCIMB42532。
WAP7.1基因在具有例如两个或三个拷贝的突变型等位基因的三倍体西瓜中也有很大的优势,因为不再需要将这种三倍体西瓜植物与授粉植物间作(interplant)(通常需要在具有三个拷贝的野生型WAP7.1等位基因的正常三倍体中诱导结实)。这些单性结实三倍体植物产生无籽果实,不需要授粉来诱导结实。因此,基本上正常三倍体西瓜的种子败育性质被改变为单性结实。无籽三倍体果实的产量因此大大增加,因为田地中不再需要授粉植物并且整个田地可以包含三倍体西瓜植物。
在生长在防虫温室中的诱变M2二倍体西瓜植物群体中,为了不发生授粉,在筛选超过20,000株植物时,观察到由未授粉的雌花产生无籽果实的植物(参见图1)。这些果实只含有一些母系起源外皮(tegumen)的痕迹,与已知的三倍体无籽果实中的所见的相似。遗传分析显示,该性状作为单个隐性基因被分离。该基因被命名为WAP7.1,并且突变型等位基因被命名为wap7.1。
使用能够产生单性结实果实的单个植物株系的不同遗传背景中生成了几个F2定位群体。对源自两个不同背景的两个F2群体进行表型和基因分型分析。将QTL定位到7号染色体上的5.6Mb区域,该区域包含16个突变,其中15个位于基因间区和一个突变(单个核苷酸置换)位于基因中,其在本文以SEQ ID NO:6(野生型,在核苷酸7394处包含G)和SEQ IDNO:7(突变型,在核苷酸7394处包含A)被提供,将编码W1054的密码子(密码子TGG)改为终止密码子(密码子TGA),并由此截短了编码的蛋白质。图2分别显示了SEQ ID NO:1和SEQ IDNO:2的野生型和突变型WAP7.1蛋白的氨基酸序列。W1054*(也被称为W1054STOP)突变型蛋白因此缺少氨基酸1054至1266,即到蛋白的末端。
在西瓜的参考基因组中,野生型基因存在于7号染色体上,例如在cucurbitgenomics.org发现的Charleston Grey基因组中,WAP7.1基因被标记为ClCG07G008850.1并在正链上发现,起始于核苷酸23357225(ATG)并终止于核苷酸23365257(TGA)。类似地,在品种97103的参考基因组(基因组97103V2)中,野生型基因被标记为Cla97C07G135900.1,并被发现在7号染色体上,起始于核苷酸21927587并终止于核苷酸21935619。据说这两个基因都编码“含锌指CCCH结构域的蛋白质”,但没有已知的体内功能或表型。
尽管基因组序列是相同的,但申请人发现据说由ClCG07G008850.1和Cla97C07G135900.1(本文中包含于SEQ ID NO:8和SEQ ID NO:9)编码的蛋白质是不同的。通过分析mRNA序列,申请人推断出该差异是由于数据库中提供的内含子和外显子信息的错误并且根据mRNA序列数据,发现正确的蛋白质序列是SEQ ID NO:1的蛋白质序列。另参见图3,其中显示了所有三种蛋白,即CG蛋白(据说由ClCG07G008850.1编码)、97103蛋白(据说由Cla97C07G135900.1编码)和野生型WAP7.1蛋白(SEQ ID NO:1),由RNA数据确定。
已知锌指蛋白是转录调节器和WAP7.1蛋白包含若干个保守结构域,已知其在其他基因的转录调控中起作用。SEQ ID NO:1包含四个保守结构域,也显示在图2中。
a)‘锌结合结构域’,起始于氨基酸114并终止于氨基酸159,
b)‘肽结合结构域’,起始于氨基酸350并终止于氨基酸395,
c)‘Plus3结构域’,起始于氨基酸464并终止于氨基酸572;以及
d)‘脯氨酸结合基序’,起始于SEQ ID NO:1的氨基酸812并终止于SEQ ID NO:1的氨基酸828。
这些保守结构域也显示在图2中(下划线)。
尽管所有的保守结构域仍然存在于截短的W1054*突变型wap7.1蛋白中,但截断的蛋白在体内具有功能的可能性很小,因此认为该突变是一个功能丧失的等位基因。如前所述,这种突变型wap7.1等位基因以纯合形式存在于二倍体西瓜植物中,会导致兼性单性结实,该植物在没有花的授粉情况下产生无籽果实。
在西瓜TILLING群体中生成和/或鉴定了更多的突变型,其在内源性wap7.1等位基因上有突变以及它们的表型将通过产生突变型等位基因纯合型的植物来确认。因此,到目前为止,发现了以下突变型:
表1
因此,本文的一个方面是一种包含至少一个wap7.1基因的突变型等位基因的西瓜植物,其中当突变型等位基因为纯合形式时导致单性结实,由于产生的突变型蛋白与野生型WAP7.1蛋白相比具有功能降低或功能丧失,或由于突变型等位基因与野生型WAP7.1等位基因相比具有基因表达降低或无基因表达,导致植物中制备的野生型WAP7.1蛋白更少或没有。
因此,突变型wap7.1等位基因可与野生型WAP7.1蛋白相比包含插入、缺失或替换的一个或更多个氨基酸,或者突变型wap7.1等位基因可包含蛋白调控区的一个或更多个突变,如启动子或增强子,导致降低的或无活性的制备的野生型蛋白,从而当突变型等位基因为纯合形式时,同样会导致兼性单性结实。
上述突变型或植物的内源性WAP7.1基因中其他突变型可通过例如随机诱变或定向诱变,如基于CRISPR的方法生成。例如Erpen-Dalla Corte等人在Plants 2019,8,601(doi:10.3390/plants8120601)和Bed Prakash Bhatta和Subas Malla在Plants 2020,9,1360;doi:10.3390/plants9101360中提供了靶向基因编辑的综述。基于Crispr的编辑也已经在西瓜和其他葫芦科作物中进行,因此可以由技术人员用于编辑包含直系同源基因的西瓜或其他葫芦科物种的内源性WAP7.1基因。例如,如WO2017098508所述,CRISPR已被用于黄瓜中以产生目的基因中的突变型。同样在西瓜中,Crispr已经成功地用于修饰目的基因,参见例如Wang,Y.,Wang,J.,Guo,S.等人,CRISPR/Cas9-mediated mutagenesis of ClBG1decreased seed size and promoted seed germination in watermelon.Hortic Res 8,70(2021)。https://doi.org/10.1038/s41438-021-00506-1。
关于四个保守结构域(或蛋白质的其他部分)中的任何一个的突变,在一方面,特别是导致氨基酸替换的突变,其中野生型氨基酸和被替换的氨基酸的性质不同,是本文的一个方面,因为不同的氨基酸性质将降低或破坏蛋白质或结构域的正确折叠和/或正常功能。因此,例如用极性氨基酸(包含亲水侧链)替换非极性氨基酸,或反之亦然,或用非带电荷侧链或不同带电荷侧链替换具有带电荷侧链的氨基酸。非极性氨基酸是丙氨酸(A或Ala)、半胱氨酸(C或Cys)、甘氨酸(G或Gly)、异亮氨酸(I或Ile)、亮氨酸(L或Leu)、蛋氨酸(M或Met)、苯丙氨酸(F或Phe)、脯氨酸(P或Pro)、色氨酸(W或Trp)、缬氨酸(V或Val)。极性氨基酸是精氨酸(R或Arg)、天冬酰胺(N或Asn)、天冬氨酸(D或Asp)、谷氨酸(E或Glu)、谷氨酰胺(Q或Gln)、组氨酸(H或His)、赖氨酸(K或Lys)、丝氨酸(S或Ser)、苏氨酸(T或Thr)、酪氨酸(Y或Tyr)。
因此,在一个方面,保守结构域(选自四个保守结构域)的任何一个(或更多个)非极性氨基酸被极性氨基酸置换和/或保守结构域的任何一个(或更多个)极性氨基酸被非极性氨基酸替换。然后可以通过生成突变型等位基因纯合型的植物并分析表型来测试所得突变型等位基因的功能。如果所述突变型等位基因导致植物成为兼性单性结实,那么所述突变型等位基因是编码在体内具有功能降低或无功能的突变型wap7.1蛋白的等位基因。
在另一方面,突变型wap7.1等位基因编码截短的蛋白,其中缺失野生型Wap7.1蛋白的C末端的至少50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、201、202、203、204、205、206、207、208、209、210、211、212、213个或更多的氨基酸(例如缺失至少200、300、400、500、600、700、800、850、890、892、893、894个氨基酸)或任选被不同的氨基酸替换,使该蛋白具有体内功能降低或没有体内功能。本文在实施例中给出了两个编码截短蛋白的突变型等位基因的实例:编码SEQ ID NO:1中的W1054*(或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的WAP7.1蛋白中等同位置的W的终止密码子);或编码SEQ ID NO:1中的Q373*(或与SEQ ID NO:1具有至少有94%、95%、96%、97%、98%或99%序列同一性的WAP7.1蛋白中等同位置的Q的终止密码子)。
在一方面,西瓜WAP7.1基因是编码WAP7.1蛋白的基因,其中WAP7.1蛋白是SEQ IDNO:1的蛋白或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的蛋白。需要注意的是,据说由ClCG07G008850.1(SEQ ID NO:8)和Cla97C07G135900.1(SEQ IDNO:9)编码的蛋白质与SEQ ID NO:1有99.3%和97.7%的序列同一性。因此,如果这些蛋白质序列不是由于内含子/外显子信息的错误,而且这些可为功能性的蛋白质(其不被认为是如上所述的),这些都包含在本文中。如前所述,基因组序列与本文以SEQ ID NO:6提供的野生型WAP7.1基因组基因序列100%相同。
西瓜WAP7.1基因也可称为ClWAP7.1,指西瓜(Citrullus lanatus)WAP7.1,并在本文中以SEQ ID NO:6提供,编码SEQ ID NO:1的蛋白质。其他栽培西瓜可含有WAP7.1基因的等位基因变体,与SEQ ID NO:6具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的核苷酸序列同一性,并可编码野生型(功能性)WAP7.1蛋白,其具有与SEQ IDNO:1至少94%、95%、96%、97%、98%或99%的序列同一性。这样的蛋白质在本文中也被称为SEQ ID NO:1的蛋白质的功能变体,并且这样的基因被称为SEQ ID NO:6的基因的等位基因变体。重要的是,当突变为敲低或敲除基因表达时,或当突变为编码功能降低或功能丧失的蛋白质时,它们应导致兼性单性结实。例如,本文产生的引入相同突变的等位基因变体,如SEQ ID NO:6的核苷酸7394的单核苷酸变化(G到A)(导致密码子TGG变为密码子TGA,即W1054STOP),当二倍体植物中存在纯合时,应给出相同的表型。
在本发明的一个方面,提供了一种植物或植物细胞,其特征在于,与相应的野生型植物细胞相比,所述植物或植物细胞具有活性降低的WAP7.1蛋白,其中所述野生型植物细胞的所述WAP7.1蛋白由选自以下的核酸分子编码:
a)核酸分子,其编码具有SEQ ID NO:1(西瓜)的氨基酸序列的蛋白质;
b)核酸分子,其编码蛋白质,所述蛋白质的序列与SEQ ID NO:1(西瓜)的氨基酸序列具有至少94%、95%、96%、97%、98%或99%的同一性;
c)核酸分子,其编码蛋白质,所述蛋白质的序列与SEQ ID NO:1(西瓜)的氨基酸序列具有至少94%、95%、96%、97%、98%或99%的同一性并且其中所述蛋白质包含锌结合结构域的氨基酸序列,即SEQ IDNO:1的氨基酸114至159,和/或它包含肽结合结构域的氨基酸序列,即SEQ ID NO:1的氨基酸350至395,和/或它包含Plus3结构域的氨基酸,即SEQ IDNO:1的氨基酸464至572,和/或它包含脯氨酸结合基序的氨基酸,即SEQ ID NO:1的氨基酸812至828;
d)SEQ ID NO:6的核酸分子或与SEQ ID NO:6具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性并编码WAP7.1蛋白的序列。
WAP7.1蛋白的活性降低由突变型wap7.1等位基因引起。活性降低可通过敲低或敲除突变型wap7.1等位基因的表达(如通过启动子或其他调控序列的突变)或通过突变型wap7.1等位基因编码功能丧失或功能降低的WAP7.1蛋白(突变型WAP7.1蛋白)引起。
在一个方面,突变型wap7.1等位基因编码的突变型WAP7.1蛋白与野生型蛋白相比具有功能降低或功能丧失,例如所述突变型WAP7.1蛋白与野生型蛋白相比包含替换、缺失和/或插入的一个或更多个氨基酸。在一个方面,SEQ ID NO:1的氨基酸R346、S324、P830、A328、Q373和/或W1054(或与SEQ ID NO:1的氨基酸序列具有至少94%、95%、96%、97%、98%或99%的序列的等同氨基酸)被缺失或被不同的氨基酸替换或被终止密码子替换,导致WAP7.1蛋白的功能降低或功能丧失。
在一个方面,所述突变型WAP7.1蛋白包含在选自以下的该蛋白的保守结构域中替换、缺失和/或插入的一个或更多个氨基酸:1.蛋白质的保守的“锌结合结构域”结构域,2.保守的“肽结合结构域”,3.保守的“Plus3结构域”和/或,4.蛋白质的保守的“脯氨酸结合结构域”。
在一个方面,保守结构域(4个结构域的)中的至少一个氨基酸被另一个氨基酸或终止密码子替换,导致当等位基因为纯合形式时(当二倍体植物或植物细胞中没有野生型等位基因存在时)功能丧失或功能降低的蛋白质和兼性单性结实。
在另一个方面,保守结构域(4个结构域的)的一个或更多个氨基酸缺失,例如通过突变导致提前终止密码子,导致当等位基因为纯合形式时(当二倍体植物或植物细胞中没有野生型等位基因存在时)功能丧失或功能降低的蛋白质和兼性单性结实。
在另一个方面,所述突变型蛋白是截短的,缺失SEQ ID NO:1(或与SEQ ID NO:1具有至少94%同一性的野生型蛋白)的野生型Wap7.1蛋白的C末端的至少50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、201、202、203、204、205、206、207、208、209、210、211、212、213个或更多个氨基酸或可选地被不同的氨基酸替换,使所述蛋白具有降低的体内功能或无体内功能。在一个方面,SEQ ID NO:1的第1054位的W,或与SEQ ID NO:1具有至少94%同一性的蛋白质的等同位置处的W缺失,或被不同的氨基酸替换,或被终止密码子替换。在一个方面,SEQ ID NO:1的第373位的Q,或与SEQ ID NO:1具有至少94%同一性的蛋白质的等同位置上的Q缺失,或被不同的氨基酸替换,或被终止密码子替换。
当突变型等位基因将体内表型从野生型表型(即当野生型等位基因以纯合形式存在时,果实仅在授粉后发育)改变为兼性单性结实(当所述突变型等位基因在二倍体植物中为纯合形式时),该蛋白存在功能降低或功能丧失或功能降低。
与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或更多序列同一性的序列中的等同氨基酸可通过与SEQ ID NO:1的成对比对(例如使用程序Needle)来鉴定,参见例如图3。SEQ ID NO:1的W1054或表1所示的其他突变型的等同氨基酸,可例如容易地在SEQ IDNO:8和9中被鉴定,参见图3,其中用粗体突出显示。与SEQ ID NO:1至少94%同一性的变体序列中的等同氨基酸因此是相同的氨基酸,但它在变体序列中可具有略微不同的位置,例如SEQ ID NO:1的W1054可为例如变体蛋白质中的W1055或W1052或W1053。
在一个方面,SEQ ID NO:1的西瓜蛋白的W1054(或在与SEQ ID NO:1具有至少94%、95%、96%、97%或更多序列同一性的序列中的等同氨基酸),被不同的氨基酸替换、缺失或被终止密码子替换。
在一个方面,SEQ ID NO:1的西瓜蛋白的Q373(或在与SEQ ID NO:1具有至少94%、95%、96%、97%或更多序列同一性的序列中的等同氨基酸),被不同的氨基酸替换、缺失或被终止密码子替换。
在一个方面,SEQ ID NO:1的西瓜蛋白的R346(或在与SEQ ID NO:1具有至少94%、95%、96%、97%或更多序列同一性的序列中的等同氨基酸),被不同的氨基酸替换、缺失或被终止密码子替换。
在一个方面,SEQ ID NO:1的西瓜蛋白的S324(或在与SEQ ID NO:1具有至少94%、95%、96%、97%或更多序列同一性的序列中的等同氨基酸),被不同的氨基酸替换、缺失或被终止密码子替换。
在一个方面,SEQ ID NO:1的西瓜蛋白的P830(或在与SEQ ID NO:1具有至少94%、95%、96%、97%或更多序列同一性的序列中的等同氨基酸),被不同的氨基酸替换、缺失或被终止密码子替换。
在一个方面,SEQ ID NO:1的西瓜蛋白的A328(或在与SEQ ID NO:1具有至少94%、95%、96%、97%或更多序列同一性的序列中的等同氨基酸),被不同的氨基酸替换、缺失或被终止密码子替换。
在一个方面,突变型等位基因编码SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14或SEQ ID NO:10的突变型蛋白。
发明内容
本发明提供了一种包含至少一个拷贝的命名为WAP7.1的基因的突变型等位基因的栽培西瓜植物或植物部分,当所述突变型等位基因是纯合形式时,所述突变型等位基因赋予兼性单性结实。
在一个方面,所述基因位于西瓜基因组的第7号染色体上,特别是所述基因位于Charleston Grey染色体的第7号染色体的起始于碱基对23357225并终止于碱基对23365257的区域,在其上它被称为ClCG07G08850。
在一个实施方案中,包含所述WAP7.1基因的突变型等位基因的所述植物或植物部分是二倍体、四倍体、三倍体或多倍体。优选地,突变型等位基因在二倍体植物或植物部分中以两个拷贝存在,在四倍体植物或植物部分中以四个拷贝存在,或在三倍体植物或植物部分中以一个、两个或三个拷贝存在。
任选地,包含所述WAP7.1基因的突变型等位基因的所述植物或植物部分进一步包含赋予雄性不育的基因或赋予种子败育的基因,例如WO2017202715和/或WO2019238832中所述的基因。
任选地,包含WAP7.1基因的突变型等位基因的所述植物或植物部分进一步包含赋予单性结实的基因,例如WO2018/060444中所述的基因。
包含所述WAP7.1基因的突变型等位基因的所述植物部分可为细胞、花、叶、茎、插条、胚珠、花粉、根、根茎、接穗、果实、原生质体、胚、花药。
还包括从这样的包含至少一个WAP7.1基因的突变型等位基因的植物部分繁殖的无性繁殖的西瓜植物。
同样,本发明提供了一种可从其生长出本发明的植物的种子。
进一步,本发明提供了一种由根据本发明的植物产生的无籽果实。
本发明提供了一种产生无籽西瓜果实的方法,所述方法包括种植包含两个拷贝的WAP7.1基因的突变型等位基因的二倍体植物并收获所述植物产生的果实。特别是所述果实在不对雌花授粉的情况下发育,而在花的授粉后产生有籽果实。
本发明提供了一种产生无籽西瓜果实的方法,所述方法包括种植包含一个、两个或三个拷贝的WAP7.1基因的突变型等位基因的三倍体植物,并收获所述植物产生的果实。特别是所述果实在不对雌花授粉的情况下发育,即不需要花粉来诱导果实发育。
本发明提供了一种种植西瓜植物的方法,其包括种植包含一个、两个或三个拷贝的WAP7.1基因的突变型等位基因的三倍体西瓜植物,特别是在没有授粉植物的田地里,并任选地地收获所述植物的无籽西瓜果实。
本发明提供了一种产生兼性单性结实栽培西瓜植物的方法,其包括以下步骤:
a)在西瓜植物或种子的群体中引入突变;或提供突变型植物或种子的群体(例如TILLING群体,例如M2、M3、M4或更多代),
b)选择在不对雌花授粉的情况下产生无籽果实并在对雌花授粉后产生有籽果实的植物;
c)任选地验证b)中选择的植物是否包含WAP7.1基因的突变型等位基因;以及
d)任选地种植c)中获得的植物。
本发明提供了一种产生兼性单性结实栽培西瓜植物的方法,其包括以下步骤:
a)在西瓜植物或种子中引入突变;或提供突变型植物或种子的群体(例如TILLING群体,例如M2、M3、M4或更多代),
b)选择包含WAP7.1基因的突变型等位基因的植物;
c)任选地自交所选择的植物以生成WAP7.1基因的突变型等位基因的纯合型植物;
d)任选地种植所述植物。
在本文中还包括由所述方法产生的西瓜植物、种子或果实。
一种兼性单性结实西瓜植物用于产生无籽西瓜果实,优选在不对植物的雌花授粉的情况下的用途也是本发明的一个方面。
一种本文所述的WAP7.1基因的突变型wap7.1等位基因用于产生兼性单性结实西瓜植物的用途也是本发明的一个方面。
本发明提供了一种产生在没有授粉的情况下产生无籽果实和在有授粉的情况下产生有籽果实的栽培西瓜植物的方法,其包括以下步骤:
a)将随机或定向突变引入到一种或更多种西瓜植物、植物部分或种子中;或提供突变型植物或种子的群体(例如TILLING群体,例如M2、M3、M4或更多代),
b)选择包含wap7.1基因的突变型等位基因的植物,例如产生明显降低的或无野生型WAP7.1蛋白的突变型等位基因(例如基因敲除等位基因),或其编码的蛋白与野生型蛋白相比包含缺失、替换、插入或重复的一个或更多个氨基酸,
c)任选地从所述植物中移除任何转基因构建体(例如CRISPR构建体),和/或
d)任选地生成突变型等位基因纯合型的植物,并分析是否在没有授粉的情况下发育无籽果实,和在有授粉的情况下发育有籽果实。
本发明提供了一种选择或鉴定西瓜植物、种子或植物部分的方法,其包括以下步骤:
a)分析所述植物或植物部分或种子的基因组DNA在它们的基因组中是否包含突变型等位基因和/或包含WAP7.1基因的野生型等位基因,并任选地
b)选择在基因组中包含一个或两个拷贝的wap7.1基因的突变型等位基因的植物或植物部分或种子,
其中所述西瓜WAP7.1基因的所述野生型等位基因编码SEQ ID NO:1的蛋白质(或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%、99%同一性的野生型蛋白)。
步骤a)可通过各种方式进行,例如使用基于PCR的方法、基于测序的方法、基于核酸杂交的方法、基因表达水平等。在一个方面,例如可使用KASP测定。
本发明提供了一种筛选(例如基因分型)西瓜植物、种子或植物部分的基因组DNA的方法,其包括以下步骤:
a)提供西瓜植物或多种植物(如F2群体、近交株系、回交群体、育种群体、杂种植物等)的基因组DNA样品(或多个样品),
b)提供一对PCR引物或寡核苷酸探针,其中引物或(寡核苷酸)探针包含西瓜WAP7.1基因的基因组WAP7.1组等位基因的至少10、11、12、13、14、15、16、17、18、19、20、21、22或更多的连续核苷酸并在PCR测定中能与基因组等位基因杂交和/或扩增基因组等位基因的一部分,以及
c)在步骤a)的样品上,使用引物对进行PCR测定,或使用步骤b)的探针进行杂交测定,以及任选地
d)选择在基因组中包含一个或两个拷贝的西瓜WAP7.1基因的等位基因(例如野生型等位基因和/或突变型等位基因)的植物或植物部分或种子,
其中所述西瓜WAP7.1基因的所述野生型等位基因编码SEQ ID NO:1的蛋白质(或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%、99%同一性的野生型蛋白)。
在步骤b)中,PCR引物对是至少一个正向引物,与WAP7.1等位基因的DNA链中的一条互补和一个与WAP7.1等位基因的另一条DNA链互补的反向引物,其中引物对与变性基因组DNA杂交和在PCR反应中扩增WAP7.1等位基因的一部分。可使用引物设计工具设计引物来扩增野生型或任何突变型WAP7.1等位基因。在一个方面,使用两个正向引物,一个设计来扩增野生型等位基因和一个设计来扩增WAP7.1基因的突变型等位基因和一个共有的反向引物。这三个引物可用于KASP-测定中来对步骤a)的样品进行基因分型。因此,在一个方面,步骤c)中的测定是KASP-测定,但也可使用其他的基因分型测定,如那些在万维网biosearchtech.com/sectors/agrigenomics/agrigenomics-pcr-qpcr-technologi es描述的。
在一个方面,所述测定区分WAP7.1基因的野生型和突变型等位基因,例如区分野生型WAP7.1等位基因和表1的突变型等位基因,或另一个突变型等位基因。
为了分析基因组DNA,至少粗基因组DNA提取可能是必要的。基因组DNA中突变型等位基因或野生型等位基因的存在可以直接或间接地检测。直接地可通过例如寡核苷酸探针的核酸杂交。间接地可以例如通过使用例如PCR引物的核酸扩增,所述PCR引物包含例如连接到引物的尾序列,并且在PCR期间等位基因特异性引物结合到模板DNA并延伸,由此将尾序列连接到新合成的链上并在随后的PCR轮中,FRET盒(荧光共振能量转移盒)与尾部结合并发出荧光。然后可以检测荧光信号。这被用于例如KASP-测定中。
所述突变型等位基因可在各个方面与野生型等位基因不同,例如在启动子序列中或在蛋白质编码序列中或在内含子/外显子剪接位点中。所述突变型等位基因可具有降低的基因表达或无基因表达,或者它可导致产生与野生型蛋白质相比包含缺失、替换、插入或重复一个或更多个氨基酸的蛋白质。
在一个方面,所述突变型等位基因是编码表1所述的突变型蛋白的等位基因,其中表1的突变在编码SEQ ID NO:1的蛋白质的西瓜WAP7.1基因的野生型等位基因中,或在编码与SEQ ID NO:1具有至少94%、95%、96%、97%、98%、99%同一性的野生型WAP7.1蛋白的野生型等位基因的等同位置。
在一个方面,所述植物或植物部分是西瓜以及所述突变型等位基因编码SEQ IDNO:2或SEQ ID NO:10或SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQ ID NO:14的突变型蛋白。
本发明还提供了生成和/或选择在基因组中包含所述西瓜WAP7.1基因的至少一个突变型等位基因的植物或植物部分的方法。
在一个方面,本发明还提供了一种检测基因组中所述西瓜WAP7.1基因的野生型等位基因和/或突变型等位基因的存在的方法。
在一个方面,本发明提供了一种检测西瓜植物或植物部分或种子是否包含至少一个拷贝的野生型等位基因的方法,所述野生型等位基因例如其编码SEQ ID NO:1的蛋白质(或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型等位基因),和/或检测西瓜植物或植物部分或种子是否包含至少一个拷贝的突变型等位基因的方法,其包含例如相对于野生型等位基因被替换、插入或缺失的一个或更多个氨基酸,所述突变型等位基因例如其编码SEQ ID NO:2、10、11、12、13或14的蛋白质或表1所示的突变型蛋白质,并任选地选择包含至少一个拷贝的突变型wap7.1等位基因的植物、植物部分或种子的方法。
本发明还提供了KASP-测定(Kbioscience竞争性等位基因特异性PCR–基因分型测定),其包含两个等位基因特异性正向引物,例如FAM引物和VIC引物和Common反向引物。显然,其他等位基因特异性引物可被开发来检测和/或区分野生型等位基因和任何其他突变型等位基因,所述任何其他突变型等位基因包含例如相对于野生型蛋白被替换、重复、缺失或插入的一个或更多个氨基酸。
同样,在本文中也包括(野生型或突变型)基因组序列、cDNA或mRNA序列、蛋白质序列的分离的序列或分子,以及寡核苷酸引物或探针,其用于检测西瓜WAP7.1基因的野生型或突变型等位基因。
本发明还提供了一种生成西瓜植物、种子或植物部分的(一部分的)基因组DNA的PCR扩增产物和/或寡核苷酸杂交产物的方法,其包括以下步骤:
a)提供西瓜植物或多种植物(如F2群体、近交株系、回交群体、育种群体、杂种植物等)的基因组DNA样品(或多个样品),
b)提供至少一对PCR引物或至少一个寡核苷酸探针,其中引物或(寡核苷酸)探针包含西瓜WAP7.1基因的基因组WAP7.1组等位基因的至少10、11、12、13、14、15、16、17、18、19、20、21、22或更多的连续核苷酸并在PCR测定中能与基因组等位基因杂交和/或扩增基因组等位基因的一部分,以及
c)在步骤a)的样品上,使用引物对进行PCR测定,或使用步骤b)的探针进行杂交测定以产生PCR扩增产物和/或寡核苷酸杂交产物,以及任选地
d)选择在基因组中包含一个或两个拷贝的WAP7.1基因的等位基因(例如野生型等位基因和/或突变型等位基因)的植物或植物部分或种子,
其中所述西瓜WAP7.1基因的所述野生型等位基因编码SEQ ID NO:1的蛋白质(或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%、99%同一性的野生型蛋白)。
本发明进一步提供了一种扩增和/或杂交西瓜植物、种子或植物部分的(一部分的)基因组DNA的方法,其包括以下步骤:
a)提供西瓜植物或多种植物(如F2群体、近交株系、回交群体、育种群体、杂种植物等)的基因组DNA样品(或多个样品),
b)提供至少一对PCR引物或至少一个寡核苷酸探针,其中引物或(寡核苷酸)探针包含西瓜WAP7.1基因的基因组WAP7.1组等位基因的至少10、11、12、13、14、15、16、17、18、19、20、21、22或更多的连续核苷酸并在PCR测定中能与基因组等位基因杂交和/或扩增基因组等位基因的一部分,以及
c)在步骤a)的样品上,使用引物对进行PCR测定,或使用步骤b)的探针进行杂交测定以产生PCR扩增产物和/或寡核苷酸杂交产物,以及任选地
d)选择在基因组中包含一个或两个拷贝的西瓜WAP7.1基因的等位基因(例如野生型等位基因和/或突变型等位基因)的植物或植物部分或种子,
其中所述西瓜WAP7.1基因的所述野生型等位基因编码SEQ ID NO:1的蛋白质(或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%、99%同一性的野生型蛋白)。
本发明还提供了包含引物和/或探针和反应组分以扩增和/或杂交一部分的WAP7.1基因的基因组DNA的基因分型试剂盒。
引物和探针优选用例如尾序列或标记物标记或修饰,以便能够检测扩增或杂交反应产物。
一般定义
动词“包含”及其变形以其非限定性含义使用,意指包括该词后面的项目,但也不排除没特定提及的项目。此外,以不定冠词“一种(a)”或“一种(an)”提及元素时,不排除存在一个以上元素的可能性,除非上下文明确要求存在一个且仅一个元素。因此,不定冠词“一种(a)”或“一种(an)”通常意指“至少一种”,例如“植物(a plant)”也指几个细胞植物等。类似地,“果实(a fruit)”或“植物(a plant)”也指多个果实和植物。
如本文中使用,术语“植物”包括整株植物或其任何部分或衍生物,所述部分或衍生物优选具有与其来源的植物相同的遗传组成,例如植物器官(例如收获的或未收获的果实、叶、花、花药等)、植物细胞、植物原生质体、能够再生出整株植物的植物细胞组织培养物、植物愈伤组织、植物细胞块、植物外植体、幼苗、在植物中的完整的植物细胞、植物克隆或微繁殖体,或植物的部位,例如植物插条、胚、花粉、花药、胚珠、果实(例如收获的组织或器官)、花、叶、种子、克隆繁殖的植物、根、茎、根尖、嫁接体(接穗和/或根茎)等。也包括任何发育阶段,例如幼苗,生根前或后的插条等。当提及“植物的种子”时,这些或者是指植物可从其生长的种子,或者是指在自花受精或交叉受精后在植物上产生的种子。
如本文中使用,术语“品种”或“栽培种”意指最低已知等级的单一植物学分类单元内的植物群,其可以通过由给定的基因型或基因型组合产生的特征的表达来定义。
术语“等位基因”意指位于特定基因座的基因的一种或多种可选形式中的任何一种形式,例如:WAP7.1基因座(WAP7.1基因所在的位置;该基因的等位基因可为命名为WAP7.1的野生型等位基因,或命名为wap7.1的突变型等位基因),所有这些等位基因均与特定基因座上的一种性状或特性(例如兼性单性结实)。在生物体的二倍体细胞中,给定基因的等位基因位于染色体的特定位置或基因座(locus)(复数形式loci)上。一个等位基因存在于一对同源染色体的一条染色体上。二倍体植物种可以在特定基因座包含大量不同的等位基因。这些等位基因可以是基因的相同等位基因(纯合的)或不同等位基因(杂合的),例如两个相同拷贝的突变型wap7.1等位基因(即wap7.1/wap7.1)或一个拷贝的突变型wap7.1等位基因和一个拷贝的野生型等位基因(即wap7.1/WAP7.1)。同样,如果三倍体植物具有一个基因的三个相同等位基因,则其被称为该基因纯合型的植物(例如三个拷贝的突变型wap7.1等位基因,即wap7.1/wap7.1wap7.1),以及如果四倍体植物具有该基因的四个相同等位基因,则四倍体植物被称为该基因纯合型的植物,例如四个拷贝的突变型wap7.1等位基因(即wap7.1/wap7.1/wap7.1/wap7.1)。
“WAP7.1基因”是在栽培西瓜中鉴定的位于7号染色体上的单个隐性基因,当其突变时导致单性结实,尤其是兼性单性结实。WAP7.1是野生型(WT),功能等位基因,如存在于非单性结实的栽培西瓜植物中,以及wap 7.1是导致单性结实的突变型等位基因,如果该等位基因在二倍体(wap 7.1/wap 7.1)、三倍体(wap 7.1/wap 7.1/wap 7.1)、四倍体(wap7.1/wap 7.1/wap 7.1/wap 7.1)或其他多倍体(例如八倍体等)中是纯合形式。在一个方面,WAP7.1基因是编码SEQ ID NO:1的蛋白质,或编码与SEQ ID NO:1(西瓜)具有至少94%、95%、96%、97%或98%序列同一性的蛋白质的基因(当成对序列比对时)。
“单性结实”或“单性结实的”在本领域中是通常理解的,并且在本发明中也被理解为描述没有雌性胚珠受精的果实发育。授粉过程对于产生果实是不需要的,然而由于缺乏授粉,果实是无籽的。因此,单性结实在本文中是指果实在没有对雌花授粉的情况下在植物上形成。同样,“单性结实植物”或“包含当为纯合形式时赋予单性结实的突变型基因(或基因的突变型等位基因)的植物”是指该植物在没有对雌花授粉的情况下产生无籽果实。
“兼性单性结实”应理解为是指当兼性单性结实植物的花被授粉时看不到单性结实性状,在这种情况下发生正常受精和正常果实发育。当正常受精发生时,果实是有籽的。
“F1、F2、F3等”是指两个亲本植物或亲本株系之间杂交后的连续相关世代。由两个植物或株系杂交产生的种子长出的植物称为F1代。F1植物自交产生F2代等。
“F1杂种”植物(或F1杂种种子)是由两个近交的亲本株系杂交得到的世代。因此,F1杂种种子是由其长出F1杂种植物的种子。由于杂种优势,F1杂种表现出较强的生长势且更高的产量。近交株系在基因组中大多数基因座上是基本纯合的。
“植物株系”或“育种株系”是指植物及其后代。本文使用的术语“近交株系”是指已经被反复自交且几乎为纯合的植物株系。因此“近交株系”或“亲本株系”是指已经历过几代(例如至少5、6、7或更多代)近交,产生具有高度均一性的植物株系的植物。
术语“基因”意指包含区域(转录区)的(基因组)DNA序列,其在细胞和可操作连接的调控区(例如启动子)中转录成信使RNA分子(mRNA)。一个实例是本发明的WAP7.1基因。因此,基因的不同等位基因是基因的不同替代形式,其可以是这样的形式:例如在基因组DNA序列(例如启动子序列、外显子序列、内含子序列等)的一个或多个核苷酸、mRNA和/或所编码的蛋白的氨基酸序列中的不同。
“突变型wap7.1等位基因”或“wap7.1等位基因”在本文中是指西瓜7号染色体上的WAP7.1基因的突变型等位基因,当该突变型等位基因为纯合形式时,其导致植物为兼性单性结实。突变型等位基因中的突变可以是任何突变或突变的组合,包括缺失、截短、插入、点突变、无义突变、错义突变或非同义突变、剪接位点突变、移码突变和/或一个或更多个调控序列(如启动子序列或增强子序列或沉默子序列)中的突变。在一个方面,突变型wap 7.1等位基因是WAP7.1基因的突变型等位基因,其中WAP7.1基因是编码SEQ ID NO:1的蛋白质,或编码与SEQ ID NO:1具有至少94%、95%、96%、97%或98%或99%序列同一性的蛋白质的基因(当成对序列比对时)。
“野生型WAP7.1等位基因”或“WAP7.1等位基因”在本文中是指WAP7.1基因的功能等位基因,其导致植物正常结实,需要正常授粉和受精以结实。野生型WAP7.1等位基因在西瓜的任何市售品种(例如Nunhems品种Premium F1、Montreal F1和其他品种)中被发现。在一个方面,野生型WAP7.1等位基因是WAP7.1基因的野生型等位基因,其中WAP7.1基因是编码SEQ ID NO:1的蛋白质,或编码与SEQ ID NO:1具有至少94%、95%、96%、97%或98%序列同一性的蛋白质的基因(当成对序列比对时)。
术语“基因座”(复数形式loci)是指染色体上的一个或更多个特定位置或位点,在此发现例如基因或遗传标记物。因此,WAP7.1基因座是西瓜基因组中发现WAP7.1基因的突变型等位基因和/或野生型等位基因的位置。WAP7.1基因座是位于栽培西瓜7号染色体上的基因座(使用公开的西瓜基因组的染色体定位,该西瓜基因组可在万维网cucurbitgenomics.org的“西瓜:基因组”、“Charleston Grey”或“西瓜97103”处找到),即通过诱变在栽培西瓜基因组中产生wap7.1,并将突变型wap7.1等位基因定位于栽培西瓜7号染色体的确定区域。
“诱导突变型”等位基因是指其中的突变是由人为干预诱导的突变型等位基因,例如通过物理或化学诱变方法或通过例如组织培养进行诱变(如Zhang等人,Plos 9(5)e96879中所述),包括靶向基因编辑技术(如基于Crispr的技术、TALENS等)。
“二倍体植物”是指具有两组染色体(在本文中指定为2n)的植物、营养性植物部位或从中可以生长出二倍体植物的种子。
“DH植物”或“双单倍体植物”是通过使用例如体外技术使二倍体植物的单倍体基因组加倍而产生的二倍体植物。因此,DH植物在所有基因座上都是纯合的。
“三倍体植物”是指具有三组染色体(在本文中指定为3n)的植物、植物营养部位或从中可以生长出三倍体植物的种子。
“四倍体植物”是指具有四组染色体(在本文中指定为4n)的植物、植物营养部位或从中可以生长出四倍体植物的种子。
“多倍体植物”指具有比二倍体更高倍性的植物,即三倍体(3n)、四倍体(4n)、六倍体(6n)、八倍体(8n)等。
“授粉植物”或“授粉者”是指(近交或杂种)二倍体植物,或其部位(例如其花粉或接穗),适合作为诱导三倍体植物结实的授粉者。因此,授粉植物能够通过在适当的白天和适当的时间段产生适当量的花粉而导致正常三倍体植物(包含野生型WAP7.1等位基因的三个拷贝)的良好的结实(和良好的三倍体果实产量)。
“杂种三倍体植物”或“F1三倍体”或“三倍体杂种”是由雄性二倍体亲本与雌性四倍体亲本杂交受精获得的杂种三倍体种子生长的三倍体植物。该父本用于诱导四倍体母本结实和种子产生,导致产生含有F1杂交三倍体种子的果实。用于产生F1三倍体种子的父本和母本都是近交的,使得每个亲本株系几乎是纯合和稳定的。
“无籽果实”是指不含有能存活的成熟种子的果实。果实可以含有一个或更多个小的、可食用的白色胚珠,例如图1所示。任选地,果实可以含有一些棕色或黑色种子,但这些种子是不能存活的。可存活的成熟种子是在适当条件下可以在土壤中发芽并生长成植物的种子。
“种植的(Planting)”或“种植的(planted)”是指通过机器或手播种(直接播种)或将幼苗(小植株)移植到田地中。
“无性繁殖”或“克隆繁殖”是指植物从营养组织的繁殖,例如通过体外繁殖或嫁接方法(使用接穗和根茎)。体外繁殖包括体外细胞或组织培养和从体外培养物再生整个植物。嫁接包括通过嫁接到根茎上繁殖原始植物。因此,可以通过体外培养或嫁接产生原始植物的克隆(即遗传上相同的无性繁殖体)。“细胞培养物”或“组织培养物”是指植物细胞或组织的体外培养物。“再生”是指从细胞培养物或组织培养物或无性繁殖物中发育出植物。“非繁殖细胞”是指不能再生为完整植物的细胞。
“隐性”是指当二倍体基因组中不存在显性等位基因时(即当其在二倍体中是纯合的时)表达其表型(例如单性结实或兼性单性结实)的等位基因。当突变型wap7.1等位基因在二倍体植物中以两个拷贝、任选地在四倍体植物中以四个拷贝或在三倍体植物中以两个或三个拷贝或在另一多倍体中以各自的拷贝数存在时,产生(兼性)单性结实植物。显性等位基因在本文中也称为野生型(WT)等位基因。
“栽培西瓜”或“西瓜(Citrullus lanatus)”在本文中是指普通西瓜亚种(Citrullus lanatus ssp.vulgaris),或西瓜(Citrullus lanatus(Thunb.)Matsum.&Nakai subsp.vulgaris(Schrad.)),并且具有良好的农艺性状,尤其是产生具有良好果实品质和果实均一性的可市售果实。
“野生西瓜”在本文中是指毛西瓜亚种(Citrullus lanatus ssp.lanatus)和黏籽西瓜亚种(Citrullus lanatus ssp.mucosospermus),产生的果实质量和均一性差。
“SNP标记物”是指例如突变型wap7.1等位基因和野生型WAP7.1等位基因之间的单核苷酸多态性。例如SEQ ID NO:5提供了在核苷酸51处包含SNP的序列,通过‘G’(鸟嘌呤)的存在表明野生型WAP7.1等位基因的存在,以及‘A’(腺嘌呤)的存在表明突变型等位基因的存在,其编码SEQ ID NO:2(W1054STOP突变)的蛋白。使用可区分WAP7.1基因的突变型和野生型等位基因的SNP标记物测定(即等位基因特异性测定),可筛选植物、植物部位或其DNA中突变型等位基因和/或野生型等位基因的存在。对于例如表1的任何SNP标记物,可以基于本文提供的序列设计SNP标记物测定。这种SNP标记物测定可用于检测突变型等位基因,例如在标记辅助选择和/或SNP基因分型测定中。因此,使用可区分基因的突变型等位基因和野生型等位基因的SNP标记物测定(例如在等位基因特异性测定中),可筛选植物、植物部位或其DNA中突变型等位基因的存在。
“INDEL标记物”是指例如突变型wap7.1等位基因和野生型WAP7.1等位基因之间的插入/缺失多态性。使用可以区分基因的突变型和野生型等位基因的INDEL标记物测定(例如等位基因特异性测定),可筛选植物、植物部位或其DNA中突变型等位基因的存在。
“基因分型”方法是可以确定植物或植物部位或种子的基因型或等位基因组成的方法。双等位基因分型测定(如KASP测定),可以区分基因座上的两个等位基因。
“栽培西瓜基因组”和“栽培西瓜基因组上的物理位置”以及“7号染色体”是指栽培西瓜的物理基因组,参考基因组可在万维网cucurbitgenomics.org的“西瓜:基因组”,例如“西瓜(Charleston Grey)”和物理染色体以及在染色体上的物理位置。
“包含突变型wap7.1等位基因的染色体区域”是指例如栽培西瓜的7号染色体的基因组区域,该区域携带突变型wap7.1等位基因。等位基因的存在可以通过表型和/或通过与突变型wap7.1等位基因连接的一个或更多个分子标记物(例如SNP标记物、INDEL标记物或其他标记物)或优选区分不同wap7.1等位基因的标记物的存在,或通过等位基因序列本身的基因组序列(例如对等位基因测序)来确定。如果标记物与等位基因物理连接,则其“与wap7.1等位基因连接”。“等位基因特异性标记物”是对特定等位基因(例如特异性突变型等位基因)特异的标记物,并因此区分例如突变型等位基因和野生型等位基因。等位基因特异性标记物优选是等位基因本身中的标记物,即基因的启动子区域或转录区域中,例如基于野生型等位基因序列和突变型等位基因序列之间的多态性。
一对“侧翼标记物”是指两个标记物,优选两个SNP标记物或两个包含SNP标记物的序列,其与wap7.1等位基因连接,和/或与wap7.1等位基因紧密连接,其中wap7.1等位基因位于两个标记物之间或两个包含标记物的序列之间。
“白利糖度(Brix)”或“白利糖度(degree Brix)”或”°白利糖度”是指使用折射计在若干成熟果实上测量的平均总可溶性固体含量。优选地,计算至少3个果实的平均值,每个果实在切开的果实中心和外皮之间进行测量。
与果实品质相关的“可市售的”意指西瓜果实适于被出售用于新鲜食用,具有良好的气味(没有异味),白利糖度至少9.0,优选地至少10.0或至少11.0,并且优选地还具有均一的果肉颜色,例如白色(例如品种Cream of Saskatchewan)、黄色(例如品种YamatoCream 1)、橙色(例如品种Tendersweet)、粉色(例如品种Sadul)、粉红色(例如品种CrimsonSweet)、红色(例如品种Sugar Baby)或暗红色(例如品种Dixie Lee)。
“均一的果肉颜色”意指当从中间(正中切开)切开时,整个成熟果实的颜色均匀地分布在整个果肉中,即不是分布不均的。因此,红色果实在整个果肉中是红色,并且不包含白色斑点。具有均一红色的果实的实例为二倍体品种Premium F1(Nunhems)。
在同一染色体上的基因座之间(例如分子标记物之间和/或表型标记物之间)的“物理距离”为实际距离,其用碱基或碱基对(bp),千碱基或千碱基对(kb)或者兆碱基或兆碱基对(Mb)表示。
通过交叉频率或重组频率(RF)测量在同一染色体上的基因座之间(例如分子标记物之间和/或表型标记物之间)的“遗传距离”,并且用厘摩(cM)表示。1cM相当于约1%的重组频率。如果没有发现重组体,则RF为零,并且所述基因座在物理上非常接近彼此或它们是相同的。两个基因座相距越远,RF越高。
“一致性”或“一致”涉及植物株系或品种的遗传或表型特征。由于近交株系是通过几代近交而产生,因此其在遗传上是高度一致的。同样地,由这种近交株系产生的F1杂种和三倍体杂种在其基因型和表型的特征和表现上也是高度一致的。
赋予性状(例如单性结实)的遗传元件、渐渗片段、或基因或等位基因被称为“可获自”或可以“获自”或“可源自”或可以“源自”或“存在于”或“发现于”植物或种子或组织或细胞(如其可使用传统育种技术从存在其的植物或种子中转移至不存在其的另一植物或种子)(例如非单性结实株系或品种)中,除增加所述遗传元件、基因座、基因渗入片段、基因或等位基因所赋予的性状之外不会导致受体植物的表型改变。所述术语可互换使用,因此可将所述遗传元件、基因座、基因渗入片段、基因或等位基因转移至缺少所述性状的任何其他遗传背景中。含有所述遗传元件、基因座、基因渗入片段、基因或等位基因(例如突变型wap7.1等位基因)的栽培西瓜可从头产生,例如通过诱变(例如化学诱变,CRISPR-Cas诱导等),并然后例如杂交到其它栽培西瓜中。
本文中“平均值”(average)或“平均值”(mean)是指算术平均值,并且这两个术语可以互换使用。因此,术语“平均值”(average)或“平均值”(mean)是指数个测量值的算术平均值。本领域技术人员应理解,植物株系或品种的表型在一定程度上依赖于生长条件,因此优选地在随机实验设计中(在相同实验中的相同条件下,数个重复和适合的对照植物生长),对至少10、15、20、30、40、50或更多株植物(或植物部位)的算术平均值进行测量。“统计学上显著的”或“统计学上显著地”差异或“显著地”差异是指这样的植物株系或品种的特征,即当与适合的对照比较时,其在该特征中表现出与对照(的平均值)的统计学上显著性差异(例如,使用ANOVA时,p值小于0.05,p<0.05)。
在本文中,术语“传统育种技术”包含育种者所有已知的杂交、回交、自交、选择、双单倍体产生、染色体加倍、胚拯救、原生质融合、标记物辅助选择、突变育种等(即除遗传修饰/转化/转基因方法以外的方法),通过这些方法,例如,可获得、鉴定和/或转移包含突变型wap7.1等位基因的7号染色体。
“回交”是指一种育种方法,通过其可将(单一)性状(例如兼性单性结实性状)从一种(通常是劣等的)遗传背景(也称为“供体”)转移到另一种(通常是优良的)遗传背景(也称为“轮回亲本”)。将杂交的子代(通过杂交供体与轮回亲本西瓜获得的F1植物;或由自交F1获得的F2植物或F3植物等)“回交”到具有例如优良遗传背景的亲本中。在反复回交后,一种(通常是劣等的)遗传背景的性状将被掺入到另一种(通常是优良的)遗传背景中。
“标记物辅助选择”或“MAS”是一种利用存在的分子标记物(例如SNP标记或INDEL标记)(其被遗传和物理上(physically)连锁到特定基因座或特定染色体区域或等位基因特异性标记)来选择存在特定基因座或区域或等位基因的植物的方法。例如,遗传和物理上连锁到突变型wap7.1等位基因或等位基因特异性标记的分子标记物可用于检测和/或选择例如包含wap7.1等位基因的西瓜植物或植物部位。分子标记物与基因座的连锁越近,则所述标记物通过减数分裂重组而被从基因座中解离的可能性就越小。同样地,两个标记物彼此连锁得接近,则所述两个标记物彼此分离的可能性就越小(并且它们将作为一个单元被共分离的可能性就越大)。等位基因特异性标记物是优选的标记物,因为它们直接选择等位基因。
另一个标记物(或包含分子标记物的序列)或基因座的5Mb、3Mb、2.5Mb、2Mb、1Mb、0.5Mb、0.4Mb、0.3Mb、0.2Mb、0.1Mb、74kb、50kb、20kb、10kb、5kb、2kb、1kb或更小范围内的分子标记物(或包含分子标记物的序列)是指在物理上位于所述标记物侧翼(即所述标记物的任意一侧)的基因组DNA区域的5Mb、3Mb、2.5Mb、2Mb、1Mb、0.5Mb、0.4Mb、0.3Mb、0.2Mb、0.1Mb、74kb、50kb、20kb、10kb、5kb、2kb、1kb或更小范围内。
“LOD评分”(可能性的对数(底数为10))是指通常用于动物和植物种群中的连锁分析的统计学检验。所述LOD评分比较了如果两个基因座(分子标记物基因座和/或表型形状基因座)的确连锁时,获得的检验数据的可能性与纯粹偶然观察到相同数据的可能性。正的LOD评分支持连锁的存在,并且大于3.0的LOD评分被认为是连锁的证据。+3的LOD评分表明所观察到的连锁并非偶然出现的可能性为1000比1。
“转基因”或“嵌合基因”是指包含DNA序列的遗传基因座,例如重组基因,其已通过转化(例如农杆菌(Agrobacterium)介导的转化)被引入到植物的基因组中。将包含被稳定整合至其基因组中的转基因的植物称为“转基因植物”。
“分离的核酸序列”或“分离的DNA”是指这样的核酸序列,即其不再处于从中分离出其的天然环境中,例如在细菌宿主细胞中或在植物核中或质体基因组中的核酸序列。当在本文中提及“序列”时,应理解提及具有这种序列的分子,例如核酸分子。
“宿主细胞”或“重组的宿主细胞”或“转化的细胞”是这样的术语,即其指由于至少一种核酸分子已经被引入到所述细胞而产生的新个体细胞(或生物体)。所述宿主细胞优选地为植物细胞或细菌细胞。所述宿主细胞可包含作为染色体外(游离基因的)复制分子的核酸,或包含整合至宿主细胞的核或质体基因组中的核酸,或作为引入的染色体(例如微型染色体)的核酸。
可通过使用全局或局部比对算法进行的两个肽或两个核苷酸序列的比对来确定“序列同一性”或“序列相似性”。然后,当通过例如程序GAP或BESTFIT或Emboss程序“Needle”(使用默认参数,参见下文)对序列进行最佳比对时,这些序列共有至少某一最小的序列同一性百分比(如下文进一步定义的)时,所述序列可以被称作“基本相同”或“基本相似”。这些程序使用Needleman和Wunsch全局比对算法来在全长上比对两个序列,最大化匹配数并最小化空位数。通常,使用默认参数,其中空位生成(gap creation)罚分=10,空位延伸(gag extension)罚分=0.5(对于核苷酸和蛋白质比对均如此)。对于核苷酸,使用的默认评分矩阵是DNAFULL,而对于蛋白质,默认评分矩阵是Blosum62(Henikoff&Henikoff,1992,PNAS 89,10915-10919)。例如可以使用计算机程序(例如可在万维网上http://www.ebi.ac.uk/Tools/psa/emboss_needle/获得的EMBOSS)来确定用于序列比对和序列同一性百分比的分数。或者,可以通过搜索数据库(例如FASTA、BLAST等)来确定序列相似性或同一性,但是应检索命中并进行成对序列比对以比较序列同一性。如果百分比序列同一性为至少80%、85%、90%、92%、93%、94%、95%、98%、99%或更多(通过Emboss“Needle”测定,如通过使用默认参数(即,空位生成罚分=10,空位延伸罚分=0.5),对于核苷酸,使用评分矩阵DNAFULL,对于蛋白质,使用评分矩阵Blosum62),则两个蛋白质或两个蛋白质结构域或两个核酸序列具有“基本序列同一性”。
当提到这样的核酸序列(例如DNA或基因组DNA)时,即所述核酸序列与参考序列具有“基本序列同一性”或与参考序列具有至少80%序列同一性,例如,至少85%、90%、91%、92%、93%、94%、95%、98%、99%、99.2%、99.5%、99.9%核酸序列同一性,则在一个实施方案中,所述核苷酸序列被认为是与给定的核苷酸序列基本上相同的,并且可以使用严格杂交条件进行鉴定。在另一个实施方案中,与给定的核苷酸序列相比,所述核酸系列包含一个或多个突变型,但是仍然可以使用严格杂交条件进行鉴定。
“严格杂交条件”可用于鉴定核甘酸序列,其与给定的核苷酸序列基本相同。严格条件是序列依赖性的,并且在不同的环境下是不同的。通常,所选择的严格条件为在确定的离子强度和pH下,低于具体序列的热熔解温度(Tm)约5℃。所述Tm为50%的靶序列杂交至完全匹配的探针时的温度(在确定的离子强度和pH下)。通常选择其中在pH 7下盐浓度为约0.02摩尔且温度为至少60℃的严格条件。降低盐浓度和/或增加温度均会提高严格度。RNA-DNA杂交(使用例如100nt探针的Northern印迹法)的严格条件为,例如包括在63℃下于0.2XSSC中洗涤至少一次,持续20分钟,或等同条件。DNA-DNA杂交(使用例如100nt探针的Southern印迹法)的严格条件为,例如包括在至少50℃(通常约55℃)温度下于0.2X SSC中洗涤至少一次(通常2次),持续20分钟,或等同条件。
在本发明的上下文中,“M1代”或“M1植物”应是指由诱变处理直接产生的第一代。从用诱变剂处理的种子生长出的植物,例如,是M1代的代表。
“M2代”或“M2植物”在本文中应是指从M1代的自花授粉获得的世代。从获自自花授粉的M1植物的种子生长出的植物代表M2植物。M3、M4等指自花授粉后获得的进一步世代。
“等位性检验”指遗传检验,由此可用于检验在两种植物株系或品种中观察到的表型(例如兼性单性结实)是否由相同的基因或基因座决定,或者由不同的基因或基因座决定。例如,将待被检验的植物彼此杂交(优选在自交之后以确保它们是纯合的),确定F1或者进一步自交或回交子代中的表型分离。分离的比例表明基因或基因座是否是等位的,或它们是否是不同的。因此,例如,如果等位基因是相同基因的等位基因,(通过杂交两株纯合植物产生的)F1植物将全部(100%)具有相同表型,而如果等位基因是不同基因的等位基因,就不是这种情况。同样,在F2植物中,表型分离将表明是否涉及相同或不同的基因。
“mRNA编码序列”在本文中应具有通用含义。mRNA编码序列对应于基因/等位基因的相应DNA编码(cDNA)序列,除了胸腺嘧啶(T)被尿嘧啶(U)置换。
核酸分子(DNA或RNA)中的“突变”是与相应的野生型序列相比一个或多个核苷酸的改变,例如通过一个或多个核苷酸的替换、缺失或插入。这种突变的实例是点突变、无义突变、错义突变、剪接位点突变、移码突变或调控序列中的突变。
“核酸分子”应具有本领域中的通用理解。其由包含糖类脱氧核糖(DNA)或核糖(RNA)的核苷酸组成。
“点突变”是单个核苷酸的替换,或单个核苷酸的插入或缺失。
“无义突变”是编码蛋白的核酸序列中的(点)突变,由此核酸分子中的密码子变为终止密码子。这导致在mRNA中存在提前终止密码子并导致截短的蛋白的翻译。截短的蛋白可能具有降低的功能或丧失功能。
“错义或非同义突变”是编码蛋白的核酸序列中的(点)突变,由此一个密码子变为编码不同氨基酸的密码子。所产生的蛋白质可能具有降低的功能或丧失功能。
“剪接位点突变”是编码蛋白的核酸序列中的突变,由此前体mRNA的RNA剪接发生改变,导致mRNA具有与野生型不同的核苷酸序列和蛋白质具有与野生型不同的氨基酸序列。所产生的蛋白可能具有降低的功能或丧失功能。
“移码突变”是编码蛋白质的核酸序列中的突变,由此mRNA的读码框发生改变,产生不同的氨基酸序列。所产生的蛋白质可能具有降低的功能或丧失功能。
本发明上下文中的“缺失”应意指与相应的野生型序列的核酸序列相比在给定核酸序列中的任意位置处缺少至少一个核苷酸,或与相应(野生型)序列的氨基酸序列相比在给定氨基酸序列中的任意位置处缺少至少一个氨基酸。
“截短”应理解为意指与相应野生型序列的核酸序列相比,在核苷酸序列的3'末端或5'末端处缺少至少一个核苷酸,或与相应野生型蛋白的氨基酸序列相比,在蛋白的N-末端或C-末端处缺少至少一个氨基酸,但优选至少10、20、30、40、50、60、70、80、90、100或更多个氨基酸。5'末端由ATG密码子决定,该密码子在相应野生型核酸序列的翻译中用作起始密码子。
“替换”应意指与相应的野生型核酸序列或相应的野生型氨基酸序列相比,核酸序列中的至少一个核苷酸或蛋白序列中的至少一个氨基酸分别是不同的,这是由于各蛋白的编码序列中的核苷酸的交换。
“插入”应意指与相应的野生型核酸序列或相应的野生型氨基酸序列相比,核酸序列或蛋白的氨基酸序列分别包含至少一个额外的核苷酸或氨基酸。
本发明上下文中的“提前终止密码子”意指存在于编码序列(cds)中的终止密码子,其与相应野生型编码序列的终止密码子相比,更接近5'末端的起始密码子。
“调控序列中的突变”,例如在基因的启动子或增强子中,是与野生型序列相比一个或多个核苷酸的改变,例如通过替换、缺失或插入一个或多个核苷酸,导致例如所制备的基因的mRNA转录物减少或没有。
“蛋白质中的突变”是与野生型序列相比一个或多个氨基酸残基的改变,例如,通过替换、缺失、截短或插入一个或多个氨基酸残基。
“突变型蛋白”在本文中是在编码该蛋白的核酸序列中包含一个或更多个突变的蛋白,由此所述突变导致(所述突变型核酸分子编码)“功能降低”或“功能丧失”的蛋白,如例如通过突变型等位基因赋予的表型在体内可测量的。
“野生型三维结构”或“野生型蛋白折叠”是指在体内进行其正常功能的野生型蛋白质的体内折叠。“修饰的三维结构或修饰的蛋白质折叠”是指具有与野生型蛋白质不同的折叠的突变蛋白质,其降低或破坏其正常的体内功能或活性,即蛋白质具有功能降低或功能丧失。
在本发明的上下文中,蛋白的“活性降低”应意指与相应的野生型植物细胞或相应的野生型植物相比时,WAP7.1蛋白的活性降低。在一方面,降低应包括基因表达的完全敲除或敲低,或功能丧失或功能降低的WAP7.1蛋白的产生,例如突变型WAP7.1蛋白与野生型功能WAP7.1蛋白相比,可能功能丧失或功能下降。活性降低可以是编码WAP7.1蛋白的基因表达的降低(也称为敲低),或者编码WAP7.1蛋白的基因表达的敲除和/或细胞中WAP7.1蛋白的量降低,或细胞中WAP7.1蛋白的活性中的功能降低或功能丧失。
在本发明上下文中,术语“野生型植物细胞”或“野生型植物”是指它们包含野生型wap7.1等位基因而不包含突变型wap7.1等位基因。因此,野生型植物或野生型植物细胞是包含全功能WAP7.1基因的植物或植物细胞,所述全功能WAP7.1基因编码全功能WAP7.1蛋白(也称为野生型WAP7.1蛋白),例如对于西瓜植物或植物细胞,二倍体西瓜植物产生SEQ IDNO:1的蛋白质(或与SEQ ID NO:1具有至少94%序列同一性的蛋白质)并且只在授粉后产生果实。
“敲除”或“完全敲除”应理解为各个基因的表达不再是可检测到的。
“功能丧失”或“功能减弱”或“功能降低”在本发明的上下文中应意指尽管可能以与相应的野生型蛋白相同或相似的量存在,但所述蛋白不再发挥其正常作用,即对于编码这样的蛋白的突变型等位基因,当在二倍体植物中以纯合形式存在时,所述植物植物在没有授粉的情况下产生无籽果实,在有授粉的情况下产生有籽果实。
“保守结构域”是指保守的蛋白结构域,例如“锌结合结构域”(或锌结合结构域)、“肽结合结构域”、“Plus3结构域”和“脯氨酸结合结构域”,其可能参与其它基因的转录调节(沉默或激活)中的蛋白质功能。在SEQ ID NO:1的西瓜WAP7.1蛋白中,“锌结合结构域”发现于氨基酸114至159,或在与SEQ ID NO:1具有至少94%、95%、96%或更多序列同一性的蛋白质中的等同氨基酸处。在SEQ ID NO:1的西瓜WAP7.1蛋白中,“肽结合结构域”发现于氨基酸350至395,或在与SEQ ID NO:1具有至少94%、95%、96%或更多序列同一性的蛋白质中的等同氨基酸处。在SEQ ID NO:1的西瓜WAP7.1蛋白中,“Plus3结构域”存在于氨基酸464至572,或在与SEQ ID NO:1具有至少94%、95%、96%或更多序列同一性的蛋白质中的等同氨基酸处。在SEQ ID NO:1的西瓜WAP7.1蛋白中,“脯氨酸结合结构域”存在于氨基酸812至828,或在与SEQ ID NO:1具有至少94%、95%、96%或更多序列同一性的蛋白质中的等同氨基酸处。保守结构域可例如在NCBI的保守结构域数据库中被找到(万维网:ncbi.nlm.nih.gov/cdd)。
“靶向基因编辑”是指可以修饰内源靶基因的技术,例如可以在例如启动子或编码序列中插入、替换和/或缺失一个或更多个核苷酸。例如,基于CRISPR的技术,如Crispr-Cas9基因编辑、Crispr-CpfI基因编辑,或称为“碱基编辑”或“引物编辑”的最新技术可用于修饰内源靶基因,例如西瓜中的内源性野生型Wap7.1基因(编码SEQ ID NO:1的蛋白质,或与SEQ ID NO:1具有至少94%序列同一性的野生型蛋白)。例如,本文所述的突变型可以通过野生型WAP7.1基因的靶向基因编辑来复制。
“寡核苷酸(Oligonucleotides)”或“寡核苷酸(oligo)”或“寡核苷酸引物或探针”是短的单链核酸聚合物,例如长度至少为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24个或更多个核苷酸。寡核苷酸可以是未修饰的或用各种化学方法修饰的,这取决于它们的预期用途,例如,添加5’或3’磷酸基团以分别实现连接或阻断延伸、用放射性核素或荧光团和/或猝灭剂标记以用作探针、掺入硫醇、氨基或其他反应性部分以提供能够共价偶联的功能分子(例如酶),以及用不同官能度的其他接头和间隔基延伸。DNA寡核苷酸是最常用的,但RNA寡核苷酸也是可用的。寡核苷酸的长度通常通过添加后缀-mer来指定。例如,具有19个核苷酸(碱基)的寡核苷酸被称为19-mer。对于大多数用途,寡核苷酸被设计成与DNA或RNA链碱基配对。寡核苷酸最常见的用途是作为PCR(聚合酶链式反应)的引物。引物被设计成其序列的至少一部分与扩增靶序列互补。互补序列的最佳引物长度为例如18至22个核苷酸。PCR的最佳引物序列通常由引物设计软件确定。
“DNA微阵列”是具有许多结合在固相支持物上的DNA(通常是寡核苷酸)的微观斑点的阵列。测定靶标可以是DNA、cDNA或cRNA。根据系统,通过荧光、化学发光或胶体银或胶体金检测靶标与特定斑点的杂交。微阵列用于多种应用,例如同时测量大量基因的表达,使得能够进行全基因组基因表达分析,以及使用例如单核苷酸多态性(SNP)或InDel分析进行基因分型研究。
“互补链”是指两条互补序列链,对于双链DNA可以称为有义(或正)链和反义(或负)链。有义/正链通常是DNA的转录序列(或在转录中产生的mRNA),而反义/负链是与有义序列互补的链。对于本文提供的任何序列,仅给出了该序列的一条链,但本文也包括给定链的互补链。DNA的互补核苷酸是A与T互补,G与C互补。RNA的互补核苷酸是A与U互补,G与C互补。
附图说明
图1:在突变型wap7.1等位基因纯合型的植物上无授粉发育的西瓜果实的横截面照片,所述突变型wap7.1等位基因编码其中SEQ ID NO:6的第7394位处的核苷酸鸟嘌呤被核苷酸腺嘌呤替换的蛋白质,导致密码子TGG(编码W)变为TGA(终止密码子)。SEQ ID NO:1的第1054位处的氨基酸W由此被提前终止密码子替换。
图2:SEQ ID NO:1的西瓜野生型WAP7.1蛋白质(标记为‘WAP7.17.1WT’)和SEQ IDNO:2的突变型截短的WAP7.1蛋白质(标记为‘wap7.1’)的蛋白质成对序列比对(使用EMBOSS–Needle)。蛋白质的保守结构域用下划线标出。
图3:由SEQ ID NO:6编码的西瓜的SEQ ID NO:1的野生型WAP7.1蛋白(标记为‘WAP7.1’)与在cucurbitgenomics.org上公开的由Charleston Grey基因组中的ClCG07G008850.1编码的蛋白质(标记为‘CG’,SEQ ID NO:8)和由在西瓜97103V2基因组上的Cla97C07G135900.1编码的蛋白质(标记为‘97103’;SEQ ID NO:9)的多个序列比对。SEQID NO:1的氨基酸1054处的W以粗体突出显示,如表1的其它突变型。所有三种的基因组序列与SEQ ID NO:6 100%相同。
具体实施方式
本发明的第一个实施方案涉及栽培西瓜植物,西瓜(Citrullus lanatus),其包含至少一个拷贝的当突变型等位基因,当所述突变型等位基因为纯合形式时,其赋予单性结实,尤其是兼性单性结实。因此,在一个方面,本发明提供了栽培西瓜植物,其包含至少一个拷贝的命名为WAP7.1的单个隐性基因的突变型等位基因。
WAP7.1基因是栽培西瓜的内源性基因,当其突变且为纯合形式时导致单性结实,特别是兼性单性结实。
通过将本发明人鉴定的突变型单性结实西瓜植株与优良西瓜株系杂交而形成的分离群体,能够将WAP7.1基因定位到7号染色体上的区域。在两个定位群体中的进一步分析导致了包含突变的基因的鉴定,所述突变导致提前终止密码子和编码蛋白质的截短。SEQID NO:7的基因组序列的核苷酸7394处的单核苷酸变化(鸟嘌呤到腺嘌呤),对应于SEQ IDNO:4的cDNA序列的核苷酸3162的单核苷酸变化(鸟嘌呤到腺嘌呤),导致密码子TGG(编码氨基酸W或Trp或色氨酸)被突变为TGA(翻译终止密码子)。所述突变是该株系独有的,并在93个全基因组重测序株系中没有被发现。所述基因被命名为WAP7.1(对于7号染色体上的西瓜单性结实基因)。为了筛选突变型等位基因的植物,等位基因特异性标记物被设计,在SEQID NO:5中提供。
在突变型单性结实西瓜植物中,在野生型WAP7.1蛋白(SEQ ID NO:1)的氨基酸第1054位的色氨酸(W或Trp)的密码子在突变型蛋白中被终止密码子替换,由此其在氨基酸1053(SEQ ID NO:2)处提前被结束,如图2所示。在突变型等位基因的cDNA中(SEQ ID NO:4),核苷酸3162是腺嘌呤(A),而它在野生型wap7.1 cDNA(SEQ ID NO:3)中是鸟嘌呤(G)。该单核苷酸变化(或SNP,从G→A)导致密码子从密码子TGG(编码Trp或W)变为密码子TGA(终止密码子)。
研究发现,WAP7.1蛋白的这种截短导致所述蛋白在体内无功能或功能降低。因此,这种突变蛋白的纯合型植物(因此缺乏功能性的野生型蛋白)在没有授粉的情况下会发育无籽果实,和当授粉发生时发育正常的有籽果实。当在RaptorX中看到野生型WAP7.1蛋白的蛋白质结构特性预测时(万维网raptorx.uchicago.edu/StructurePropertyPred/predict/),可看到W1054下游的氨基酸含有大量环和α-螺旋,表明C末端蛋白参与整个蛋白质的折叠和功能,解释了为什么没有这些结构会降低或破坏蛋白质功能。
在一个方面,本发明提供了一种西瓜植物或植物部分,其包含至少一个拷贝的命名为WAP7.1的基因的突变型等位基因,其中所述突变型等位基因
a)在调控元件中包含一个或更多个突变,导致与野生型等位基因相比没有表达或表达降低,和/或
b)编码突变型蛋白,其与野生型蛋白相比包含被替换、插入或缺失的一个或多个氨基酸,
其中a)或b)的所述突变型等位基因在当突变型等位基因为纯合形式时,赋予兼性单性结实,并且其中所述野生型西瓜等位基因编码SEQ ID NO:1的蛋白质或与SEQ ID NO:1具有至少94%、95%、96%或更多序列同一性的蛋白质。
西瓜的野生型功能性WAP7.1蛋白在SEQ ID NO:1(西瓜)中提供。然而,西瓜内可存在一些氨基酸序列变异和功能性WAP7.1蛋白可包含例如至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个氨基酸,其与本文提供的SEQ ID NO:1中的不同,或者由此蛋白质与SEQ ID NO:1的蛋白质具有至少94%、95%、96%、97%、98%、99%或99.3%、99.4%、99.5%或99.6%、99.7%、99.8%或99.9%的序列同一性(当使用例如Emboss-Needle进行成对序列比对时)。例如,SEQ ID NO:8或9的WAP7.1蛋白可为功能性的,尽管不清楚它们是否真实的还是由于数据库中的错误。
因此,在一个方面,SEQ ID NO:1的西瓜蛋白的功能性变体是与SEQ ID NO:1的蛋白质具有至少94%、95%、96%、97%、98%、99%或99.3%、99.4%、99.5%或99.6%、99.7%、99.8%或99.9%的序列同一性的蛋白质,当成对序列比对时(使用例如默认参数的Needle)。在一个方面,氨基酸序列变异是在四个保守结构域之外发现的,其为锌结合结构域、肽结合结构域、Plus3结构域和脯氨酸结合基序。在一个方面,功能蛋白,其与SEQ IDNO:1的蛋白质具有至少94%、95%、96%、97%、98%、99%或99.3%、99.4%、99.5%或99.6%、99.7%、99.8%或99.9%的序列同一性,因此在图2中提到并显示(下划线)的四个保守结构域中,包含与SEQ ID NO:1100%同一性的氨基酸。
由于所述四个保守结构域在物种内高度保守,因此预测这四个保守结构域的任何一个中的任何突变(缺失、插入和/或替换至少1、2、3、4、5个或更多个氨基酸)导致突变型WAP7.1蛋白在体内功能降低或无功能,由此在例如二倍体植物中,突变型等位基因为纯合形式时导致兼性单性结实表型。
因此,在锌结合结构域、肽结合结构域、Plus3结构域或脯氨酸结合基序中插入、缺失和/或替换的一个或更多个氨基酸将负面影响蛋白质功能。
因此,在一个方面,本发明提供了一种西瓜植物或植物部位,其包含至少一个拷贝的命名为WAP7.1的基因的突变型等位基因,其中所述突变型等位基因编码突变型蛋白,该蛋白包含起始于SEQ ID NO:1(西瓜)的氨基酸114并终止于氨基酸159的蛋白锌结合结构域中插入、缺失或替换的一个或多个氨基酸,或包含与SEQ ID NO:1至少94%序列同一性的变体WAP7.1蛋白中的等同氨基酸,并且其中当所述突变型等位基因为纯合形式时,所述突变型等位基因赋予兼性单性结实。
因此,在另一个方面,本发明提供了一种西瓜植物或植物部位,其包含至少一个拷贝的命名为WAP7.1的基因的突变型等位基因,其中所述突变型等位基因编码突变型蛋白,该蛋白包含起始于SEQ ID NO:1(西瓜)的氨基酸350并终止于氨基酸395的蛋白肽结合结构域中插入、缺失或替换的一个或多个氨基酸,或包含与SEQ ID NO:1具有至少94%序列同一性的变体WAP7.1蛋白中的等同氨基酸,并且其中所述突变型等位基因为纯合形式时,所述突变型等位基因赋予兼性单性结实。
在另一个方面,本发明提供了一种西瓜植物或植物部位,其包含至少一个拷贝的命名为WAP7.1的基因的突变型等位基因,其中所述突变型等位基因编码突变型蛋白,该蛋白包含起始于SEQ ID NO:1(西瓜)的氨基酸464并终止于氨基酸572的蛋白Plus3结构域中插入、缺失或替换的一个或多个氨基酸,或包含与SEQ ID NO:1具有至少94%序列同一性的变体WAP7.1蛋白中的等同氨基酸,并且其中所述突变型等位基因为纯合形式时,所述突变型等位基因赋予兼性单性结实。
在又另一个方面,本发明提供了一种西瓜植物或植物部位,其包含至少一个拷贝的命名为WAP7.1的基因的突变型等位基因,其中所述突变型等位基因编码突变型蛋白,该蛋白包含起始于SEQ ID NO:1(西瓜)的氨基酸812并终止于氨基酸828的蛋白脯氨酸结合基序中插入、缺失或替换的一个或多个氨基酸,或包含与SEQ ID NO:1具有至少94%序列同一性的变体WAP7.1蛋白中的等同氨基酸,并且其中所述突变型等位基因为纯合形式时,所述突变型等位基因赋予兼性单性结实。
术语“起始于”和“终止于”或“从”和“至”包括提到的第一个和最后一个氨基酸。
因此,锌结合结构域、肽结合结构域、Plus3结构域或脯氨酸结合基序中一个或更多个氨基酸的插入、缺失和/或替换,可为至少1、2、3、4、5、6、7、8、9、10个或更多个氨基酸的插入、缺失和/或替换。
在又另一个方面,本发明提供了一种西瓜植物或植物部位,其包含至少一个拷贝的命名为WAP7.1的基因的突变型等位基因,其中所述突变型等位基因编码突变型蛋白,该蛋白包含SEQ ID NO:1或变体WAP7.1蛋白中被插入、缺失和/或替换的至少10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200个或更多个氨基酸,或包含与SEQ ID NO:1具有至少94%序列同一性的蛋白质,并且其中所述突变型等位基因为纯合形式时,所述突变型等位基因赋予兼性单性结实。因此,突变型WAP7.1蛋白可例如在N末端或C末端被截短,在N末端或C末端缺乏所述至少10个或更多氨基酸,或者与野生型功能性WAP7.1蛋白相比,可被缺失、替换或插入任何其他至少10个氨基酸。
在又另一个方面,本发明提供了一种西瓜植物或植物部位,其包含至少一个拷贝的命名为WAP7.1的基因的突变型等位基因,其中所述突变型等位基因编码突变型蛋白,该蛋白包含在SEQ ID NO:1或变体WAP7.1蛋白中插入、缺失和/或置换的至少1、2、3、4、5、6、7、8或9个或更多个氨基酸,或包含与SEQ ID NO:1具有至少94%序列同一性的蛋白质,并且其中所述突变型等位基因为纯合形式时,所述突变型等位基因赋予兼性单性结实。因此,与野生型功能性WAP7.1蛋白相比,突变型WAP7.1蛋白可包含至少1个被缺失、替换或插入的氨基酸。例如,被缺失或替换的氨基酸(例如通过终止密码子或不同的氨基酸)可为R346、S324、P830、A328、Q373或W1054,如表1所示。
突变型等位基因可通过各种技术产生,如随机诱变或靶向基因编辑,然后可以在突变型等位基因纯合型的植物中分析体突变型等位基因的表型。
任何导致野生型功能蛋白的一个或多个氨基酸的插入、缺失和/或替换的突变型等位基因可导致突变型蛋白质具有功能降低或无功能,并因此当突变型等位基因为纯合形式时,可导致兼性单性结实的表型。包含这种突变型等位基因的植物和植物部位是本文的一个实施方案。
‘等同氨基酸’可容易地通过氨基酸序列比对来确定,例如参见图3,其中等同氨基酸用粗体突出显示。
密码子中的突变可以是密码子中(至少一个)核苷酸插入、缺失或替换,导致例如不同的阅读框或不同的密码子,例如编码不同的氨基酸或终止密码子。另外,整个密码子可被缺失或被不同的密码子(或任选地终止密码子)替换,导致编码的氨基酸或缺失或其替换。
在一个方面,突变型等位基因编码SEQ ID NO:1的氨基酸编号W1054的氨基酸置换或终止密码子,或编码与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的蛋白质中的等同氨基酸的氨基酸取代或终止密码子。
在一个方面,突变型等位基因编码SEQ ID NO:1的氨基酸编号R346的氨基酸置换或终止密码子,或编码与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的蛋白质中的等同氨基酸。
在一个方面,突变型等位基因编码SEQ ID NO:1的氨基酸编号S324的氨基酸置换或终止密码子,或编码与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的蛋白质中的等同氨基酸。
在一个方面,突变型等位基因编码SEQ ID NO:1的氨基酸编号P830的氨基酸取代或终止密码子,或与编码SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的蛋白质中的等同氨基酸。
在一个方面,突变型等位基因编码SEQ ID NO:1的氨基酸编号A328的氨基酸取代或终止密码子,或编码与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的蛋白质中的等同氨基酸。
在一个方面,突变型等位基因编码SEQ ID NO:1的氨基酸编号Q373的氨基酸取代或终止密码子,或编码与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的蛋白质中的等同氨基酸。
在一个方面,突变型等位基因编码突变型WAP7.1蛋白,所述突变型WAP7.1蛋白在SEQ ID NO:1的蛋白质的C末端处或与SEQ ID NO:1具有至少94%序列同一性的蛋白质的C末端处包含至少10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、213个氨基酸的截短。在一个方面,起始于(和包括)SEQ ID NO:1的氨基酸W1054的所有氨基酸,或与SEQ ID NO:1具有至少94%序列同一性的蛋白质中的等同氨基酸,被缺失或被一个或更多个不同的氨基酸替换。在另一个方面,起始于(和包括)SEQ IDNO:1的氨基酸Q373的所有氨基酸,或与SEQ ID NO:1具有至少94%序列同一性的蛋白质中的等同氨基酸,被缺失或被一个或更多个不同的氨基酸替换。
如前所述,西瓜植物或种子或植物部位可包含突变型wap7.1等位基因,其中所述突变型等位基因是通过随机诱变或靶向诱变,如基于CRISPR的方法产生。随机诱变可例如是化学诱导(如EMS处理)或辐射诱导诱变或其他方法,由此突变在基因组中被随机诱导,然后可筛选和鉴定在内源性wap7.1基因中包含突变的植物或植物部位。靶向诱变是指使用如Crispr-Cas9或Crispr-CpfI或其他已知的方法,将突变特异性地引入到靶基因,如wap7.1基因的方法。需要指出的是,使用这样的方法,例如表1中描述的突变型等位基因可以在没有过度负担的情况下产生,或者可以产生其它突变型等位基因。
当在本文中提及西瓜植物时,其在一个方面包括所述植物可从其生长的种子,即种子中的胚可包含至少一个拷贝的所述突变型wap7.1等位基因。
在一个方面,包含所述突变型等位基因的植物并不是专门地由基本生物学方法产生的,这意味着所述突变型等位基因在某一点上是通过人类干预生成的。如果这种人类产生的突变型等位基因通过杂交和筛选从一种植物转移到另一种植物,那么该专利就涵盖了包含所述突变型等位基因的植物,即使所述植物本身是仅仅通过杂交和筛选产生的。优选所述植物不是转基因的,并且例如,在靶向基因编辑的情况下,用于修饰内源基因的任何构建体已从基因组中移除。此外,植物优选不是转基因植物,因为突变型wap7.1等位基因没有使用植物转化技术从外部引入并整合到植物基因组中的任何地方,而是突变型等位基因是内源性野生型WAP7.1等位基因,其在野生型等位基因所位于的基因组中的基因座处发生突变(使用靶向或随机诱变)。
在一个方面,所述西瓜植物是二倍体的,并包含至少一个拷贝的如上所述的突变型wap7.1等位基因,即植物是杂合的。由于表型只有在突变型等位基因为纯合形式时才能被看到,这些植物不是兼性单性结实,而是在授粉时产生正常的有籽果实,在没有花的授粉情况下没有果实。这种杂合植物的自交将产生纯合型植物,并且其包含突变型等位基因的两个拷贝。在一个方面,所述西瓜植物是二倍体的,并包含两个拷贝的上述突变型wap7.1等位基因,即所述植物是纯合的。因此,所述植物也是兼性单性结实,在没有授粉的情况下产生无籽果实,且如果授粉发生产生有籽果实。
包含至少一个拷贝的突变型wap7.1等位基因的植物和植物部位优选栽培植物,而不是野生植物。所以优选栽培西瓜(Citrullus lanatus)。所述植物可为近交株系、F1杂种或育种株系。
在一个方面,所述植物是西瓜植物,并且所述西瓜植物是二倍体、三倍体或四倍体,其包含至少一个拷贝的突变型wap7.1等位基因。所述二倍体植物或植物部位在一个方面包含两个拷贝,所述三倍体植物或植物部位包含一个、两个或三个拷贝,以及所述四倍体植物或植物部位包含两个或四个拷贝的突变型wap7.1等位基因。
在本文中还包括可从其生长上述植物或植物部位的种子。
同样,由上述植物产生的果实也包括在本文中,任选地其中所述果实是无籽的且是在没有授粉的情况下产生。
所述植物或植物部位可进一步包含赋予雄性不育的基因或赋予种子败育的基因或另一种赋予单性结实的基因。
该植物部分可为细胞、花、叶、茎、插条、胚珠、花粉、根、根茎、接穗、果实、原生质体、胚、花药。
本发明进一步提供了一种从植物部位繁殖的无性繁殖植物,并且在其基因组中包含至少一个拷贝的突变型wap7.1等位基因。
在一个方面还提供了一种产生无籽西瓜果实的方法,所述方法包含种植包含两个拷贝的所述突变型wap7.1等位基因的二倍体西瓜植物,由此在种植期间防止花的授粉。防止授粉可以通过各种方法进行,例如去除雄花或雄性生殖器官(雄蕊、花粉),在无昆虫环境中种植和/或植物的雄性不育。
在另一个方面,提供了一种生产无籽西瓜果实的方法,所述方法包含种植包含一个、两个或三个拷贝的所述突变型wap7.1等位基因的三倍体西瓜植物,由此在种植期间无授粉者植物。
提供了一种筛选或检测或基因分型植物、种子、植物部分或其DNA中命名为WAP7.1的基因的突变型等位基因的存在,或选择包含命名为WAP7.1的基因的突变型等位基因的植物、种子或植物部分,或产生包含命名为WAP7.1的基因的突变型等位基因的植物、种子或植物部分的方法,其中所述突变型等位基因
a)在调控元件中包含一个或更多个突变,导致与野生型等位基因相比没有表达或表达降低,和/或
b)编码一个突变型蛋白,其包含与野生型蛋白相比被置换、插入和/或缺失的一个或多个氨基酸,
其中所述野生型西瓜等位基因编码SEQ ID NO:1的蛋白质或与SEQ ID NO:1具有至少94%序列同一性的蛋白质。
在一个方面,突变型wap7.1等位基因包含基因组DNA中的突变,导致包含如上所述插入、缺失或替换的一个或更多个氨基酸的突变型WAP7.1蛋白的表达,例如SEQ ID NO:1的W1054(或与SEQ ID NO:1具有至少94%同一性的序列中的等同氨基酸)或例如表1中所示。
然而,WAP7.1基因的不同突变型等位基因,其在纯合形式时导致兼性单性结实也是本发明的实施方案。这种不同的突变型wap7.1等位基因可由技术人员在没有过度负担的情况下产生。技术人员可例如产生WAP7.1基因中的其他突变型,并确定它们在二倍体西瓜植物中以纯合形式时是否同样会导致兼性单性结实。
已经鉴定了基因的核苷酸序列,技术人员可以通过各种方法,例如诱变、TILLING或CRISPR-Cas或本领域已知的其他方法,产生包含WAP7.1基因中的突变型的西瓜植物。特别是用靶向基因修饰技术,例如Crispr-Cas、TALENS及其他,本领域技术人员可在例如基因的启动子或编码序列中进行靶向突变。然后,技术人员可确认突变型wap7.1等位基因纯合型的植物的表型,即为兼性单性结实。因此,技术人员不限于由本发明人产生的特异性WAP7.1突变型(技术人员也可产生),技术人员同样可以在西瓜的wap7.1等位基因中产生其他突变并由此产生其他在纯合形式时导致兼性单性结实的突变型。各种突变可被产生并被测试产生的表型,例如调控元件可被突变以降低等位基因的表达(敲低)或消除表达(敲除)并因此降低或消除细胞或植物中存在的野生型WAP7.1蛋白的量。或者,导致WAP7.1蛋白功能降低或功能丧失的突变可被产生,即导致一个或更多个氨基酸被置换、插入和/或缺失的突变(如错义突变或移码突变),或由此蛋白质通过在编码序列中引入提前终止密码子被截短(无义突变)。由于WAP7.1蛋白包含四个保守结构域,因此在一个方面包括在这些结构域中的任一个中一个或更多个氨基酸被替换、缺失和/或插入,因为这样突变可能会降低蛋白功能或导致功能丧失。所述突变是否导致预期的表型(兼性单性结实),可然后通过自交产生所述突变的纯合型植物,并在有花授粉和无花授粉的情况下种植所述植物株系,以观察果实是否以兼性单性结实的方式发育来测试。
或者,技术人员可进行一种产生兼性单性结实栽培西瓜植物的方法,其包括以下步骤:
a)在西瓜植物(的群体)或种子,特别是栽培植物中引入突变,或提供突变植物(的群体)或种子或其后代;
b)选择在不对雌花授粉的情况下产生无籽果实并在对雌花授粉后产生有籽果实的植物;
c)任选地确定b)中选择的植物是否包含WAP7.1基因的突变型等位基因;以及
d)任选地种植c)中获得的植物。
步骤b)和c)也可交换,因此步骤b)是选择包含WAP7.1基因的突变型等位基因的植物,步骤c)是确定所述植物(或通过自交产生的其后代)是否在不对雌花授粉的情况下产生无籽果实,并在对雌花授粉后产生有籽果实。
步骤a)可以通过例如诱变一个或更多个西瓜株系或品种的种子进行,例如用诱变剂如化学诱变剂,例如EMS(乙基甲烷磺酸盐),或用紫外辐射、X射线或伽马射线或类似的照射处理。所述群体可例如是TILLING群体。优选地,在进行步骤b)之前,诱变植物群体至少自交一次(例如产生M2代,或M3、M4等)。在与表型有关的步骤b)中,植物优选生长在防虫环境中,以避免昆虫授粉者的存在。可进行雌花的定期目视检验、那些没有授粉的花的结实和成熟果实的目视检验(例如,有活力的种子或无籽的存在)以鉴定在没有雌性花的授粉的情况下产生无籽果实的突变型。这样的植物或其自交后代可通过以下检测突变型WAP7.1基因的存在:对雌花授粉来看授粉后果实是否有籽,对植物进行WAP7.1基因和编码蛋白突变的基因分型,或WAP7.1基因的表达,测序和本领域技术人员已知的其它方法。因此,有各种方法或方法的组合,用于验证表型选择的植物是否包含WAP7.1基因的突变型等位基因。如果步骤b)是选择包含WAP7.1基因的突变型等位基因的植物,技术人员还可使用各种方法检测WAP7.1基因的DNA、mRNA或蛋白质,以鉴定包含突变型wap7.1等位基因的植物。编码功能性的WAP7.1蛋白(SEQ ID NO:1)的野生型西瓜wap7.1基因的基因组DNA是SEQ ID NO:6的DNA以及编码SEQ ID NO:1的蛋白质的cDNA(mRNA)在SEQ ID NO:3中给出。启动子在这个序列的上游,例如可以通过测序或从西瓜基因组数据库中检索。由于编码某一蛋白质的基因组序列可能有轻微差别(例如由于遗传密码的简并性或由于内含子序列中的变化),编码野生型WAP7.1蛋白的基因组等位基因可与SEQ ID NO:6具有至少90%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性。
在一个方面,所述WAP7.1基因的所述突变型等位基因是导致WAP7.1基因表达降低或无表达的突变型等位基因,或者是导致编码的WAP7.1蛋白与野生型WAP7.1蛋白相比一个或多个氨基酸被替换、插入或缺失的突变型等位基因。
在一个方面,所述WAP7.1基因的所述突变型等位基因可通过将突变(靶向的或随机的)诱导到基因(启动子或其它调控元件、剪接位点、编码区等)中,并选择例如来自子代的包含突变型wap7.1等位基因的植物而获得。在一个方面,选择包含密码子特别是锌结合结构域的密码子、或肽结合结构域的密码子、或Plus3结构域的密码子、或脯氨酸结合基序的密码子中突变的等位基因,例如,导致氨基酸替换、移码或终止密码子的突变。在一个方面,所述突变型等位基因导致编码的西瓜WAP7.1蛋白的截短。
在一个方面,在西瓜植物或植物部位的基因组中或其DNA中检测到SEQ ID NO:5的核苷酸51处的SNP标记物腺嘌呤(A)(标记物mWM23348403)。该SNP标记物检测西瓜中包含W1054STOP突变的等位基因。在另一个方面,在西瓜植物或植物部位的基因组或其DNA中检测表1所示的SNP标记物,以检测表1所示的突变型等位基因,其引起相对于SEQ ID NO:1的野生型蛋白的氨基酸变化,或与SEQ ID NO:1具有至少94%、95%、96%、97%或更多序列同一性的野生型蛋白中的等同氨基酸变化。
对于其他突变型wap7.1等位基因,可很容易地设计类似的SNP标记物(或其他标记物)和SNP基因分型(或其他基因分型)分析。因此,在本文中包括等位基因特异性标记物和检测方法,特别是对于导致西瓜WAP7.1蛋白的保守结构域之一中氨基酸插入、缺失或替换的任何突变型等位基因,但也包括其他突变型等位基因。
特别是在一个方面,可确定标记物mWM23348403的基因型,并将其用于选择包含SEQ ID NO:5的核苷酸51处的腺嘌呤并因此包含突变型wap7.1等位基因的后代植物,其中编码的WAP7.1蛋白被截短并缺少SEQ ID NO:1的氨基酸1053的下游(C末端)的所有氨基酸(或与SEQ ID NO:1具有至少94%同一性的序列的等同氨基酸)。其他突变型等位基因(如表1所示)的类似等位基因特异性标记物可由技术人员容易地设计并用于基因分型分析或用于育种项目的选择。
wap7.1杂合型的二倍体植物(即wap7.1/WAP7.1)将是SNP标记物杂合型,例如将具有SEQ ID NO:5的核苷酸51的基因型‘AG’(即植物包含在SEQ ID NO:5的核苷酸51处具有腺嘌呤A或在与SEQ ID NO:5具有至少92%、93%、94%、95%、96%、97%、98%或更多的序列同一性的序列的核苷酸51处具有腺嘌呤A的一个染色体和在SEQ ID NO:5的核苷酸51处具有鸟嘌呤G的第二染色体或在与SEQ ID NO:5具有至少92%、93%、94%、95%、96%、97%、98%或更多序列同一性的序列的核苷酸51处具有鸟嘌呤G的第二染色体),而wap7.1纯合型的植物(即wap7.1/wap7.1)将具有SEQ ID NO:5的核苷酸51的基因型‘AA’(即所述植物包含两条染色体,所述两条染色体均在SEQ ID NO:5的核苷酸51处或在与SEQ ID NO:5具有至少92%、93%、94%、95%、96%、97%、98%或更高序列同一性的序列的核苷酸51处具有腺嘌呤A)。
所述标记物mWM23348403是基于SEQ ID NO:6的野生型WAP7.1基因的基因组DNA中的核苷酸7394(鸟嘌呤)诱导突变为腺嘌呤(G7394→A)而设计的,由此密码子TGG(编码Trp或W)变为编码终止密码子的密码子TGA,导致翻译停止和截短的WAP7.1蛋白。因此,SEQ IDNO:6的基因组WAP7.1序列的核苷酸7394对应于SEQ ID NO:5的标记物mWM23348403的核苷酸51。
对于任何突变型wap7.1等位基因(例如表1中所示的那些),突变型等位基因特异性标记物和标记物分析同样容易开发,因为潜在的基因组变化,例如在密码子中,可用于设计标记物分析,以检测基因组变化,例如本文公开潜在的的氨基酸变化或与野生型WAP7.1等位基因相比突变型wap7.1中的其他基因组变化。
使用这种等位基因特异性标记物,其检测特异性突变型wap7.1等位基因,可进行基因分型以检测植物和植物材料(或其衍生的DNA)中等位基因的存在和拷贝数。因此,在二倍体中,当突变型等位基因是纯合形式时,上述突变型wap7.1等位基因的标记物基因型(西瓜中蛋白质的潜在的W1054STOP变化)是‘AA’。在三倍体或四倍体中,标记物基因型可用于确定突变型等位基因的拷贝数。因此,例如,如果三倍体中存在三个拷贝,基因型可以是AAA;如果四倍体中存在四个拷贝,基因型可以是AAAA;如果三倍体中存在两个拷贝,基因型可以是AAG,等等。
植物和植物部位
在一个实施方案中,本发明提供了栽培西瓜植物,或其部位(例如细胞、组织、器官、果实等),其包含至少一个拷贝的命名为WAP7.1的基因的突变型等位基因,当所述突变型等位基因为纯合形式时,所述突变型等位基因赋予兼性单性结实。
在一个方面,突变型等位基因是西瓜基因的突变型等位基因,其编码SEQ ID NO:1的WAP7.1蛋白,或包含与SEQ ID NO:1至少94%、95%、96%、97%或98%序列同一性的蛋白(野生型功能蛋白),由此所述突变型等位基因表达降低或无表达,或由此所述突变型等位基因编码与野生型蛋白相比包含一个或更多个氨基酸替换、插入和/或缺失的突变型WAP7.1蛋白质。
在一个实施方案中,所述一个或更多个氨基酸替换、插入或缺失包含四个保守结构域中的一个或更多个中的一个或更多个氨基酸的替换、插入或缺失,或由其组成。与野生型蛋白相比(并且因此与包含野生型WAP7.1基因的野生型植物相比),突变型蛋白功能降低或功能丧失,优选地,包含纯合形式的突变型等位基因的植物细胞或植物是兼性单性结实的。
当在本文中提及具体核苷酸或氨基酸位置时,例如在SEQ ID NO:1的氨基酸1054,“或在包含与SEQ ID NO至少94%、95%、96%、97%、98%或99%序列同一性的序列的氨基酸1054处”(或‘在包含与……至少94%序列同一性的序列的等同位置处’),这是指核苷酸或氨基酸在变体序列中存在于对应于在变体序列中(即在包含与提及的SEQ ID NO至少94%、95%、96%、97%、98%或99%序列同一性的序列中)的相同核苷酸或氨基酸(例如对应于SEQ ID NO:1的氨基酸1054)。例如,变体序列可能短一个或几个核苷酸或氨基酸长度,但当将变体序列与所述SEQ ID NO进行成对序列比对时,可以看出变体序列的哪个核苷酸或氨基酸对应于相同的核苷酸或氨基酸。在变体序列中,这可以是例如SEQ ID NO:8中氨基酸1045或SEQ ID NO:9中氨基酸1082,其对应于SEQ ID NO:1的氨基酸1054(参见图3)。
突变型等位基因是栽培西瓜内源基因中的突变。赋予兼性单性结实的基因的存在使技术人员能够在该基因中(例如在任何栽培株系或品种中)产生其他从头突变型。
本领域技术人员可以例如通过实施用于在突变型群体中产生和/或鉴定WAP7.1突变型的方法或通过WAP7.1基因的靶向基因编辑,在没有过度负担的情况下产生本发明的植物。
如上所述,由于WAP7.1基因已被鉴定为是正常情况下编码SEQ ID NO:1(野生型西瓜蛋白)的蛋白质的基因,非单性结实西瓜植物,与本发明人产生的突变型相同或其他的突变型可以从头产生。
由于野生型、功能性WAP7.1蛋白中可能存在天然变异,因此野生型WAP7.1蛋白不需要与SEQ ID NO:1具有100%同一性,但可能与SEQ ID NO:1具有稍低的序列同一性,例如当与SEQ ID NO:1进行全长成对序列比对时,为至少94%、95%、96%、97%、98%、99%或99.5%或99.6%、99.7%、99.8%或99.9%。然而,在一个方面,保守锌结合结构域、和/或保守肽结合结构域、和/或保守Plus3结构域、和/或保守脯氨酸结合结构域与SEQ ID NO:1具有100%同一性,因此至少94%同一性的变异位于一个或更多个或所有保守结构域之外。在另一个方面,在SEQ ID NO:1的功能性野生型蛋白中至少94%序列同一性的变异位于3Plus结构域和脯氨酸结合基序之间和/或脯氨酸结合基序之后(在蛋白质的C-末端部分中)。
如上所述,当植物为突变型等位基因纯合型时,WAP7.1蛋白编码基因的突变型等位基因导致植物在无授粉的情况下产生无籽果实,而在存在授粉的情况下产生有籽果实,尤其是突变型等位基因纯合型的二倍体植物,和任选地包含至少一个、两个或三个拷贝的突变型等位基因的三倍体植物或包含至少两个或四个拷贝的突变型等位基因的四倍体植物。关于本发明的实施方案,WAP7.1蛋白编码基因的突变型等位基因中的突变可以是任何突变,包括缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变和/或调控序列中的突变。在一个方面,WAP7.1蛋白编码基因的突变型等位基因中的突变是点突变。所述突变可以发生在包含WAP7.1蛋白编码基因的编码序列的DNA序列中,或发生在编码WAP7.1蛋白的RNA序列中,或者可以发生在WAP7.1蛋白的氨基酸中。关于WAP7.1蛋白编码基因的DNA序列,所述突变可以发生在编码序列中,或可以发生在非编码序列中,如WAP7.1蛋白编码基因的5’-和3’-非翻译区、启动子、增强子等。关于编码WAP7.1蛋白的RNA,所述突变可以发生在mRNA前体或mRNA中。在一个方面,突变型等位基因导致蛋白质由于一个或更多个氨基酸被替换、插入和/或缺失而功能丧失或功能降低,例如导致一个或更多个氨基酸在蛋白质的C末端处或在蛋白质的一个或更多个保守结构域中被替换、插入和/或缺失。例如,截短蛋白质以引起野生型蛋白的C-末端的至少10、15、20、25、30、40、50、100、150、200个或更多氨基酸的缺失将产生引起兼性单性结实的突变型蛋白,如W1054STOP突变型蛋白所示。
同样,由于任何保守结构域全部或部分缺失或被一个或更多个不同氨基酸替换的突变将导致蛋白质的功能丧失或功能降低。
例如,终止密码子突变,例如在任何保守结构域之前或在保守结构域之一中的N末端部分,导致截短的蛋白质具有功能降低或功能丧失。
同样,在任何保守结构域之前或在保守结构域之一中的N末端部分中的氨基酸插入、缺失或替换可导致蛋白质具有功能降低或功能丧失。
当等位基因在例如二倍体植物中为纯合形式时,可以分析任何突变型等位基因的表型,以观察植物是否确实变为兼性单性结实。
因此,本发明的一个实施方案涉及本发明的植物细胞或植物,其包含WAP7.1蛋白编码基因的突变型等位基因,其特征在于所述突变型等位基因包含或影响选自以下的一个或更多个突变:
a)基因组序列中的缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变;
b)一个或更多个调控序列中的突变;
c)编码序列中的缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变;
d)mRNA前体或mRNA中的缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变;
e)WAP7.1蛋白中一个或更多个氨基酸的缺失、截短、插入或替换。
在一个方面,突变型等位基因导致WAP7.1基因表达降低或不表达,或突变型等位基因编码功能降低或功能丧失的蛋白质。
表达降低或无表达是指在WAP7.1基因的调控区(例如启动子)中存在突变,由此与包含野生型WAP7.1等位基因的植物和植物部位相比,导致WAP7.1等位基因的mRNA转录物减少或无mRNA转录物。表达的降低可以例如通过测量编码WAP7.1蛋白的mRNA转录物的量来确定,例如使用Northern印迹分析或RT-PCR。在本文中,降低优选地是指与包含野生型WAP7.1基因的植物或植物部位相比,RNA转录物的量降低至少50%,特别是至少70%,任选地至少85%或至少95%,或甚至100%(无表达)。可以在例如幼叶组织或子房组织中分析表达。
在一个方面,与野生型蛋白相比,所述蛋白质包含一个或更多个替换、插入或缺失的氨基酸。因此,对于西瓜,与SEQ ID NO:1的野生型WAP7.1蛋白或与SEQ ID NO:1具有至少94%、95%、96%、97%或98%序列同一性的野生型WAP7.1蛋白相比,插入、缺失或替换了一个或更多个氨基酸;由此与野生型蛋白相比,突变型蛋白功能降低或功能丧失,因此当突变型等位基因以纯合形式存在于二倍体植物中时,导致兼性单性结实。
在一个方面,野生型WAP7.1蛋白包含保守锌结合结构域。因此,在一个方面,突变型等位基因是基因WAP7.1的突变型等位基因,该基因编码SEQ ID NO:1(西瓜)的野生型蛋白或与SEQ ID NO:1具有至少94%、95%、96%、97%或98%序列同一性的野生型蛋白,并且由此野生型蛋白包含SEQ ID NO:1的氨基酸114至159的保守锌结合结构域。
在一个方面,野生型WAP7.1蛋白包含保守肽结合结构域。因此,在一个方面,突变型等位基因是基因WAP7.1的突变型等位基因,该基因编码SEQ ID NO:1(西瓜)的野生型蛋白或与SEQ ID NO:1具有至少94%、95%、96%、97%或98%序列同一性的野生型蛋白,并且由此野生型蛋白包含SEQ ID NO:1的氨基酸350至395的保守肽结合结构域。
在一个方面,野生型WAP7.1蛋白包含保守Plus3结构域。因此,在一个方面,突变型等位基因是基因WAP7.1的突变型等位基因,该基因编码SEQ ID NO:1(西瓜)的野生型蛋白或与SEQ ID NO:1具有至少94%、95%、96%、97%或98%序列同一性的野生型蛋白,并且由此野生型蛋白包含SEQ ID NO:1的氨基酸464至572的保守Plus3结构域。
在一个方面,野生型WAP7.1蛋白包含保守脯氨酸结合基序。因此,在一个方面,突变型等位基因是基因WAP7.1的突变型等位基因,该基因编码SEQ ID NO:1(西瓜)的野生型蛋白或与SEQ ID NO:1具有至少94%、95%、96%、97%或98%序列同一性的野生型蛋白,并且由此野生型蛋白包含SEQ ID NO:1的氨基酸812至828的保守脯氨酸结合基序。
在一个方面,野生型WAP7.1蛋白包含保守的锌结合结构域和肽结合结构域和Plus3结构域和脯氨酸结合基序,即功能性野生型蛋白的任何变异在这些保守结构域之外。
上述野生型等位基因的突变型等位基因在一个方面是表达降低或无表达(通过例如启动子或增强子元件中的突变)或产生突变型蛋白的突变型等位基因,该突变型蛋白与野生型蛋白相比包含一个或更多个插入、缺失或替换的氨基酸,由此突变型蛋白在体内具有功能降低或无功能,如确定当突变型等位基因在植物中为纯合形式时,以及通过分析植物是否在无授粉(单性结实)的情况下产生果实,例如当生长在无昆虫的环境中时,以及(雌)花尽管未授粉也产生果实。当(雌)花被授粉时,可以测试植物是否产生正常的有籽果实。如果突变型等位基因在体内引起兼性单性结实,而仅包含野生型WAP7.1等位基因的对照植物不是兼性单性结实,则突变型蛋白与野生型蛋白相比功能降低或无功能。对于基因表达降低或无基因表达的突变型等位基因,可以进行相同的表型分析。因此,可以使植物中的任何突变型等位基因纯合,并且可以比较表型与包含原始的、未突变的等位基因的对照植物。
发现锌结合结构域、肽结合结构域、Plus3结构域和脯氨酸结合基序是保守的蛋白质结构域,其最可能在其它野生型、功能性WAP7.1变体中也是100%相同的,因为它们将是植物中蛋白质正常功能所需的。因此,通过插入、缺失或替换一个或更多个氨基酸来突变一个或更多个这些保守结构域将降低或破坏WAP7.1蛋白的体内功能。
因此,在一个方面,本文提供的植物包含编码WAP7.1蛋白的突变WAP7.1等位基因,所述WAP7.1蛋白包含在锌结合结构域、肽结合结构域、Plus3结构域和/或脯氨酸结合基序中插入、缺失或置换的一个或更多个氨基酸。
被突变为包含一个或更多个插入、替换或缺失的氨基酸的野生型功能性WAP7.1蛋白选自SEQ ID NO:1的C1WAP7.1或与SEQ ID NO:1具有至少94%同一性的蛋白质,由此所述野生型蛋白质包含SEQ ID NO:1的锌结合结构域、肽结合结构域、Plus3结构域和/或脯氨酸结合基序。
包含导致任一保守结构域中的中一个或更多个氨基酸变化的移码的突变型蛋白或包含导致任一保守结构域中一个或更多个氨基酸缺失的截短的突变型蛋白在此被包括为体内功能降低或无功能的突变蛋白。
因此,在一个方面,本发明提供了编码突变型蛋白的突变型C1WAP7.1等位基因,其中SEQ ID NO:1的W1054(或与SEQ ID NO:1具有至少94%同一性的序列)被另一个氨基酸替换或缺失,例如密码子被终止密码子替换。
因此,在一个方面,本发明提供了编码突变型蛋白的突变型ClWAP7.1等位基因,其中SEQ ID NO:1的R346(或与SEQ ID NO:1具有至少94%同一性的序列)被另一个氨基酸替换或缺失,例如密码子被终止密码子替换。
因此,在一个方面,本发明提供了编码突变型蛋白的突变型ClWAP7.1等位基因,其中SEQ ID NO:1的S324(或与SEQ ID NO:1具有至少94%同一性的序列)被另一个氨基酸替换或缺失,例如密码子被终止密码子替换。
因此,在一个方面,本发明提供了编码突变型蛋白的突变型ClWAP7.1等位基因,其中SEQ ID NO:1的P830(或与SEQ ID NO:1具有至少94%同一性的序列)被另一个氨基酸替换或缺失,例如密码子被终止密码子替换。
因此,在一个方面,本发明提供了编码突变型蛋白的突变型ClWAP7.1等位基因,其中SEQ ID NO:1的A328(或与SEQ ID NO:1具有至少94%同一性的序列)被另一个氨基酸替换或缺失,例如密码子被终止密码子替换。
因此,在一个方面,本发明提供了编码突变型蛋白的突变型ClWAP7.1等位基因,其中SEQ ID NO:1的Q373(或与SEQ ID NO:1具有至少94%同一性的序列)被另一个氨基酸替换或缺失,例如密码子被终止密码子替换。
当本文提及从一个氨基酸到另一个氨基酸的氨基酸时,这包括所提及的起始/第一个和末端/最后一个氨基酸。
当提及氨基酸被“缺失”时,其包括密码子变为终止密码子或密码子被缺失的突变,或存在导致氨基酸不被编码的移码的突变。同样,当提及氨基酸被“替换”时,其包括密码子编码不同氨基酸的突变,或插入密码子的突变,或存在导致编码不同氨基酸的移码的突变。
包含至少一个拷贝的突变型wap7.1等位基因的植物和植物部位可以是葫芦科(Cucurbitaceae)植物,尤其是栽培物种,例如西瓜(Citrullus lanatus)。本文还包括包含两个拷贝的突变型wap7.1等位基因的葫芦科植物和植物部位,尤其是包含两个拷贝的突变型wap7.1等位基因的西瓜,由此包含两个拷贝的突变型WAP7.1等位基因的二倍体植物导致植物表现出兼性单性结实表型。
在一个方面,突变型wap7.1等位基因在二倍体植物细胞或植物中(例如在二倍体西瓜植物中)是杂合的。在另一方面,突变型wap7.1等位基因在二倍体植物细胞或植物中是纯合的。
植物细胞和植物优选地是栽培植物,例如优良育种株系或品种,而非野生植物。西瓜可以是任何类型的西瓜。
包含至少一个拷贝的突变型wap7.1等位基因的西瓜植物及其部位可以是二倍体、四倍体或三倍体。在另一方面,它可以是另一种多倍体,例如五倍体、六倍体、七倍体、八倍体等。包含四个拷贝的wap7.1的四倍体植物可以例如用于通过染色体加倍制备八倍体。将所述八倍体与wap7.1纯合型的二倍体杂交将产生包含五个拷贝的wap7.1的五倍体。在一个方面,多倍体西瓜植物包含至少一个拷贝的突变型wap7.1等位基因,但它也可以包含更多拷贝,例如在优选的方面,三倍体植物包含两个或三个拷贝的突变型wap7.1等位基因,或四倍体包含两个或四个拷贝的突变型wap7.1等位基因。
因此,二倍体植物可以具有基因型wap7.1/WAP7.1(突变型等位基因杂合型)或wap7.1/wap7.1(突变型等位基因纯合型)。在一个方面,包含纯合形式的wap7.1等位基因的二倍体植物是双单倍体植物(DH),例如双单倍体西瓜植物或植物细胞或植物部位。DH植物可以通过单倍体细胞的染色体加倍(例如通过秋水仙素处理)制备。
三倍体西瓜植物可以具有基因型wap7.1/WAP7.1/WAP7.1或wap7.1/wap7.1/WAP7.1或wap7.1/wap7.1/wap7.1。具有wap7.1/WAP7.1/WAP7.1基因型的三倍体植株可通过将野生型雌性四倍体(WAP7.1/WAP7.1/WAP7.1/WAP7.1)与突变型等位基因纯合型的二倍体雄性(wap7.1/wap7.1)杂交制备。基因型wap7.1/wap7.1/WAP7.1的三倍体植物可通过将雌性四倍体(wap7.1/wap7.1/wap7.1/wap7.1)与野生型等位基因纯合型的二倍体雄性(WAP7.1/WAP7.1)杂交制备。
四倍体西瓜植物可以具有基因型wap7.1/WAP7.1/WAP7.1/WAP7.1或wap7.1/wap7.1/WAP7.1/WAP7.1或wap7.1/wap7.1/wap7.1/WAP7.1或wap7.1/wap7.1/wap7.1/wap7.1。基因型wap7.1/wap7.1/WAP7.1/WAP7.1可通过二倍体wap7.1/WAP7.1染色体加倍制备。基因型wap7.1/wap7.1/wap7.1/wap7.1可通过二倍体wap7.1/wap7.1染色体加倍来制备。另外两种基因型,wap7.1/WAP7.1/WAP7.1/WAP7.1和wap7.1/wap7.1/wap7.1/WAP7.1例如可通过杂交基因型wap7.1/wap7.1/WAP7.1/WAP7.1的两种四倍体制备并鉴定后代中的基因型。
在一个方面,西瓜植物是wap7.1纯合型的,在另一方面,它是wap7.1杂合型的。在一个方面,它是近交株系或品种。在另一方面,它是F1杂种。
本文还包括可生长所述西瓜植物中任何一种的种子,以及所述植物的部位,例如在无授粉的情况下产生的无籽果实、花、细胞、根、根茎、接穗、叶、茎、无性繁殖体、插条、种子繁殖体(例如,自交系)和体外细胞或组织培养物,以及花粉、子房等。
包含突变型wap7.1等位基因的二倍体西瓜植物
在一个方面,西瓜植物是二倍体株系(例如近交株系)或品种,其包含wap7.1的至少一个突变型拷贝,优选两个突变型拷贝(即wap7.1纯合型)。当防止雌花授粉时,wap7.1纯合型的二倍体植物将产生无籽的果实。当授粉确实发生时,果实将结籽。
为了防止授粉,可以例如在无昆虫的环境中种植植物。然而,也可以产生雄性不育的二倍体植物。因此,在本发明的一方面,本发明提供了wap7.1纯合的二倍体植物,并且其是雄性不育的。雄性不育是指植物不能产生有功能的花药、花粉或雄配子。在西瓜中已经鉴定出几个雄性不育基因,包括ms-1基因。ms-1核基因控制雄性不育,并且在具有纯合形式的ms-1基因的植物中(ms-1是隐性的),花药的正常发育受到阻碍,而雌花发育正常。所述基因会抑制花粉的产生。ms-1基因的标记物和包含该基因的植物记载于EP2959771,以及数据库PINTO提到Seminis的品种Bonta或Bonta F1是所述专利的植物。ms-1基因同样已记载于Zhang等人1996(HortScience 31(1):123-126)。ms-1基因位于西瓜的6号染色体上,因此可以容易地与7号染色体上的wap7.1结合。
因此,在一个方面,本发明的二倍体植物和植物部分是雄性不育的和/或包含雄性不育基因。如果雄性不育基因是隐性基因,则植物和植物部分优选包含纯合形式的基因。在一个方面,西瓜植物包含ms-1基因,优选为纯合形式。因此,在一个方面,二倍体西瓜植物在7号染色体上包含纯合形式的突变型wap7.1基因(wap7.1/wap7.1),并且例如如果雄性不育基因是隐性的(例如ms-1/ms-1),还包含纯合形式的雄性不育基因,例如ms-1,或者任选地如果雄性不育是显性的,则为杂合形式。一种优选的植物是wap7.1纯合型和ms-1纯合型的二倍体植物。
确保本发明的植物,特别是二倍体西瓜植物,在任何时候(不仅在无授粉的情况下)都产生无籽果实的另一种方式是将纯合形式的wap7.1基因与赋予种子败育的基因组合,使得如果授粉确实发生,尽管授粉,果实也将是无籽的。在一个方面,种子败育基因是称为emb1的隐性基因。野生型和突变型Emb1基因已经记载于待审申请EP16171462.1中。Emb1基因编码一种细胞周期蛋白SDS样蛋白。当突变型等位基因emb1是纯合形式时,导致种子败育。“种子败育”是指诱导结实和发育需要授粉,但果实不产生成熟或有活力的种子。由于种子发育受阻或胚珠和/或胚和/或胚乳降解或胚珠和/或胚和/或胚乳在达到成熟之前的败育,在种子败育的植物中不发育成熟或有活力的种子。因此,当突变型emb1等位基因(emb1/emb1)纯合型的二倍体植物自花授粉或被来自另一植物的花粉授粉时,它们产生无籽的二倍体果实。
因此,在一个方面,二倍体西瓜植物在7号染色体上包含纯合形式的wap7.1基因(wap7.1/wap7.1),并且例如如果种子败育基因是隐性的(例如emb1/emb1),进一步包含纯合形式的种子败育基因,例如emb1,或者任选地如果种子败育基因是显性的,则其为杂合形式。一种优选的植物是wap7.1纯合型且emb1纯合型的二倍体植物。
emb1的一个突变型等位基因可以获自西瓜种子,所述西瓜种子对于细胞周期蛋白SDS样蛋白编码基因(也称为Emb1基因)(由Nunhems B.V.以NCIMB 42532保藏)的突变型等位基因是杂合的或纯合的。在所述种子中,25%含有编码SEQ ID NO:28的突变型等位基因(参见SEQ ID NO:27)。Emb1基因的野生型等位基因可以获自对于野生型细胞周期蛋白SDS样蛋白编码基因(由Nunhems B.V.以NCIMB 42532保藏)是杂合或纯合的西瓜种子。在所述种子中,25%含有编码SEQ ID NO:26的野生型蛋白的纯合形式的SEQ ID NO:25的野生型等位基因。Emb1基因的其他突变型等位基因可以例如通过诱变或通过本领域技术人员已知的其他方法从头产生。如SEQ ID NO:25所示的基因组Emb1核苷酸序列编码西瓜的野生型细胞周期蛋白SDS样蛋白,其具有如SEQ ID NO:26所示的氨基酸序列。如SEQ ID NO:27所示的mRNA序列和如SEQ ID NO:28所示的突变型蛋白是在保藏于NCIMB42532的种子中发现的突变型emb1等位基因。
当植物是突变型等位基因纯合型时,emb1的突变型等位基因导致植物雄性可育但产生无籽果实。Emb1基因中的突变可以是任何突变,包括缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变和/或调控序列中的突变。优选地,所述突变是点突变和/或剪接位点突变。所述突变可以发生在包含细胞周期蛋白SDS样蛋白编码基因(Emb1基因)的编码序列的DNA序列中或发生在编码细胞周期蛋白SDS样蛋白的RNA序列中,或者它可以发生在细胞周期蛋白SDS样蛋白(或Emb1蛋白)的氨基酸中。关于细胞周期蛋白SDS样蛋白编码基因的DNA序列,所述突变可以发生在编码序列(cds,由外显子组成)中,或者可以发生在非编码序列中,如细胞周期蛋白SDS样蛋白编码基因的5’-和3’-非翻译区、内含子、启动子、增强子等。对于编码细胞周期蛋白SDS样蛋白的RNA,所述突变可以发生在mRNA前体或mRNA中。
分离细胞周期蛋白SDS样蛋白编码基因的突变型等位基因的植物的二倍体西瓜种子已经由Nunhems B.V.根据布达佩斯条约在2016年1月27日以登录号NCIMB 42532保藏于NCIMB Ltd.,Ferguson Building,Craibstone Estate Bucksburn Aberdeen AB21 9YA,Scotland,UK。对于种子保藏,将细胞周期蛋白SDS样蛋白编码基因的等位基因命名为emb1。
保藏的种子获自emb1突变型等位基因纯合型的植物与emb1野生型等位基因纯合型的植物的自花授粉回交。因此,25%的保藏种子是emb1突变型等位基因纯合的并产生无籽果实,50%是突变型等位基因杂合的,25%是野生型等位基因纯合的,所述野生型等位基因编码野生型细胞周期蛋白SDS样蛋白。
因此,在一个方面,本发明涉及二倍体西瓜植物或植物部位,其包含至少一个拷贝的突变型wap7.1等位基因,优选两个拷贝,和至少一个拷贝的突变型emb1等位基因,优选两个拷贝的突变型emb1等位基因。在一个方面,突变型emb1等位基因是在以NCIMB 42532保藏的种子中发现的等位基因。
本文还包括可从中生长出所述二倍体植物的种子,以及所述植物的部位,例如包括二倍体无籽果实、花、叶、茎、无性繁殖体、细胞、插条、种子繁殖体(例如自交系)和体外细胞或组织培养物,以及花粉、子房、根茎、接穗等。因此,在一个实施方案中,二倍体植物、或可生长出植物的种子、或植物的组织或部位(花粉、花药、胚珠)包含如上所述的突变型wap7.1等位基因或不同的突变型wap7.1等位基因。
在一个方面,所述二倍体植物包含两个拷贝的突变型wap7.1等位基因,其由于SEQID NO:1的氨基酸1054处的终止密码子而编码SEQ ID NO:2的截短蛋白,或其编码包含与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同氨基酸密码子处的终止密码子的截短蛋白。
在一个方面,所述二倍体植物包含两个拷贝的突变型wap7.1等位基因,其由于SEQID NO:1的氨基酸373处的终止密码子而编码SEQ ID NO:10的截短蛋白,或其编码包含与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同氨基酸密码子处的终止密码子的截短蛋白。
在一个方面,所述二倍体植物包含两个拷贝的突变型wap7.1等位基因,其编码在氨基酸346处包含K的SEQ ID NO:11的突变型蛋白,或其编码在与SEQ ID NO:11具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同位置处的K的突变型蛋白。
在一个方面,所述二倍体植物包含两个拷贝的突变型wap7.1等位基因,其编码在氨基酸324处包含N的SEQ ID NO:12的突变型蛋白,或其编码在与SEQ ID NO:12具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同位置处的N的突变型蛋白。
在一个方面,所述二倍体植物包含两个拷贝的突变型wap7.1等位基因,其编码在氨基酸830处包含S的SEQ ID NO:13的突变型蛋白,或其编码在与SEQ ID NO:13具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同位置处的S的突变型蛋白。
在一个方面,所述二倍体植物包含两个拷贝的突变型wap7.1等位基因,其编码在氨基酸328处包含T的SEQ ID NO:14的突变型蛋白,或其编码在与SEQ ID NO:14具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同位置处的T的突变型蛋白。
在一个方面,所述二倍体植物包含两个拷贝的编码表1的突变型蛋白的突变型wap7.1等位基因。
在一个方面,所述二倍体植物包含两个拷贝的SEQ ID NO:7的突变型wap7.1等位基因。
包含突变型wap7.1等位基因的四倍体西瓜植物
无籽三倍体西瓜的产生包括使用二倍体父本植物的花粉使四倍体母本植物的花受精。用二倍体花粉对四倍体花授粉产生三倍体的F1种子(Kihara,1951,Proceedings ofAmerican Society for Horticultural Science58:217-230;Eigsti 1971,Hort Science6:1-2)。由所述F1种子生长的三倍体杂种植物是自交不育的,因为它们由于染色体不平衡而产生不育的花粉。因此,三倍体杂种通常需要通过二倍体授粉者授粉以产生西瓜果实。
然而,根据本发明,包含一个、两个或三个拷贝的突变型wap7.1基因的三倍体植物在无授粉的情况下产生果实,并且不再需要授粉者植物存在。因此,本文包括例如在田地中、在不存在传粉者植物和/或不存在(可育)花粉的情况下种植这样的三倍体西瓜植物以产生无籽果实的方法。
因此,在本发明的一方面,提供了用作母本的包含优选四个拷贝的隐性wap7.1等位基因的四倍体植物和用作父本的包含优选两个拷贝的隐性wap7.1等位基因的二倍体植物,以及通过二倍体父本与四倍体母本杂交产生的三倍体F1杂种(包含优选三个拷贝的突变型wap7.1等位基因)。
为了产生所述四倍体植物,可以使用上述二倍体植物中的任何一种(优选是wap7.1纯合的)作为起始材料来生成四倍体植物。本领域技术人员已知的染色体加倍技术可用于通过所述二倍体植物产生四倍体植物。例如Noh等人.(2012)Hort.Environ.Biotechnol.53(6):521-529评估了生成四倍体西瓜的不同诱导方法。在所有方法中,使用抗有丝分裂剂(如秋水仙碱、二硝基丙氨酸或氨磺乐灵(oryzalin))以诱导染色体加倍。任选地,组织培养可用于通过植物部分产生四倍体植物。为了验证植株是否为四倍体,可以确认染色体数目。倍性可通过染色体计数或流式细胞术或其他已知方法容易地确定(Sari等人.1999,Scientia Horticulturae 82:265–277,通过引用的方式纳入本文)。
因此,在本发明的一方面,提供了西瓜物种的四倍体栽培西瓜植物,其中所述植物包含两个或优选四个拷贝的突变型wap7.1等位基因(如上所述),四条7号染色体的每一条上各一个。
以上针对突变型wap7.1等位基因描述的所有实施方案同样适用于四倍体。因此,例如四倍体植物可包含所述的四个拷贝的wap7.1等位基因,或如上文进一步描述的四个拷贝的不同突变型wap7.1等位基因。
因此,在一个方面,本发明包括包含一个、两个、三个或四个拷贝的命名为WAP7.1的基因的突变型等位基因的四倍体西瓜植物或植物部位,所述WAP7.1编码SEQ ID NO:1的蛋白质或与SEQ ID NO:1具有至少94%、95%、96%、97%或98%序列同一性的蛋白质。关于上文针对包含一个或两个拷贝的突变型wap7.1等位基因的二倍体西瓜植物描述的突变型wap7.1等位基因的方面适用于四倍体植物和植物部位。因此,例如,在一个方面,突变型等位基因导致WAP7.1基因表达降低或不表达,或者突变型等位基因编码功能降低或功能丧失的突变型WAP7.1蛋白。
在一个方面,所述四倍体植物包含两个或优选四个拷贝的编码SEQ ID NO:2的突变型蛋白的突变型wap7.1等位基因。
在一个方面,所述四倍体植物包含两个或优选四个拷贝的突变型wap7.1等位基因,其由于SEQ ID NO:1的氨基酸1054处的终止密码子而编码SEQ ID NO:2的截短蛋白,或其编码包含与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同氨基酸密码子处的终止密码子的截短蛋白。
在一个方面,所述四倍体植物包含两个或优选四个拷贝的突变型wap7.1等位基因,其由于SEQ ID NO:1的氨基酸373处的终止密码子而编码SEQ ID NO:10的截短蛋白,或其编码包含与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同氨基酸密码子处的终止密码子的截短蛋白。
在一个方面,所述四倍体植物包含两个或优选四个拷贝的突变型wap7.1等位基因,其编码在氨基酸346处包含K的SEQ ID NO:11的突变型蛋白,或其编码在与SEQ ID NO:11具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同位置处的K的突变型蛋白。
在一个方面,所述四倍体植物包含两个或优选四个拷贝的突变型wap7.1等位基因,其编码在氨基酸324处包含N的SEQ ID NO:12的突变型蛋白,或其编码在与SEQ ID NO:12具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同位置处的N的突变型蛋白。
在一个方面,所述四倍体植物包含两个或优选四个拷贝的突变型wap7.1等位基因,其编码在氨基酸830处包含S的SEQ ID NO:13的突变型蛋白,或其编码在与SEQ ID NO:13具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同位置处的S的突变型蛋白。
在一个方面,所述四倍体植物包含两个或优选四个拷贝的突变型wap7.1等位基因,其编码在氨基酸328处包含T的SEQ ID NO:14的突变型蛋白,或其编码在与SEQ ID NO:14具有至少94%、95%、96%、97%、98%或99%序列同一性的序列中的等同位置处的T的突变型蛋白。
在另一个方面,所述四倍体植物包含两个或四个拷贝的编码表1的突变型蛋白的突变型wap7.1等位基因。
在一个方面,所述四倍体植物包含两个或优选四个拷贝的SEQ ID NO:7的突变型wap7.1等位基因。
四倍体植物或植物部位(细胞、叶、DNA等)的基因分型可以以与二倍体相同的方式进行,例如使用KASP测定来区分SNP基因型,例如包含SEQ ID NO:5的核苷酸51处的标记物mWM23348403的AAAA(检测编码SEQ ID NO:2的蛋白质的四个突变型wap7.1等位基因,包含W1054STOP突变)的植物或部位可区别于在其基因组的SEQ ID NO:5的51位核苷酸处的mWM23348403包含GAAA(检测编码SEQ ID NO:2的蛋白质的三个突变型等位基因)、GGAA(检测编码SEQ ID NO:2的蛋白质的两个突变型等位基因)、GGGA(检测编码SEQ ID NO 2的蛋白质的一个突变型等位基因)或GGGG(检测编码SEQ ID NO:1的蛋白质的四个野生型等位基因)的植物或部分。这同样适用于其他等位基因特异性标记物,如例如表1的SNP标记物。
在本发明的一个方面,提供了包含至少一个或两个或三个拷贝的突变型wap7.1等位基因(如上所述),优选包含四个拷贝的突变型wap7.1等位基因(如上所述)的四倍体西瓜。优选地,西瓜植物是四倍体近交雌性株系,适合作为F1杂种种子产生的亲本。
四倍体雌性近交株系的生成可以通过使用二倍体植物来进行,所述二倍体植物包含一个或优选两个拷贝的wap7.1等位基因以使染色体加倍并生成四倍体植物。例如,wap7.1纯合型的二倍体近交株系可用于产生四倍体植物。
包含突变型wap 7.1等位基因的四个拷贝的四倍体植物将表达表型,即兼性单性结实。
本文还包括可从中生长出所述四倍体植物的种子,以及所述植物的部位,例如在无授粉的情况下产生的四倍体无籽果实、花、叶、茎、插条、无性繁殖体、细胞、种子繁殖体(例如自交系)和体外细胞或组织培养物,以及本文包括花粉、子房、根茎、接穗等。因此,在一个实施方案中,四倍体植物、或可生长出植物的种子、或植物的组织或部位(花粉、花药、胚珠)包含如上所述的突变型wap 7.1等位基因。
四倍体可以包含不同的突变型wap 7.1等位基因,例如编码截短的WAP7.1蛋白的两个突变型wap7.1等位基因和编码具有氨基酸置换的WAP7.1蛋白的两个突变型wap7.1等位基因。所述植物可以例如通过首先制备包含不同突变型wap7.1等位基因的二倍体,然后使所述二倍体的染色体加倍来制备。然而,在一个方面,四倍体包含四个拷贝的相同的突变型wap7.1等位基因,即四倍体由wap7.1等位基因纯合型的二倍体制成。
包含突变型wap7.1等位基因的三倍体西瓜植物
在另一方面,本发明提供了包含一个、两个或三个拷贝的突变型wap7.1等位基因的三倍体西瓜种子、植物和植物部位,即分别为wap7.1/WAP7.1/WAP7.1或wap7.1/wap7.1/WAP7.1或wap7.1/wap7.1/wap7.1。所述三倍体可以如上所述制备,并且如下表2所示:
表2:
在一个方面,将包含四个拷贝的突变型wap 7.1等位基因的四倍体植物用作母本,用包含两个拷贝的突变型wap 7.1等位基因的二倍体父本的花粉授粉,并收获杂交产生的种子。所述种子是三倍体,并且它们包含三个拷贝的本发明的突变型wap7.1等位基因(表2,A行)。由所述种子生长的植物产生无籽西瓜果实(三倍体果实)而不需要授粉来诱导结实。由所述F1三倍体种子生长的三倍体杂种植物是自交不育的,因为它们由于染色体不平衡而产生不育的花粉。因此,所述种子可以在生产田中生长而不需要授粉植物。这是第一次在无花粉和授粉植物的情况下产生无籽三倍体西瓜果实。
在一个方面,上述A中的三倍体包含三个相同的突变型wap7.1等位基因,即母本和父本包含相同的突变型等位基因。然而,在另一方面,母本和父本可包含不同的突变型wap7.1等位基因。例如,母本可包含编码截短的WAP7.1蛋白的四个突变型wap7.1等位基因,父本可包含编码具有氨基酸置换的WAP7.1蛋白的两个突变型wap7.1等位基因。
在一个方面,本文所述的赋予兼性单性结实的突变型wap7.1等位基因与赋予单性结实、特别是赋予兼性单性结实的另一突变型等位基因组合。所述另一突变型等位基因是例如WO 2018/060444中记载的wop1等位基因,其位于4号染色体上(其也称为wap4.1)。在一个方面,突变型wap7.1等位基因与突变型wop1等位基因在二倍体、三倍体或四倍体西瓜植物中组合。由于wop1在不同的染色体上,可以在wop1和wap7.1之间进行不同的组合,例如在三倍体西瓜中各三个突变型拷贝的wop1和wap7.1,或者在三倍体西瓜中一个或两个突变型拷贝的wop1和三个突变型拷贝的wap7.1,或者相反等。
三倍体无籽果实优选可市售的。优选它们具有至少6.0、7.0、8.0或优选至少9.0、优选至少10.0、更优选至少11.0的平均白利糖度。果实可以是任何大小、形状、颜色和外皮花纹。优选成熟时的果肉颜色是均匀的。在一个方面,果肉是红色或暗红色的。
包含三个拷贝的wap7.1的三倍体杂种的平均果实重量可以等于或高于2、3、4、5、6、7、8、9、10、11、12、13或14kg。在另一个实施方案中,包含三个拷贝的wap7.1的三倍体杂种的平均果实重量可以等于或小于5kg,例如4、3、2、1.5或1kg或甚至更小。
无籽果实可以是任何形状(例如伸长的、椭圆形的、块状的、球形的或圆形的)、果实表面(有皱纹的、光滑的)、果肉颜色(红色、暗红色、猩红色、珊瑚红色、橙色、浅橙色、粉色、粉红色、黄色、淡黄色或白色)、外皮颜色(例如浅绿色;深绿色;绿色,具有窄、中或宽条纹;灰色类型(grey types);有或无斑点;金黄色)、外皮厚度、外皮韧性、外皮花纹(例如条纹、无条纹、网状)、果肉结构/果肉硬度、番茄红素和/或维生素含量、不同的糖酸比、果实风味等。
因此,突变型wap7.1等位基因可用于通过传统育种培育一系列无籽品种,产生不同形状和大小的果实等。参见Guner和Wehner 2004,Hort Science 39(6):1175-1182,特别是1180-1181页记载了果实特征的基因。通常重要的育种目标是早熟、高果实产量、高果实内部品质(良好的均匀颜色、高糖、适当的糖酸比、良好的风味、高维生素和番茄红素含量、坚实的肉质、非纤维的肉质、没有空心、外皮坏死、脐腐症、十字裂缝(cross stitch)等缺陷、良好的外皮特性和抗裂性)。
可以生长出所述三倍体F1杂种植物的种子是本发明的一方面。因此,在一个方面,用于种植三倍体西瓜植物/产生无籽西瓜果实的方法包含以下步骤:播种或种植在其基因组中包含一个、两个或三个突变型wap7.1等位基因的三倍体西瓜植物,任选地防止花的授粉(例如通过雄性不育、无授粉者和/或无花粉),并收获在无授粉的情况下发育为单性结实的无籽西瓜果实。原则上,不需要防止授粉,因为三倍体果实无论如何都会产生无籽果实。不同之处在于包含突变型wap7.1等位基因的三倍体不再需要花粉来诱导果实发育,因此栽培区域可以完全被三倍体植物占据,并且不再需要间作授粉者植物。
对于包含两个拷贝的突变型wap7.1等位基因的二倍体西瓜植物,还提供了产生无籽果实的方法。因此,在一个方面,用于种植二倍体西瓜植物/产生无籽西瓜果实的方法包含以下步骤:播种或种植在其基因组中包含两个拷贝的突变型wap7.1等位基因的三倍体西瓜植物,防止花的授粉(例如通过雄性不育、无授粉者和/或无花粉),并收获在无授粉的情况下发育为单性结实的无籽西瓜果实。对于二倍体栽培,有必要防止雌花授粉,否则果实将含有籽。可以通过各种方法或其组合来防止授粉,例如在受保护的无花粉环境中种植植物,确保植物雄性不育和/或不产生花粉,在花粉产生和雌花开放中形成时间差,去除雄花等。
关于仅包含一个或两个拷贝的本发明的突变型wap7.1等位基因的三倍体种子和三倍体植物(如上表2中B和C行所示),表型尚未被测试,但它们也可能适合于在无授粉时产生无籽果实,并且它们也可以在没有授粉者植物的田地中生长。在任何情况下,所述三倍体植物和可以生长出所述植物的种子是本发明的一方面,其部分和由所述植物产生的三倍体果实也是本发明的一方面。优选地,所述三倍体果实是可市售的。优选它们具有至少6.0、7.0、8.0或优选至少9.0、优选至少10.0、更优选至少11.0的平均白利糖度。果实可以是任何大小、形状、颜色和外皮花纹。优选成熟时的果肉颜色是均匀的。在一个方面,果肉是红色或暗红色的。
在一个方面,本发明的三倍体植物是无性繁殖体。
本发明还提供了产生三倍体杂交西瓜种子的方法,其中由所述种子生长出的三倍体植物在无授粉的情况下产生果实,所述方法包含:
(a)提供兼性单性结实二倍体西瓜植物和兼性单性结实四倍体植物(参见例如表2,A行),
(b)使用二倍体植物的花粉对四倍体植物的雌花授粉,以及
(c)收获在四倍体植物的果实中产生的种子,以及任选地
(d)干燥收获的种子。
然后任选地,包装干燥和收获的F1种子。它们也可以在包装之前进行处理。因此,包含通过上述方法获得的种子或由通过上述方法获得的种子组成的包装或容器是本文的一个实施方案。
本发明还提供了产生三倍体杂交西瓜种子的方法,所述方法包含:
(a)提供缺乏突变型wap7.1等位基因的二倍体西瓜植物和包含4个拷贝的突变型wap7.1等位基因的四倍体植物(参见例如表2,B行),
或提供突变型wap7.1等位基因纯合型的二倍体西瓜植物和缺乏突变型wap7.1等位基因的四倍体植物(例如表2,C行),
(b)使用二倍体植物的花粉对四倍体植物的雌花授粉,以及
(c)收获在四倍体植物的果实中产生的种子,以及任选地
(d)干燥收获的种子。
然后任选地,包装干燥和收获的F1种子。它们也可以在包装之前进行处理。因此,包含通过上述方法获得的种子或由通过上述方法获得的种子组成的包装或容器是本文的一个实施方案。
本文还包括可从中生长出任何上述三倍体植物的种子,以及所述植物的部分,例如三倍体果实、花、叶、茎、插条、无性繁殖体、细胞、种子繁殖体(例如自交系)和体外细胞或组织培养物,以及花粉、子房、根茎、接穗等。因此,在一个实施方案中,三倍体植物、或可生长出植物的种子、或植物的组织或部分(花粉、花药、胚珠)包含如上所述的突变型wap7.1等位基因。
本发明还提供了一种种植包含至少一个拷贝的突变型wap7.1等位基因的三倍体植物的方法。三倍体植物从种子败育变为单性结实,即从花发育成果实不再需要传粉者植物来诱导,因此所述植物可以在无传粉者植物的情况下生长,产生无籽果实。因此,整个田地或温室可以仅生长三倍体植物,增加无籽三倍体果实的产量。在其基因组中包含至少一个拷贝(或两个或三个拷贝)的突变型wap7.1等位基因的无籽果实也包括在本文中,包含果实或果实部分的食物或饲料产品也包括在本文中。
因此,该方法包含:在无传粉者植物(例如未间作传粉者植物)的栽培区域(例如田地或温室或隧道(tunnel))中播种或种植包含至少一个拷贝的突变型wap7.1等位基因的三倍体西瓜植物,使其在无花授粉时发育果实(单性结实),并任选地收获无籽三倍体果实。
无性繁殖体和细胞或组织培养物
上述二倍体植物、四倍体植物或三倍体植物(或其他多倍体)也可以通过无性繁殖(克隆),所述无性繁殖植物或“无性繁殖体”是本发明的一个实施方案。通过突变型wap7.1等位基因的存在和/或表型,它们可以容易地与其他西瓜植物区分。一个或更多个突变型wap7.1等位基因的存在可以如本文其他位置所述测定。
无性繁殖体可以用不同的方法制备。例如,本发明的植物的一个或更多个接穗可以嫁接到不同的根茎上,例如生物或非生物胁迫耐受性根茎。
其他方法包括体外细胞或组织培养物法和由所述培养物再生无性繁殖体。所述细胞或组织培养物包含本发明的植物的各种细胞或组织或由其组成。在一个方面,所述细胞或组织培养物包含本发明的植物的营养细胞或营养组织或由其组成。
在另一方面,细胞或组织培养物包含生殖细胞或组织或由其组成,例如本发明的植物的花药或胚珠。所述培养物可以用染色体加倍剂处理以制备例如双单倍体植物,或者它们可以用于制备单倍体植物(例如从四倍体产生二倍体或从二倍体制备单倍体)。
因此,体外细胞或组织培养物可以包含选自下列的植物部位的细胞或原生质体或植物组织或由其组成:果实、胚、分生组织、子叶、花粉、胚珠、叶、花药、根、根尖、雌蕊、花、种子、茎。还包括所述任意一种的一部分,例如仅种皮(母体组织)。
因此,在本发明的一方面,提供了包含一个、两个、三个或四个拷贝的突变型wap7.1等位基因的植物的细胞培养物或细胞的组织培养物,全部如上所述。如所提及的,细胞培养物或组织培养物包含来自包含突变型wap7.1等位基因的植物的植物部分的细胞或原生质体或植物组织,其可包含选自下列的细胞或组织或由其组成:胚、分生组织、子叶、花粉、叶、花药、根、根尖、雌蕊、花、种子、茎;或其中任意一种的一部分。
本发明还提供了从所述细胞培养物或组织培养物再生的西瓜植物,其中再生的植物(或其后代,例如再生的植物自交后获得的后代)包含突变型wap7.1等位基因。因此,在一个方面,包含突变型wap7.1等位基因的一个或更多个拷贝的西瓜植物是无性繁殖的西瓜植物。
在不同的方面,包含一个或更多个拷贝的wap7.1的本发明的细胞和组织(以及任选地细胞或组织培养物)是非繁殖细胞或组织。
方法
本发明提供了产生无籽三倍体西瓜果实的方法,所述方法包括:
1.提供包含至少一个、优选两个或优选三个拷贝的突变型wap7.1等位基因的三倍体杂种(F1)西瓜植物或种子,
2.在田地中种植或播种所述三倍体杂种植物,优选在同一田地中不种植或播种二倍体传粉者植物,以及任选地
3.收获在三倍体植物上产生的无籽西瓜果实,其中所述果实优选在无雌花授粉的情况下产生。
在一个方面,步骤1的三倍体杂种植物优选不嫁接到不同的根茎上。在另一方面,它可以嫁接到不同的根茎上。
如上所述,不再需要提供二倍体授粉者植物来诱导三倍体植物的雌花结实。这意味着整个田地可以基本上仅用F1三倍体种子或植物的种子或移植物进行播种或移植。因此,每公顷无籽西瓜果实的产量大大提高。由于只播种或种植一种基因型,播种和种植也变得更加容易。
因此,该方法也可描述为产生无籽西瓜果实的方法,所述方法包括种植包含至少一个、优选两个、更优选三个拷贝的突变型wap7.1等位基因的三倍体植物,并收获由所述植物产生的果实。果实优选在无雌花授粉的情况下(即在没有有活力的或可育的花粉的情况下)发育。结实不再需要昆虫存在,如蜜蜂,即放置蜂箱进或接近田地是没有必要的。
收获的三倍体无籽果实可以包装用于新鲜出售或用于加工。本文包括可通过上述方法获得的包含一个、两个或三个wap7.1等位基因的果实。任选地,突变型wap7.1等位基因的检测,例如通过使用如其他位置所述的DNA、RNA或蛋白质检测来检测突变型wap7.1等位基因,例如通过PCR、基因分型或标记物分析,所述标记物与wap7.1等位基因连接(或与其紧密连接)或等位基因特异性(例如检测区分突变型等位基因和野生型等位基因的突变),可以区分这样的果实。因此,在一个实施方案中,提供了收获的三倍体果实(即wap7.1/WAP7.1/WAP7.1或wap7.1/wap7.1/WAP7.1或wap7.1/wap7.1/wap7.1),例如包装的整个果实或果实部位和/或加工的果实或果实部位。
本发明还提供了产生兼性单性结实栽培西瓜植物的方法,其包括以下步骤:
a)在西瓜植物群体中引入突变或提供西瓜植物的突变型群体;
b)筛选在不对雌花授粉的情况下产生无籽果实并在对雌花授粉后产生有籽果实的植物和/或筛选包含WAP7.1基因的突变型等位基因的植物;
c)任选地验证b)中选择的植物是否包含WAP7.1基因的突变型等位基因;以及
d)任选地种植c)中获得的植物。
包括通过上述方法产生的西瓜植物。
a)中的西瓜植物群体优选是用诱变剂处理/已经用诱变剂处理(或经诱变剂处理)的栽培西瓜育种系或品种的单一基因型,或所述群体的后代,例如在群体中的个体自交产生M2、M3或进一步世代的植物后获得的后代。例如,其可以是TILLING群体。
在步骤b)中筛选植物的表型(即兼性单性结实)和/或筛选植物(或植物部分或其DNA)是否存在WAP7.1基因的突变型等位基因,即野生型WAP7.1蛋白表达降低或不表达的等位基因或编码突变型WAP7.1蛋白的等位基因。关于表型的筛选,应当理解,无雌花授粉时将发育无籽果实;有雌花授粉时将发育有籽果实。所述表型筛选可以分几个步骤进行。例如,第一植物可以生长在无昆虫的环境中,并且可以去除雄花。雌花可以目测观察开花和果实发育(在无花粉的情况下)。发育的果实可以在成熟时切成两半,以检查所述果实是否无籽。筛选的植物可以例如通过无性繁殖以确认单性结实表型和/或例如通过人工授粉以观察果实是否在授粉时结籽(兼性单性结实)。关于筛选植物是否存在WAP7.1基因的突变型等位基因,这可以通过检测wap7.1 DNA、RNA或蛋白质的各种方法来完成,例如通过设计扩增部分编码区或全部编码区的PCR引物以扩增基因组DNA,从而确定植物是否在基因组DNA中包含突变,或其他方法。
步骤c)可以包括多种方法来确定突变型wap7.1等位基因是否存在。例如,可以进行对包含WAP7.1基因座的染色体区域的标记物分析或序列分析,或者可以使用PCR或RT-PCR来扩增wap7.1等位基因(或其部分)或mRNA(cDNA)。也可以进行遗传分析以确定隐性遗传。
本发明还提供了兼性单性结实西瓜植物用于产生无籽西瓜果实的用途,优选无所述植物的雌花授粉。此外,提供了突变型wap7.1等位基因用于在无雌花授粉的情况下产生兼性单性结实西瓜植物和/或无籽西瓜果实的用途。同样,本发明的WAP7.1基因的突变型wap7.1等位基因用于产生兼性单性结实西瓜植物的用途也包括在本文中。
在一个方面,本发明的植物、植物部位和植物细胞不排他地通过规定28(2)EPC(欧洲专利公约)定义的基本生物学的方法获得。
在一个方面,所述植物是非GMO的(非遗传修饰的)。
在一个方面,突变型等位基因通过诱变(例如化学或辐射诱变)或通过定向诱变产生,尤其是使用CRISPR系统(例如Crispr/Cas9或Crispr/CpfI或其他核酸酶)产生。在一个方面,包含突变型wap7.1等位基因的栽培植物不是转基因植物,例如筛选不包含例如CRISPR构建体的非转基因后代。
在一个方面,WAP7.1基因的突变型等位基因包括人为诱导的突变,即通过诱变技术(例如化学诱变或辐射诱变)或靶向诱变技术(例如基于Crispr的技术)引入的突变。
本文提供了用于西瓜中内源性WAP7.1基因的靶向诱变的方法,其使用任何靶向基因修饰方法,例如基于CRISPR的方法(例如Crispr/Cas9或Crispr/CpfI)、TALENS、锌指或其他方法。
在一个方面,本发明提供了分离的突变型WAP7.1蛋白和分离的野生型WAP7.1蛋白,或编码突变型WAP7.1蛋白或野生型WAP7.1蛋白的分离的核酸分子。本文还包括能够结合突变型或野生型WAP7.1蛋白的抗体。
检测方法
在一个方面,本发明提供了用于鉴定和/或选择在其基因组中包含WAP7.1蛋白编码基因的突变型等位基因的种子、植物或植物部位或来自所述种子、植物或植物部位的DNA的筛选方法。
该方法包括使用已知方法在DNA、RNA(或cDNA)或蛋白质水平上筛选,以检测突变型等位基因的存在。有许多方法可以检测基因的突变型等位基因的存在。
因此,本发明提供了一种针对突变型wap7.1等位基因的存在而筛选和/或选择植物、种子或植物材料或植物部位、或由其衍生的DNA或RNA或蛋白质的方法,其包含以下步骤中的一个或更多个:
a)确定内源性WAP7.1基因的基因表达是否被降低或破坏;
b)确定野生型WAP7.1蛋白的量是否被降低或破坏;
c)确定是否存在编码突变型WAP7.1蛋白的突变型mRNA、cDNA或基因组DNA;
d)确定是否存在突变型WAP7.1蛋白;
e)确定植物或其后代是否是兼性单性结实的。
可以使用常规方法,例如RT-PCR、PCR、基于抗体的测定、测序、基因分型测定(例如等位基因特异性基因分型)、表型分析等。
所述植物或植物材料或植物部位可以是西瓜植物或植物材料或植物部分,例如叶、叶部分、细胞、果实、果实部分、子房、茎、胚轴、种子、种子部分、种皮、胚等。
例如,如果在野生型和突变型等位基因之间存在单核苷酸差异(单核苷酸多态性,SNP)(例如表1中所示),则SNP基因分型测定可用于检测植物或植物部位或细胞在其基因组中是否包含野生型核苷酸或突变型核苷酸。例如,使用KASP测定(参见万维网kpbioscience.co.uk)或其他SNP基因分型测定可以容易地检测SNP。为了实施KASP测定,例如可以选择SNP上游50、60或70个碱基对和下游50、60或70个碱基对,并且可以设计两个等位基因特异性正向引物和一个等位基因特异性反向引物。参见例如Allen等人.2011,PlantBiotechnology J.9,1086-1099,尤其是记载KASP测定的p097-1098。
同样可以使用其他基因分型测定。例如,可以使用TaqMan SNP基因分型测定、高分辨率熔解(HRM)测定、SNP基因分型阵列(例如Fluidigm、Illumina等)或DNA测序。
在一个方面,例如SEQ ID NO:5的核苷酸51处的或与SEQ ID NO:5具有至少92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的序列的核苷酸51处的SNP标记物mWM23348403,可用于检测西瓜中编码包含W1054STOP突变的突变型蛋白的突变型wap7.1等位基因是否存在。基于野生型等位基因和突变型等位基因的基因组序列之间的差异,技术人员可以容易地开发可用于检测特定等位基因的标记物(例如表1的那些或其他)。
本文还提供了用于鉴定包含突变型wap7.1等位基因的西瓜植物(或植物部位)的方法,所述方法包括检测植物(或植物部位)中突变型wap7.1等位基因的存在,其中所述存在通过检测wap7.1等位基因内的至少一种标记物或通过检测由wap7.1等位基因编码的蛋白质来检测。用于检测突变型wap7.1等位基因的方法选自PCR扩增、核酸测序、核酸杂交和用于检测由等位基因编码的wap7.1蛋白的基于抗体的测定(例如免疫测定)。
本文还提供了鉴定包含在调控元件中包含突变的突变型wap7.1等位基因的西瓜植物(或植物部位)的方法,所述方法包括在植物(或植物部位)中检测突变型wap7.1等位基因的基因表达降低或不存在基因表达,其中通过野生型WAP7.1等位基因的mRNA水平(cDNA)或通过检测野生型WAP7.1蛋白的蛋白质水平来检测其存在。用于检测突变型wap7.1等位基因的方法选自PCR扩增(例如RT-PCR)、核酸测序、蛋白质印迹和用于检测由等位基因编码的WAP7.1蛋白的基于抗体的测定(例如免疫测定)。
本发明还提供了一种用于确定、或检测或测定细胞或西瓜植物或植物部位是否包含命名为WAP7.1的基因的突变型等位基因的方法,所述基因编码SEQ ID NO:1的蛋白质或与SEQ ID NO:1具有至少94%、95%、96%、97%或98%序列同一性的蛋白质。在一个方面,所述方法包括测定等位基因的表达,和/或测定等位基因的编码序列和/或测定等位基因的部分编码序列(例如等位基因的SNP基因型),和/或测定所产生的蛋白质的氨基酸序列和/或所产生的蛋白质的量。
可以使用各种方法来确定植物或其部位是否包含本发明的突变型wap7.1等位基因。如上所述,可测定野生型等位基因的mRNA(或cDNA)水平,或可测定野生型蛋白水平,以观察野生型等位基因的表达是否降低或不表达。此外,可以分析编码序列或其部分,例如如果已经知道可能存在哪个突变型等位基因,则可以开发检测突变的测定,例如SNP基因分型测定可以例如区分突变型等位基因和野生型等位基因的存在,例如标记物mWM23348403的基因分型。
用于筛选植物或种子的方法,其包括以下步骤:
a)鉴定在编码WAP7.1蛋白的基因的等位基因中具有突变的植物或种子,其中基因的野生型等位基因编码与SEQ ID NO:1具有至少94%、95%、96%、97%或98%或99%序列同一性的WAP7.1蛋白,以及任选地
b)确定所述植物或通过自花受精产生的后代植物是否为兼性单性结实的,以及任选地
c)筛选步骤a)的包含中至少一个拷贝的突变型等位基因的植物或种子。
一种产生植物的方法,优选地为西瓜植物,其包括以下步骤:
a)在植物或种子群体中引入突变,
b)筛选在不存在授粉的情况下产生无籽果实和在授粉后产生有籽果实的植物和/或筛选在其基因组中包含突变型wap7.1等位基因的植物或种子,
c)任选地验证b)中筛选的植物是否在编码WAP7.1蛋白的等位基因中具有突变,以及任选地
d)种植或栽培c)中获得的植物或种子,
其中基因的野生型等位基因编码与选自下组的任何一种蛋白质具有至少94%序列同一性的WAP7.1蛋白:SEQ ID NO:1。
一种产生植物的方法,其包括以下步骤:
a)将外源核酸分子引入到植物中,其中所述外源核酸分子选自:
i)DNA分子,其编码至少一种反义RNA,所述反义RNA引起编码WAP7.1蛋白的内源基因的表达降低;
ii)DNA分子,其通过共抑制效应引起编码WAP7.1蛋白的内源基因的表达降低;
iii)DNA分子,其编码至少一种核酶,所述核酶裂解编码WAP7.1蛋白的内源基因的特异性转录物;
iv)DNA分子,其同时编码至少一种反义RNA和至少一种正义RNA,其中所述反义RNA和所述正义RNA形成双链RNA分子,其引起编码WAP7.1蛋白的内源基因表达降低(RNAi技术)
v)通过体内诱变引入的核酸分子,其导致编码WAP7.1蛋白的内源基因中的突变或异源序列的插入,其中所述突变或插入引起编码WAP7.1蛋白的基因表达降低或导致合成功能丧失或功能降低的WAP7.1蛋白;
vi)核酸分子,其编码抗体,其中所述抗体由于其与内源WAP7.1蛋白结合而导致编码WAP7.1蛋白的内源基因的活性降低;
vii)DNA分子,其含有转座子,其中这些转座子的整合导致编码WAP7.1蛋白的内源基因中的突变或插入,其引起编码WAP7.1蛋白的内源基因表达降低,或导致合成无活性蛋白;
viii)T-DNA分子,其由于插入编码WAP7.1蛋白的内源基因中而引起编码WAP7.1蛋白的内源基因表达降低,或导致合成功能丧失或功能降低的WAP7.1蛋白;
ix)编码罕见切割核酸内切酶或定制的罕见切割核酸内切酶的核酸分子,优选地为归巢核酸内切酶、TALEN或CRISPR/Cas系统。
b)筛选植物,其中所述植物或通过自花受精产生的所述植物的后代在无授粉的情况下产生无籽果实,并在授粉后产生有籽果实,任选地
c)验证b)中筛选的植物与基因组中例如没有整合外源核酸分子的野生型植物相比WAP7.1蛋白活性是否降低,任选地
d)种植/栽培c)中获得的植物,
通过上述任何方法获得的植物包括在本文中。
在一个方面,本发明提供了遗传修饰的植物和植物部位,由此植物内源性WAP7.1基因的表达降低或无表达,例如通过内源性WAP7.1基因的沉默。此类植物可以是任何植物,在一个方面它是西瓜。然而,它也可以是黄瓜、甜瓜、辣椒、玉米、大豆、小麦、油菜、西红柿、棉花等。
在另一方面,本发明提供了植物和植物部位,其包含内源性WAP7.1基因中的突变,例如通过例如靶向诱变产生的诱导突变,由此与野生型蛋白相比,基因表达降低或破坏,或者表达的基因编码功能降低或功能丧失的WAP7.1蛋白。此类植物可以是任何植物,在一个方面,它是西瓜、甜瓜或黄瓜,如所述。然而,它也可以是黄瓜、甜瓜、玉米、大豆、小麦、油菜、西红柿、棉花、辣椒等。由于其他物种中的WAP7.1基因可能与西瓜WAP7.1基因具有较低的序列同一性,因此在本发明的该方面,WAP7.1基因是编码与SEQ ID NO:1具有至少60%、65%、70%、75%、80%、85%、90%、94%、95%序列同一性的蛋白质的基因。任选地WAP7.1基因是编码与SEQ ID NO:1具有至少60%、65%、70%、75%、80%、85%、90%、94%、95%序列同一性的蛋白质的基因,其中所述蛋白质包含SEQ ID NO:1的保守锌结合结构域、肽结合结构域、Plus3结构域和/或脯氨酸结合基序或与SEQ ID NO:1的锌结合结构域、肽结合结构域、Plus3结构域和/或脯氨酸结合基序具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%序列同一性的锌结合结构域、肽结合结构域、Plus3结构域和/或脯氨酸结合基序。本领域技术人员可以鉴定WAP7.1基因在其他物种(例如甜瓜和黄瓜,辣椒或番茄)中的直系同源物,从而产生兼性单性结实的甜瓜、黄瓜、辣椒或番茄植物。本文所述的西瓜的所有实施方案同样适用于其他作物物种,不同之处在于WAP7.1基因因此可编码与SEQ IDNO:1的野生型WAP7.1西瓜蛋白质相比低于94%序列同一性的蛋白质。
本文还提供了一种针对命名为WAP7.1的基因的突变型等位基因的存在而筛选西瓜植物、种子、植物部位或其DNA的方法,或筛选包含命名为WAP7.1的基因的突变型等位基因的西瓜植物、种子或植物部位的方法,所述方法包括以下步骤:
a)分析基因组DNA是否包含编码SEQ ID NO:1的蛋白质(或与SEQ ID NO:1具有至少94%同一性的野生型蛋白)的野生型WAP7.1等位基因和/或编码与野生型WAP7.1蛋白相比包含一个或更多个替换、插入或缺失的氨基酸的突变型蛋白的突变型WAP7.1等位基因,以及任选地
b)筛选包含两个拷贝的野生型等位基因、两个拷贝的突变型等位基因或一个拷贝的野生型等位基因和一个拷贝的突变型等位基因的植物、种子或植物部位。
在一个方面,方法步骤a)包含选自以下的方法:
i)使用与WAP7.1等位基因的DNA杂交的一个或更多个寡核苷酸引物扩增WAP7.1等位基因的至少一部分,
ii)使一个或更多个寡核苷酸探针与WAP7.1等位基因的DNA的至少一部分杂交,
iii)对WAP7.1等位基因的DNA、mRNA或cDNA进行测序。
因此,例如,可以从植物、种子或植物部位获得DNA样品,并且可以进行PCR反应以扩增野生型WAP7.1等位基因的一部分和/或突变型WAP7.1等位基因的一部分。
例如,可以使用竞争性PCR方法(如KASP测定)来产生基因组DNA中WAP7.1基因座处存在的等位基因的扩增产物。类似地,寡核苷酸探针可以产生基因组DNA中WAP7.1基因座上存在的等位基因的杂交产物。引物或探针可设计为对特定WAP7.1等位基因特异,例如区分野生型等位基因和突变型等位基因。例如,SNP标记物mWM23348403包含核苷酸51处的SNP,其区分编码包含氨基酸W1054的蛋白质的野生型等位基因和编码包含氨基酸W1054密码子处的提前终止密码子的蛋白质的突变型等位基因。可以设计引物或探针来检测该SNP,并且可以对野生型和突变型WAP7.1等位基因之间发现的任何其他多态性(例如SNP或INDEL)进行相同的检测,例如表1的那些。
在一个方面,本发明提供了用于基因分型西瓜植物、种子、植物部位、细胞或组织的基因分型测定,其包括以下步骤:
a)提供一种或多种西瓜植物或植物群体的基因组DNA,以及
b)进行基因分型测定,其检测编码SEQ ID NO:1的野生型等位基因或编码与SEQID NO:1具有至少94%序列同一性的蛋白质的野生型等位基因和/或突变型等位基因(或两个不同的突变型等位基因)的存在,其中所述突变型等位基因编码突变型蛋白,所述突变型蛋白包含与SEQ ID NO:1的野生型蛋白相比或与与SEQ ID NO:1具有至少94%序列同一性的野生型蛋白相比插入、缺失或替换的一个或更多个氨基酸,以及任选地
c)筛选包含两个拷贝的野生型等位基因、或一个拷贝的野生型等位基因和一个拷贝的突变型等位基因、或两个拷贝的突变型等位基因的植物、种子、植物部位、细胞或组织。
在步骤b)中,突变型等位基因中的突变优选地导致相对于野生型蛋白插入、缺失或替换一个或更多个氨基酸,例如突变型等位基因编码例如本文表1中所述的突变型WAP7.1蛋白之一。
因此,例如包含G/A SNP(密码子AGG→AAG;参见表1,1行)的等位基因的基因分型,其在SEQ ID NO:1中第346位的氨基酸R或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸R和SEQ ID NO:1中第346位的氨基酸K或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸K之间区分,可以在上述测定中分析。因此,在一个方面,所述测定可例如检测编码SEQ ID NO:1的蛋白质的等位基因(野生型WAP7.1)和/或编码SEQ IDNO:11的蛋白质的等位基因(具有R346K替换的突变型WAP7.1蛋白)
同样,例如包含G/A SNP(密码子AGC→AAC;参见表1,2行)的等位基因的基因分型,其在SEQ ID NO:1中第324位的氨基酸S或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸S和SEQ ID NO:1中第324位的氨基酸N或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸N之间区分,可以在上述测定中分析。因此,在一个方面,所述测定可例如检测编码SEQ ID NO:1的蛋白质的等位基因(野生型WAP7.1)和/或编码SEQ IDNO:12的蛋白质的等位基因(具有S324N替换的突变型WAP7.1蛋白)
同样,包含C/T SNP(密码子CCT→TCT;参见表1,3行)的等位基因的基因分型,其在SEQ ID NO:1中第830位的氨基酸P或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸P和SEQ ID NO:1中第830位的氨基酸S或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸S之间区分,可以在上述测定中分析。因此,在一个方面,所述测定可例如检测编码SEQ ID NO:1的蛋白质的等位基因(野生型WAP7.1)和/或编码SEQ ID NO:13的蛋白质的等位基因(具有P830S替换的突变型WAP7.1蛋白)
同样,包含G/A SNP(密码子GCA→ACA;参见表1,4行)的等位基因的基因分型,其在SEQ ID NO:1中第328位的氨基酸A或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸A和SEQ ID NO:1中第328位的氨基酸T或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸T之间区分,可以在上述测定中分析。因此,在一个方面,所述测定可例如检测编码SEQ ID NO:1的蛋白质的等位基因(野生型WAP7.1)和/或编码SEQ ID NO:14的蛋白质的等位基因(具有A328T替换的突变型WAP7.1蛋白)
同样,包含G/A SNP(密码子TGG→TGA;参见表1,5行)的等位基因的基因分型,其在SEQ ID NO:1中第1054位的氨基酸W或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸W和包含SEQ ID NO:1中第1054位的氨基酸W或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸W的终止密码子的等位基因之间区分,可以在上述测定中分析。因此,在一个方面,所述测定可例如检测编码SEQ ID NO:1的蛋白质的等位基因(野生型WAP7.1)和/或编码SEQ ID NO:2的蛋白质的等位基因(具有W1054*替换的突变型WAP7.1蛋白)
还同样,包含C/T SNP(密码子CAA→TAA;参见表1,6行)的等位基因的基因分型,其在SEQ ID NO:1中第373位的氨基酸Q或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸Q和包含SEQ ID NO:1中第373位的氨基酸Q或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中等同位置处的氨基酸Q的终止密码子的等位基因之间区分,可以在上述测定中分析。因此,在一个方面,所述测定可例如检测编码SEQ ID NO:1的蛋白质的等位基因(野生型WAP7.1)和/或编码SEQ ID NO:10的蛋白质的等位基因(具有Q373*替换的突变型WAP7.1蛋白)
显然,在上述试验中也可以检测一个或两个突变型等位基因的存在,例如一个或两个拷贝的特异性突变型等位基因或两个不同的突变型等位基因。因此,例如,编码SEQ IDNO:11的蛋白质的等位基因和/或编码SEQ ID NO:12的蛋白质的突变等位体基因的存在可以在这样的测定中检测。在上述方法中,该测定可以检测任何WAP7.1等位基因的基因型,无论是野生型等位基因和/或一种或多种突变型等位基因。
野生型等位基因是例如7号染色体上WAP7.1基因座处的基因组DNA。例如,SEQ IDNO:6在本文中提供了编码野生型WAP7.1蛋白的基因组DNA,但与SEQ ID NO:6具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的基因组序列也可以是编码野生型WAP7.1蛋白的基因组DNA序列。
因此,在一方面,在上述方法的步骤b中检测一个或多个以下等位基因:
-编码蛋白SEQ ID NO:1或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白的野生型WAP7.1等位基因;
-相对于编码蛋白SEQ ID NO:1或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白的野生型WAP7.1等位基因,编码包含一个或多个插入、替换或缺失的氨基酸的WAP7.1突变型蛋白的突变型WAP7.1等位基因(也参见本文别处);
-编码突变型WAP7.1蛋白的突变型WAP7.1等位基因,所述突变型WAP7.1蛋白在SEQ ID NO:1中或在与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中的等同氨基酸位置处包含R346K置换;
-编码突变WAP7.1蛋白的突变型WAP7.1等位基因,所述突变型WAP7.1蛋白在SEQID NO:1中或在与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白中的等同氨基酸位置处包含S324N替换;
-编码突变WAP7.1蛋白的突变型WAP7.1等位基因,所述突变型WAP7.1蛋白在SEQID NO:1中或在与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白的等同氨基酸位置处包含P830S替换;
-编码突变WAP7.1蛋白的突变型WAP7.1等位基因,所述突变型WAP7.1蛋白在SEQID NO:1中或在与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白的等同氨基酸位置处包含A328T替换;
-编码突变WAP7.1蛋白的突变型WAP7.1等位基因,所述突变WAP7.1蛋白在SEQ IDNO:1中或在与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白的等同氨基酸位置处包含W1054*替换;
-编码突变WAP7.1蛋白的突变型WAP7.1等位基因,所述突变WAP7.1蛋白在SEQ IDNO:1中或在与SEQ ID NO:1具有至少94%、95%、96%、97%、98%或99%序列同一性的野生型蛋白的等同氨基酸位置处包含Q373*替换。
步骤a)可包含从植物、种子、植物部位、细胞或组织中分离基因组DNA以在基因分型测定中进行分析。通常可以使用本领域已知的粗DNA提取方法。
步骤b)优选地包含双等位基因分型测定,其利用等位基因特异性寡核苷酸引物和/或等位基因特异性探针,即区分例如野生型等位基因和突变型等位基因之间或两个突变型等位基因的引物或探针。
步骤a)的植物可以使用例如化学或辐射诱变剂或基因编辑技术被诱变。因此,在步骤a)之前,可以含有用诱变剂处理植物、种子或植物部位或在WAP7.1等位基因中诱导定点突变的步骤。
可以使用各种基因分型测定,只要它们可以检测INDEL和SNP并且可以区分例如存在于基因组DNA中的野生型等位基因之间(在7号染色体上的WAP7.1基因座)和/或一个或更多个存在于基因组DNA中的WAP7.1基因的突变型等位基因。
基因分型测定通常基于PCR或热循环反应(聚合酶链式反应)中使用的等位基因特异性引物,以扩增野生型或突变型等位基因并检测扩增产物,或者基于等位基因特异性寡核苷酸探针,其与野生型等位基因或突变型等位基因或两者杂交。例如,用BHQplus探针进行基因分型,使用两个等位基因特异性探针和两个位于多态性区域侧翼的引物,并且在热循环期间聚合酶遇到结合到DNA上的等位基因特异性探针并释放荧光信号。等位基因区分涉及两个等位基因特异性BHQPlus探针的竞争性结合(同样参见biosearchtech.com)。
基因分型测定的实例是KASP测定(由LGC提供,参见www.LGCgenomics.com和www.biosearchtech.com/products/pcr-kits-and-reagents/genotyping-assays/kasp-genotyping-chemistry)、基于竞争性等位基因特异性PCR和终点荧光检测、TaqMan测定(应用生物系统),其同样基于PCR、HRM测定(高分辨率熔解试验),其中等位基因特异性探针使用实时PCR检测、或rhAmp测定,其基于RNA酶H2依赖性PCR、BHQplus基因分型、BHQplexCoPrimer基因分型和许多其他方法。
KASP测定同样记载于He C,Holme J,Anthony J.‘SNP genotyping:the KASPassay,Methods Mol Biol.2014;1145:75-86’和EP1726664B1或US7615620B2,以引用方式纳入本文。KASP基因分型测定采用独特形式的竞争性等位基因特异性PCR,结合新型、均质、基于荧光的报告系统,用于识别和测量核苷酸水平发生的遗传变异,以检测单核苷酸多态性(SNP)或插入和缺失(InDel)。KASP技术适用于各种设备平台,并在SNP数目和可分析的样品数目方面提供灵活性。KASP化学在96、384和1536孔微量滴定板形式中同样良好地起作用,并且多年来已被人类、动物和植物遗传学领域的用户在大型和小型实验室中使用。
TaqMan基因分型测定同样记载于Woodward J.‘Bi-allelic SNP genotypingusing the assay.’Methods Mol Biol.2014;1145:67-74,US5210015和US5487972,通过引用纳入本文。/>技术利用等位基因特异性探针对已知多态性位点进行快速可靠的基因分型。TaqMan测定在对多种变体类型进行基因分型方面具有稳健性,包括单核苷酸多态性、插入/缺失和存在/缺失变体。为了查询单个双等位基因多态性,设计了用不同荧光团标记的两个TaqMan探针,使得它们在周围目标区域的基于PCR的扩增期间与不同等位基因杂交。在PCR的引物延伸阶段,Taq聚合酶的5'-3'核酸外切酶活性切割并释放结合探针上的荧光团。在PCR结束时,测量每个荧光团的发射强度,并且可以进行查询位点的等位基因确定。
因此,可以使用各种基因分型测定,其可以区分例如一个或更多个WAP7.1基因的野生型等位基因,其编码SEQ ID NO:1的蛋白质或与SEQ ID NO:1具有至少94%同一性的蛋白质,和/一个或更多个WAP7.1基因的突变型等位基因的存在。可以检测WAP7.1基因的各种突变型等位基因。因此,不仅可检测编码SEQ ID NO:2、10、11、12、13或14的蛋白质的突变型等位基因,该测定还可设计为检测WAP7.1基因的任何其他突变型等位基因,包括表1中所述的那些和其他突变型等位基因。
如上所述,优选地使用双等位基因分型测定,例如KASP测定、TaqMan测定、BHQplus测定、PACE基因分型(参见万维网idtdna.com/pages/products/qpcr-andpcr/genotyping/pace-snp-genotyping-assays)或任何其他双等位基因分型测定。
在一个方面,上述方法步骤b)中的基因分型测定是KASP测定。因此,在步骤b)中,使用两个正向引物和一个共同的反向引物进行竞争性PCR。两个正向引物包含与基因组序列(或其互补链)互补的至少10、11、12、13、14、15、16、17、18、19或20个核苷酸。此外,两个正向引物包含1、2、3或更多个核苷酸(优选在引物的3’末端),其提供区分例如等位基因的野生型序列与例如突变型序列或区分两个突变型等位基因的序列的对SNP或INDEL的特异性。因此,两个正向引物对例如野生型等位基因和/或例如突变型等位基因具有不同的结合特异性(或优先性)。例如,Fam引物可包含例如野生型序列的17个核苷酸和对突变型等位基因的核苷酸特异的1个核苷酸,并且VIC引物可包含野生型等位基因的18个核苷酸和对野生型等位基因的核苷酸特异的1个核苷酸。可容易地设计KASP测定以区分例如WAP7.1基因的野生型等位基因和/或任何突变型等位基因(其与野生型等位基因在插入、缺失或替换的一个或多个核苷酸上不同),或区分所述基因的不同突变型等位基因,因此例如可设计该测定用于区分任何两个WAP7.1等位基因的任何SNP或INDEX。
应注意,也可以进行基因分型测定(例如KASP测定)以与针对二倍体西瓜植物和植物部分所述相同的方式检测三倍体或四倍体西瓜植物和植物部位中的突变型和/或野生型WAP7.1等位基因。
在一个方面,WAP7.1基因的突变型等位基因编码相对于SEQ ID NO:1的野生型蛋白包含一个或更多个氨基酸插入、替换或缺失的蛋白质,如本文其他地方已经描述的。
因此,在一个实施方案中,提供了用于检测和任选地选择西瓜植物、种子或植物部位的方法,所述西瓜植物、种子或植物部位包含至少一个拷贝的命名为WAP7.1的基因的野生型等位基因和/或突变型等位基因,所述方法包括:
a)提供西瓜植物或多种植物(例如育种群体、F2、回交等)的基因组DNA,
b)进行测定(例如双等位基因基因分型测定),其区分或能够区分a)中的基因组DNA中等位基因的存在,所述测定基于核酸扩增(例如包含使用等位基因特异性寡核苷酸引物)和/或核酸杂交(例如包含使用等位基因特异性寡核苷酸探针),以检测基因的野生型等位基因和/或一个或更多个基因的突变型等位基因的存在,其中所述野生型等位基因编码SEQ ID NO:1的蛋白质(或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%、99%、99.5%或99.8%或99.9%同一性的野生型WAP7.1蛋白),并且所述突变型等位基因编码相对于SEQ ID NO:1的野生型蛋白(或相对于与SEQ ID NO:1具有至少94%、95%、96%、97%、98%、99%、99.5%或99.8%或99.9%同一性的野生型WAP7.1蛋白)包含一个或更多个氨基酸插入、缺失或替换的蛋白质,以及任选地
c)选择包含一个或两个拷贝的突变型等位基因的植物、种子或植物部位。
在步骤b)中,基因分型测定区分例如野生型和/或一个或更多个突变型等位基因,其基于利用例如寡核苷酸引物如PCR(聚合酶链式反应)和PCR引物,优选等位基因特异性引物的核酸(特别是DNA)扩增反应,和/或利用寡核苷酸探针,优选等位基因特异性探针的核酸杂交。
引物或探针优选地被修饰以包含标记物,例如荧光标记,或包含尾部序列或其他修饰。
在一个方面,在任何上述方法中,所述测定使用一种或多种WAP7.1等位基因特异性引物或一种或多种WAP7.1等位基因特异性探针。
如上所述,基于SEQ ID NO:6的基因组序列或其他(例如简并)编码SEQ ID NO:1的蛋白质的基因组序列,或突变型等位基因的基因组序列,其编码例如与SEQ ID NO:1相比包含一个或更多个插入、缺失或替换的氨基酸的蛋白质,PCR引物和核酸探针可以使用已知的方法或用于寡核苷酸设计的软件程序来设计。引物和探针的长度可以是例如至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或更多个核苷酸(碱基),并且退火(或杂交)至模板DNA序列,即它们优选与靶序列具有至少94%、95%、96%、97%、98%、99%或100%序列同一性。引物或探针对例如野生型等位基因或突变型等位基因(或两个或更多个突变型等位基因)的特异性是由于引物或探针的至少1、2、3或更多个核苷酸对任一等位基因特异。因此,引物或探针是围绕靶基因的两个(或更多)等位基因之间的多态性(例如SNP或InDel)设计的,以便所述引物或探针可以区分等位基因。在一个方面,所述测定是双等位基因分型测定,其选自例如KASP测定、TaqMan测定、BHQplus探针测定或任何其他双等位基因分型测定。
在一个方面,突变型等位基因包含在等位基因的编码区中插入或复制的至少一个密码子,或改变成另一密码子的至少一个密码子(例如通过单个核苷酸改变),或缺失或改变成终止密码子的至少一个密码子。
在上述任何方法中,在一个方面,突变型等位基因编码如表1中所述的蛋白质。因此,在一个方面,所述方法可用于区分包含两个拷贝的编码SEQ ID NO:1的蛋白质的野生型WAP7.1等位基因的植物、种子或植物部位、两个拷贝的编码表1的突变型蛋白的突变型WAP7.1等位基因、或一个拷贝的每个等位基因(杂合子)。在另一方面,所述方法可用于区分包含一个或两个拷贝的编码表1的突变型蛋白的任一或更多个突变型WAP7.1等位基因的植物、种子或植物部位。任选地,包含任何这些基因型的植物、植物部位或种子可被筛选用于例如进一步育种或用于西瓜生产。
尽管任何DNA基因分型测定都可用于上述方法,无论是基于PCR(使用PCR引物)和/或基于杂交(使用探针),在一个方面,KASP测定用于区分野生型和突变型等位基因。所述测定可以以高通量方式使用,例如在96孔板或更多孔板(例如384孔板)中使用。
在一个方面,所述测定区分在SEQ ID NO:5的核苷酸51处的G/ASNP。因此,引物或探针检测在SEQ ID NO:5的核苷酸51处的包含G或A的等位基因。
根据野生型和/或突变型WAP7.1等位基因之间的SNP或INDEL,各种等位基因特异性引物和探针可被设计用于测定。也参见表1SNP信息。
一方面,在KASP测定中使用两个正向引物(例如一个用于野生型等位基因,一个用于突变型等位基因)和一个共同的反向引物(例如用于野生型和突变型等位基因)。在一个方面,两个正向引物和反向引物包含基因组WAP7.1序列或其互补序列的至少10、11、12、13、14、15、16、17、18、19或更多个核苷酸。正向引物还包含至少1、2或3个核苷酸(优选在引物的3’末端),其赋予例如野生型等位基因扩增或突变型等位基因的扩增特异性(或优先性);或其赋予不同突变型等位基因特异性。每个正向引物与共同的反向引物形成引物对,以在热循环期间扩增引物对之间的目标等位基因的DNA序列。使用用于热循环的标准组件和用于KASP测定的标准组件。
在另一个实施方案中,本发明提供了用于产生例如命名为WAP7.1的基因的野生型等位基因和/或(或一个或两个或更多)突变型等位基因的杂交产物或扩增产物的方法,其包括:
a)提供西瓜植物或多种植物(例如育种群体、F2、回交等)的基因组DNA,
b)进行测定(例如双等位基因基因分型测定),其区分或能够区分a)中的基因组DNA中等位基因的存在,该测定产生核酸扩增产物(例如通过使用等位基因特异性寡核苷酸引物产生产物)和/或该测定产生核酸杂交产物(例如通过使用等位基因特异性寡核苷酸探针产生杂交产物),由此扩增产物或杂交产物表明在DNA中存在基因的野生型等位基因和/或基因的突变型等位基因,其中所述野生型等位基因编码SEQ ID NO:1的蛋白质或与SEQID NO:1具有至少94%的序列同一性的野生型蛋白),并且所述突变型等位基因编码相对于SEQ ID NO:1的野生型蛋白或与SEQ ID NO:1具有至少94%的序列同一性的野生型蛋白包含一个或更多个氨基酸被插入、缺失或替换的蛋白质,以及任选地
c)筛选包含一个或两个拷贝的突变型等位基因的植物、种子或植物部位。
本发明还提供了从来源于西瓜植物、植物部位或种子的基因组DNA样品中扩增全部或部分突变型和/或野生型WAP7.1等位基因的方法,包括使基因组DNA与扩增样品中全部或部分突变型WAP7.1等位基因和/或野生型WAP7.1等位基因的引物对接触,并检测扩增产物。
本发明还提供了一种将探针与来源于西瓜植物、植物部位或种子的基因组DNA样品中的突变型和/或野生型WAP7.1等位基因杂交的方法,包括使基因组DNA与寡核苷酸探针接触,所述寡核苷酸探针与样品中的突变型WAP7.1等位基因和/或野生型WAP7.1等位基因杂交,并检测杂交产物。
上文和本文其他地方描述的所有实施方案也适用于这些实施方案。因此,扩增产物可以是PCR扩增产物,例如在例如KASP测定或其他测定中产生的竞争性PCR扩增产物,以检测DNA样品中的突变型等位基因(或一个或两个或更多突变型等位基因)和/或野生型等位基因。因此,杂交产物可以是寡核苷酸探针的杂交产物,所述寡核苷酸探针与DNA样品中的核酸杂交,以检测例如DNA样品中的突变型和/或野生型等位基因。引物对或探针优选的是等位基因特异性的,因此产物可以区分为例如存在于西瓜植物、植物部位或种子的基因组DNA中的两个拷贝的野生型等位基因、两个拷贝的突变型等位基因或各一个拷贝。
引物或探针优选地被修饰,例如用尾部序列或荧光标记进行标记,或者相对于它们扩增或杂交的野生型序列被修饰。
由于所述方法需要检测植物、植物部位或种子的基因组DNA中的突变型和/或野生型等位基因,基因组DNA需要易于检测,例如其可以使用DNA提取方法从植物细胞中提取或至少从受损细胞洗脱到溶液(例如缓冲溶液)中。
上述测定可用于例如育种程序中的植物的标记辅助选择(MAS),以筛选包含某一基因型的植物,例如WAP7.1基因的野生型等位基因纯合型、WAP7.1等位基因的突变型等位基因纯合型或杂合型。
因此,本文还提供了培育西瓜植物的方法,所述方法包含对一种或多种植物基因组中WAP7.1基因座的等位基因组成进行基因分型,并任选地选择在WAP7.1基因座具有特定基因型的一种或多种植物。在一个方面,还可以对WAP7.1基因进行测序基因分型。
如上所述,任选地可以培养包含突变型WAP7.1等位基因的两个拷贝的植物或种子,并确定兼性单性结实的表型。突变型等位基因在一个方面是纯合形式的赋予兼性单性结实的突变型等位基因。
在不同方面,提供了西瓜植物、种子或植物部位,其包含至少一个拷贝的西瓜中命名为ClWAP7.1的基因的突变型等位基因,其中所述突变型等位基因
a)在调控元件中包含一个或更多个突变,导致与野生型等位基因相比没有表达或表达降低,和/或
b)编码突变型蛋白,其包含与野生型蛋白相比被替换、插入或缺失的一个或多个氨基酸,
其中a)或b)的所述突变型等位基因为纯合形式时(与包含纯合形式的野生型等位基因的植物相比),其赋予兼性单性结实,并且其中所述野生型西瓜ClWAP7.1等位基因编码SEQ ID NO:1的蛋白质或与SEQ ID NO:1具有至少94%、95%、96%、97%、98%、99%或更多序列同一性的蛋白质。
育种方法
此外,本发明提供了使包含至少一个如本文所述的突变型WAP7.1等位基因的植物与例如缺乏突变型WAP7.1等位基因的植物杂交的方法,并提供了选择包含至少一个拷贝的突变型WAP7.1等位基因的后代的方法。
因此,在一个方面,本发明提供了生成西瓜植物的方法,其包括以下步骤:
a)提供包含至少一个拷贝的突变型WAP7.1等位基因的西瓜植物,如所述;
b)使所述西瓜植物与另一西瓜植物杂交以产生F1种子;
c)任选地使由F1种子生长的西瓜植物自交一次或多次以产生F2、F3或进一步世代的自交后代;
d)使所述F1或进一步世代的自交后代与步骤b)的植物杂交,以产生回交后代;
e)选择包含步骤a)的突变型WAP7.1等位基因的回交后代。
任选地,步骤e)的植物包含两个拷贝的突变型WAP7.1等位基因,并且是兼性单性结实的。
任选地,可以使用分子方法在任何步骤中筛选或检测突变型WAP7.1等位基因的存在,例如SNP或INDEL基因分型、测序等。
优选地,步骤a)中的等位基因是突变型等位基因,其在纯合形式时赋予兼性单性结实。在一个方面,步骤a)中的植物是包含杂合或纯合形式的表1中的突变型等位基因的西瓜植物。
本发明还提供了产生西瓜植物的方法,其包括以下步骤:
a)在西瓜植物群体中引入突变或提供西瓜植物的突变型群体,例如M2、M3或进一步世代的TILLING群体,
b)鉴定在编码WAP7.1蛋白的等位基因中具有突变的植物,其中所述基因的野生型等位基因编码与SEQ ID NO:1的蛋白质具有至少94%序列同一性的WAP7.1蛋白。
所述方法还可以包含以下步骤中的一个或两个
选择包含至少两个拷贝的步骤b)的突变型等位基因的植物,
确定所述植物是否在无授粉的情况下产生果实。
此外,包括任何序列和所述序列的分子,包括与所提供的序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.8%或99.9%序列同一性的序列。本发明还提供了任何片段和/或修饰的序列(例如包含所述序列或互补序列的至少10、15、16、17、18、19、20或更多个核苷酸的引物或探针)及其在育种(例如MAS)或在检测或筛选植物或植物部位中的用途。
当描述突变型蛋白时,显然编码导致蛋白质中突变的突变的基因组序列和mRNA或cDNA序列包括在本文中,并且可用于检测基因组中包含导致氨基酸改变的突变的等位基因,以及用于例如进行针对突变型等位基因的基因分型测定。
序列描述
SEQ ID NO 1:西瓜的野生型WAP7.1蛋白
SEQ ID NO:2:西瓜的突变型WAP7.1蛋白,其包含一个W1054STOP替换。
SEQ ID NO:3:编码野生型WAP7.1蛋白的cDNA
SEQ ID NO 4:编码突变型WAP7.1蛋白的cDNA,包含在核苷酸3162处的A而不是G,即包含密码子TGA(终止)而不是密码子TGG(W)。
SEQ ID NO 5:在核苷酸51(G/A)处的用于检测突变型wap7.1等位基因或野生型Wap7.1等位基因的SNP标记物mWM23348403。在野生型等位基因中,密码子TGG编码SEQ IDNO:1的W、W1054。在突变型等位基因中,G被改变为A(G→A),并且所得突变密码子TGA是终止密码子。因此,SNP标记物包含在SEQ ID NO:5的核苷酸51处或在与SEQ ID NO:5具有至少92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列的等同核苷酸处的A,可用于检测突变型wap7.1等位基因,而SNP标记物包含SEQ ID NO:5的核苷酸51处或在与包含SEQ ID NO:5至少92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列的等同核苷酸处的G,可用于检测野生型wap7.1等位基因。
SEQ ID NO 6:编码野生型WAP7.1蛋白的基因组DNA序列
SEQ ID NO 7:在核苷酸7394处包含A而不是G的基因组DNA序列,即包含密码子TGA(终止)而不是密码子TGG(W),并编码突变型WAP7.1蛋白
SEQ ID NO 8:由基因ClCG07G008850.1编码的公开的氨基酸序列
SEQ ID NO 9:由基因Cla97C07G135900.1编码的公开的的氨基酸序列
SEQ ID NO:10:西瓜的突变型WAP7.1蛋白,其包含Q373终止替换
SEQ ID NO:11:西瓜的突变型WAP7.1蛋白,其包含R346K替换
SEQ ID NO:12:西瓜的突变型WAP7.1蛋白,其包含S324N替换
SEQ ID NO:13:西瓜的突变型WAP7.1蛋白,其包含P830S替换
SEQ ID NO:14:西瓜的突变型WAP7.1蛋白,其包含A328T替换
实施例
在智利用正向筛选方法筛选西瓜突变型群体(通过EMS处理称为TY的优良株系而开发),发现一个突变型,其在防虫温室中无授粉而产生果实。
能够产生单性结实果实的单个植物被选择,并被用于在不同遗传背景中产生若干F2定位群体。QTL被定位于7号染色体上的5.6Mb/24.6cM区域。在该区间内有16个突变,除了在称为C1CG07G008850.1的基因中编码锌指蛋白的基因中引入了提前终止密码子之外,所有这些突变都被预测为是基因间的。
在Charleston Grey基因组的cucurbitgenomics.org数据库中,该基因命名为CICG07G008850.1,并且位于7号染色体(CG_Chr7)的核苷酸23357225至23365257。
在品种97103V2基因组的cucurbitgenomics.org数据库中,该基因命名为Cla97C07G135900.1,并且位于7号染色体(Cla97Chr7)的核苷酸21927587至21935619。
然而,尽管两个基因组序列100%相同,但所编码的蛋白质被描述为不同的。使用RNA序列分析,正确编码的蛋白质看起来是SEQ ID NO:1的蛋白质。在图3中,显示了蛋白质之间的差异。
当与93个全基因组重新测序的品系比较时,发现该突变型wap 7.1等位基因对于该品系是完全独有的。
设计使该区间饱和的标记物并在F2群体上运行。将与该性状关联度最高的标记物mWM23348403设计为锌指基因。为了确认该突变,用mWM23348403和侧翼标记物对额外的400株F2进行基因分型。最高关联标记物是mWM23348403,其进一步证实了该标记物设计用于的突变是该性状的基础。
wap 7.1基因是单个隐性基因,并且在突变纯合型的植物(wap 7.1/wap7.1)中,兼性单性结实表型与突变型wap 7.1等位基因共分离。
基于WAP7.1基因的知识,(EMS诱导的)突变型西瓜群体(也称为TILLING群体)被筛选以及包含表1所示突变型等位基因的植物被鉴定。
靶向诱变
使用工程化核酸酶的靶特异性基因组编辑已经在各种领域中广泛使用。在西瓜中,Crispr已经成功地用于修饰靶基因,参见例如Wang,Y.,Wang,J.,Guo,S.等人,CRISPR/Cas9-mediated mutagenesis of ClBG1decreased seed size and promoted seedgermination in watermelon.Hortic Res 8,70(2021).https://doi.org/10.1038/s41438-021-00506-1,该方法和载体也可用于在WAP7.1基因中生成突变。
一个或更多个核苷酸的单碱基置换或缺失可通过同源重组(HR)进行。
可使用双元CRISPR/Cas9载体,例如Wang等人(上述)所述。靶向至WAP7.1的特异性单向导RNA(sgRNAs)可以根据CRISPR-P(http://cbi.hzau.edu.cn/crispr/)的评估被选择。将靶序列克隆到载体中,然后用于转化西瓜栽培种。
西瓜外植体可以根据Yu等人的修饰方法被转化(2011Plant Cell Rep30:359–371)。简而言之,将表面灭菌的西瓜种子播种在补充有3%Suc的基础Murashige和Skoog固体培养基上3天。然后将不含胚的子叶切成2×2mm的片。含有载体的根癌农杆菌菌株EHA105可用于转化。将子叶外植体在黑暗中共培养4天,然后转移到含有1.5mg/L 6BA、2mg/LBasta的选择性诱导培养基上。将再生的不定芽切除并转移到选择性伸长培养基(selective elongation medium)上,其含有:0.1mg/L 6BA、0.01mg/LNAA、2mg/L Basta。
质粒载体包含表达CAS9的盒和两个向导RNA(gRNA)和作为同源定向修复(HDR)模板的供体片段。Cas9基因和gRNA的表达由强启动子如泛素启动子驱动。gRNA被设计在两个靶向位点的相对链处。
供体片段在对应于靶WAP7.1基因序列的片段的中部含有所需突变(突变除外)。任选地,一旦成功实现HDR,不改变供体片段中的氨基酸残基的额外同义突变,将防止Cas9再次切割供体片段。所述片段分别侧接两个包括PAM基序的gRNA靶序列,使得供体DNA可通过Cas9/gRNA从质粒载体释放;参见例如Sun等人(2016)Molecular Plant 9,628–631DOI:10.1016/j.molp.2016.01.001。
为了增加HDR,可以在外植体中共同引入额外的游离DNA供体片段。转化后,生长基于例如质粒载体编码的抗生素抗性选择的再生芽并分析突变的存在。这可以通过引物以通过PCR从DNA扩增目的基因序列来完成。设计引物使得它们不能从质粒扩增片段。可以对扩增产物测序以确认突变的存在。
可使用标准方法从包含所需突变的转化植物材料中再生出植物。
例如如Wang等人(上述)所述,可从T0-T4转基因植物的幼叶中提取基因组DNA,然后将其用于创建模板以使用侧翼于两个靶位点的引物扩增目的基因中的特异性片段。PCR可在以下条件下进行:94℃/5分钟;94℃/30秒,56℃/30秒,和72℃/1分钟(35个循环);和72℃/10分钟作为最后延伸。PCR产物可直接使用标准方法测序。
所述转基因植物也可用对Cas9的特异性引物来验证Cas9-free。PCR可在以下条件下进行:94℃/5分钟;94℃/30秒,60℃/30秒,和72℃/1分钟(29个循环);和72℃/10分钟作为最后延伸。
序列表
<110> Nunhems B.V.
<120> 单性结实西瓜植物
<130> 202258WO01
<150> EP20206517
<151> 2020-11-09
<150> US63/111,941
<151> 2020-11-10
<150> US63/117,791
<151> 2020-11-24
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 1266
<212> PRT
<213> 人工的
<220>
<223> 西瓜的野生型WAP7.1蛋白
<400> 1
Met Asp Lys Pro Leu Asp Pro Pro Leu Asp Phe Tyr Lys Pro Arg Leu
1 5 10 15
Gln Pro Asp Asp Pro Thr Pro Pro Pro Pro Asp Ala Ser Val Leu Gly
20 25 30
Asn Ser His His Pro Pro His Leu Met Asp Ser His Ile Asp Asp Ser
35 40 45
Lys Leu Val Gly Val Pro Val Ala Gly Pro Leu Leu Pro Ala Asp Ser
50 55 60
Ser Pro Ala Ala Lys Leu Asn Ala Lys Phe Lys Asp Lys Val Leu Val
65 70 75 80
Val Asp Lys Thr Leu Gly Ile Arg Arg Arg Gly Arg Pro Pro Arg Gly
85 90 95
Gln Val Lys Pro Pro Pro Leu Pro Pro Arg Gln Lys Lys Asp Glu Glu
100 105 110
Asp Val Cys Phe Ile Cys Phe Asp Gly Gly Ser Leu Val Leu Cys Asp
115 120 125
Arg Arg Gly Cys Pro Lys Ala Tyr His Pro Ser Cys Ile Lys Arg Asp
130 135 140
Glu Ser Phe Phe Arg Ser Lys Ala Lys Trp Asn Cys Gly Trp His Ile
145 150 155 160
Cys Thr Asn Cys Gln Lys Ala Ser Tyr Tyr Met Cys Tyr Thr Cys Pro
165 170 175
Phe Ser Leu Cys Lys Gly Cys Ile Lys Gly Ala Asp Tyr Gln Cys Val
180 185 190
Arg Gly Thr Lys Gly Phe Cys Gly Thr Cys Met Lys Ile Ile Met Leu
195 200 205
Phe Glu Lys Ser Ala Pro Asp Gly Glu Ser Val Gln Val Asp Phe Asp
210 215 220
Asp Lys Ser Ser Trp Glu Tyr Leu Phe Lys Val Tyr Trp Ile Tyr Leu
225 230 235 240
Lys Glu Lys Leu Ser Leu Thr Val Asp Glu Leu Val Arg Ala Lys Asn
245 250 255
Ser Trp Lys Gly Ser Ile Ile Met Asp His Lys Val Ala Ser Ser Glu
260 265 270
Ile Leu Asp Gly Ser Ile Asp Lys Ser Gln Gly Ala His Asn Ser Phe
275 280 285
Arg Asn Pro Lys Ser Gln Arg Lys Arg Pro Asn Arg Gln Gln Ser Ser
290 295 300
Leu Asn Lys Phe Gly Ser Leu Val Asp Arg Pro Ser Ser Asn Glu Gln
305 310 315 320
Phe Ser Val Ser Thr Lys Trp Ala Thr Thr Glu Leu Met Asp Phe Val
325 330 335
Ala His Val Arg Asn Gly Asp Thr Thr Arg Leu Ser Pro Leu Asp Val
340 345 350
Gln Ala Leu Leu Leu Glu Tyr Val Lys Lys Asn Asn Leu Arg Asp Pro
355 360 365
Gln Gln Gln Ser Gln Ile Asn Cys Asp Leu Arg Leu Thr Asn Leu Phe
370 375 380
Gly Lys Ser Arg Ile Gly His Phe Glu Met Leu Asn Leu Leu Gln Ser
385 390 395 400
His Val His Ile Lys Gly Thr Thr Ala Asp Asn Ala Thr Ser Ser Gly
405 410 415
Ala Gly Val Val Ile Asn Pro Val Glu Ser Lys Glu Lys Tyr Asp Cys
420 425 430
Glu Val Val Asp Asp Cys Glu Arg Lys Arg Lys Thr Arg Lys Lys Ala
435 440 445
Asp Glu Ser Arg Gln Gln Leu His Ala Ile Val Asp Glu Tyr Ala Ala
450 455 460
Ile Asp Ile Gln Asn Ile Asn Leu Ile Tyr Leu Arg Arg Asp Leu Ile
465 470 475 480
Val Ser Leu Ile Asp Asp Glu Lys Phe Asn Asp Met Val Ile Gly Ser
485 490 495
Ile Val Arg Ile Gln Ile Pro Asn Asn Asp Glu Lys His Asp Phe His
500 505 510
Arg Leu Val Gln Val Val Gly Ile Ser Lys Ile Ser Thr Pro Tyr Thr
515 520 525
Val Gly Glu Lys Thr Ile Asp Val Met Leu Asp Ile Leu Asn Leu Asp
530 535 540
Lys Arg Glu Ser Val Ser Val Gln Gly Ile Ser Asn Gln Glu Phe Thr
545 550 555 560
Glu Glu Glu Cys Arg Arg Leu Arg Arg Ser Ile Lys Cys Gly Leu Val
565 570 575
Lys Arg Phe Arg Val Ser Glu Ile Leu Asp Lys Gly Arg Glu Leu Gln
580 585 590
Ala Leu Lys Ile Lys Asp Leu Leu Gln Lys Glu Ile Ser Gln Leu Thr
595 600 605
His Leu His Asp Gln Ala Ser Glu Lys Gly Asn Val Asp Glu Leu Arg
610 615 620
Tyr Phe Ala Glu Arg Leu His Arg Leu Lys Ser Pro Glu Glu Cys Gln
625 630 635 640
Arg Arg Leu Leu Glu Ile Leu Glu Val Arg Ser Asp Pro Thr Met Asp
645 650 655
Pro Ser Tyr Glu Ser Glu Glu Asp Lys Asp Glu Ser Asn Lys Lys Arg
660 665 670
Gln Gly Ser Leu Lys Arg Ser Arg Asn Tyr Asp Phe Asp Glu Lys Glu
675 680 685
Val Glu Leu Thr Ser Pro Arg Arg Gly Thr Asn Ser Asn Val Ser Gly
690 695 700
Ser Asp Val Gln Gln Asn Ser Thr Ser Thr Ser Glu Gln Ser Arg Asn
705 710 715 720
Ile Ser Leu Leu Ala His Glu Asn Lys Glu Gly Asp Cys Leu Ala Ser
725 730 735
Asp Arg Thr Gly Glu Thr Ser Trp Ala Gly Arg Gly Leu Val Pro Asn
740 745 750
Asn Trp Asn Val Pro Ser Gln Ala Lys Thr Ala Thr Pro Leu Ser Ser
755 760 765
Asp Gly Asn Tyr Gln Val Val Leu Pro Glu Ala Ser Ile Pro Pro Leu
770 775 780
Ser Ile Gly Leu Gly Thr Ser Ser Asn Asp Ala Glu Val Glu Arg Ile
785 790 795 800
Trp Gln Tyr Gln Asp Pro Thr Gly Lys Val Gln Gly Pro Phe Ser Met
805 810 815
Thr Gln Leu Arg Asn Trp Asn Asn Ser Gly His Phe Thr Pro Asp Leu
820 825 830
Arg Val Trp Arg Ile Thr Glu Ser Gln Asn Asp Ala Val Leu Leu Thr
835 840 845
Asn Ala Leu Asn Gly Cys Tyr Thr Lys Ala Ser Ser Ile Trp His Asn
850 855 860
Ser His Ile Leu Ser Leu Gly Arg Gly Asn Gly Leu Ser Leu Gly Gly
865 870 875 880
Ser Asp Asn His His Asn Gly Gln Ser Asn Gly Gly Thr Asp Ser Gly
885 890 895
Thr Asn Leu Ile Arg Phe Gly Val Asp Pro Ile Arg Asn Ser Asn Ser
900 905 910
Glu Gln Lys Asp His Ile Ala Val Cys Asp Ala Glu Asn Glu Pro Met
915 920 925
Met Ser Thr Gly Ser Ser Ser Pro Ser Lys Asp Leu Cys Ala Pro Ala
930 935 940
Asp Thr Val Asn Ser Ile Gln Ser Pro Ala Arg Asn Leu Glu Val Ala
945 950 955 960
His Glu Ser Leu Lys Asn Asn Asn Ser Trp Ser Tyr Pro Ser Leu Met
965 970 975
Asn Leu Leu Ser Ser Ala Thr Leu Ser Leu Gln Pro Pro Val Thr Glu
980 985 990
Val His Gln Ala Lys Glu Asn His Ser Pro Asn Asn Glu Asp Gln Asn
995 1000 1005
Ser Gln Thr Ile Thr Leu Gly Gly Ile His Ser Gln Thr Gly Arg
1010 1015 1020
Lys Lys Arg Ser Ser Ser Glu Asp Cys Ser Ser Gln Ser Ser Gly
1025 1030 1035
Gln Asn Trp Ile Ala Pro Pro Ala Thr Asp Thr Ser Ser Arg Glu
1040 1045 1050
Trp Asn Ser Asn Cys Ser Gly Leu Ser Leu Met Asp Ser Phe Lys
1055 1060 1065
Pro Ser Glu Lys Ile Gly Glu Ile Leu Pro Asp Ile Pro His Ser
1070 1075 1080
Thr Leu Lys Pro Val Thr Ala Asp Ala Glu Ile Lys Gln Ser Ala
1085 1090 1095
Ser Ser Ser Val Leu Val Gln Asn Ser Gly Leu Ser Trp Ser Ser
1100 1105 1110
Ala Ser Ser Leu Pro Gly Gly Arg Gln Leu Pro Ser His Val Ala
1115 1120 1125
Ala Gly Ala Trp Gly Gly Gly Tyr Leu Ala Ala Pro Gly Arg Ala
1130 1135 1140
Ile Glu Asp Leu Asn Ser Ser Phe Ile Thr Ala Ser Gly Met Lys
1145 1150 1155
Ser Ser Asp Ile Ile Asp Asp His Glu Thr Thr Gly Ala Thr Ile
1160 1165 1170
Asn Trp Ile Asp Asp Glu Pro Asn Asp Phe Asn Ser Leu Val Asp
1175 1180 1185
Glu Ser Val Ser Asp Leu Leu Ala Glu Val Glu Ala Met Glu Cys
1190 1195 1200
Leu Ser Gly Leu Ala Ser Thr Ala Ser Met Met Asn Cys Asn Glu
1205 1210 1215
Gly Leu Thr Arg Asp Ser Arg Ser Asp Cys Phe Phe Ser Val Asp
1220 1225 1230
Gly Phe Asn Pro Ala Ala Glu Met Gly Lys Val Asp Ala Leu Ser
1235 1240 1245
Ser Thr Ala Asn Leu Gln Phe Pro Phe Asn Ile Lys Val Lys Asp
1250 1255 1260
Glu Gln Pro
1265
<210> 2
<211> 1053
<212> PRT
<213> 人工的
<220>
<223> 突变型WAP7.1蛋白
<400> 2
Met Asp Lys Pro Leu Asp Pro Pro Leu Asp Phe Tyr Lys Pro Arg Leu
1 5 10 15
Gln Pro Asp Asp Pro Thr Pro Pro Pro Pro Asp Ala Ser Val Leu Gly
20 25 30
Asn Ser His His Pro Pro His Leu Met Asp Ser His Ile Asp Asp Ser
35 40 45
Lys Leu Val Gly Val Pro Val Ala Gly Pro Leu Leu Pro Ala Asp Ser
50 55 60
Ser Pro Ala Ala Lys Leu Asn Ala Lys Phe Lys Asp Lys Val Leu Val
65 70 75 80
Val Asp Lys Thr Leu Gly Ile Arg Arg Arg Gly Arg Pro Pro Arg Gly
85 90 95
Gln Val Lys Pro Pro Pro Leu Pro Pro Arg Gln Lys Lys Asp Glu Glu
100 105 110
Asp Val Cys Phe Ile Cys Phe Asp Gly Gly Ser Leu Val Leu Cys Asp
115 120 125
Arg Arg Gly Cys Pro Lys Ala Tyr His Pro Ser Cys Ile Lys Arg Asp
130 135 140
Glu Ser Phe Phe Arg Ser Lys Ala Lys Trp Asn Cys Gly Trp His Ile
145 150 155 160
Cys Thr Asn Cys Gln Lys Ala Ser Tyr Tyr Met Cys Tyr Thr Cys Pro
165 170 175
Phe Ser Leu Cys Lys Gly Cys Ile Lys Gly Ala Asp Tyr Gln Cys Val
180 185 190
Arg Gly Thr Lys Gly Phe Cys Gly Thr Cys Met Lys Ile Ile Met Leu
195 200 205
Phe Glu Lys Ser Ala Pro Asp Gly Glu Ser Val Gln Val Asp Phe Asp
210 215 220
Asp Lys Ser Ser Trp Glu Tyr Leu Phe Lys Val Tyr Trp Ile Tyr Leu
225 230 235 240
Lys Glu Lys Leu Ser Leu Thr Val Asp Glu Leu Val Arg Ala Lys Asn
245 250 255
Ser Trp Lys Gly Ser Ile Ile Met Asp His Lys Val Ala Ser Ser Glu
260 265 270
Ile Leu Asp Gly Ser Ile Asp Lys Ser Gln Gly Ala His Asn Ser Phe
275 280 285
Arg Asn Pro Lys Ser Gln Arg Lys Arg Pro Asn Arg Gln Gln Ser Ser
290 295 300
Leu Asn Lys Phe Gly Ser Leu Val Asp Arg Pro Ser Ser Asn Glu Gln
305 310 315 320
Phe Ser Val Ser Thr Lys Trp Ala Thr Thr Glu Leu Met Asp Phe Val
325 330 335
Ala His Val Arg Asn Gly Asp Thr Thr Arg Leu Ser Pro Leu Asp Val
340 345 350
Gln Ala Leu Leu Leu Glu Tyr Val Lys Lys Asn Asn Leu Arg Asp Pro
355 360 365
Gln Gln Gln Ser Gln Ile Asn Cys Asp Leu Arg Leu Thr Asn Leu Phe
370 375 380
Gly Lys Ser Arg Ile Gly His Phe Glu Met Leu Asn Leu Leu Gln Ser
385 390 395 400
His Val His Ile Lys Gly Thr Thr Ala Asp Asn Ala Thr Ser Ser Gly
405 410 415
Ala Gly Val Val Ile Asn Pro Val Glu Ser Lys Glu Lys Tyr Asp Cys
420 425 430
Glu Val Val Asp Asp Cys Glu Arg Lys Arg Lys Thr Arg Lys Lys Ala
435 440 445
Asp Glu Ser Arg Gln Gln Leu His Ala Ile Val Asp Glu Tyr Ala Ala
450 455 460
Ile Asp Ile Gln Asn Ile Asn Leu Ile Tyr Leu Arg Arg Asp Leu Ile
465 470 475 480
Val Ser Leu Ile Asp Asp Glu Lys Phe Asn Asp Met Val Ile Gly Ser
485 490 495
Ile Val Arg Ile Gln Ile Pro Asn Asn Asp Glu Lys His Asp Phe His
500 505 510
Arg Leu Val Gln Val Val Gly Ile Ser Lys Ile Ser Thr Pro Tyr Thr
515 520 525
Val Gly Glu Lys Thr Ile Asp Val Met Leu Asp Ile Leu Asn Leu Asp
530 535 540
Lys Arg Glu Ser Val Ser Val Gln Gly Ile Ser Asn Gln Glu Phe Thr
545 550 555 560
Glu Glu Glu Cys Arg Arg Leu Arg Arg Ser Ile Lys Cys Gly Leu Val
565 570 575
Lys Arg Phe Arg Val Ser Glu Ile Leu Asp Lys Gly Arg Glu Leu Gln
580 585 590
Ala Leu Lys Ile Lys Asp Leu Leu Gln Lys Glu Ile Ser Gln Leu Thr
595 600 605
His Leu His Asp Gln Ala Ser Glu Lys Gly Asn Val Asp Glu Leu Arg
610 615 620
Tyr Phe Ala Glu Arg Leu His Arg Leu Lys Ser Pro Glu Glu Cys Gln
625 630 635 640
Arg Arg Leu Leu Glu Ile Leu Glu Val Arg Ser Asp Pro Thr Met Asp
645 650 655
Pro Ser Tyr Glu Ser Glu Glu Asp Lys Asp Glu Ser Asn Lys Lys Arg
660 665 670
Gln Gly Ser Leu Lys Arg Ser Arg Asn Tyr Asp Phe Asp Glu Lys Glu
675 680 685
Val Glu Leu Thr Ser Pro Arg Arg Gly Thr Asn Ser Asn Val Ser Gly
690 695 700
Ser Asp Val Gln Gln Asn Ser Thr Ser Thr Ser Glu Gln Ser Arg Asn
705 710 715 720
Ile Ser Leu Leu Ala His Glu Asn Lys Glu Gly Asp Cys Leu Ala Ser
725 730 735
Asp Arg Thr Gly Glu Thr Ser Trp Ala Gly Arg Gly Leu Val Pro Asn
740 745 750
Asn Trp Asn Val Pro Ser Gln Ala Lys Thr Ala Thr Pro Leu Ser Ser
755 760 765
Asp Gly Asn Tyr Gln Val Val Leu Pro Glu Ala Ser Ile Pro Pro Leu
770 775 780
Ser Ile Gly Leu Gly Thr Ser Ser Asn Asp Ala Glu Val Glu Arg Ile
785 790 795 800
Trp Gln Tyr Gln Asp Pro Thr Gly Lys Val Gln Gly Pro Phe Ser Met
805 810 815
Thr Gln Leu Arg Asn Trp Asn Asn Ser Gly His Phe Thr Pro Asp Leu
820 825 830
Arg Val Trp Arg Ile Thr Glu Ser Gln Asn Asp Ala Val Leu Leu Thr
835 840 845
Asn Ala Leu Asn Gly Cys Tyr Thr Lys Ala Ser Ser Ile Trp His Asn
850 855 860
Ser His Ile Leu Ser Leu Gly Arg Gly Asn Gly Leu Ser Leu Gly Gly
865 870 875 880
Ser Asp Asn His His Asn Gly Gln Ser Asn Gly Gly Thr Asp Ser Gly
885 890 895
Thr Asn Leu Ile Arg Phe Gly Val Asp Pro Ile Arg Asn Ser Asn Ser
900 905 910
Glu Gln Lys Asp His Ile Ala Val Cys Asp Ala Glu Asn Glu Pro Met
915 920 925
Met Ser Thr Gly Ser Ser Ser Pro Ser Lys Asp Leu Cys Ala Pro Ala
930 935 940
Asp Thr Val Asn Ser Ile Gln Ser Pro Ala Arg Asn Leu Glu Val Ala
945 950 955 960
His Glu Ser Leu Lys Asn Asn Asn Ser Trp Ser Tyr Pro Ser Leu Met
965 970 975
Asn Leu Leu Ser Ser Ala Thr Leu Ser Leu Gln Pro Pro Val Thr Glu
980 985 990
Val His Gln Ala Lys Glu Asn His Ser Pro Asn Asn Glu Asp Gln Asn
995 1000 1005
Ser Gln Thr Ile Thr Leu Gly Gly Ile His Ser Gln Thr Gly Arg
1010 1015 1020
Lys Lys Arg Ser Ser Ser Glu Asp Cys Ser Ser Gln Ser Ser Gly
1025 1030 1035
Gln Asn Trp Ile Ala Pro Pro Ala Thr Asp Thr Ser Ser Arg Glu
1040 1045 1050
<210> 3
<211> 3801
<212> DNA
<213> 人工的
<220>
<223> 编码SEQ ID NO: 1的野生型WAP7.1蛋白的cDNA
<400> 3
atggacaaac ccctcgatcc gcctttggat ttctacaaac cccgtcttca acccgatgac 60
cctactccgc cgcctccaga cgcctccgtt ttggggaatt ctcatcaccc tccccacctc 120
atggactccc atatcgacga ttccaagctg gttggagttc cagtcgctgg acccctcctt 180
cctgccgatt cttcacccgc cgctaagctg aatgctaaat tcaaggacaa ggttcttgtt 240
gtcgacaaaa ctctcgggat tcgccgacga ggtcgtcctc ctcgtggtca agtcaagccc 300
cccccgttac cgccgagaca aaagaaggat gaggaggatg tgtgttttat atgctttgat 360
ggtggcagcc ttgttctctg tgatcgccga gggtgtccaa aggcttatca tccatcatgc 420
attaagcgag atgagtcatt ctttcgatcc aaggctaaat ggaattgtgg atggcacata 480
tgcacaaatt gccagaaggc ttcatattat atgtgctata catgcccgtt ttctctgtgc 540
aagggatgca ttaaaggtgc tgattaccag tgtgttaggg gaaccaaagg gttctgtgga 600
acttgtatga aaataataat gctgttcgag aaaagcgcac ctgacggaga atcggtccaa 660
gtcgattttg atgataaaag tagctgggag tatcttttta aagtgtattg gatttacttg 720
aaagaaaaac tctctttaac tgtggatgaa ctcgttcgtg ctaagaattc atggaaagga 780
agcattatca tggaccataa ggtggcttcc agtgagattc tcgatggcag tattgataaa 840
agccaaggag ctcataattc atttagaaac ccaaaatcac aaaggaaaag gcctaacagg 900
caacaaagct ctctgaataa attcggctcc ttagtggaca ggccaagtag taatgagcaa 960
ttttctgtta gcacaaaatg ggcaactaca gagctcatgg actttgttgc ccatgtgaga 1020
aatggtgaca cgacaaggct ttcaccattg gatgtacaag ctttactgct ggagtatgtg 1080
aagaaaaata atcttcgtga tcctcaacag caatcccaaa ttaattgtga tttgaggctt 1140
accaatctat ttgggaaatc acggataggt cactttgaga tgctaaatct tcttcaatct 1200
catgtgcaca taaaaggaac tacagctgat aatgcaacca gctcaggtgc tggtgtagtg 1260
atcaatccag ttgaaagcaa agagaagtat gattgtgaag tagtggatga ttgtgaaaga 1320
aagcgtaaaa cacgcaagaa agctgatgag agcaggcagc aattgcatgc aattgtggat 1380
gaatatgccg caattgacat tcaaaacatt aacttgattt acttgcggcg tgatctgata 1440
gtgagcctca ttgatgatga aaaatttaat gacatggtta taggctctat tgtgagaata 1500
cagattccaa ataatgatga aaaacatgat tttcataggc ttgtccaagt tgtaggcata 1560
agcaagatct ctacaccata cacagtcggt gagaaaacaa ttgatgtgat gcttgatata 1620
ttgaacttgg acaagagaga gtcggtgtct gttcagggga tttctaacca agaatttact 1680
gaggaagaat gcaggcgtct acgccggagc ataaagtgtg ggcttgtcaa acgattcaga 1740
gttagtgaaa ttctggacaa aggaagggaa cttcaagcat tgaagattaa ggatctgctc 1800
caaaaagaga tctctcaact cactcacctc cacgatcaag caagtgagaa gggcaacgtg 1860
gatgaactaa gatattttgc ggagaggtta catcgtctga aatcacctga agaatgccag 1920
cgtaggcttc ttgaaattct tgaagtacgt tctgatccaa ctatggatcc gagttacgag 1980
tctgaagaag ataaggatga atcaaacaag aaaagacaag gaagtctcaa gagatctaga 2040
aattatgact tcgatgaaaa agaggtggag cttacctcac cacgaagagg aaccaattca 2100
aatgttagtg gaagtgatgt acagcaaaat tcgactagta cttcagagca aagtagaaat 2160
attagcttac ttgctcacga gaataaagaa ggtgactgct tggccagtga caggaccggt 2220
gaaacgtcgt gggcaggaag aggtcttgta ccaaataatt ggaatgtacc tagtcaggct 2280
aaaactgcca ctcctttgtc ctctgatggg aattaccaag tggtcttacc tgaagcctca 2340
attccgccac tttctattgg gttaggaact tcttctaatg atgcagaagt ggaaaggata 2400
tggcaatacc aggatccgac tggaaaagtt cagggtccat tttctatgac gcagttacgc 2460
aattggaaca atagtggaca cttcactcct gatcttagag tatggaggat aactgaatca 2520
caaaatgacg ctgtactgtt aaccaatgca ttaaatggat gttacaccaa agcatcttcc 2580
atttggcaca acagtcatat tctgagtcta gggcgaggaa atggactttc tttgggtggt 2640
tcagataatc atcataatgg tcaaagtaat ggaggtactg attctggtac aaatttaatt 2700
cggtttggcg tggatcctat caggaatagc aattctgagc agaaagatca tattgcagtt 2760
tgtgatgctg aaaatgagcc catgatgagc actggttcaa gctcaccttc taaagatttg 2820
tgtgcacctg cagacactgt caactctatt cagtctccag ctaggaacct tgaggtagca 2880
cacgagtcat tgaagaacaa taattcgtgg tcctacccat cccttatgaa tttactttca 2940
tcagcgacgt tatctttaca accacctgta actgaagtcc atcaggctaa ggaaaaccac 3000
agccctaata acgaggatca gaattcacag accattactt tgggaggaat tcatagtcaa 3060
accggtcgca agaaacggtc tagtagtgag gattgttcta gtcaatcttc agggcaaaac 3120
tggatcgctc cacctgcaac ggatacttcc tctcgtgaat ggaactctaa ttgtagtggt 3180
ctttctttga tggattcatt caagccatca gagaaaattg gagaaatttt acctgatatt 3240
cctcattcta ccctgaaacc ggtgactgca gatgctgaaa ttaaacaatc tgcatcttca 3300
agtgttcttg ttcagaattc tggccttagc tggagtagcg cctcaagttt accgggtgga 3360
cgacagcttc ctagtcatgt agcagcgggt gcttgggggg gtgggtattt ggctgcacca 3420
ggtagagcaa ttgaggactt gaactccagt ttcataactg catctggtat gaaatcatct 3480
gatataatcg acgatcacga gacaactggg gctacaataa attggattga tgatgaaccc 3540
aatgacttca attccttggt cgatgaatct gtctcagatt tgttagcaga agttgaagca 3600
atggaatgct tgagtggttt ggcttccaca gcatcgatga tgaattgtaa cgagggatta 3660
actcgggatt ctagaagtga ttgttttttc tcagtcgatg gtttcaatcc agcagctgag 3720
atggggaagg tggatgcatt aagctccaca gccaatttgc agtttccatt taacatcaaa 3780
gtgaaagatg agcaaccttg a 3801
<210> 4
<211> 3801
<212> DNA
<213> 人工的
<220>
<223> 编码SEQ ID NO: 2的突变型蛋白的cDNA
<400> 4
atggacaaac ccctcgatcc gcctttggat ttctacaaac cccgtcttca acccgatgac 60
cctactccgc cgcctccaga cgcctccgtt ttggggaatt ctcatcaccc tccccacctc 120
atggactccc atatcgacga ttccaagctg gttggagttc cagtcgctgg acccctcctt 180
cctgccgatt cttcacccgc cgctaagctg aatgctaaat tcaaggacaa ggttcttgtt 240
gtcgacaaaa ctctcgggat tcgccgacga ggtcgtcctc ctcgtggtca agtcaagccc 300
cccccgttac cgccgagaca aaagaaggat gaggaggatg tgtgttttat atgctttgat 360
ggtggcagcc ttgttctctg tgatcgccga gggtgtccaa aggcttatca tccatcatgc 420
attaagcgag atgagtcatt ctttcgatcc aaggctaaat ggaattgtgg atggcacata 480
tgcacaaatt gccagaaggc ttcatattat atgtgctata catgcccgtt ttctctgtgc 540
aagggatgca ttaaaggtgc tgattaccag tgtgttaggg gaaccaaagg gttctgtgga 600
acttgtatga aaataataat gctgttcgag aaaagcgcac ctgacggaga atcggtccaa 660
gtcgattttg atgataaaag tagctgggag tatcttttta aagtgtattg gatttacttg 720
aaagaaaaac tctctttaac tgtggatgaa ctcgttcgtg ctaagaattc atggaaagga 780
agcattatca tggaccataa ggtggcttcc agtgagattc tcgatggcag tattgataaa 840
agccaaggag ctcataattc atttagaaac ccaaaatcac aaaggaaaag gcctaacagg 900
caacaaagct ctctgaataa attcggctcc ttagtggaca ggccaagtag taatgagcaa 960
ttttctgtta gcacaaaatg ggcaactaca gagctcatgg actttgttgc ccatgtgaga 1020
aatggtgaca cgacaaggct ttcaccattg gatgtacaag ctttactgct ggagtatgtg 1080
aagaaaaata atcttcgtga tcctcaacag caatcccaaa ttaattgtga tttgaggctt 1140
accaatctat ttgggaaatc acggataggt cactttgaga tgctaaatct tcttcaatct 1200
catgtgcaca taaaaggaac tacagctgat aatgcaacca gctcaggtgc tggtgtagtg 1260
atcaatccag ttgaaagcaa agagaagtat gattgtgaag tagtggatga ttgtgaaaga 1320
aagcgtaaaa cacgcaagaa agctgatgag agcaggcagc aattgcatgc aattgtggat 1380
gaatatgccg caattgacat tcaaaacatt aacttgattt acttgcggcg tgatctgata 1440
gtgagcctca ttgatgatga aaaatttaat gacatggtta taggctctat tgtgagaata 1500
cagattccaa ataatgatga aaaacatgat tttcataggc ttgtccaagt tgtaggcata 1560
agcaagatct ctacaccata cacagtcggt gagaaaacaa ttgatgtgat gcttgatata 1620
ttgaacttgg acaagagaga gtcggtgtct gttcagggga tttctaacca agaatttact 1680
gaggaagaat gcaggcgtct acgccggagc ataaagtgtg ggcttgtcaa acgattcaga 1740
gttagtgaaa ttctggacaa aggaagggaa cttcaagcat tgaagattaa ggatctgctc 1800
caaaaagaga tctctcaact cactcacctc cacgatcaag caagtgagaa gggcaacgtg 1860
gatgaactaa gatattttgc ggagaggtta catcgtctga aatcacctga agaatgccag 1920
cgtaggcttc ttgaaattct tgaagtacgt tctgatccaa ctatggatcc gagttacgag 1980
tctgaagaag ataaggatga atcaaacaag aaaagacaag gaagtctcaa gagatctaga 2040
aattatgact tcgatgaaaa agaggtggag cttacctcac cacgaagagg aaccaattca 2100
aatgttagtg gaagtgatgt acagcaaaat tcgactagta cttcagagca aagtagaaat 2160
attagcttac ttgctcacga gaataaagaa ggtgactgct tggccagtga caggaccggt 2220
gaaacgtcgt gggcaggaag aggtcttgta ccaaataatt ggaatgtacc tagtcaggct 2280
aaaactgcca ctcctttgtc ctctgatggg aattaccaag tggtcttacc tgaagcctca 2340
attccgccac tttctattgg gttaggaact tcttctaatg atgcagaagt ggaaaggata 2400
tggcaatacc aggatccgac tggaaaagtt cagggtccat tttctatgac gcagttacgc 2460
aattggaaca atagtggaca cttcactcct gatcttagag tatggaggat aactgaatca 2520
caaaatgacg ctgtactgtt aaccaatgca ttaaatggat gttacaccaa agcatcttcc 2580
atttggcaca acagtcatat tctgagtcta gggcgaggaa atggactttc tttgggtggt 2640
tcagataatc atcataatgg tcaaagtaat ggaggtactg attctggtac aaatttaatt 2700
cggtttggcg tggatcctat caggaatagc aattctgagc agaaagatca tattgcagtt 2760
tgtgatgctg aaaatgagcc catgatgagc actggttcaa gctcaccttc taaagatttg 2820
tgtgcacctg cagacactgt caactctatt cagtctccag ctaggaacct tgaggtagca 2880
cacgagtcat tgaagaacaa taattcgtgg tcctacccat cccttatgaa tttactttca 2940
tcagcgacgt tatctttaca accacctgta actgaagtcc atcaggctaa ggaaaaccac 3000
agccctaata acgaggatca gaattcacag accattactt tgggaggaat tcatagtcaa 3060
accggtcgca agaaacggtc tagtagtgag gattgttcta gtcaatcttc agggcaaaac 3120
tggatcgctc cacctgcaac ggatacttcc tctcgtgaat gaaactctaa ttgtagtggt 3180
ctttctttga tggattcatt caagccatca gagaaaattg gagaaatttt acctgatatt 3240
cctcattcta ccctgaaacc ggtgactgca gatgctgaaa ttaaacaatc tgcatcttca 3300
agtgttcttg ttcagaattc tggccttagc tggagtagcg cctcaagttt accgggtgga 3360
cgacagcttc ctagtcatgt agcagcgggt gcttgggggg gtgggtattt ggctgcacca 3420
ggtagagcaa ttgaggactt gaactccagt ttcataactg catctggtat gaaatcatct 3480
gatataatcg acgatcacga gacaactggg gctacaataa attggattga tgatgaaccc 3540
aatgacttca attccttggt cgatgaatct gtctcagatt tgttagcaga agttgaagca 3600
atggaatgct tgagtggttt ggcttccaca gcatcgatga tgaattgtaa cgagggatta 3660
actcgggatt ctagaagtga ttgttttttc tcagtcgatg gtttcaatcc agcagctgag 3720
atggggaagg tggatgcatt aagctccaca gccaatttgc agtttccatt taacatcaaa 3780
gtgaaagatg agcaaccttg a 3801
<210> 5
<211> 101
<212> DNA
<213> 人工的
<220>
<223> 标记物mWM23348403
<220>
<221> [G/A] SNP
<222> (51)..(51)
<400> 5
gggcaaaact ggatcgctcc acctgcaacg gatacttcct ctcgtgaatg aaactctaat 60
tgtagtggtc tttctttgat ggattcattc aagccatcag a 101
<210> 6
<211> 8033
<212> DNA
<213> 人工的
<220>
<223> 野生型WAP7.1基因组序列
<400> 6
atggacaaac ccctcgatcc gcctttggat ttctacaaac cccgtcttca acccgatgac 60
cctactccgc cgcctccaga cgcctccgtt ttggggaatt ctcatcaccc tccccacctc 120
atggactccc atatcgacga ttccaagctg gttggagttc cagtcgctgg acccctcctt 180
cctgccgatt cttcacccgc cgctaagctg aatgctaaat tcaaggacaa ggttcttgtt 240
gtcgacaaaa ctctcgggat tcgccgacga ggtcgtcctc ctcgtggtca agtcaagccc 300
cccccgttac cgccgagaca aaagaaggat gaggaggatg tgtgttttat atgctttgat 360
ggtggcagcc ttgttctctg tgatcgccgg tgagtggact ttgtttgtgc aaatttgttg 420
tgtggcttgc cgcaagtttc ggggacgatg agagattttt tttccccctc tactttggat 480
ttatggaatc tttgctttgc gcgttcgcct tttatttagg gaattccgtc tcgatcacac 540
ttgagcttgt tgattagttg tagctattta agcggagatt tcgctgttaa tataatacgt 600
tgctccaatg aatttatctt gatttagttg aggtgaagga cacggaaata gtaattcttt 660
aattttgtac atctaaggtg agagaaaatt ttccttattt gagcgtaata ttacaatttc 720
acctcaattg tttcccattt cgttgtctct tactctttgc atgttctggg ttgtggtata 780
tttgattcgt tccccttaag aaatggtttt catttattgt tatttgacag agggtgtcca 840
aaggcttatc atccatcatg cattaagcga gatgagtcat tctttcgatc caaggctaaa 900
tggaattgtg gtacgtagct ttgtgttttt ggttgttctc cggctgttac ttactgcact 960
gcactcgact gtggatgtca gtataatatt tattttctac ccaatattca ctatcgttta 1020
gaattcaaga tgcaatcttt tttcatcgtt gtgcaggatg gcacatatgc acaaattgcc 1080
agaaggcttc atattatatg tgctatacat gcccgttttc tctgtgcaag ggatgcatta 1140
aaggtgctga ttaccagtgt gttaggggaa ccaaagggtt ctgtggaact tgtatgaaaa 1200
taataatgct gttcgagaaa agcgcacctg acggagaatc ggtatgaaaa aattcgatgt 1260
tgtcttcctg tctatgcatg tatgacattc tattatttat ttctcaagtc tacttatact 1320
tccaattcga tagtggataa tatgaagaaa ttcattcatc atgtggtata tgcatgcaca 1380
ctcaagaaaa tccttctttg ctttccgttt cactcaagtg attcttggtt tgagattcac 1440
attccatctt tttatttgcc tggcgataaa ttcatctagt cgttcggagt atcgtttttg 1500
tttttggacc tggctattaa atgcatatat tagccatttt ctgtacgtca gtttctaatt 1560
tatgccttct atgttgtttc taacatccaa taaattgttc ttaaaatatg caggtccaag 1620
tcgattttga tgataaaagt agctgggagt atctttttaa agtgtattgg atttacttga 1680
aagaaaaact ctctttaact gtggatgaac tcgttcgtgc taagaattca tggaaaggaa 1740
gcattatcat ggaccataag gtggcttcca gtgagattct cgatggcagt attgataaaa 1800
gccaaggagc tcataattca tttagaaacc caaaatcaca aaggaaaagg cctaacaggc 1860
aacaaagctc tctgaataaa ttcggctcct tagtggacag gccaagtagt aatgagcaat 1920
tttctgttag cacaaaatgg gcaactacag agctcatgga ctttgttgcc catgtgagaa 1980
atggtgacac gacaaggctt tcaccattgg atgtacaagc tttactgctg gagtatgtga 2040
agaaaaataa tcttcgtgat cctcaacagc aatcccaaat taattgtgat ttgaggctta 2100
ccaatctatt tgggaaatca cggataggtc actttgagat gctaaatctt cttcaatctc 2160
atgtgcacat aaaaggaact acagctgata atgcaaccag ctcaggtgct ggtgtagtga 2220
tcaatccagt tgaaagcaaa gagaagtatg attgtgaagt agtggatgat tgtgaaagaa 2280
agcgtaaaac acgcaagaaa gctgatgaga gcaggcagca attgcatgca attgtggatg 2340
aatatgccgc aattgacatt caaaacatta acttgattta cttgcggcgt gatctgatag 2400
tgagcctcat tgatgatgaa aaatttaatg acatggttat aggctctatt gtgagaatac 2460
agattccaaa taatgatgaa aaacatgatt ttcataggct tgtccaagtt gtaggtatta 2520
atatctaata ttaatgcttg atatgacata caatgatata tacatatttt taccctcgat 2580
cttaacattt tgcatatgtg tttaggcata agcaagatct ctacaccata cacagtcggt 2640
gagaaaacaa ttgatgtgat gcttgatata ttgaacttgg acaagagaga gtcggtgtct 2700
gttcagggga tttctaacca agaatttact gaggttatta aacttacctt attaattgaa 2760
aatgatagtt tcgtcgatct ctggtttaca tggctagttt gatgtcagtg actgatttta 2820
taatggtggt tacatagttt ctattatttt tatgcaagtt aaattcaatt attatgctta 2880
agtccgcaat tgctttggtt ttgtagttga tttgtttgtc tgttcagaat gtctacagaa 2940
catgctacat cttacggtct cacgggtttg cttctagttt aggccatatt gaagtagata 3000
acggttccac acattctaag ttggaccctt gcctcattct caggattttc tcaaattgtt 3060
ttctaaaata taatgatggg gaggaaaagc ccatatttat tatttccaca tgtttagttt 3120
ttttgattgg tttctcatct cttttgattt ccgaagagag attgaattat catttctgtt 3180
ggagaccgaa tgggatgttg attaagaaac tcaacaaaca aaatgaacta atttttgggt 3240
tagagaactt tttatgtaaa gctaattgct cggaaatgca actacatgtt tctggctcaa 3300
aacagggaaa aaagaaaaaa gacaccaact taagcaatgt ttgagatact ttttatacaa 3360
gtcatccctc aaatcttttc tttgcagtat gattgtgatt ttgaagttcg tgtatcatct 3420
ttatattggc ttcttttgat caaaagagtg gtattgatgg ttggtggtcc cctctttcag 3480
ttgatatgta atgtgatgga catgctactt gtgtcattgt taatttttct aagaaatgcg 3540
tgcatgcatt ttacccttcc agtattgatg tattagtata tactcaggaa gaatgcaggc 3600
gtctacgccg gagcataaag tgtgggcttg tcaaacgatt cagagttgta agattacata 3660
tccatagatt tttttatatt tcaacctatt tagctgttgt gcctttaact cctatacagc 3720
ttgtgttgtt tatagaaatt tttgtttttg actgcagagt gaaattctgg acaaaggaag 3780
ggaacttcaa gcattgaaga ttaaggatgt gagttcaacc ccacttttgt caatcatgag 3840
actcaattac attctgcttt ggtttttttt tcttttcttt ttttgggtgt gtttctcttt 3900
ttgggggttt agaaattaga gtttatccat cttgaaagca atcagataaa acaaatacca 3960
gagtctaaag actattctcg attctcgaac taatgataat tcagaataac tcacgtccca 4020
taccacacat ctttggtgta tcacatctat ctttgacatc agataggatg cagtagtatc 4080
ttacacgctg tgatgttgaa gtagtgggag tggcttagaa gttagaatca gatctttaat 4140
gaaattttgc attaaaaagg ccaaaccccc caaaaaaaag ggccaaacca aggccacaaa 4200
aggtcaacct ccgcccaaaa ccagatcttt agtgaaaata aacttgcata aattcccatt 4260
atatttggat aggttctatt taaaatggaa aattagttta atcaattttt atatatgata 4320
tttttcttac tcgaaatacc aagcaaacat ctgataattt gagagaggct tcccatccat 4380
ctttgttatt atcctttttt ttttctggga gggggttctc cctactgccc cgcccctatg 4440
ttgttctctc tctttccttt gattaactcc acatcgtttc ttatctaaaa aaatatagat 4500
aaagaaatag caagcgaacc tcattagaat actttcctga atttttcatc cttatttttc 4560
ttaaccaaaa atatgttcaa ctatttatga gacgatcaac taagtctaag ttgtatgaaa 4620
ttcctttttt tattttttta tttaattttt ttagattaag tttccaacta ttactaaaag 4680
agggggctaa accatatgat atgttttttt ggataagaaa accatatgat atgttataga 4740
ttagtagatt acaattatag atgagatgcc taggacttta acatgtatta catagatgga 4800
aactggaata tatgttttga agaaattaat atgcctgata aatcttcttt tcatttaata 4860
gtatttatga tgccaatatg tgagtcctct ctctgtctct gtctttcttt ctttctttct 4920
tctagggtga tgattgctat gaactgaagt ttacataatc actaaatgat taattcttgg 4980
cctagacaat gttgcaaaga caatgatatg tcatacagaa tggtgttata aactgtgata 5040
gaaagtttta atgcaggtgg tagagagatt ttgaaatatt tagtagggaa aataggggga 5100
aacagttatc ttgattttat ttatatcatt tttaaaaggg catgttcttt aatggtcgat 5160
gagttggtct cttttcttgg tttggctaag gccagaaaca tatggctggg atagagatgt 5220
tcaaaaggtg tcaagctttg gccaacacac ttaaatagtg tggggagtct tcttgagccc 5280
gtggatcagt tatattttag agtattataa ggctagtaac attaaagaca actttgattg 5340
ttttcatgtt tggtcatgtg attgatttgt ttccgtactg ttctgttttt tgatgtgctt 5400
ggtttggtct tttgttgtat gtgtcataat ttctttccag ctgctccaaa aagagatctc 5460
tcaactcact cacctccacg atcaagcaag tgagaagggc aacgtggatg aatatccttt 5520
tatgagatgt cattttgaac tcactctttt atgctatcgt gcttgtcgac aatggtgaat 5580
aaatacctct attttcaaca tatcttcttt ccatttcctc ccgttcttct ttgcatattt 5640
tttttttttt tgtttcatga atattgagta cttgattagt ggcttttccc acaaaagttc 5700
tctcttgaat ttatcaatgc aagctggagg ttctctttaa ttatagtttc atgccttcta 5760
ttttaaattt aacttttgtg acgccttttc aaatgacaag ttatctggct tcctggtttt 5820
gttaactaca ttgcacatct gtgcactgaa atatggaatt tgctttacac ccatattcaa 5880
ggactacaag atccactgga gcagagaagt tgaatgttct tcaatttatg cacatttcat 5940
ttgtttaact ttaggctgat gtggatgatt gtatttatag aaaagatttt tagttccttg 6000
actataccat acactaagat attttgcgga gaggttacat cgtctgaaat cacctgaaga 6060
atgccagcgt aggcttcttg aaattcttga agtacgttct gatccaacta tggatccgag 6120
ttacgagtct gaagaagata aggatgaatc aaacaagaaa agacaaggtc tgttaactgt 6180
cttttgttat tatggaacta ttttcaagtt tttccttgag ttagtattct gtaaatttat 6240
gtgtatgtgc aggaagtctc aagagatcta gaaattatga cttcgatgaa aaagaggtgg 6300
agcttacctc accacgaaga ggaaccaatt caaatgttag tggaagtgat gtacagcaaa 6360
attcgactag tacttcagag caaagtagaa atattagctt acttgctcac gagaataaag 6420
aaggtgactg cttggccagt gacaggaccg gtgaaacgtc gtgggcagga agaggtcttg 6480
taccaaataa ttggaatgta cctagtcagg ctaaaactgc cactcctttg tcctctgatg 6540
ggaattacca agtggtctta cctgaagcct caattccgcc actttctatt gggttaggaa 6600
cttcttctaa tgatgcagaa gtggaaagga tatggcaata ccaggatccg actggaaaag 6660
ttcagggtcc attttctatg acgcagttac gcaattggaa caatagtgga cacttcactc 6720
ctgatcttag agtatggagg ataactgaat cacaaaatga cgctgtactg ttaaccaatg 6780
cattaaatgg atgttacacc aaagcatctt ccatttggca caacagtcat attctgagtc 6840
tagggcgagg aaatggactt tctttgggtg gttcagataa tcatcataat ggtcaaagta 6900
atggaggtac tgattctggt acaaatttaa ttcggtttgg cgtggatcct atcaggaata 6960
gcaattctga gcagaaagat catattgcag tttgtgatgc tgaaaatgag cccatgatga 7020
gcactggttc aagctcacct tctaaagatt tgtgtgcacc tgcagacact gtcaactcta 7080
ttcagtctcc agctaggaac cttgaggtag cacacgagtc attgaagaac aataattcgt 7140
ggtcctaccc atcccttatg aatttacttt catcagcgac gttatcttta caaccacctg 7200
taactgaagt ccatcaggct aaggaaaacc acagccctaa taacgaggat cagaattcac 7260
agaccattac tttgggagga attcatagtc aaaccggtcg caagaaacgg tctagtagtg 7320
aggattgttc tagtcaatct tcagggcaaa actggatcgc tccacctgca acggatactt 7380
cctctcgtga atggaactct aattgtagtg gtctttcttt gatggattca ttcaagccat 7440
cagagaaaat tggagaaatt ttacctgata ttcctcattc taccctgaaa ccggtgactg 7500
cagatgctga aattaaacaa tctgcatctt caagtgttct tgttcagaat tctggcctta 7560
gctggagtag cgcctcaagt ttaccgggtg gacgacagct tcctagtcat gtagcagcgg 7620
gtgcttgggg gggtgggtat ttggctgcac caggtagagc aattgaggac ttgaactcca 7680
gtttcataac tgcatctggt atgaaatcat ctgatataat cgacgatcac gagacaactg 7740
gggctacaat aaattggatt gatgatgaac ccaatgactt caattccttg gtcgatgaat 7800
ctgtctcaga tttgttagca gaagttgaag caatggaatg cttgagtggt ttggcttcca 7860
cagcatcgat gatgaattgt aacgagggat taactcggga ttctagaagt gattgttttt 7920
tctcagtcga tggtttcaat ccagcagctg agatggggaa ggtggatgca ttaagctcca 7980
cagccaattt gcagtttcca tttaacatca aagtgaaaga tgagcaacct tga 8033
<210> 7
<211> 8033
<212> DNA
<213> 人工的
<220>
<223> 突变型WAP7.1基因组序列
<400> 7
atggacaaac ccctcgatcc gcctttggat ttctacaaac cccgtcttca acccgatgac 60
cctactccgc cgcctccaga cgcctccgtt ttggggaatt ctcatcaccc tccccacctc 120
atggactccc atatcgacga ttccaagctg gttggagttc cagtcgctgg acccctcctt 180
cctgccgatt cttcacccgc cgctaagctg aatgctaaat tcaaggacaa ggttcttgtt 240
gtcgacaaaa ctctcgggat tcgccgacga ggtcgtcctc ctcgtggtca agtcaagccc 300
cccccgttac cgccgagaca aaagaaggat gaggaggatg tgtgttttat atgctttgat 360
ggtggcagcc ttgttctctg tgatcgccgg tgagtggact ttgtttgtgc aaatttgttg 420
tgtggcttgc cgcaagtttc ggggacgatg agagattttt tttccccctc tactttggat 480
ttatggaatc tttgctttgc gcgttcgcct tttatttagg gaattccgtc tcgatcacac 540
ttgagcttgt tgattagttg tagctattta agcggagatt tcgctgttaa tataatacgt 600
tgctccaatg aatttatctt gatttagttg aggtgaagga cacggaaata gtaattcttt 660
aattttgtac atctaaggtg agagaaaatt ttccttattt gagcgtaata ttacaatttc 720
acctcaattg tttcccattt cgttgtctct tactctttgc atgttctggg ttgtggtata 780
tttgattcgt tccccttaag aaatggtttt catttattgt tatttgacag agggtgtcca 840
aaggcttatc atccatcatg cattaagcga gatgagtcat tctttcgatc caaggctaaa 900
tggaattgtg gtacgtagct ttgtgttttt ggttgttctc cggctgttac ttactgcact 960
gcactcgact gtggatgtca gtataatatt tattttctac ccaatattca ctatcgttta 1020
gaattcaaga tgcaatcttt tttcatcgtt gtgcaggatg gcacatatgc acaaattgcc 1080
agaaggcttc atattatatg tgctatacat gcccgttttc tctgtgcaag ggatgcatta 1140
aaggtgctga ttaccagtgt gttaggggaa ccaaagggtt ctgtggaact tgtatgaaaa 1200
taataatgct gttcgagaaa agcgcacctg acggagaatc ggtatgaaaa aattcgatgt 1260
tgtcttcctg tctatgcatg tatgacattc tattatttat ttctcaagtc tacttatact 1320
tccaattcga tagtggataa tatgaagaaa ttcattcatc atgtggtata tgcatgcaca 1380
ctcaagaaaa tccttctttg ctttccgttt cactcaagtg attcttggtt tgagattcac 1440
attccatctt tttatttgcc tggcgataaa ttcatctagt cgttcggagt atcgtttttg 1500
tttttggacc tggctattaa atgcatatat tagccatttt ctgtacgtca gtttctaatt 1560
tatgccttct atgttgtttc taacatccaa taaattgttc ttaaaatatg caggtccaag 1620
tcgattttga tgataaaagt agctgggagt atctttttaa agtgtattgg atttacttga 1680
aagaaaaact ctctttaact gtggatgaac tcgttcgtgc taagaattca tggaaaggaa 1740
gcattatcat ggaccataag gtggcttcca gtgagattct cgatggcagt attgataaaa 1800
gccaaggagc tcataattca tttagaaacc caaaatcaca aaggaaaagg cctaacaggc 1860
aacaaagctc tctgaataaa ttcggctcct tagtggacag gccaagtagt aatgagcaat 1920
tttctgttag cacaaaatgg gcaactacag agctcatgga ctttgttgcc catgtgagaa 1980
atggtgacac gacaaggctt tcaccattgg atgtacaagc tttactgctg gagtatgtga 2040
agaaaaataa tcttcgtgat cctcaacagc aatcccaaat taattgtgat ttgaggctta 2100
ccaatctatt tgggaaatca cggataggtc actttgagat gctaaatctt cttcaatctc 2160
atgtgcacat aaaaggaact acagctgata atgcaaccag ctcaggtgct ggtgtagtga 2220
tcaatccagt tgaaagcaaa gagaagtatg attgtgaagt agtggatgat tgtgaaagaa 2280
agcgtaaaac acgcaagaaa gctgatgaga gcaggcagca attgcatgca attgtggatg 2340
aatatgccgc aattgacatt caaaacatta acttgattta cttgcggcgt gatctgatag 2400
tgagcctcat tgatgatgaa aaatttaatg acatggttat aggctctatt gtgagaatac 2460
agattccaaa taatgatgaa aaacatgatt ttcataggct tgtccaagtt gtaggtatta 2520
atatctaata ttaatgcttg atatgacata caatgatata tacatatttt taccctcgat 2580
cttaacattt tgcatatgtg tttaggcata agcaagatct ctacaccata cacagtcggt 2640
gagaaaacaa ttgatgtgat gcttgatata ttgaacttgg acaagagaga gtcggtgtct 2700
gttcagggga tttctaacca agaatttact gaggttatta aacttacctt attaattgaa 2760
aatgatagtt tcgtcgatct ctggtttaca tggctagttt gatgtcagtg actgatttta 2820
taatggtggt tacatagttt ctattatttt tatgcaagtt aaattcaatt attatgctta 2880
agtccgcaat tgctttggtt ttgtagttga tttgtttgtc tgttcagaat gtctacagaa 2940
catgctacat cttacggtct cacgggtttg cttctagttt aggccatatt gaagtagata 3000
acggttccac acattctaag ttggaccctt gcctcattct caggattttc tcaaattgtt 3060
ttctaaaata taatgatggg gaggaaaagc ccatatttat tatttccaca tgtttagttt 3120
ttttgattgg tttctcatct cttttgattt ccgaagagag attgaattat catttctgtt 3180
ggagaccgaa tgggatgttg attaagaaac tcaacaaaca aaatgaacta atttttgggt 3240
tagagaactt tttatgtaaa gctaattgct cggaaatgca actacatgtt tctggctcaa 3300
aacagggaaa aaagaaaaaa gacaccaact taagcaatgt ttgagatact ttttatacaa 3360
gtcatccctc aaatcttttc tttgcagtat gattgtgatt ttgaagttcg tgtatcatct 3420
ttatattggc ttcttttgat caaaagagtg gtattgatgg ttggtggtcc cctctttcag 3480
ttgatatgta atgtgatgga catgctactt gtgtcattgt taatttttct aagaaatgcg 3540
tgcatgcatt ttacccttcc agtattgatg tattagtata tactcaggaa gaatgcaggc 3600
gtctacgccg gagcataaag tgtgggcttg tcaaacgatt cagagttgta agattacata 3660
tccatagatt tttttatatt tcaacctatt tagctgttgt gcctttaact cctatacagc 3720
ttgtgttgtt tatagaaatt tttgtttttg actgcagagt gaaattctgg acaaaggaag 3780
ggaacttcaa gcattgaaga ttaaggatgt gagttcaacc ccacttttgt caatcatgag 3840
actcaattac attctgcttt ggtttttttt tcttttcttt ttttgggtgt gtttctcttt 3900
ttgggggttt agaaattaga gtttatccat cttgaaagca atcagataaa acaaatacca 3960
gagtctaaag actattctcg attctcgaac taatgataat tcagaataac tcacgtccca 4020
taccacacat ctttggtgta tcacatctat ctttgacatc agataggatg cagtagtatc 4080
ttacacgctg tgatgttgaa gtagtgggag tggcttagaa gttagaatca gatctttaat 4140
gaaattttgc attaaaaagg ccaaaccccc caaaaaaaag ggccaaacca aggccacaaa 4200
aggtcaacct ccgcccaaaa ccagatcttt agtgaaaata aacttgcata aattcccatt 4260
atatttggat aggttctatt taaaatggaa aattagttta atcaattttt atatatgata 4320
tttttcttac tcgaaatacc aagcaaacat ctgataattt gagagaggct tcccatccat 4380
ctttgttatt atcctttttt ttttctggga gggggttctc cctactgccc cgcccctatg 4440
ttgttctctc tctttccttt gattaactcc acatcgtttc ttatctaaaa aaatatagat 4500
aaagaaatag caagcgaacc tcattagaat actttcctga atttttcatc cttatttttc 4560
ttaaccaaaa atatgttcaa ctatttatga gacgatcaac taagtctaag ttgtatgaaa 4620
ttcctttttt tattttttta tttaattttt ttagattaag tttccaacta ttactaaaag 4680
agggggctaa accatatgat atgttttttt ggataagaaa accatatgat atgttataga 4740
ttagtagatt acaattatag atgagatgcc taggacttta acatgtatta catagatgga 4800
aactggaata tatgttttga agaaattaat atgcctgata aatcttcttt tcatttaata 4860
gtatttatga tgccaatatg tgagtcctct ctctgtctct gtctttcttt ctttctttct 4920
tctagggtga tgattgctat gaactgaagt ttacataatc actaaatgat taattcttgg 4980
cctagacaat gttgcaaaga caatgatatg tcatacagaa tggtgttata aactgtgata 5040
gaaagtttta atgcaggtgg tagagagatt ttgaaatatt tagtagggaa aataggggga 5100
aacagttatc ttgattttat ttatatcatt tttaaaaggg catgttcttt aatggtcgat 5160
gagttggtct cttttcttgg tttggctaag gccagaaaca tatggctggg atagagatgt 5220
tcaaaaggtg tcaagctttg gccaacacac ttaaatagtg tggggagtct tcttgagccc 5280
gtggatcagt tatattttag agtattataa ggctagtaac attaaagaca actttgattg 5340
ttttcatgtt tggtcatgtg attgatttgt ttccgtactg ttctgttttt tgatgtgctt 5400
ggtttggtct tttgttgtat gtgtcataat ttctttccag ctgctccaaa aagagatctc 5460
tcaactcact cacctccacg atcaagcaag tgagaagggc aacgtggatg aatatccttt 5520
tatgagatgt cattttgaac tcactctttt atgctatcgt gcttgtcgac aatggtgaat 5580
aaatacctct attttcaaca tatcttcttt ccatttcctc ccgttcttct ttgcatattt 5640
tttttttttt tgtttcatga atattgagta cttgattagt ggcttttccc acaaaagttc 5700
tctcttgaat ttatcaatgc aagctggagg ttctctttaa ttatagtttc atgccttcta 5760
ttttaaattt aacttttgtg acgccttttc aaatgacaag ttatctggct tcctggtttt 5820
gttaactaca ttgcacatct gtgcactgaa atatggaatt tgctttacac ccatattcaa 5880
ggactacaag atccactgga gcagagaagt tgaatgttct tcaatttatg cacatttcat 5940
ttgtttaact ttaggctgat gtggatgatt gtatttatag aaaagatttt tagttccttg 6000
actataccat acactaagat attttgcgga gaggttacat cgtctgaaat cacctgaaga 6060
atgccagcgt aggcttcttg aaattcttga agtacgttct gatccaacta tggatccgag 6120
ttacgagtct gaagaagata aggatgaatc aaacaagaaa agacaaggtc tgttaactgt 6180
cttttgttat tatggaacta ttttcaagtt tttccttgag ttagtattct gtaaatttat 6240
gtgtatgtgc aggaagtctc aagagatcta gaaattatga cttcgatgaa aaagaggtgg 6300
agcttacctc accacgaaga ggaaccaatt caaatgttag tggaagtgat gtacagcaaa 6360
attcgactag tacttcagag caaagtagaa atattagctt acttgctcac gagaataaag 6420
aaggtgactg cttggccagt gacaggaccg gtgaaacgtc gtgggcagga agaggtcttg 6480
taccaaataa ttggaatgta cctagtcagg ctaaaactgc cactcctttg tcctctgatg 6540
ggaattacca agtggtctta cctgaagcct caattccgcc actttctatt gggttaggaa 6600
cttcttctaa tgatgcagaa gtggaaagga tatggcaata ccaggatccg actggaaaag 6660
ttcagggtcc attttctatg acgcagttac gcaattggaa caatagtgga cacttcactc 6720
ctgatcttag agtatggagg ataactgaat cacaaaatga cgctgtactg ttaaccaatg 6780
cattaaatgg atgttacacc aaagcatctt ccatttggca caacagtcat attctgagtc 6840
tagggcgagg aaatggactt tctttgggtg gttcagataa tcatcataat ggtcaaagta 6900
atggaggtac tgattctggt acaaatttaa ttcggtttgg cgtggatcct atcaggaata 6960
gcaattctga gcagaaagat catattgcag tttgtgatgc tgaaaatgag cccatgatga 7020
gcactggttc aagctcacct tctaaagatt tgtgtgcacc tgcagacact gtcaactcta 7080
ttcagtctcc agctaggaac cttgaggtag cacacgagtc attgaagaac aataattcgt 7140
ggtcctaccc atcccttatg aatttacttt catcagcgac gttatcttta caaccacctg 7200
taactgaagt ccatcaggct aaggaaaacc acagccctaa taacgaggat cagaattcac 7260
agaccattac tttgggagga attcatagtc aaaccggtcg caagaaacgg tctagtagtg 7320
aggattgttc tagtcaatct tcagggcaaa actggatcgc tccacctgca acggatactt 7380
cctctcgtga atgaaactct aattgtagtg gtctttcttt gatggattca ttcaagccat 7440
cagagaaaat tggagaaatt ttacctgata ttcctcattc taccctgaaa ccggtgactg 7500
cagatgctga aattaaacaa tctgcatctt caagtgttct tgttcagaat tctggcctta 7560
gctggagtag cgcctcaagt ttaccgggtg gacgacagct tcctagtcat gtagcagcgg 7620
gtgcttgggg gggtgggtat ttggctgcac caggtagagc aattgaggac ttgaactcca 7680
gtttcataac tgcatctggt atgaaatcat ctgatataat cgacgatcac gagacaactg 7740
gggctacaat aaattggatt gatgatgaac ccaatgactt caattccttg gtcgatgaat 7800
ctgtctcaga tttgttagca gaagttgaag caatggaatg cttgagtggt ttggcttcca 7860
cagcatcgat gatgaattgt aacgagggat taactcggga ttctagaagt gattgttttt 7920
tctcagtcga tggtttcaat ccagcagctg agatggggaa ggtggatgca ttaagctcca 7980
cagccaattt gcagtttcca tttaacatca aagtgaaaga tgagcaacct tga 8033
<210> 8
<211> 1257
<212> PRT
<213> 人工的
<220>
<223> 蛋白质ClCG07G008850
<400> 8
Met Asp Lys Pro Leu Asp Pro Pro Leu Asp Phe Tyr Lys Pro Arg Leu
1 5 10 15
Gln Pro Asp Asp Pro Thr Pro Pro Pro Pro Asp Ala Ser Val Leu Gly
20 25 30
Asn Ser His His Pro Pro His Leu Met Asp Ser His Ile Asp Asp Ser
35 40 45
Lys Leu Val Gly Val Pro Val Ala Gly Pro Leu Leu Pro Ala Asp Ser
50 55 60
Ser Pro Ala Ala Lys Leu Asn Ala Lys Phe Lys Asp Lys Val Leu Val
65 70 75 80
Val Asp Lys Thr Leu Gly Ile Arg Arg Arg Gly Arg Pro Pro Arg Gly
85 90 95
Gln Val Lys Pro Pro Pro Leu Pro Pro Arg Gln Lys Lys Asp Glu Glu
100 105 110
Asp Val Cys Phe Ile Cys Phe Asp Gly Gly Ser Leu Val Leu Cys Asp
115 120 125
Arg Arg Gly Cys Pro Lys Ala Tyr His Pro Ser Cys Ile Lys Arg Asp
130 135 140
Glu Ser Phe Phe Arg Ser Lys Ala Lys Trp Asn Cys Gly Trp His Ile
145 150 155 160
Cys Thr Asn Cys Gln Lys Ala Ser Tyr Tyr Met Cys Tyr Thr Cys Pro
165 170 175
Phe Ser Leu Cys Lys Gly Cys Ile Lys Gly Ala Asp Tyr Gln Cys Val
180 185 190
Arg Gly Thr Lys Gly Phe Cys Gly Thr Cys Met Lys Ile Ile Met Leu
195 200 205
Phe Glu Lys Ser Ala Pro Asp Gly Glu Ser Val Gln Val Asp Phe Asp
210 215 220
Asp Lys Ser Ser Trp Glu Tyr Leu Phe Lys Val Tyr Trp Ile Tyr Leu
225 230 235 240
Lys Glu Lys Leu Ser Leu Thr Val Asp Glu Leu Val Arg Ala Lys Asn
245 250 255
Ser Trp Lys Gly Ser Ile Ile Met Asp His Lys Val Ala Ser Ser Glu
260 265 270
Ile Leu Asp Gly Ser Ile Asp Lys Ser Gln Gly Ala His Asn Ser Phe
275 280 285
Arg Asn Pro Lys Ser Gln Arg Lys Arg Pro Asn Arg Gln Gln Ser Ser
290 295 300
Leu Asn Lys Phe Gly Ser Leu Val Asp Arg Pro Ser Ser Asn Glu Gln
305 310 315 320
Phe Ser Val Ser Thr Lys Trp Ala Thr Thr Glu Leu Met Asp Phe Val
325 330 335
Ala His Val Arg Asn Gly Asp Thr Thr Arg Leu Ser Pro Leu Asp Val
340 345 350
Gln Ala Leu Leu Leu Glu Tyr Val Lys Lys Asn Asn Leu Arg Asp Pro
355 360 365
Gln Gln Gln Ser Gln Ile Asn Cys Asp Leu Arg Leu Thr Asn Leu Phe
370 375 380
Gly Lys Ser Arg Ile Gly His Phe Glu Met Leu Asn Leu Leu Gln Ser
385 390 395 400
His Val His Ile Lys Gly Thr Thr Ala Asp Asn Ala Thr Ser Ser Gly
405 410 415
Ala Gly Val Val Ile Asn Pro Val Glu Ser Lys Glu Lys Tyr Asp Cys
420 425 430
Glu Val Val Asp Asp Cys Glu Arg Lys Arg Lys Thr Arg Lys Lys Ala
435 440 445
Asp Glu Ser Arg Gln Gln Leu His Ala Ile Val Asp Glu Tyr Ala Ala
450 455 460
Ile Asp Ile Gln Asn Ile Asn Leu Ile Tyr Leu Arg Arg Asp Leu Ile
465 470 475 480
Val Ser Leu Ile Asp Asp Glu Lys Phe Asn Asp Met Val Ile Gly Ser
485 490 495
Ile Val Arg Ile Gln Ile Pro Asn Asn Asp Glu Lys His Asp Phe His
500 505 510
Arg Leu Val Gln Val Val Gly Ile Ser Lys Ile Ser Thr Pro Tyr Thr
515 520 525
Val Gly Glu Lys Thr Ile Asp Val Met Leu Asp Ile Leu Asn Leu Asp
530 535 540
Lys Arg Glu Ser Val Ser Val Gln Gly Ile Ser Asn Gln Glu Phe Thr
545 550 555 560
Glu Glu Glu Cys Arg Arg Leu Arg Arg Ser Ile Lys Cys Gly Leu Val
565 570 575
Lys Arg Phe Arg Val Ser Glu Ile Leu Asp Lys Gly Arg Glu Leu Gln
580 585 590
Ala Leu Lys Ile Lys Asp Leu Leu Gln Lys Glu Ile Ser Gln Leu Thr
595 600 605
His Leu His Asp Gln Ala Ser Glu Lys Gly Asn Arg Leu His Arg Leu
610 615 620
Lys Ser Pro Glu Glu Cys Gln Arg Arg Leu Leu Glu Ile Leu Glu Val
625 630 635 640
Arg Ser Asp Pro Thr Met Asp Pro Ser Tyr Glu Ser Glu Glu Asp Lys
645 650 655
Asp Glu Ser Asn Lys Lys Arg Gln Gly Ser Leu Lys Arg Ser Arg Asn
660 665 670
Tyr Asp Phe Asp Glu Lys Glu Val Glu Leu Thr Ser Pro Arg Arg Gly
675 680 685
Thr Asn Ser Asn Val Ser Gly Ser Asp Val Gln Gln Asn Ser Thr Ser
690 695 700
Thr Ser Glu Gln Ser Arg Asn Ile Ser Leu Leu Ala His Glu Asn Lys
705 710 715 720
Glu Gly Asp Cys Leu Ala Ser Asp Arg Thr Gly Glu Thr Ser Trp Ala
725 730 735
Gly Arg Gly Leu Val Pro Asn Asn Trp Asn Val Pro Ser Gln Ala Lys
740 745 750
Thr Ala Thr Pro Leu Ser Ser Asp Gly Asn Tyr Gln Val Val Leu Pro
755 760 765
Glu Ala Ser Ile Pro Pro Leu Ser Ile Gly Leu Gly Thr Ser Ser Asn
770 775 780
Asp Ala Glu Val Glu Arg Ile Trp Gln Tyr Gln Asp Pro Thr Gly Lys
785 790 795 800
Val Gln Gly Pro Phe Ser Met Thr Gln Leu Arg Asn Trp Asn Asn Ser
805 810 815
Gly His Phe Thr Pro Asp Leu Arg Val Trp Arg Ile Thr Glu Ser Gln
820 825 830
Asn Asp Ala Val Leu Leu Thr Asn Ala Leu Asn Gly Cys Tyr Thr Lys
835 840 845
Ala Ser Ser Ile Trp His Asn Ser His Ile Leu Ser Leu Gly Arg Gly
850 855 860
Asn Gly Leu Ser Leu Gly Gly Ser Asp Asn His His Asn Gly Gln Ser
865 870 875 880
Asn Gly Gly Thr Asp Ser Gly Thr Asn Leu Ile Arg Phe Gly Val Asp
885 890 895
Pro Ile Arg Asn Ser Asn Ser Glu Gln Lys Asp His Ile Ala Val Cys
900 905 910
Asp Ala Glu Asn Glu Pro Met Met Ser Thr Gly Ser Ser Ser Pro Ser
915 920 925
Lys Asp Leu Cys Ala Pro Ala Asp Thr Val Asn Ser Ile Gln Ser Pro
930 935 940
Ala Arg Asn Leu Glu Val Ala His Glu Ser Leu Lys Asn Asn Asn Ser
945 950 955 960
Trp Ser Tyr Pro Ser Leu Met Asn Leu Leu Ser Ser Ala Thr Leu Ser
965 970 975
Leu Gln Pro Pro Val Thr Glu Val His Gln Ala Lys Glu Asn His Ser
980 985 990
Pro Asn Asn Glu Asp Gln Asn Ser Gln Thr Ile Thr Leu Gly Gly Ile
995 1000 1005
His Ser Gln Thr Gly Arg Lys Lys Arg Ser Ser Ser Glu Asp Cys
1010 1015 1020
Ser Ser Gln Ser Ser Gly Gln Asn Trp Ile Ala Pro Pro Ala Thr
1025 1030 1035
Asp Thr Ser Ser Arg Glu Trp Asn Ser Asn Cys Ser Gly Leu Ser
1040 1045 1050
Leu Met Asp Ser Phe Lys Pro Ser Glu Lys Ile Gly Glu Ile Leu
1055 1060 1065
Pro Asp Ile Pro His Ser Thr Leu Lys Pro Val Thr Ala Asp Ala
1070 1075 1080
Glu Ile Lys Gln Ser Ala Ser Ser Ser Val Leu Val Gln Asn Ser
1085 1090 1095
Gly Leu Ser Trp Ser Ser Ala Ser Ser Leu Pro Gly Gly Arg Gln
1100 1105 1110
Leu Pro Ser His Val Ala Ala Gly Ala Trp Gly Gly Gly Tyr Leu
1115 1120 1125
Ala Ala Pro Gly Arg Ala Ile Glu Asp Leu Asn Ser Ser Phe Ile
1130 1135 1140
Thr Ala Ser Gly Met Lys Ser Ser Asp Ile Ile Asp Asp His Glu
1145 1150 1155
Thr Thr Gly Ala Thr Ile Asn Trp Ile Asp Asp Glu Pro Asn Asp
1160 1165 1170
Phe Asn Ser Leu Val Asp Glu Ser Val Ser Asp Leu Leu Ala Glu
1175 1180 1185
Val Glu Ala Met Glu Cys Leu Ser Gly Leu Ala Ser Thr Ala Ser
1190 1195 1200
Met Met Asn Cys Asn Glu Gly Leu Thr Arg Asp Ser Arg Ser Asp
1205 1210 1215
Cys Phe Phe Ser Val Asp Gly Phe Asn Pro Ala Ala Glu Met Gly
1220 1225 1230
Lys Val Asp Ala Leu Ser Ser Thr Ala Asn Leu Gln Phe Pro Phe
1235 1240 1245
Asn Ile Lys Val Lys Asp Glu Gln Pro
1250 1255
<210> 9
<211> 1294
<212> PRT
<213> 人工的
<220>
<223> 蛋白质Cla97C07G135900
<400> 9
Met Asp Lys Pro Leu Asp Pro Pro Leu Asp Phe Tyr Lys Pro Arg Leu
1 5 10 15
Gln Pro Asp Asp Pro Thr Pro Pro Pro Pro Asp Ala Ser Val Leu Gly
20 25 30
Asn Ser His His Pro Pro His Leu Met Asp Ser His Ile Asp Asp Ser
35 40 45
Lys Leu Val Gly Val Pro Val Ala Gly Pro Leu Leu Pro Ala Asp Ser
50 55 60
Ser Pro Ala Ala Lys Leu Asn Ala Lys Phe Lys Asp Lys Val Leu Val
65 70 75 80
Val Asp Lys Thr Leu Gly Ile Arg Arg Arg Gly Arg Pro Pro Arg Gly
85 90 95
Gln Val Lys Pro Pro Pro Leu Pro Pro Arg Gln Lys Lys Asp Glu Glu
100 105 110
Asp Val Cys Phe Ile Cys Phe Asp Gly Gly Ser Leu Val Leu Cys Asp
115 120 125
Arg Arg Gly Cys Pro Lys Ala Tyr His Pro Ser Cys Ile Lys Arg Asp
130 135 140
Glu Ser Phe Phe Arg Ser Lys Ala Lys Trp Asn Cys Gly Trp His Ile
145 150 155 160
Cys Thr Asn Cys Gln Lys Ala Ser Tyr Tyr Met Cys Tyr Thr Cys Pro
165 170 175
Phe Ser Leu Cys Lys Gly Cys Ile Lys Gly Ala Asp Tyr Gln Cys Val
180 185 190
Arg Gly Thr Lys Gly Phe Cys Gly Thr Cys Met Lys Ile Ile Met Leu
195 200 205
Phe Glu Lys Ser Ala Pro Asp Gly Glu Ser Val Gln Val Asp Phe Asp
210 215 220
Asp Lys Ser Ser Trp Glu Tyr Leu Phe Lys Val Tyr Trp Ile Tyr Leu
225 230 235 240
Lys Glu Lys Leu Ser Leu Thr Val Asp Glu Leu Val Arg Ala Lys Asn
245 250 255
Ser Trp Lys Gly Ser Ile Ile Met Asp His Lys Val Ala Ser Ser Glu
260 265 270
Ile Leu Asp Gly Ser Ile Asp Lys Ser Gln Gly Ala His Asn Ser Phe
275 280 285
Arg Asn Pro Lys Ser Gln Arg Lys Arg Pro Asn Arg Gln Gln Ser Ser
290 295 300
Leu Asn Lys Phe Gly Ser Leu Val Asp Arg Pro Ser Ser Asn Glu Gln
305 310 315 320
Phe Ser Val Ser Thr Lys Trp Ala Thr Thr Glu Leu Met Asp Phe Val
325 330 335
Ala His Val Arg Asn Gly Asp Thr Thr Arg Leu Ser Pro Leu Asp Val
340 345 350
Gln Ala Leu Leu Leu Glu Tyr Val Lys Lys Asn Asn Leu Arg Asp Pro
355 360 365
Gln Gln Gln Ser Gln Ile Asn Cys Asp Leu Arg Leu Thr Asn Leu Phe
370 375 380
Gly Lys Ser Arg Ile Gly His Phe Glu Met Leu Asn Leu Leu Gln Ser
385 390 395 400
His Val His Ile Lys Gly Thr Thr Ala Asp Asn Ala Thr Ser Ser Gly
405 410 415
Ala Gly Val Val Ile Asn Pro Val Glu Ser Lys Glu Lys Tyr Asp Cys
420 425 430
Glu Val Val Asp Asp Cys Glu Arg Lys Arg Lys Thr Arg Lys Lys Ala
435 440 445
Asp Glu Ser Arg Gln Gln Leu His Ala Ile Val Asp Glu Tyr Ala Ala
450 455 460
Ile Asp Ile Gln Asn Ile Asn Leu Ile Tyr Leu Arg Arg Asp Leu Ile
465 470 475 480
Val Ser Leu Ile Asp Asp Glu Lys Phe Asn Asp Met Val Ile Gly Ser
485 490 495
Ile Val Arg Ile Gln Ile Pro Asn Asn Asp Glu Lys His Asp Phe His
500 505 510
Arg Leu Val Gln Val Val Gly Ile Ser Lys Ile Ser Thr Pro Tyr Thr
515 520 525
Val Gly Glu Lys Thr Ile Asp Val Met Leu Asp Ile Leu Asn Leu Asp
530 535 540
Lys Arg Glu Ser Val Ser Val Gln Gly Ile Ser Asn Gln Glu Phe Thr
545 550 555 560
Glu Glu Glu Cys Arg Arg Leu Arg Arg Ser Ile Lys Cys Gly Leu Val
565 570 575
Lys Arg Phe Arg Val Ser Glu Ile Leu Asp Lys Gly Arg Glu Leu Gln
580 585 590
Ala Leu Lys Ile Lys Asp Leu Leu Gln Lys Glu Ile Ser Gln Leu Thr
595 600 605
His Leu His Asp Gln Ala Ser Glu Lys Gly Asn Val Asp Glu Tyr Pro
610 615 620
Phe Met Arg Cys His Phe Glu Leu Thr Leu Leu Cys Tyr Arg Ala Cys
625 630 635 640
Arg Gln Trp Thr Thr Arg Ser Thr Gly Ala Glu Lys Tyr Phe Ala Glu
645 650 655
Arg Leu His Arg Leu Lys Ser Pro Glu Glu Cys Gln Arg Arg Leu Leu
660 665 670
Glu Ile Leu Glu Val Arg Ser Asp Pro Thr Met Asp Pro Ser Tyr Glu
675 680 685
Ser Glu Glu Asp Lys Asp Glu Ser Asn Lys Lys Arg Gln Gly Ser Leu
690 695 700
Lys Arg Ser Arg Asn Tyr Asp Phe Asp Glu Lys Glu Val Glu Leu Thr
705 710 715 720
Ser Pro Arg Arg Gly Thr Asn Ser Asn Val Ser Gly Ser Asp Val Gln
725 730 735
Gln Asn Ser Thr Ser Thr Ser Glu Gln Ser Arg Asn Ile Ser Leu Leu
740 745 750
Ala His Glu Asn Lys Glu Gly Asp Cys Leu Ala Ser Asp Arg Thr Gly
755 760 765
Glu Thr Ser Trp Ala Gly Arg Gly Leu Val Pro Asn Asn Trp Asn Val
770 775 780
Pro Ser Gln Ala Lys Thr Ala Thr Pro Leu Ser Ser Asp Gly Asn Tyr
785 790 795 800
Gln Val Val Leu Pro Glu Ala Ser Ile Pro Pro Leu Ser Ile Gly Leu
805 810 815
Gly Thr Ser Ser Asn Asp Ala Glu Val Glu Arg Ile Trp Gln Tyr Gln
820 825 830
Asp Pro Thr Gly Lys Val Gln Gly Pro Phe Ser Met Thr Gln Leu Arg
835 840 845
Asn Trp Asn Asn Ser Gly His Phe Thr Pro Asp Leu Arg Val Trp Arg
850 855 860
Ile Thr Glu Ser Gln Asn Asp Ala Val Leu Leu Thr Asn Ala Leu Asn
865 870 875 880
Gly Cys Tyr Thr Lys Ala Ser Ser Ile Trp His Asn Ser His Ile Leu
885 890 895
Ser Leu Gly Arg Gly Asn Gly Leu Ser Leu Gly Gly Ser Asp Asn His
900 905 910
His Asn Gly Gln Ser Asn Gly Gly Thr Asp Ser Gly Thr Asn Leu Ile
915 920 925
Arg Phe Gly Val Asp Pro Ile Arg Asn Ser Asn Ser Glu Gln Lys Asp
930 935 940
His Ile Ala Val Cys Asp Ala Glu Asn Glu Pro Met Met Ser Thr Gly
945 950 955 960
Ser Ser Ser Pro Ser Lys Asp Leu Cys Ala Pro Ala Asp Thr Val Asn
965 970 975
Ser Ile Gln Ser Pro Ala Arg Asn Leu Glu Val Ala His Glu Ser Leu
980 985 990
Lys Asn Asn Asn Ser Trp Ser Tyr Pro Ser Leu Met Asn Leu Leu Ser
995 1000 1005
Ser Ala Thr Leu Ser Leu Gln Pro Pro Val Thr Glu Val His Gln
1010 1015 1020
Ala Lys Glu Asn His Ser Pro Asn Asn Glu Asp Gln Asn Ser Gln
1025 1030 1035
Thr Ile Thr Leu Gly Gly Ile His Ser Gln Thr Gly Arg Lys Lys
1040 1045 1050
Arg Ser Ser Ser Glu Asp Cys Ser Ser Gln Ser Ser Gly Gln Asn
1055 1060 1065
Trp Ile Ala Pro Pro Ala Thr Asp Thr Ser Ser Arg Glu Trp Asn
1070 1075 1080
Ser Asn Cys Ser Gly Leu Ser Leu Met Asp Ser Phe Lys Pro Ser
1085 1090 1095
Glu Lys Ile Gly Glu Ile Leu Pro Asp Ile Pro His Ser Thr Leu
1100 1105 1110
Lys Pro Val Thr Ala Asp Ala Glu Ile Lys Gln Ser Ala Ser Ser
1115 1120 1125
Ser Val Leu Val Gln Asn Ser Gly Leu Ser Trp Ser Ser Ala Ser
1130 1135 1140
Ser Leu Pro Gly Gly Arg Gln Leu Pro Ser His Val Ala Ala Gly
1145 1150 1155
Ala Trp Gly Gly Gly Tyr Leu Ala Ala Pro Gly Arg Ala Ile Glu
1160 1165 1170
Asp Leu Asn Ser Ser Phe Ile Thr Ala Ser Gly Met Lys Ser Ser
1175 1180 1185
Asp Ile Ile Asp Asp His Glu Thr Thr Gly Ala Thr Ile Asn Trp
1190 1195 1200
Ile Asp Asp Glu Pro Asn Asp Phe Asn Ser Leu Val Asp Glu Ser
1205 1210 1215
Val Ser Asp Leu Leu Ala Glu Val Glu Ala Met Glu Cys Leu Ser
1220 1225 1230
Gly Leu Ala Ser Thr Ala Ser Met Met Asn Cys Asn Glu Gly Leu
1235 1240 1245
Thr Arg Asp Ser Arg Ser Asp Cys Phe Phe Ser Val Asp Gly Phe
1250 1255 1260
Asn Pro Ala Ala Glu Met Gly Lys Val Asp Ala Leu Ser Ser Thr
1265 1270 1275
Ala Asn Leu Gln Phe Pro Phe Asn Ile Lys Val Lys Asp Glu Gln
1280 1285 1290
Pro
<210> 10
<211> 372
<212> PRT
<213> 西瓜(Citrullus lanatus)
<400> 10
Met Asp Lys Pro Leu Asp Pro Pro Leu Asp Phe Tyr Lys Pro Arg Leu
1 5 10 15
Gln Pro Asp Asp Pro Thr Pro Pro Pro Pro Asp Ala Ser Val Leu Gly
20 25 30
Asn Ser His His Pro Pro His Leu Met Asp Ser His Ile Asp Asp Ser
35 40 45
Lys Leu Val Gly Val Pro Val Ala Gly Pro Leu Leu Pro Ala Asp Ser
50 55 60
Ser Pro Ala Ala Lys Leu Asn Ala Lys Phe Lys Asp Lys Val Leu Val
65 70 75 80
Val Asp Lys Thr Leu Gly Ile Arg Arg Arg Gly Arg Pro Pro Arg Gly
85 90 95
Gln Val Lys Pro Pro Pro Leu Pro Pro Arg Gln Lys Lys Asp Glu Glu
100 105 110
Asp Val Cys Phe Ile Cys Phe Asp Gly Gly Ser Leu Val Leu Cys Asp
115 120 125
Arg Arg Gly Cys Pro Lys Ala Tyr His Pro Ser Cys Ile Lys Arg Asp
130 135 140
Glu Ser Phe Phe Arg Ser Lys Ala Lys Trp Asn Cys Gly Trp His Ile
145 150 155 160
Cys Thr Asn Cys Gln Lys Ala Ser Tyr Tyr Met Cys Tyr Thr Cys Pro
165 170 175
Phe Ser Leu Cys Lys Gly Cys Ile Lys Gly Ala Asp Tyr Gln Cys Val
180 185 190
Arg Gly Thr Lys Gly Phe Cys Gly Thr Cys Met Lys Ile Ile Met Leu
195 200 205
Phe Glu Lys Ser Ala Pro Asp Gly Glu Ser Val Gln Val Asp Phe Asp
210 215 220
Asp Lys Ser Ser Trp Glu Tyr Leu Phe Lys Val Tyr Trp Ile Tyr Leu
225 230 235 240
Lys Glu Lys Leu Ser Leu Thr Val Asp Glu Leu Val Arg Ala Lys Asn
245 250 255
Ser Trp Lys Gly Ser Ile Ile Met Asp His Lys Val Ala Ser Ser Glu
260 265 270
Ile Leu Asp Gly Ser Ile Asp Lys Ser Gln Gly Ala His Asn Ser Phe
275 280 285
Arg Asn Pro Lys Ser Gln Arg Lys Arg Pro Asn Arg Gln Gln Ser Ser
290 295 300
Leu Asn Lys Phe Gly Ser Leu Val Asp Arg Pro Ser Ser Asn Glu Gln
305 310 315 320
Phe Ser Val Ser Thr Lys Trp Ala Thr Thr Glu Leu Met Asp Phe Val
325 330 335
Ala His Val Arg Asn Gly Asp Thr Thr Arg Leu Ser Pro Leu Asp Val
340 345 350
Gln Ala Leu Leu Leu Glu Tyr Val Lys Lys Asn Asn Leu Arg Asp Pro
355 360 365
Gln Gln Gln Ser
370
<210> 11
<211> 1266
<212> PRT
<213> 西瓜(Citrullus lanatus)
<400> 11
Met Asp Lys Pro Leu Asp Pro Pro Leu Asp Phe Tyr Lys Pro Arg Leu
1 5 10 15
Gln Pro Asp Asp Pro Thr Pro Pro Pro Pro Asp Ala Ser Val Leu Gly
20 25 30
Asn Ser His His Pro Pro His Leu Met Asp Ser His Ile Asp Asp Ser
35 40 45
Lys Leu Val Gly Val Pro Val Ala Gly Pro Leu Leu Pro Ala Asp Ser
50 55 60
Ser Pro Ala Ala Lys Leu Asn Ala Lys Phe Lys Asp Lys Val Leu Val
65 70 75 80
Val Asp Lys Thr Leu Gly Ile Arg Arg Arg Gly Arg Pro Pro Arg Gly
85 90 95
Gln Val Lys Pro Pro Pro Leu Pro Pro Arg Gln Lys Lys Asp Glu Glu
100 105 110
Asp Val Cys Phe Ile Cys Phe Asp Gly Gly Ser Leu Val Leu Cys Asp
115 120 125
Arg Arg Gly Cys Pro Lys Ala Tyr His Pro Ser Cys Ile Lys Arg Asp
130 135 140
Glu Ser Phe Phe Arg Ser Lys Ala Lys Trp Asn Cys Gly Trp His Ile
145 150 155 160
Cys Thr Asn Cys Gln Lys Ala Ser Tyr Tyr Met Cys Tyr Thr Cys Pro
165 170 175
Phe Ser Leu Cys Lys Gly Cys Ile Lys Gly Ala Asp Tyr Gln Cys Val
180 185 190
Arg Gly Thr Lys Gly Phe Cys Gly Thr Cys Met Lys Ile Ile Met Leu
195 200 205
Phe Glu Lys Ser Ala Pro Asp Gly Glu Ser Val Gln Val Asp Phe Asp
210 215 220
Asp Lys Ser Ser Trp Glu Tyr Leu Phe Lys Val Tyr Trp Ile Tyr Leu
225 230 235 240
Lys Glu Lys Leu Ser Leu Thr Val Asp Glu Leu Val Arg Ala Lys Asn
245 250 255
Ser Trp Lys Gly Ser Ile Ile Met Asp His Lys Val Ala Ser Ser Glu
260 265 270
Ile Leu Asp Gly Ser Ile Asp Lys Ser Gln Gly Ala His Asn Ser Phe
275 280 285
Arg Asn Pro Lys Ser Gln Arg Lys Arg Pro Asn Arg Gln Gln Ser Ser
290 295 300
Leu Asn Lys Phe Gly Ser Leu Val Asp Arg Pro Ser Ser Asn Glu Gln
305 310 315 320
Phe Ser Val Ser Thr Lys Trp Ala Thr Thr Glu Leu Met Asp Phe Val
325 330 335
Ala His Val Arg Asn Gly Asp Thr Thr Lys Leu Ser Pro Leu Asp Val
340 345 350
Gln Ala Leu Leu Leu Glu Tyr Val Lys Lys Asn Asn Leu Arg Asp Pro
355 360 365
Gln Gln Gln Ser Gln Ile Asn Cys Asp Leu Arg Leu Thr Asn Leu Phe
370 375 380
Gly Lys Ser Arg Ile Gly His Phe Glu Met Leu Asn Leu Leu Gln Ser
385 390 395 400
His Val His Ile Lys Gly Thr Thr Ala Asp Asn Ala Thr Ser Ser Gly
405 410 415
Ala Gly Val Val Ile Asn Pro Val Glu Ser Lys Glu Lys Tyr Asp Cys
420 425 430
Glu Val Val Asp Asp Cys Glu Arg Lys Arg Lys Thr Arg Lys Lys Ala
435 440 445
Asp Glu Ser Arg Gln Gln Leu His Ala Ile Val Asp Glu Tyr Ala Ala
450 455 460
Ile Asp Ile Gln Asn Ile Asn Leu Ile Tyr Leu Arg Arg Asp Leu Ile
465 470 475 480
Val Ser Leu Ile Asp Asp Glu Lys Phe Asn Asp Met Val Ile Gly Ser
485 490 495
Ile Val Arg Ile Gln Ile Pro Asn Asn Asp Glu Lys His Asp Phe His
500 505 510
Arg Leu Val Gln Val Val Gly Ile Ser Lys Ile Ser Thr Pro Tyr Thr
515 520 525
Val Gly Glu Lys Thr Ile Asp Val Met Leu Asp Ile Leu Asn Leu Asp
530 535 540
Lys Arg Glu Ser Val Ser Val Gln Gly Ile Ser Asn Gln Glu Phe Thr
545 550 555 560
Glu Glu Glu Cys Arg Arg Leu Arg Arg Ser Ile Lys Cys Gly Leu Val
565 570 575
Lys Arg Phe Arg Val Ser Glu Ile Leu Asp Lys Gly Arg Glu Leu Gln
580 585 590
Ala Leu Lys Ile Lys Asp Leu Leu Gln Lys Glu Ile Ser Gln Leu Thr
595 600 605
His Leu His Asp Gln Ala Ser Glu Lys Gly Asn Val Asp Glu Leu Arg
610 615 620
Tyr Phe Ala Glu Arg Leu His Arg Leu Lys Ser Pro Glu Glu Cys Gln
625 630 635 640
Arg Arg Leu Leu Glu Ile Leu Glu Val Arg Ser Asp Pro Thr Met Asp
645 650 655
Pro Ser Tyr Glu Ser Glu Glu Asp Lys Asp Glu Ser Asn Lys Lys Arg
660 665 670
Gln Gly Ser Leu Lys Arg Ser Arg Asn Tyr Asp Phe Asp Glu Lys Glu
675 680 685
Val Glu Leu Thr Ser Pro Arg Arg Gly Thr Asn Ser Asn Val Ser Gly
690 695 700
Ser Asp Val Gln Gln Asn Ser Thr Ser Thr Ser Glu Gln Ser Arg Asn
705 710 715 720
Ile Ser Leu Leu Ala His Glu Asn Lys Glu Gly Asp Cys Leu Ala Ser
725 730 735
Asp Arg Thr Gly Glu Thr Ser Trp Ala Gly Arg Gly Leu Val Pro Asn
740 745 750
Asn Trp Asn Val Pro Ser Gln Ala Lys Thr Ala Thr Pro Leu Ser Ser
755 760 765
Asp Gly Asn Tyr Gln Val Val Leu Pro Glu Ala Ser Ile Pro Pro Leu
770 775 780
Ser Ile Gly Leu Gly Thr Ser Ser Asn Asp Ala Glu Val Glu Arg Ile
785 790 795 800
Trp Gln Tyr Gln Asp Pro Thr Gly Lys Val Gln Gly Pro Phe Ser Met
805 810 815
Thr Gln Leu Arg Asn Trp Asn Asn Ser Gly His Phe Thr Pro Asp Leu
820 825 830
Arg Val Trp Arg Ile Thr Glu Ser Gln Asn Asp Ala Val Leu Leu Thr
835 840 845
Asn Ala Leu Asn Gly Cys Tyr Thr Lys Ala Ser Ser Ile Trp His Asn
850 855 860
Ser His Ile Leu Ser Leu Gly Arg Gly Asn Gly Leu Ser Leu Gly Gly
865 870 875 880
Ser Asp Asn His His Asn Gly Gln Ser Asn Gly Gly Thr Asp Ser Gly
885 890 895
Thr Asn Leu Ile Arg Phe Gly Val Asp Pro Ile Arg Asn Ser Asn Ser
900 905 910
Glu Gln Lys Asp His Ile Ala Val Cys Asp Ala Glu Asn Glu Pro Met
915 920 925
Met Ser Thr Gly Ser Ser Ser Pro Ser Lys Asp Leu Cys Ala Pro Ala
930 935 940
Asp Thr Val Asn Ser Ile Gln Ser Pro Ala Arg Asn Leu Glu Val Ala
945 950 955 960
His Glu Ser Leu Lys Asn Asn Asn Ser Trp Ser Tyr Pro Ser Leu Met
965 970 975
Asn Leu Leu Ser Ser Ala Thr Leu Ser Leu Gln Pro Pro Val Thr Glu
980 985 990
Val His Gln Ala Lys Glu Asn His Ser Pro Asn Asn Glu Asp Gln Asn
995 1000 1005
Ser Gln Thr Ile Thr Leu Gly Gly Ile His Ser Gln Thr Gly Arg
1010 1015 1020
Lys Lys Arg Ser Ser Ser Glu Asp Cys Ser Ser Gln Ser Ser Gly
1025 1030 1035
Gln Asn Trp Ile Ala Pro Pro Ala Thr Asp Thr Ser Ser Arg Glu
1040 1045 1050
Trp Asn Ser Asn Cys Ser Gly Leu Ser Leu Met Asp Ser Phe Lys
1055 1060 1065
Pro Ser Glu Lys Ile Gly Glu Ile Leu Pro Asp Ile Pro His Ser
1070 1075 1080
Thr Leu Lys Pro Val Thr Ala Asp Ala Glu Ile Lys Gln Ser Ala
1085 1090 1095
Ser Ser Ser Val Leu Val Gln Asn Ser Gly Leu Ser Trp Ser Ser
1100 1105 1110
Ala Ser Ser Leu Pro Gly Gly Arg Gln Leu Pro Ser His Val Ala
1115 1120 1125
Ala Gly Ala Trp Gly Gly Gly Tyr Leu Ala Ala Pro Gly Arg Ala
1130 1135 1140
Ile Glu Asp Leu Asn Ser Ser Phe Ile Thr Ala Ser Gly Met Lys
1145 1150 1155
Ser Ser Asp Ile Ile Asp Asp His Glu Thr Thr Gly Ala Thr Ile
1160 1165 1170
Asn Trp Ile Asp Asp Glu Pro Asn Asp Phe Asn Ser Leu Val Asp
1175 1180 1185
Glu Ser Val Ser Asp Leu Leu Ala Glu Val Glu Ala Met Glu Cys
1190 1195 1200
Leu Ser Gly Leu Ala Ser Thr Ala Ser Met Met Asn Cys Asn Glu
1205 1210 1215
Gly Leu Thr Arg Asp Ser Arg Ser Asp Cys Phe Phe Ser Val Asp
1220 1225 1230
Gly Phe Asn Pro Ala Ala Glu Met Gly Lys Val Asp Ala Leu Ser
1235 1240 1245
Ser Thr Ala Asn Leu Gln Phe Pro Phe Asn Ile Lys Val Lys Asp
1250 1255 1260
Glu Gln Pro
1265
<210> 12
<211> 1266
<212> PRT
<213> 西瓜(Citrullus lanatus)
<400> 12
Met Asp Lys Pro Leu Asp Pro Pro Leu Asp Phe Tyr Lys Pro Arg Leu
1 5 10 15
Gln Pro Asp Asp Pro Thr Pro Pro Pro Pro Asp Ala Ser Val Leu Gly
20 25 30
Asn Ser His His Pro Pro His Leu Met Asp Ser His Ile Asp Asp Ser
35 40 45
Lys Leu Val Gly Val Pro Val Ala Gly Pro Leu Leu Pro Ala Asp Ser
50 55 60
Ser Pro Ala Ala Lys Leu Asn Ala Lys Phe Lys Asp Lys Val Leu Val
65 70 75 80
Val Asp Lys Thr Leu Gly Ile Arg Arg Arg Gly Arg Pro Pro Arg Gly
85 90 95
Gln Val Lys Pro Pro Pro Leu Pro Pro Arg Gln Lys Lys Asp Glu Glu
100 105 110
Asp Val Cys Phe Ile Cys Phe Asp Gly Gly Ser Leu Val Leu Cys Asp
115 120 125
Arg Arg Gly Cys Pro Lys Ala Tyr His Pro Ser Cys Ile Lys Arg Asp
130 135 140
Glu Ser Phe Phe Arg Ser Lys Ala Lys Trp Asn Cys Gly Trp His Ile
145 150 155 160
Cys Thr Asn Cys Gln Lys Ala Ser Tyr Tyr Met Cys Tyr Thr Cys Pro
165 170 175
Phe Ser Leu Cys Lys Gly Cys Ile Lys Gly Ala Asp Tyr Gln Cys Val
180 185 190
Arg Gly Thr Lys Gly Phe Cys Gly Thr Cys Met Lys Ile Ile Met Leu
195 200 205
Phe Glu Lys Ser Ala Pro Asp Gly Glu Ser Val Gln Val Asp Phe Asp
210 215 220
Asp Lys Ser Ser Trp Glu Tyr Leu Phe Lys Val Tyr Trp Ile Tyr Leu
225 230 235 240
Lys Glu Lys Leu Ser Leu Thr Val Asp Glu Leu Val Arg Ala Lys Asn
245 250 255
Ser Trp Lys Gly Ser Ile Ile Met Asp His Lys Val Ala Ser Ser Glu
260 265 270
Ile Leu Asp Gly Ser Ile Asp Lys Ser Gln Gly Ala His Asn Ser Phe
275 280 285
Arg Asn Pro Lys Ser Gln Arg Lys Arg Pro Asn Arg Gln Gln Ser Ser
290 295 300
Leu Asn Lys Phe Gly Ser Leu Val Asp Arg Pro Ser Ser Asn Glu Gln
305 310 315 320
Phe Ser Val Asn Thr Lys Trp Ala Thr Thr Glu Leu Met Asp Phe Val
325 330 335
Ala His Val Arg Asn Gly Asp Thr Thr Arg Leu Ser Pro Leu Asp Val
340 345 350
Gln Ala Leu Leu Leu Glu Tyr Val Lys Lys Asn Asn Leu Arg Asp Pro
355 360 365
Gln Gln Gln Ser Gln Ile Asn Cys Asp Leu Arg Leu Thr Asn Leu Phe
370 375 380
Gly Lys Ser Arg Ile Gly His Phe Glu Met Leu Asn Leu Leu Gln Ser
385 390 395 400
His Val His Ile Lys Gly Thr Thr Ala Asp Asn Ala Thr Ser Ser Gly
405 410 415
Ala Gly Val Val Ile Asn Pro Val Glu Ser Lys Glu Lys Tyr Asp Cys
420 425 430
Glu Val Val Asp Asp Cys Glu Arg Lys Arg Lys Thr Arg Lys Lys Ala
435 440 445
Asp Glu Ser Arg Gln Gln Leu His Ala Ile Val Asp Glu Tyr Ala Ala
450 455 460
Ile Asp Ile Gln Asn Ile Asn Leu Ile Tyr Leu Arg Arg Asp Leu Ile
465 470 475 480
Val Ser Leu Ile Asp Asp Glu Lys Phe Asn Asp Met Val Ile Gly Ser
485 490 495
Ile Val Arg Ile Gln Ile Pro Asn Asn Asp Glu Lys His Asp Phe His
500 505 510
Arg Leu Val Gln Val Val Gly Ile Ser Lys Ile Ser Thr Pro Tyr Thr
515 520 525
Val Gly Glu Lys Thr Ile Asp Val Met Leu Asp Ile Leu Asn Leu Asp
530 535 540
Lys Arg Glu Ser Val Ser Val Gln Gly Ile Ser Asn Gln Glu Phe Thr
545 550 555 560
Glu Glu Glu Cys Arg Arg Leu Arg Arg Ser Ile Lys Cys Gly Leu Val
565 570 575
Lys Arg Phe Arg Val Ser Glu Ile Leu Asp Lys Gly Arg Glu Leu Gln
580 585 590
Ala Leu Lys Ile Lys Asp Leu Leu Gln Lys Glu Ile Ser Gln Leu Thr
595 600 605
His Leu His Asp Gln Ala Ser Glu Lys Gly Asn Val Asp Glu Leu Arg
610 615 620
Tyr Phe Ala Glu Arg Leu His Arg Leu Lys Ser Pro Glu Glu Cys Gln
625 630 635 640
Arg Arg Leu Leu Glu Ile Leu Glu Val Arg Ser Asp Pro Thr Met Asp
645 650 655
Pro Ser Tyr Glu Ser Glu Glu Asp Lys Asp Glu Ser Asn Lys Lys Arg
660 665 670
Gln Gly Ser Leu Lys Arg Ser Arg Asn Tyr Asp Phe Asp Glu Lys Glu
675 680 685
Val Glu Leu Thr Ser Pro Arg Arg Gly Thr Asn Ser Asn Val Ser Gly
690 695 700
Ser Asp Val Gln Gln Asn Ser Thr Ser Thr Ser Glu Gln Ser Arg Asn
705 710 715 720
Ile Ser Leu Leu Ala His Glu Asn Lys Glu Gly Asp Cys Leu Ala Ser
725 730 735
Asp Arg Thr Gly Glu Thr Ser Trp Ala Gly Arg Gly Leu Val Pro Asn
740 745 750
Asn Trp Asn Val Pro Ser Gln Ala Lys Thr Ala Thr Pro Leu Ser Ser
755 760 765
Asp Gly Asn Tyr Gln Val Val Leu Pro Glu Ala Ser Ile Pro Pro Leu
770 775 780
Ser Ile Gly Leu Gly Thr Ser Ser Asn Asp Ala Glu Val Glu Arg Ile
785 790 795 800
Trp Gln Tyr Gln Asp Pro Thr Gly Lys Val Gln Gly Pro Phe Ser Met
805 810 815
Thr Gln Leu Arg Asn Trp Asn Asn Ser Gly His Phe Thr Pro Asp Leu
820 825 830
Arg Val Trp Arg Ile Thr Glu Ser Gln Asn Asp Ala Val Leu Leu Thr
835 840 845
Asn Ala Leu Asn Gly Cys Tyr Thr Lys Ala Ser Ser Ile Trp His Asn
850 855 860
Ser His Ile Leu Ser Leu Gly Arg Gly Asn Gly Leu Ser Leu Gly Gly
865 870 875 880
Ser Asp Asn His His Asn Gly Gln Ser Asn Gly Gly Thr Asp Ser Gly
885 890 895
Thr Asn Leu Ile Arg Phe Gly Val Asp Pro Ile Arg Asn Ser Asn Ser
900 905 910
Glu Gln Lys Asp His Ile Ala Val Cys Asp Ala Glu Asn Glu Pro Met
915 920 925
Met Ser Thr Gly Ser Ser Ser Pro Ser Lys Asp Leu Cys Ala Pro Ala
930 935 940
Asp Thr Val Asn Ser Ile Gln Ser Pro Ala Arg Asn Leu Glu Val Ala
945 950 955 960
His Glu Ser Leu Lys Asn Asn Asn Ser Trp Ser Tyr Pro Ser Leu Met
965 970 975
Asn Leu Leu Ser Ser Ala Thr Leu Ser Leu Gln Pro Pro Val Thr Glu
980 985 990
Val His Gln Ala Lys Glu Asn His Ser Pro Asn Asn Glu Asp Gln Asn
995 1000 1005
Ser Gln Thr Ile Thr Leu Gly Gly Ile His Ser Gln Thr Gly Arg
1010 1015 1020
Lys Lys Arg Ser Ser Ser Glu Asp Cys Ser Ser Gln Ser Ser Gly
1025 1030 1035
Gln Asn Trp Ile Ala Pro Pro Ala Thr Asp Thr Ser Ser Arg Glu
1040 1045 1050
Trp Asn Ser Asn Cys Ser Gly Leu Ser Leu Met Asp Ser Phe Lys
1055 1060 1065
Pro Ser Glu Lys Ile Gly Glu Ile Leu Pro Asp Ile Pro His Ser
1070 1075 1080
Thr Leu Lys Pro Val Thr Ala Asp Ala Glu Ile Lys Gln Ser Ala
1085 1090 1095
Ser Ser Ser Val Leu Val Gln Asn Ser Gly Leu Ser Trp Ser Ser
1100 1105 1110
Ala Ser Ser Leu Pro Gly Gly Arg Gln Leu Pro Ser His Val Ala
1115 1120 1125
Ala Gly Ala Trp Gly Gly Gly Tyr Leu Ala Ala Pro Gly Arg Ala
1130 1135 1140
Ile Glu Asp Leu Asn Ser Ser Phe Ile Thr Ala Ser Gly Met Lys
1145 1150 1155
Ser Ser Asp Ile Ile Asp Asp His Glu Thr Thr Gly Ala Thr Ile
1160 1165 1170
Asn Trp Ile Asp Asp Glu Pro Asn Asp Phe Asn Ser Leu Val Asp
1175 1180 1185
Glu Ser Val Ser Asp Leu Leu Ala Glu Val Glu Ala Met Glu Cys
1190 1195 1200
Leu Ser Gly Leu Ala Ser Thr Ala Ser Met Met Asn Cys Asn Glu
1205 1210 1215
Gly Leu Thr Arg Asp Ser Arg Ser Asp Cys Phe Phe Ser Val Asp
1220 1225 1230
Gly Phe Asn Pro Ala Ala Glu Met Gly Lys Val Asp Ala Leu Ser
1235 1240 1245
Ser Thr Ala Asn Leu Gln Phe Pro Phe Asn Ile Lys Val Lys Asp
1250 1255 1260
Glu Gln Pro
1265
<210> 13
<211> 1266
<212> PRT
<213> 西瓜(Citrullus lanatus)
<400> 13
Met Asp Lys Pro Leu Asp Pro Pro Leu Asp Phe Tyr Lys Pro Arg Leu
1 5 10 15
Gln Pro Asp Asp Pro Thr Pro Pro Pro Pro Asp Ala Ser Val Leu Gly
20 25 30
Asn Ser His His Pro Pro His Leu Met Asp Ser His Ile Asp Asp Ser
35 40 45
Lys Leu Val Gly Val Pro Val Ala Gly Pro Leu Leu Pro Ala Asp Ser
50 55 60
Ser Pro Ala Ala Lys Leu Asn Ala Lys Phe Lys Asp Lys Val Leu Val
65 70 75 80
Val Asp Lys Thr Leu Gly Ile Arg Arg Arg Gly Arg Pro Pro Arg Gly
85 90 95
Gln Val Lys Pro Pro Pro Leu Pro Pro Arg Gln Lys Lys Asp Glu Glu
100 105 110
Asp Val Cys Phe Ile Cys Phe Asp Gly Gly Ser Leu Val Leu Cys Asp
115 120 125
Arg Arg Gly Cys Pro Lys Ala Tyr His Pro Ser Cys Ile Lys Arg Asp
130 135 140
Glu Ser Phe Phe Arg Ser Lys Ala Lys Trp Asn Cys Gly Trp His Ile
145 150 155 160
Cys Thr Asn Cys Gln Lys Ala Ser Tyr Tyr Met Cys Tyr Thr Cys Pro
165 170 175
Phe Ser Leu Cys Lys Gly Cys Ile Lys Gly Ala Asp Tyr Gln Cys Val
180 185 190
Arg Gly Thr Lys Gly Phe Cys Gly Thr Cys Met Lys Ile Ile Met Leu
195 200 205
Phe Glu Lys Ser Ala Pro Asp Gly Glu Ser Val Gln Val Asp Phe Asp
210 215 220
Asp Lys Ser Ser Trp Glu Tyr Leu Phe Lys Val Tyr Trp Ile Tyr Leu
225 230 235 240
Lys Glu Lys Leu Ser Leu Thr Val Asp Glu Leu Val Arg Ala Lys Asn
245 250 255
Ser Trp Lys Gly Ser Ile Ile Met Asp His Lys Val Ala Ser Ser Glu
260 265 270
Ile Leu Asp Gly Ser Ile Asp Lys Ser Gln Gly Ala His Asn Ser Phe
275 280 285
Arg Asn Pro Lys Ser Gln Arg Lys Arg Pro Asn Arg Gln Gln Ser Ser
290 295 300
Leu Asn Lys Phe Gly Ser Leu Val Asp Arg Pro Ser Ser Asn Glu Gln
305 310 315 320
Phe Ser Val Ser Thr Lys Trp Ala Thr Thr Glu Leu Met Asp Phe Val
325 330 335
Ala His Val Arg Asn Gly Asp Thr Thr Arg Leu Ser Pro Leu Asp Val
340 345 350
Gln Ala Leu Leu Leu Glu Tyr Val Lys Lys Asn Asn Leu Arg Asp Pro
355 360 365
Gln Gln Gln Ser Gln Ile Asn Cys Asp Leu Arg Leu Thr Asn Leu Phe
370 375 380
Gly Lys Ser Arg Ile Gly His Phe Glu Met Leu Asn Leu Leu Gln Ser
385 390 395 400
His Val His Ile Lys Gly Thr Thr Ala Asp Asn Ala Thr Ser Ser Gly
405 410 415
Ala Gly Val Val Ile Asn Pro Val Glu Ser Lys Glu Lys Tyr Asp Cys
420 425 430
Glu Val Val Asp Asp Cys Glu Arg Lys Arg Lys Thr Arg Lys Lys Ala
435 440 445
Asp Glu Ser Arg Gln Gln Leu His Ala Ile Val Asp Glu Tyr Ala Ala
450 455 460
Ile Asp Ile Gln Asn Ile Asn Leu Ile Tyr Leu Arg Arg Asp Leu Ile
465 470 475 480
Val Ser Leu Ile Asp Asp Glu Lys Phe Asn Asp Met Val Ile Gly Ser
485 490 495
Ile Val Arg Ile Gln Ile Pro Asn Asn Asp Glu Lys His Asp Phe His
500 505 510
Arg Leu Val Gln Val Val Gly Ile Ser Lys Ile Ser Thr Pro Tyr Thr
515 520 525
Val Gly Glu Lys Thr Ile Asp Val Met Leu Asp Ile Leu Asn Leu Asp
530 535 540
Lys Arg Glu Ser Val Ser Val Gln Gly Ile Ser Asn Gln Glu Phe Thr
545 550 555 560
Glu Glu Glu Cys Arg Arg Leu Arg Arg Ser Ile Lys Cys Gly Leu Val
565 570 575
Lys Arg Phe Arg Val Ser Glu Ile Leu Asp Lys Gly Arg Glu Leu Gln
580 585 590
Ala Leu Lys Ile Lys Asp Leu Leu Gln Lys Glu Ile Ser Gln Leu Thr
595 600 605
His Leu His Asp Gln Ala Ser Glu Lys Gly Asn Val Asp Glu Leu Arg
610 615 620
Tyr Phe Ala Glu Arg Leu His Arg Leu Lys Ser Pro Glu Glu Cys Gln
625 630 635 640
Arg Arg Leu Leu Glu Ile Leu Glu Val Arg Ser Asp Pro Thr Met Asp
645 650 655
Pro Ser Tyr Glu Ser Glu Glu Asp Lys Asp Glu Ser Asn Lys Lys Arg
660 665 670
Gln Gly Ser Leu Lys Arg Ser Arg Asn Tyr Asp Phe Asp Glu Lys Glu
675 680 685
Val Glu Leu Thr Ser Pro Arg Arg Gly Thr Asn Ser Asn Val Ser Gly
690 695 700
Ser Asp Val Gln Gln Asn Ser Thr Ser Thr Ser Glu Gln Ser Arg Asn
705 710 715 720
Ile Ser Leu Leu Ala His Glu Asn Lys Glu Gly Asp Cys Leu Ala Ser
725 730 735
Asp Arg Thr Gly Glu Thr Ser Trp Ala Gly Arg Gly Leu Val Pro Asn
740 745 750
Asn Trp Asn Val Pro Ser Gln Ala Lys Thr Ala Thr Pro Leu Ser Ser
755 760 765
Asp Gly Asn Tyr Gln Val Val Leu Pro Glu Ala Ser Ile Pro Pro Leu
770 775 780
Ser Ile Gly Leu Gly Thr Ser Ser Asn Asp Ala Glu Val Glu Arg Ile
785 790 795 800
Trp Gln Tyr Gln Asp Pro Thr Gly Lys Val Gln Gly Pro Phe Ser Met
805 810 815
Thr Gln Leu Arg Asn Trp Asn Asn Ser Gly His Phe Thr Ser Asp Leu
820 825 830
Arg Val Trp Arg Ile Thr Glu Ser Gln Asn Asp Ala Val Leu Leu Thr
835 840 845
Asn Ala Leu Asn Gly Cys Tyr Thr Lys Ala Ser Ser Ile Trp His Asn
850 855 860
Ser His Ile Leu Ser Leu Gly Arg Gly Asn Gly Leu Ser Leu Gly Gly
865 870 875 880
Ser Asp Asn His His Asn Gly Gln Ser Asn Gly Gly Thr Asp Ser Gly
885 890 895
Thr Asn Leu Ile Arg Phe Gly Val Asp Pro Ile Arg Asn Ser Asn Ser
900 905 910
Glu Gln Lys Asp His Ile Ala Val Cys Asp Ala Glu Asn Glu Pro Met
915 920 925
Met Ser Thr Gly Ser Ser Ser Pro Ser Lys Asp Leu Cys Ala Pro Ala
930 935 940
Asp Thr Val Asn Ser Ile Gln Ser Pro Ala Arg Asn Leu Glu Val Ala
945 950 955 960
His Glu Ser Leu Lys Asn Asn Asn Ser Trp Ser Tyr Pro Ser Leu Met
965 970 975
Asn Leu Leu Ser Ser Ala Thr Leu Ser Leu Gln Pro Pro Val Thr Glu
980 985 990
Val His Gln Ala Lys Glu Asn His Ser Pro Asn Asn Glu Asp Gln Asn
995 1000 1005
Ser Gln Thr Ile Thr Leu Gly Gly Ile His Ser Gln Thr Gly Arg
1010 1015 1020
Lys Lys Arg Ser Ser Ser Glu Asp Cys Ser Ser Gln Ser Ser Gly
1025 1030 1035
Gln Asn Trp Ile Ala Pro Pro Ala Thr Asp Thr Ser Ser Arg Glu
1040 1045 1050
Trp Asn Ser Asn Cys Ser Gly Leu Ser Leu Met Asp Ser Phe Lys
1055 1060 1065
Pro Ser Glu Lys Ile Gly Glu Ile Leu Pro Asp Ile Pro His Ser
1070 1075 1080
Thr Leu Lys Pro Val Thr Ala Asp Ala Glu Ile Lys Gln Ser Ala
1085 1090 1095
Ser Ser Ser Val Leu Val Gln Asn Ser Gly Leu Ser Trp Ser Ser
1100 1105 1110
Ala Ser Ser Leu Pro Gly Gly Arg Gln Leu Pro Ser His Val Ala
1115 1120 1125
Ala Gly Ala Trp Gly Gly Gly Tyr Leu Ala Ala Pro Gly Arg Ala
1130 1135 1140
Ile Glu Asp Leu Asn Ser Ser Phe Ile Thr Ala Ser Gly Met Lys
1145 1150 1155
Ser Ser Asp Ile Ile Asp Asp His Glu Thr Thr Gly Ala Thr Ile
1160 1165 1170
Asn Trp Ile Asp Asp Glu Pro Asn Asp Phe Asn Ser Leu Val Asp
1175 1180 1185
Glu Ser Val Ser Asp Leu Leu Ala Glu Val Glu Ala Met Glu Cys
1190 1195 1200
Leu Ser Gly Leu Ala Ser Thr Ala Ser Met Met Asn Cys Asn Glu
1205 1210 1215
Gly Leu Thr Arg Asp Ser Arg Ser Asp Cys Phe Phe Ser Val Asp
1220 1225 1230
Gly Phe Asn Pro Ala Ala Glu Met Gly Lys Val Asp Ala Leu Ser
1235 1240 1245
Ser Thr Ala Asn Leu Gln Phe Pro Phe Asn Ile Lys Val Lys Asp
1250 1255 1260
Glu Gln Pro
1265
<210> 14
<211> 1266
<212> PRT
<213> 西瓜(Citrullus lanatus)
<400> 14
Met Asp Lys Pro Leu Asp Pro Pro Leu Asp Phe Tyr Lys Pro Arg Leu
1 5 10 15
Gln Pro Asp Asp Pro Thr Pro Pro Pro Pro Asp Ala Ser Val Leu Gly
20 25 30
Asn Ser His His Pro Pro His Leu Met Asp Ser His Ile Asp Asp Ser
35 40 45
Lys Leu Val Gly Val Pro Val Ala Gly Pro Leu Leu Pro Ala Asp Ser
50 55 60
Ser Pro Ala Ala Lys Leu Asn Ala Lys Phe Lys Asp Lys Val Leu Val
65 70 75 80
Val Asp Lys Thr Leu Gly Ile Arg Arg Arg Gly Arg Pro Pro Arg Gly
85 90 95
Gln Val Lys Pro Pro Pro Leu Pro Pro Arg Gln Lys Lys Asp Glu Glu
100 105 110
Asp Val Cys Phe Ile Cys Phe Asp Gly Gly Ser Leu Val Leu Cys Asp
115 120 125
Arg Arg Gly Cys Pro Lys Ala Tyr His Pro Ser Cys Ile Lys Arg Asp
130 135 140
Glu Ser Phe Phe Arg Ser Lys Ala Lys Trp Asn Cys Gly Trp His Ile
145 150 155 160
Cys Thr Asn Cys Gln Lys Ala Ser Tyr Tyr Met Cys Tyr Thr Cys Pro
165 170 175
Phe Ser Leu Cys Lys Gly Cys Ile Lys Gly Ala Asp Tyr Gln Cys Val
180 185 190
Arg Gly Thr Lys Gly Phe Cys Gly Thr Cys Met Lys Ile Ile Met Leu
195 200 205
Phe Glu Lys Ser Ala Pro Asp Gly Glu Ser Val Gln Val Asp Phe Asp
210 215 220
Asp Lys Ser Ser Trp Glu Tyr Leu Phe Lys Val Tyr Trp Ile Tyr Leu
225 230 235 240
Lys Glu Lys Leu Ser Leu Thr Val Asp Glu Leu Val Arg Ala Lys Asn
245 250 255
Ser Trp Lys Gly Ser Ile Ile Met Asp His Lys Val Ala Ser Ser Glu
260 265 270
Ile Leu Asp Gly Ser Ile Asp Lys Ser Gln Gly Ala His Asn Ser Phe
275 280 285
Arg Asn Pro Lys Ser Gln Arg Lys Arg Pro Asn Arg Gln Gln Ser Ser
290 295 300
Leu Asn Lys Phe Gly Ser Leu Val Asp Arg Pro Ser Ser Asn Glu Gln
305 310 315 320
Phe Ser Val Ser Thr Lys Trp Thr Thr Thr Glu Leu Met Asp Phe Val
325 330 335
Ala His Val Arg Asn Gly Asp Thr Thr Arg Leu Ser Pro Leu Asp Val
340 345 350
Gln Ala Leu Leu Leu Glu Tyr Val Lys Lys Asn Asn Leu Arg Asp Pro
355 360 365
Gln Gln Gln Ser Gln Ile Asn Cys Asp Leu Arg Leu Thr Asn Leu Phe
370 375 380
Gly Lys Ser Arg Ile Gly His Phe Glu Met Leu Asn Leu Leu Gln Ser
385 390 395 400
His Val His Ile Lys Gly Thr Thr Ala Asp Asn Ala Thr Ser Ser Gly
405 410 415
Ala Gly Val Val Ile Asn Pro Val Glu Ser Lys Glu Lys Tyr Asp Cys
420 425 430
Glu Val Val Asp Asp Cys Glu Arg Lys Arg Lys Thr Arg Lys Lys Ala
435 440 445
Asp Glu Ser Arg Gln Gln Leu His Ala Ile Val Asp Glu Tyr Ala Ala
450 455 460
Ile Asp Ile Gln Asn Ile Asn Leu Ile Tyr Leu Arg Arg Asp Leu Ile
465 470 475 480
Val Ser Leu Ile Asp Asp Glu Lys Phe Asn Asp Met Val Ile Gly Ser
485 490 495
Ile Val Arg Ile Gln Ile Pro Asn Asn Asp Glu Lys His Asp Phe His
500 505 510
Arg Leu Val Gln Val Val Gly Ile Ser Lys Ile Ser Thr Pro Tyr Thr
515 520 525
Val Gly Glu Lys Thr Ile Asp Val Met Leu Asp Ile Leu Asn Leu Asp
530 535 540
Lys Arg Glu Ser Val Ser Val Gln Gly Ile Ser Asn Gln Glu Phe Thr
545 550 555 560
Glu Glu Glu Cys Arg Arg Leu Arg Arg Ser Ile Lys Cys Gly Leu Val
565 570 575
Lys Arg Phe Arg Val Ser Glu Ile Leu Asp Lys Gly Arg Glu Leu Gln
580 585 590
Ala Leu Lys Ile Lys Asp Leu Leu Gln Lys Glu Ile Ser Gln Leu Thr
595 600 605
His Leu His Asp Gln Ala Ser Glu Lys Gly Asn Val Asp Glu Leu Arg
610 615 620
Tyr Phe Ala Glu Arg Leu His Arg Leu Lys Ser Pro Glu Glu Cys Gln
625 630 635 640
Arg Arg Leu Leu Glu Ile Leu Glu Val Arg Ser Asp Pro Thr Met Asp
645 650 655
Pro Ser Tyr Glu Ser Glu Glu Asp Lys Asp Glu Ser Asn Lys Lys Arg
660 665 670
Gln Gly Ser Leu Lys Arg Ser Arg Asn Tyr Asp Phe Asp Glu Lys Glu
675 680 685
Val Glu Leu Thr Ser Pro Arg Arg Gly Thr Asn Ser Asn Val Ser Gly
690 695 700
Ser Asp Val Gln Gln Asn Ser Thr Ser Thr Ser Glu Gln Ser Arg Asn
705 710 715 720
Ile Ser Leu Leu Ala His Glu Asn Lys Glu Gly Asp Cys Leu Ala Ser
725 730 735
Asp Arg Thr Gly Glu Thr Ser Trp Ala Gly Arg Gly Leu Val Pro Asn
740 745 750
Asn Trp Asn Val Pro Ser Gln Ala Lys Thr Ala Thr Pro Leu Ser Ser
755 760 765
Asp Gly Asn Tyr Gln Val Val Leu Pro Glu Ala Ser Ile Pro Pro Leu
770 775 780
Ser Ile Gly Leu Gly Thr Ser Ser Asn Asp Ala Glu Val Glu Arg Ile
785 790 795 800
Trp Gln Tyr Gln Asp Pro Thr Gly Lys Val Gln Gly Pro Phe Ser Met
805 810 815
Thr Gln Leu Arg Asn Trp Asn Asn Ser Gly His Phe Thr Pro Asp Leu
820 825 830
Arg Val Trp Arg Ile Thr Glu Ser Gln Asn Asp Ala Val Leu Leu Thr
835 840 845
Asn Ala Leu Asn Gly Cys Tyr Thr Lys Ala Ser Ser Ile Trp His Asn
850 855 860
Ser His Ile Leu Ser Leu Gly Arg Gly Asn Gly Leu Ser Leu Gly Gly
865 870 875 880
Ser Asp Asn His His Asn Gly Gln Ser Asn Gly Gly Thr Asp Ser Gly
885 890 895
Thr Asn Leu Ile Arg Phe Gly Val Asp Pro Ile Arg Asn Ser Asn Ser
900 905 910
Glu Gln Lys Asp His Ile Ala Val Cys Asp Ala Glu Asn Glu Pro Met
915 920 925
Met Ser Thr Gly Ser Ser Ser Pro Ser Lys Asp Leu Cys Ala Pro Ala
930 935 940
Asp Thr Val Asn Ser Ile Gln Ser Pro Ala Arg Asn Leu Glu Val Ala
945 950 955 960
His Glu Ser Leu Lys Asn Asn Asn Ser Trp Ser Tyr Pro Ser Leu Met
965 970 975
Asn Leu Leu Ser Ser Ala Thr Leu Ser Leu Gln Pro Pro Val Thr Glu
980 985 990
Val His Gln Ala Lys Glu Asn His Ser Pro Asn Asn Glu Asp Gln Asn
995 1000 1005
Ser Gln Thr Ile Thr Leu Gly Gly Ile His Ser Gln Thr Gly Arg
1010 1015 1020
Lys Lys Arg Ser Ser Ser Glu Asp Cys Ser Ser Gln Ser Ser Gly
1025 1030 1035
Gln Asn Trp Ile Ala Pro Pro Ala Thr Asp Thr Ser Ser Arg Glu
1040 1045 1050
Trp Asn Ser Asn Cys Ser Gly Leu Ser Leu Met Asp Ser Phe Lys
1055 1060 1065
Pro Ser Glu Lys Ile Gly Glu Ile Leu Pro Asp Ile Pro His Ser
1070 1075 1080
Thr Leu Lys Pro Val Thr Ala Asp Ala Glu Ile Lys Gln Ser Ala
1085 1090 1095
Ser Ser Ser Val Leu Val Gln Asn Ser Gly Leu Ser Trp Ser Ser
1100 1105 1110
Ala Ser Ser Leu Pro Gly Gly Arg Gln Leu Pro Ser His Val Ala
1115 1120 1125
Ala Gly Ala Trp Gly Gly Gly Tyr Leu Ala Ala Pro Gly Arg Ala
1130 1135 1140
Ile Glu Asp Leu Asn Ser Ser Phe Ile Thr Ala Ser Gly Met Lys
1145 1150 1155
Ser Ser Asp Ile Ile Asp Asp His Glu Thr Thr Gly Ala Thr Ile
1160 1165 1170
Asn Trp Ile Asp Asp Glu Pro Asn Asp Phe Asn Ser Leu Val Asp
1175 1180 1185
Glu Ser Val Ser Asp Leu Leu Ala Glu Val Glu Ala Met Glu Cys
1190 1195 1200
Leu Ser Gly Leu Ala Ser Thr Ala Ser Met Met Asn Cys Asn Glu
1205 1210 1215
Gly Leu Thr Arg Asp Ser Arg Ser Asp Cys Phe Phe Ser Val Asp
1220 1225 1230
Gly Phe Asn Pro Ala Ala Glu Met Gly Lys Val Asp Ala Leu Ser
1235 1240 1245
Ser Thr Ala Asn Leu Gln Phe Pro Phe Asn Ile Lys Val Lys Asp
1250 1255 1260
Glu Gln Pro
1265

Claims (20)

1.一种西瓜植物或植物部位,其包含至少一个拷贝的命名为WAP7.1的基因的突变型等位基因,其中所述突变型等位基因
a)在调控元件中包含一个或更多个突变,导致与野生型等位基因相比没有表达或表达降低,或
b)编码突变型蛋白,其包含与野生型蛋白相比被替换、插入或缺失的一个或多个氨基酸,
其中,当突变型等位基因为纯合形式时,a)或b)的所述突变型等位基因赋予兼性单性结实,并且其中所述野生型WAP7.1等位基因编码SEQ ID NO:1的蛋白质或与SEQ ID NO:1具有至少94%序列同一性的蛋白质。
2.根据权利要求1所述的西瓜植物或植物部位,其中所述突变型等位基因编码突变型蛋白,所述突变型蛋白在所述蛋白质的C末端包含至少20个氨基酸缺失。
3.根据权利要求1所述的西瓜植物或植物部位,其中所述突变型等位基因编码突变型蛋白,所述突变型蛋白在所述蛋白质的C末端包含至少100个氨基酸缺失。
4.根据前述权利要求任一项所述的西瓜植物或植物部位,其中所述突变型等位基因在密码子中包含突变,所述密码子编码SEQ ID NO:1的氨基酸编号W1054或与SEQ ID NO:1具有至少94%同一性的蛋白质中的等同氨基酸。
5.根据前述权利要求任一项所述的西瓜植物或植物部位,其中所述突变型等位基因具有SEQ ID NO:7的基因组序列。
6.根据权利要求1所述的西瓜植物或植物部位,其中所述突变型等位基因在密码子中包含突变,所述密码子编码SEQ ID NO:1的氨基酸编号R346、或S342、或P830、或A328或Q373或与SEQ ID NO:1具有至少94%同一性的蛋白质中的等同氨基酸。
7.根据前述权利要求任一项所述的西瓜植物或植物部位,其中所述突变型等位基因通过随机诱变或靶向诱变,如基于CRISPR的方法产生。
8.根据前述权利要求任一项所述的西瓜植物或植物部位,其中所述植物或植物部位是二倍体并且是突变型等位基因纯合型。
9.根据权利要求1至7任一项所述的西瓜植物或植物部位,其中所述植物或植物部位是三倍体或四倍体并且包含至少一个拷贝的突变型等位基因。
10.根据权利要求9所述的西瓜植物或植物部位,其中所述三倍体植物或植物部位包含一个、两个或三个拷贝的突变型等位基因,以及四倍体植物或植物部位包含两个或四个拷贝的突变型等位基因。
11.可以从其生长出根据前述权利要求任一项所述的西瓜植物或植物部位的种子。
12.由根据前述权利要求中任一项所述的西瓜植物产生的果实,任选地,其中所述果实是无籽的且在没有授粉的情况下产生。
13.根据权利要求1至10任一项所述的西瓜植物或植物部位,其中所述植物或植物部分进一步包含赋予雄性不育的基因或赋予种子败育的基因或另一种赋予单性结实的基因。
14.根据前述权利要求任一项所述的西瓜植物部位,其包含至少一种根据权利要求1至6任一项所述的突变型等位基因,其中所述植物部位是细胞、花、叶、茎、插条、胚珠、花粉、根、根茎、接穗、果实、原生质体、胚、花药。
15.从根据权利要求14所述的植物部位繁殖的无性繁殖植物。
16.一种产生无籽西瓜果实的方法,所述方法包括种植包含两个拷贝的根据权利要求1至6任一项所述的突变型等位基因的二倍体西瓜植物,由此在种植和收获由未授粉的花产生的无籽果实期间,防止花的授粉。
17.一种产生无籽西瓜果实的方法,所述方法包括种植包含一个、两个或三个拷贝的根据权利要求1至6任一项所述的突变型等位基因的三倍体西瓜植物,由此在种植和收获由未授粉的花产生的无籽果实期间,不存在授粉植物。
18.一种针对命名为WAP7.1的基因的突变型等位基因的存在而筛选西瓜植物、种子、植物部位或其DNA的方法,或筛选包含命名为WAP7.1的基因的突变型等位基因的西瓜植物、种子或植物部位的方法,所述方法包含以下步骤:
a)分析基因组DNA是否包含野生型WAP7.1等位基因,所述野生型WAP7.1等位基因编码SEQ ID NO:1的蛋白质、或与SEQ ID NO:1具有至少94%序列同一性的蛋白质,和/或分析基因组DNA是否包含突变型WAP7.1等位基因,所述突变型WAP7.1等位基因编码与野生型WAP7.1蛋白相比包含一个或更多个替换、插入或缺失的氨基酸的突变型蛋白,以及任选地
b)筛选包含两个拷贝的野生型等位基因、两个拷贝的突变型等位基因或一个拷贝的野生型等位基因和一个拷贝的突变型等位基因的植物、种子或植物部位。
19.根据权利要求18所述的方法,其中步骤a)包含选自以下的方法:
i)使用与WAP7.1等位基因的DNA杂交的一个或更多个寡核苷酸引物扩增WAP7.1等位基因的至少一部分,
ii)使一个或更多个寡核苷酸探针与WAP7.1等位基因的DNA的至少一部分杂交,
iii)对WAP7.1等位基因的DNA、mRNA或cDNA进行测序。
20.一种针对突变型wap7.1等位基因的存在而筛选和/或选择植物、种子或植物材料或植物部位、或由其衍生的DNA或RNA或蛋白质的方法,其包含以下步骤中的一个或多个:
a)确定内源性WAP7.1基因的基因表达是否被降低或破坏;
b)确定野生型WAP7.1蛋白的量是否被降低或破坏;
c)确定是否存在编码突变型WAP7.1蛋白的突变型mRNA、cDNA或基因组DNA;
d)确定是否存在突变型WAP7.1蛋白;
其中内源性WAP7.1基因是编码SEQ ID NO:1的野生型WAP7.1蛋白的基因。
CN202180075405.XA 2020-11-09 2021-11-02 单性结实西瓜植物 Pending CN116615098A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP20206517.3 2020-11-09
US63/111,941 2020-11-10
US202063117791P 2020-11-24 2020-11-24
US63/117,791 2020-11-24
PCT/EP2021/080366 WO2022096451A1 (en) 2020-11-09 2021-11-02 Parthenocarpic watermelon plants

Publications (1)

Publication Number Publication Date
CN116615098A true CN116615098A (zh) 2023-08-18

Family

ID=87680530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180075405.XA Pending CN116615098A (zh) 2020-11-09 2021-11-02 单性结实西瓜植物

Country Status (1)

Country Link
CN (1) CN116615098A (zh)

Similar Documents

Publication Publication Date Title
US9062323B2 (en) Identification and use of KRP mutants in wheat
AU2017336342B2 (en) Parthenocarpic watermelon plants
KR20230098337A (ko) 단위결과성 수박 식물
CN113365494B (zh) 能够发生种子败育型的果实形成的茄子科植物
CN113455378A (zh) 玉米单倍体诱导系的选育方法及其应用
US20230371453A1 (en) Parthenocarpic watermelon plants
JP2018518948A (ja) キュウリ(Cucumis sativus)植物における収量QTLの遺伝子移入
US20230404007A1 (en) Parthenocarpic watermelon plants
CN116615098A (zh) 单性结实西瓜植物
CN112654234A (zh) Aco2基因的突变等位基因
US20240164270A1 (en) Watermelon gene conferring a high number of male flowers
OA21301A (en) Parthenocarpic watermelon plants.
US20230189732A1 (en) Didymella bryoniae internal fruit rot resistance in cucumis sativus plants
OA21227A (en) Parthenocarpic watermelon plants.
JP2024523647A (ja) 改変dwarf14遺伝子を含むスイカ植物及び植物部分を選択する方法
CN117677286A (zh) 用于选择包含修饰的dwarf14基因的西瓜植物和植物部分的方法
WO2024094578A1 (en) Melon plants producing seedless fruit
WO2018091438A1 (en) Multibranching artichoke plant

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination