CN104969864A - 改变产纤维植物中纤维强度的方法和手段 - Google Patents

改变产纤维植物中纤维强度的方法和手段 Download PDF

Info

Publication number
CN104969864A
CN104969864A CN201510415973.6A CN201510415973A CN104969864A CN 104969864 A CN104969864 A CN 104969864A CN 201510415973 A CN201510415973 A CN 201510415973A CN 104969864 A CN104969864 A CN 104969864A
Authority
CN
China
Prior art keywords
cotton
plant
allelomorph
sequence
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510415973.6A
Other languages
English (en)
Inventor
A·阿廖利
S·恩格勒恩
J·雅各布斯
M·范托尔诺特
S·布罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bayer CropScience NV
Original Assignee
Bayer CropScience NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayer CropScience NV filed Critical Bayer CropScience NV
Publication of CN104969864A publication Critical patent/CN104969864A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8255Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving lignin biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • C12N15/8246Non-starch polysaccharides, e.g. cellulose, fructans, levans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01039Glucan endo-1,3-beta-D-glucosidase (3.2.1.39)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Abstract

本发明涉及农业领域,更具体地,涉及使用分子生物学技术改变产纤维植物特别是棉花植物和/或加速此类产纤维植物育种。提供了改变纤维品质如提高纤维强度的方法和手段。本发明还提供了鉴定一群棉花品种和相关祖先植物中与纤维强度相关的分子标记物的方法。

Description

改变产纤维植物中纤维强度的方法和手段
本申请是中国专利申请200980124338.5的分案申请,原申请的申请日是2009年5月25日,发明名称是“改变产纤维植物中纤维强度的方法和手段”。
技术领域
本发明涉及农业领域,更具体地,涉及使用分子生物学技术改变产纤维植物特别是棉花植物和/或加速此类产纤维植物育种。提供了改变纤维品质如提高纤维强度的方法和手段。本发明还提供了鉴定一群棉花品种和相关祖先植物中与纤维强度相关的分子标记物的方法。
发明背景
棉花提供了大量用于纺织工业的高品质纤维。修饰棉花纤维特征以更好地适应该工业的需求是通过经典方法或通过遗传改变棉花植物的基因组进行育种方面的主要努力。
全球种植的棉花中大约90%是陆地棉(Gossypium hirsutum L.),而海岛棉(Gossypium barbadense)占大约8%。如大多数开花植物中那样,认为棉花基因组已经经历一个或多个多倍体化事件并且已经因趋异基因组在共有核中接合而进化。棉花商业由两种“AD”异源四倍体物种(陆地棉和海岛棉(Gossypium barbadense L.))(均为2n=4x=52)的改良形式主导。认为异源四倍体棉花已经在大约1-2百万年前于新世界(New World)通过母本旧世界(Old World)“A”基因组分类群类似的草棉(Gossypiumherbaceum)(2n=2x=26)与父本新世界“D”基因组分类群类似的雷蒙德氏棉(Gossypium raimondii)或拟似棉(Gossypium gossypioides))(均为2n=2x=26)之间杂交形成。野生的A基因组二倍体和AD异源四倍体棉属(Gossypium)分类群产生可纺纤维。一种A基因组二倍体物种,树棉(Gossypium arboreum)(2n=2x=26),仍在亚洲被广泛育种和栽培。它的密切相关并且可能的棉属祖先,A基因组二倍体物种草棉(G.herbaceum)也产生可纺纤维。虽然D基因组二倍体的种子是被柔毛的(pubescent),但是均不产生可纺纤维。没有驯化来自其余已认知的二倍体棉属基因组(B、C、E、G和K)的分类群。由人类进行的密集定向选择一贯以来已经产生了与A基因组二倍体栽培种相比具有优异产量和/或品质特征的AD异源四倍体棉花。对陆地棉(G.hirsutum)(AADD;“Upland”棉花)的选择性育种强调最大产量,而海岛棉(AADD;“海岛”、“Pima”或“埃及”棉花)则以其具有优异长度、强度和精细度的纤维见长(Jiang等人,1998,Proc Natl Acad Sci U S A.95(8):4419-4424)。
棉花纤维是在开花或恰在此前从胚珠的外珠被的表皮启动的单个细胞。之后,纤维迅速伸长约3周,然后它们转变成强烈的次生细胞壁纤维素合成。纤维细胞仅在其基部末端(basal ends)与下面的种皮相互连接,并且溶质、水和其它分子的流入经胞间连丝或胞质膜进行。Ruan等人2001(Plant Cell 13:47-63)展示了纤维延伸期间胞间连丝的暂时闭合。Ruan等人2004(Plant Physiology 136:4104-4113)比较了在纤维长度方面不同的不同棉花基因型之间胞间连丝闭合的持续时间,并且发现胞间连丝闭合的持续时间与纤维长度之间的正相关。此外,提供了显微证据,其显示纤维基底处的胼胝质沉积和降解与胞间连丝闭合和重开的时机相关。纤维中令胼胝质降解的内切-1,3-β-葡聚糖酶(endo-1,3-beta-glucanase)基因表达与胞间连丝在纤维基底处的重开相关。
W02005/017157描述了通过改变纤维延伸期调节产纤维植物(如棉花)中纤维长度的方法和手段。纤维延伸期可以通过干扰纤维细胞基底处胞间连丝中的胼胝质沉积来增加或减少。
WO2008/083969(其要求欧洲专利申请EP 07000550的优先权)公开了分离的DNA分子,其包含编码棉花内切-1,3-β-葡聚糖酶的核苷酸序列和纤维细胞偏好性启动子或启动子区域,以及使用这些序列或启动子用于调节棉花植物的纤维长度的方法。WO2008/083969还描述陆地棉中纤维特异性内切-1,3-β-葡聚糖酶基因的A和D亚基因组特定等位基因表达的时机是不同的。虽然D亚基因组特定等位基因表达的启动与迅速延伸期终结(开花后(下文缩写为“DPA”)约14至17日)相关,但A亚基因组特定等位基因表达的启动延迟直至纤维成熟晚期(约35-40DPA)开始,这取决于生长条件。
对棉花工业具有特殊意义的一个纤维特征是纤维强度。不仅纤维强度与纱线强度之间存在高度相关性,而且具有高纤维强度的棉花更可能抵抗制造过程期间的断裂作用。
在棉花纤维的许多其他纺织特性(例如,纤维壁厚度或成熟度、可染性、伸长性等)当中,纤维强度被描述成直接取决于纤维素的量和特性(例如,聚合程度、微晶尺寸和微纤维方向)(Ramey,1986,在:Mauney J.R.和Stewart J.McD.(编著)Cotton Physiology.The Cotton Foundation,Memphis,TN,第351-360页;Triplett,1993,在:Cellulosics:Pulp,Fibre,and Environmental Aspects.Ellis Horwood,Chichester,UK,第135-140页;Hsieh,1999,在:Basra A.S.(编著)Cotton Fibers:Developmental Biology,Quality Improvement,and Textile Processing.The Haworth Press,NewYork,第137-166页)。过去十年间的进展,尤其使用拟南芥属(Arabidopsis)模式植物(Arioli等人,1998,Science 279(5351):717-720),已经导致对参与纤维素合成的蛋白质的了解大大增加。即便如此,仍存在更多关于纤维素合成的内容待习得,尤其关于如何在转录和转录后水平调节纤维素合成(Taylor,2008,New Phytologist 178(2),239-252)。
陆地棉中厚约0.5μm并含有20-25%纤维素连同果胶、木葡聚糖及蛋白质的典型初生纤维细胞壁(Meinert和Delmer 1977,Plant Physiol59:1088-1097)在纤维延伸期间合成(Haigler,2007,在:R.M.Brown,Jr.和I.M.Saxena(编著),Cellulose:Molecular and Structural Biology,147-168,Springer.)。初生壁沉积单独继续进行直至14-17DPA,然后在15-24DPA之间出现伴以同时初生壁及次生壁沉积的过渡期(代表“卷绕层”的沉积),随后主要是次生壁合成直到至少40DPA。壁增厚的第一阶段(12-16DPA)通过持续合成相同比例的初生壁组分实现(Meinert和Delmer,1977,见上文),这是一个与增加的壁双折射一致的观察结果,同时纤维素微纤维横向地保持取向(Seagull,1986,Can J Bot 64:1373-1381)。次生壁最终围绕纤维的整个周边达到3-6μm厚度,仅在纤维尖端变得较纤细。在海岛棉中,在每根纤维内而非在纤维群体中初生壁沉积与次生壁沉积之间存在交叠,原因是交叠期大为延长,并且90%的次生壁沉积在延伸停止之前完成(DeLanghe,1986,在:Mauney J.R.和Stewart J.McD(编著)CottonPhysiology.The Cotton Foundation,Memphis,TN,第325-350页)。认为随着次生壁沉积在大部分的细胞表面上,延伸排他地在纤维尖端继续。
Maltby等人(1979,Plant Physiol.63,1158-1164)描述了正在发育的陆地棉纤维在次生壁沉积开始时短暂合成1,3-β-D-葡聚糖(胼胝质),随后是纤维素的大量合成。Meier等人(1981,Nature 289:821-822)描述了胼胝质可以是棉花纤维的纤维素生物合成中的可能中间体。DeLanghe(1986,见上文)描述了可能在棉花纤维次生壁中需要胼胝质,旨在为纤维素微纤维在常见基质分子不存在下在外质区中结晶和最终取向提供空间。
下文在不同实施方案、实施例、图和权利要求中描述的本发明提供了用于调节纤维长度的改良方法和手段。更具体地,本发明描述了如何在植物中提高纤维强度并且同时维持高的纤维产量。特别地,本发明描述了如何通过渐渗源自针对高纤维强度所选择的其他棉花物种(如海岛棉)的纤维强度决定基因而在针对高产量所选择的棉花物种(如陆地棉)中提高纤维强度。本发明还提供了鉴定多个棉花品种和相关祖先植物中与纤维强度相关的分子标记物的方法。下文描述的本发明也提供编码纤维特异性棉属葡聚糖酶蛋白(GLUC1.1)的新核酸分子和这类蛋白质。
发明概述
本发明人在棉属植物染色体A05上鉴定到纤维强度的数量性状基因座并且发现海岛棉包含这个纤维强度基因座的等位基因,其优于来自陆地棉的这个QTL的等位基因,即,与包含陆地棉纤维强度等位基因的棉属植物的纤维强度相比,该海岛棉纤维强度等位基因在棉属植物中的存在导致更高的纤维强度。
因此,在第一方面,本发明提供非天然存在的棉属植物及其部分和后代,其包含在染色体A05上的纤维强度基因座的至少一个优异等位基因。
在一个实施方案中,该植物是来自A基因组二倍体棉属物种(如草棉或树棉)或AD基因组异源四倍体棉属物种(如陆地棉和海岛棉)的植物,并且优异纤维强度等位基因从不同的A或AD基因组棉属物种衍生。
在另一个实施方案中,该植物是陆地棉、草棉或树棉植物,优选地是陆地棉植物,并且优异纤维强度等位基因从海岛棉衍生。
在一个方面,该海岛棉纤维强度等位基因位于海岛棉的染色体A05上的AFLP标记物P5M50-M126.7与SSR标记物CIR280之间。在另一个方面,位于AFLP标记物P5M50-M126.7与SSR标记物BNL3992之间。仍在另一个方面,位于AFLP标记物P5M50-M126.7与SSR标记物CIR401c之间。又在另一个方面,海岛棉纤维强度等位基因的LOD峰值位于SSR标记物NAU861或GLUC1.1基因与SSR标记物CIR401c之间。在其他方面,海岛棉纤维强度等位基因的LOD峰值位于距SSR标记物NAU861或GLUC1.1基因约0至5cM处,更具体地在约4.008cM处。仍在其他方面,海岛棉纤维强度等位基因的LOD峰值位于距SSR标记物CIR401c约0至12cM处,更具体地在约10cM处,尤其在约10.52cM处。
在另一个方面,该海岛棉纤维强度等位基因包含核苷酸序列的至少一个海岛棉直向同源物,所述的核苷酸序列包含于SEQ ID NO:53中所示的跨度覆盖陆地棉GLUC1.1A基因的基因组DNA序列中。
仍在另一个方面,该海岛棉纤维强度等位基因包含编码无功能GLUC1.1蛋白的GLUC1.1基因。在一个方面,海岛棉GLUC1.1基因的特征在于T核苷酸在与SEQ ID NO:5的第712核苷酸位置相对应的核苷酸位置处存在。在其他方面,海岛棉GLUC1.1基因位于海岛棉纤维强度等位基因的LOD峰值约0至5cM处,更具体地在约4cM处。又在其他方面,海岛棉GLUC1.1基因位于NAU861标记物的约0至2cM处、约0至1cM出,更具体地在约0.008cM处。
又在另一个实施方案中,该植物是陆地棉、海岛棉、草棉或树棉植物,优选地是陆地棉植物,并且优异纤维强度等位基因从达尔文棉(Gossypium darwinii)衍生。在一个方面,该达尔文棉纤维强度等位基因包含编码无功能GLUC1.1蛋白的GLUC1.1基因。在另一个方面,达尔文棉GLUC1.1基因的特征在于一个T核苷酸在与SEQ ID NO:56的第761核苷酸位置相对应的核苷酸位置处存在。
仍在另一个实施方案中,该植物是陆地棉、海岛棉或草棉植物,优选地是陆地棉植物,并且优异纤维强度等位基因从树棉衍生。在一个方面,该树棉纤维强度等位基因包含编码无功能GLUC1.1蛋白的GLUC1.1基因。在另一个方面,树棉GLUC1.1基因的特征在于C核苷酸在与SEQ IDNO:21第327与第328位置之间的核苷酸位置相对应的核苷酸位置处不存在。
在又一个实施方案中,该植物中纤维的胼胝质含量与同等棉属植物的纤维的胼胝质含量相比增加,所述的同等棉属植物不包含纤维强度基因座的至少一个优异等位基因。
在又一个实施方案中,该植物中纤维的强度与同等棉属植物的纤维的强度相比提高,所述的同等棉属植物不包含纤维强度基因座的至少一个优异等位基因。在一个方面,纤维的强度平均是高约5%与约10%之间、优选地高约7.5%。在另一个方面,纤维的强度平均是高约1.6g/tex与约3.3g/tex之间、优选地高约2.5g/tex。仍在另一个方面,纤维的强度平均是在约34.6g/tex与约36.3g/tex之间、优选地约35.5g/tex。
在另一个实施方案中,该植物是对海岛棉纤维强度等位基因纯合的陆地棉植物。
仍在另一个实施方案中,本发明提供从第13至23段任一段所述的植物可获得的纤维。
在又一个实施方案中,本发明提供了鉴定植物中染色体A05上纤维强度基因座的海岛棉等位基因的方法,所述植物优选地是棉属植物,如陆地棉植物,该方法包括步骤:确定与该纤维强度基因座连锁的标记物的海岛棉等位基因在该植物的基因组DNA中存在,所述的标记物选自由以下标记物组成的组:AFLP标记物P5M50-M126.7、SSR标记物CIR280、SSR标记物BNL3992、SSR标记物CIR401c、SSR标记物NAU861、核苷酸序列的直向同源物中的多态性位点,所述的核苷酸序列包含于SEQ IDNO:53中所示的跨度覆盖陆地棉GLUC1.1A基因的基因组DNA序列中;和该植物的GLUC1.1A基因的核苷酸序列中的多态性位点,如位于与SEQID NO:5中第418至第428核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP2、位于与SEQ ID NO:5中第573核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP3、位于与SEQ ID NO:5中第712核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP5、位于与SEQ ID NO:5中第864核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP6或者位于与SEQ ID NO:5中第832核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP8。
在一个特定方面,通过用在其3’最末端分别包含SEQ ID NO:43和44的至少两条引物扩增约126.7bp的DNA片段而检测AFLP标记物P5M50-M126.7的海岛棉等位基因;通过用在其3’最末端分别包含SEQ IDNO:51和52的至少两条引物扩增约205bp的DNA片段而检测SSR标记物CIR280的海岛棉等位基因;通过用在其3’最末端分别包含SEQ ID NO:49和50的至少两条引物扩增约140bp至约145bp的DNA片段而检测SSR标记物BNL3992的海岛棉等位基因;通过用在其3’最末端分别包含SEQID NO:47和48的至少两条引物扩增约245至约250bp的DNA片段而检测SSR标记物CIR401c的海岛棉等位基因;通过用在其3’最末端分别包含SEQ ID NO:45和46的至少两条引物扩增约215bp至约220bp的DNA片段而检测SSR标记物NAU861的海岛棉等位基因;通过在与SNP标记物GLUC1.1A-SNP2的位置相对应的位置处检测CTCATCAAA核苷酸序列或通过用在其3’最末端分别包含SEQ ID NO:37和38的至少两条引物扩增约143bp的DNA片段而检测SNP标记物GLUC1.1A-SNP2的海岛棉等位基因;通过在与SNP标记物GLUC1.1A-SNP3的位置相对应的位置处检测C核苷酸而检测SNP标记物GLUC1.1A-SNP3的海岛棉等位基因;通过在与SNP标记物GLUC1.1A-SNP5的位置相对应的位置处检测T核苷酸而检测SNP标记物GLUC1.1A-SNP5的海岛棉等位基因;通过在与SNP标记物GLUC1.1A-SNP6的位置相对应的位置处检测A核苷酸而检测SNP标记物GLUC1.1A-SNP6的海岛棉等位基因;通过在与SNP标记物GLUC1.1A-SNP8的位置相对应的位置处检测C核苷酸而检测SNP标记物GLUC1.1A-SNP8的海岛棉等位基因。
在又一个实施方案中,本发明提供了鉴定植物中染色体A05上纤维强度基因座的达尔文棉等位基因的方法,所述植物优选地是棉属植物,如陆地棉植物,该方法包括确定达尔文棉特异性多态性位点,如位于与SEQ ID NO:56中第476至第477核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP2、如位于与SEQ ID NO:56中第622核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP3、位于与SEQID NO:56中第761核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP5、位于与SEQ ID NO:56中第913核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP6或者位于与SEQ ID NO:56中第881核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP8,在该植物基因组DNA中对应于SEQ ID NO:56所示GLUC1.1A基因核苷酸序列的GLUC1.1A基因核苷酸序列中存在的步骤。
在一个特定方面,通过在与SNP标记物GLUC1.1A-SNP2的位置相对应的位置处检测CTCATCAAA核苷酸序列或通过用在其3’最末端分别包含SEQ ID NO:37和38的至少两条引物扩增约143bp的DNA片段而检测SNP标记物GLUC1.1A-SNP2的达尔文棉等位基因、通过在与SNP标记物GLUC1.1A-SNP3的位置相对应的位置处检测C核苷酸而检测SNP标记物GLUC1.1A-SNP3的达尔文棉等位基因、通过在与SNP标记物GLUC1.1A-SNP5的位置相对应的位置处检测T核苷酸而检测SNP标记物GLUC1.1A-SNP5的达尔文棉等位基因、通过在与SNP标记物GLUC1.1A-SNP6的位置相对应的位置处检测A核苷酸而检测SNP标记物GLUC1.1A-SNP6的达尔文棉等位基因,并且通过在与SNP标记物GLUC1.1A-SNP8的位置相对应的位置处检测G核苷酸而检测SNP标记物GLUC1.1A-SNP8的达尔文棉等位基因。
在又一个实施方案中,本发明提供了鉴定植物中染色体A05上纤维强度基因座的树棉等位基因的方法,所述植物优选地是棉属植物,如陆地棉植物,该方法包括步骤:确定树棉特异性多态性位点,如位于与SEQID NO:21中第327和第328核苷酸位置之间的核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP7,在该植物的基因组DNA中与SEQ ID NO:21的GLUC1.1A基因核苷酸序列相对应的GLUC1.1A基因核苷酸序列中存在。在一个特定方面,通过检测C核苷酸在与SNP标记物GLUC1.1A-SNP7的位置相对应的位置处不存在而检测SNP标记物GLUC1.1A-SNP7的树棉等位基因。
在又一个实施方案中,本发明提供了区分染色体A05上纤维强度基因座的海岛棉等位基因与植物中纤维强度基因座的陆地棉等位基因的方法,所述植物优选地是棉属植物,如陆地棉植物,该方法包括步骤:确定与该纤维强度基因座连锁的标记物的海岛棉等位基因和/或陆地棉等位基因在该植物的基因组DNA中存在,所述的标记物选自由以下标记物组成的组:AFLP标记物P5M50-M126.7、SSR标记物CIR280、SSR标记物BNL3992、SSR标记物CIR401、SSR标记物NAU861;在植物的包含于SEQ ID NO:53中所示的跨度覆盖陆地棉GLUC1.1A基因的基因组DNA序列中的核苷酸序列直向同源物中的多态性位点;和在该植物的基因组DNA中GLUC1.1A基因的核苷酸序列中的多态性位点,如位于与SEQ IDNO:5中第418至第428核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP2、位于与SEQ ID NO:5中第573核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP3、位于与SEQ ID NO:5中第712核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP5、位于与SEQ ID NO:5中第864核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP6或者位于与SEQ ID NO:5中第832核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP8。
在一个特定方面,该陆地棉等位基因通过用在其3’最末端分别包含SEQ ID NO:43和44的至少两条引物分别扩增不到DNA片段和扩增到约126.7bp的DNA片段而与AFLP标记物P5M50-M126.7的海岛棉等位基因区分;该陆地棉等位基因通过在其3’最末端分别包含SEQ ID NO:51和52的至少两条引物分别扩增不到DNA片段和扩增到约205bp的DNA片段而与SSR标记物CIR280的海岛棉等位基因区分;该陆地棉等位基因通过在其3’最末端分别包含SEQ ID NO:49和50的至少两条引物分别扩增到两个DNA片段,一个约160bp至约165的片段和一个约85bp至约90的片段,以及约140bp至约145bp的DNA片段而与SSR标记物BNL3992的海岛棉等位基因区分;该陆地棉等位基因通过在其3’最末端分别包含SEQ ID NO:47和48的至少两条引物分别扩增到约255bp的DNA片段(CIR401b)和约245bp至约250bp的DNA片段(CIR401c)而与SSR标记物CIR401的海岛棉等位基因区分;该陆地棉等位基因通过在其3’最末端分别包含SEQ ID NO:45和46的至少两条引物分别扩增到约205bp至约210bp的DNA片段和约215bp至约220bp的DNA片段而与SSR标记物NAU861的海岛棉等位基因区分;该陆地棉等位基因分别通过在与SNP标记物GLUC1.1A-SNP2的位置相对应的位置处检测不到核苷酸或检测到CTCATCAAA核苷酸序列或通过用在其3’最末端分别包含SEQ IDNO:37和38的至少两条引物分别扩增到约134bp的DNA片段和约143bp的DNA片段而与SNP标记物GLUC1.1A-SNP2的海岛棉等位基因区分;该陆地棉等位基因通过在与SNP标记物GLUC1.1A-SNP3的位置相对应的位置处分别检测G或C核苷酸而与SNP标记物GLUC1.1A-SNP3的海岛棉等位基因区分;该陆地棉等位基因通过在与SNP标记物GLUC1.1A-SNP5的位置相对应的位置处分别检测C或T核苷酸而与SNP标记物GLUC1.1A-SNP5的海岛棉等位基因区分;该陆地棉等位基因通过在与SNP标记物GLUC1.1A-SNP6的位置相对应的位置处分别检测G或A核苷酸而与SNP标记物GLUC1.1A-SNP6的海岛棉等位基因区分;并且该陆地棉等位基因通过在与SNP标记物GLUC1.1A-SNP8的位置相对应的位置处分别检测G或C核苷酸而与SNP标记物GLUC1.1A-SNP8的海岛棉等位基因区分。
在另一个实施方案中,本发明提供了用于产生和/或选择在染色体A05上包含纤维强度基因座的至少一个优异等位基因的非天然存在棉属植物及其部分和后代的方法,其中优异纤维强度等位基因从海岛棉衍生,该方法包括步骤:使来自A基因组二倍体棉属物种(如草棉或树棉)或AD基因组异源四倍体棉属物种(如陆地棉)的植物与海岛棉植物杂交,并且根据第25或26段鉴定海岛棉纤维强度等位基因。
在另一个实施方案中,本发明提供了用于产生和/或选择在染色体A05上包含纤维强度基因座的至少一个优异等位基因的非天然存在棉属植物及其部分和后代的方法,其中优异纤维强度等位基因从达尔文棉衍生,该方法包括步骤:使来自A基因组二倍体棉属物种(如草棉或树棉)或AD基因组异源四倍体棉属物种(如陆地棉或海岛棉)的植物与达尔文棉植物杂交,并且根据第27或28段鉴定达尔文棉纤维强度等位基因。
在另一个实施方案中,本发明提供了用于产生和/或选择在染色体A05上包含纤维强度基因座的至少一个优异等位基因的非天然存在棉属植物及其部分和后代的方法,其中优异纤维强度等位基因从树棉衍生,该方法包括步骤:使来自A基因组二倍体棉属物种(如草棉)或AD基因组异源四倍体棉属物种(如陆地棉或海岛棉)的植物与树棉植物杂交,并且根据第29段鉴定树棉纤维强度等位基因。
仍在另一个实施方案,本发明提供了用于改变棉属植物中纤维的胼胝质含量、特别是提高纤维的胼胝质含量的方法,包括步骤:根据第32至34段任一段所述渐渗棉属植物中染色体A05上纤维强度基因座的优异等位基因,并且选择其纤维中具有改变的胼胝质含量、尤其提高的胼胝质含量的植物。
又在另一个实施方案,本发明提供了用于改变棉属植物中纤维的特性、特别是提高纤维强度的方法,包括步骤:根据第32至34段任一段所述渐渗棉属植物中染色体A05上纤维强度基因座的优异等位基因,选择具有改变的纤维强度、尤其提高的纤维强度的植物。
在又一个实施方案中,本发明提供了用于鉴定植物中染色体A05上纤维强度基因座的海岛棉等位基因或者用于区分染色体A05上纤维强度基因座的海岛棉等位基因与植物中纤维强度基因座的陆地棉等位基因的试剂盒,所述植物优选地是棉属植物,如陆地棉植物,该试剂盒包含用于确定与该纤维强度基因座连锁的标记物的海岛棉等位基因和/或陆地棉等位基因在该植物基因组DNA中存在的引物和/或探针,所述的标记物选自由以下标记物组成的组:AFLP标记物P5M50-M126.7、SSR标记物CIR280、SSR标记物BNL3992、SSR标记物CIR401、SSR标记物NAU861、核苷酸序列的直向同源物中的多态性位点,所述的核苷酸序列包含于SEQID NO:53中所示的跨度覆盖陆地棉GLUC1.1A基因的基因组DNA序列中,和该植物的基因组DNA中GLUC1.1A基因的核苷酸序列中的多态性位点,如位于与SEQ ID NO:5中第418至第428核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP2、位于与SEQ ID NO:5中第573核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP3、位于与SEQ ID NO:5中第712核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP5、位于与SEQ ID NO:5中第864核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP6或者位于与SEQ IDNO:5中第832核苷酸位置相对应的核苷酸位置处的SNP标记物GLUC1.1A-SNP8。
在一个方面,该试剂盒包含选自由以下引物组成的组中的至少两个引物和/或探针:在其3’最末端分别包含SEQ ID NO:43和44的引物、在其3’最末端分别包含SEQ ID NO:51和52的引物、在其3’最末端分别包含SEQ ID NO:49和50的引物、在其3’最末端分别包含SEQ ID NO:47和48的引物、在其3’最末端分别包含SEQ ID NO:45和46的引物、在其3’最末端分别包含SEQ ID NO:37和38的引物。
发明人已经进一步发现可以通过控制纤维发育的次生细胞壁合成阶段和成熟阶段(本文统称为纤维强度建立阶段)期间在纤维中“功能性表达”的,即产生功能性(生物学活性)内切-1,3-β-葡聚糖酶蛋白(GLUC)的内切-1,3-β-葡聚糖酶基因/等位基因的数目来控制棉花植物中纤维的特性。通过消除纤维发育的纤维强度建立阶段期间、特别在成熟阶段期间纤维中功能性表达的许多内切-1,3-β-葡聚糖酶基因/等位基因(如陆地棉中的A亚基因组特异性内切-1,3-β-葡聚糖酶基因)的功能性表达,同时维持许多此类内切-1,3-β-葡聚糖酶基因/等位基因(如陆地棉中D亚基因组特异性内切-1,3-β-葡聚糖酶基因)的功能性表达,据信可以减少胼胝质的降解至导致更高纤维强度的水平,同时维持足以获得工业相关的纤维长度的胼胝质降解水平。
因此,在另一个方面,本发明提供非天然存在的产纤维植物及其部分和后代,其特征在于纤维发育的纤维强度建立阶段、尤其纤维成熟阶段期间功能表达的至少一个纤维特异性GLUC基因的至少一个等位基因的功能性表达消除。此类植物及其部分和后代可以用于获得具有改变的胼胝质含量和/或改变的纤维特性的植物,特别用于获得产纤维植物,其在纤维中具有优选地维持工业相关的纤维长度的增加的胼胝质含量和/或提高的纤维强度。如本文中所用,“植物部分”包括从本发明植物衍生的任意物质,包括植物部分如细胞、组织、器官、种子、纤维、种子脂肪或油。
在一个实施方案中,GLUC基因是编码与SEQ ID NO:4具有至少90%序列同一性的GLUC蛋白的GLUC1.1基因。
在另一个实施方案中,该植物是棉属植物,其中GLUC基因是编码与SEQ ID NO:4具有至少97%序列同一性的GLUC蛋白的GLUC1.1A基因或编码与SEQ ID NO:10具有至少97%序列同一性的GLUC蛋白的GLUC1.1D基因,优选地是GLUC1.1A基因。
仍在另一个实施方案中,该植物是陆地棉植物。
在又一个实施方案中,与至少一个GLUC等位基因的功能性表达未消除的植物中纤维发育的纤维强度建立阶段、尤其纤维成熟阶段期间纤维中所产生的功能性GLUC蛋白的量相比,功能性GLUC蛋白的量在该植物中纤维发育的纤维强度建立阶段、尤其纤维成熟阶段期间的纤维中显著减少。
仍在又一个实施方案中,与未消除至少一个GLUC等位基因功能性表达的植物内纤维中的胼胝质含量相比,胼胝质含量在该植物的纤维中显著增加。
在又一个实施方案中,与未消除至少一个GLUC等位基因功能性表达的植物中纤维的强度相比,纤维的强度明显提高。在一个方面,纤维的强度平均是高约5%与约10%之间、优选地高约7.5%。在另一个方面,纤维的强度平均是高约1.6g/tex与约3.3g/tex之间、优选地高约2.5g/tex。仍在另一个方面,纤维的强度平均是在约34.6g/tex与约36.3g/tex之间。
仍在又一个实施方案中,该植物是特征在于至少一个纤维特异性GLUC基因的至少两个等位基因的功能性表达被消除的陆地棉植物。
在另一个实施方案中,本发明提供从第40至47段任一段所述的产纤维植物可获得的纤维。
在又一个实施方案中,本发明提供核酸分子,其编码具有以下氨基酸序列的无功能GLUC1.1蛋白,在所述氨基酸序列中与SEQ ID NO:4的GLUC1.1蛋白的活性中心残基相似或与其糖基化位点残基相似的至少一个氨基酸残基缺少或被替换为不相似的氨基酸残基。在一个方面,SEQID NO:4的GLUC1.1蛋白的活性中心残基选自由Tyr48、Glu249、Trp252和Glu308组成的组,并且其中SEQ ID NO:4的GLUC1.1蛋白的糖基化位点残基是Asn202。在另一个方面,无功能GLUC1.1蛋白包含与SEQ IDNO:6、SEQ ID NO:18、SEQ ID NO:57或SEQ ID NO:22的氨基酸序列至少90%同一的氨基酸序列。在另一个方面,该核酸分子包含与SEQ IDNO:3从第101至第1078位核苷酸具有至少92%序列同一性的核酸序列,其中至少一个核酸残基被缺失、插入或替换。又在另一个方面,该核酸分子包含与SEQ ID NO:54从第50至第589位核苷酸的核酸序列至少92%同一的核酸序列。仍在其他方面,该核酸分子包含与SEQ ID NO:54从第50至第589位核苷酸的核酸序列。仍在另一个方面,该核酸分子包含与SEQ ID NO:1从第2410至第3499位核苷酸具有至少92%序列同一性的核酸序列,其中至少一个核酸残基被缺失、插入或替换。又在另一个方面,该核酸分子包含与SEQ ID NO:5从第63至第711位核苷酸、SEQ ID NO:17从第2至第472位核苷酸、SEQ ID NO:56从第112至第760位核苷酸或SEQ ID NO:21从第27至第372位核苷酸的核酸序列至少92%同一的核酸序列。仍在其他方面,该核酸分子包含SEQ ID NO:5从第63至第711位核苷酸、SEQ ID NO:17从第2至第472位核苷酸、SEQ ID NO:56从第112至第760位核苷酸或SEQ ID NO:21从第27至第372位核苷酸的核酸序列。
在另一个实施方案中,本发明提供由第49段的核酸分子编码的无功能GLUC1.1蛋白。
仍在另一个实施方案中,本发明提供了用于鉴定植物中编码无功能GLUC1.1蛋白的GLUC1.1基因的方法,所述植物优选地是棉属植物,如陆地棉植物,所述的GLUC1.1基因包含与SEQ ID NO:1从第2410至第3499位核苷酸具有至少92%序列同一性的核酸序列,包括步骤:在导致无功能GLUC1.1蛋白产生的植物的基因组DNA中鉴定GLUC1.1基因的核苷酸序列中的多态性位点。在一个方面,本发明提供了用于鉴定来自海岛棉或来自达尔文棉的GLUC1.1基因的方法,包括步骤:在与SEQ IDNO:1中第3050核苷酸位置相对应的核苷酸位置处鉴定T核苷酸。在另一个方面,本发明提供了用于鉴定来自树棉的GLUC1.1基因的方法,包括步骤:鉴定C核苷酸在与SEQ ID NO:1中第2674、第2675或第2676核苷酸位置相对应的核苷酸位置处缺失。
在又一个实施方案中,本发明提供了区分编码无功能GLUC1.1蛋白的GLUC1.1基因与编码功能性GLUC1.1蛋白的GLUC1.1基因的方法,所述的GLUC1.1基因均包含与SEQ ID NO:1从第2410至第3499位核苷酸具有至少92%序列同一性的核酸序列,该方法包括鉴定所述GLUC1.1基因的核苷酸序列中多态性位点的步骤。在一个方面,本发明提供了分别区分来自海岛棉、来自达尔文棉或来自树棉的GLUC1.1基因与来自陆地棉的GLUC1.1基因,包括鉴定选自由以下标记物组成的组中多态性位点的步骤:位于SEQ ID NO:1中第2765和第2766位置处核苷酸之间的多态性序列标记物GLUC1.1A-SNP2、位于SEQ ID NO:1中第2911核苷酸位置处的SNP标记物GLUC1.1A-SNP3、位于SEQ ID NO:1中第3050核苷酸位置处的SNP标记物GLUC1.1A-SNP5、位于SEQ ID NO:1中第3202核苷酸位置处的SNP标记物GLUC1.1A-SNP6、位于SEQ IDNO:1中第2674、第2675或第2676核苷酸位置处的SNP标记物GLUC1.1A-SNP7,和位于SEQ ID NO:1中第3170核苷酸位置处的SNP标记物GLUC1.1A-SNP8。在另一个方面,通过用在其3’最末端分别包含SEQ ID NO:37和38的引物分别扩增到约143bp和约134bp的DNA片段来检测分别来自海岛棉或达尔文棉和来自陆地棉的多态性序列标记物GLUC1.1A-SNP2。仍在另一个方面,分别通过用包含SEQ ID NO:41和42的引物扩增到约57bp的DNA片段和用包含SEQ ID NO:39和40的荧光标记探针检测该DNA片段而分别检测来自海岛棉或达尔文棉和来自陆地棉的SNP标记物GLUC1.1A-SNP3。
在又一个实施方案中,本发明提供了用于产生和/或选择非天然存在的产纤维植物及其部分和后代的方法,其中在纤维发育的纤维强度建立阶段、尤其纤维成熟阶段期间功能表达的至少一个纤维特异性GLUC基因的至少一个等位基因的功能性表达被消除,该方法包括步骤:诱变该GLUC基因的至少一个等位基因,或渐渗该GLUC基因的无功能表达的直向同源物的至少一个等位基因或诱变的GLUC基因的至少一个等位基因,或导入包含以下有效连接的DNA元件的嵌合基因:(a)植物可表达启动子,(b)转录的DNA区域,其转录时产生能够减少GLUC等位基因表达的抑制性RNA分子,和(c)3’末端区域,其包含在该植物的细胞中有功能的转录终止与多腺苷酸化信号。在一个方面,该GLUC基因是编码与SEQ ID NO:4具有至少90%序列同一性的GLUC蛋白的GLUC1.1基因。在另一个方面,产纤维植物是棉属植物,并且该GLUC基因是编码与SEQ ID NO:4具有至少97%序列同一性的GLUC蛋白的GLUC1.1A基因或编码与SEQ IDNO:9具有至少97%序列同一性的GLUC蛋白的GLUC1.1D基因,优选地是GLUC1.1A基因。仍在另一个方面,产纤维植物是棉属植物,并且该GLUC基因的无功能表达的直向同源物是从海岛棉、从达尔文棉或树棉植物、优选地从海岛棉衍生的GLUC1.1A基因。在又一方面,该方法还包括步骤:根据第51段的方法鉴定GLUC基因或诱变的GLUC基因的无功能表达的直向同源物。
在又一个实施方案中,本发明提供了用于改变产纤维植物中纤维的胼胝质含量、尤其增加纤维的胼胝质含量的方法,包括步骤:根据第53段的方法产生和/或选择非天然存在的产纤维植物及其部分和后代,其中在纤维发育的纤维强度建立阶段、尤其纤维成熟阶段期间功能表达的至少一个纤维特异性GLUC基因的至少一个等位基因的功能性表达被消除,并且选择其纤维中具有改变的胼胝质含量、尤其增加的胼胝质含量的植物。
在又一个实施方案中,本发明提供了用于改变产纤维植物中纤维的特性、尤其提高纤维强度的方法,包括步骤:根据第53段的方法产生和/或选择非天然存在的产纤维植物及其部分和后代,其中在纤维发育的纤维强度建立阶段、尤其纤维成熟阶段期间功能表达的至少一个纤维特异性GLUC基因的至少一个等位基因的功能性表达被消除,并且选择其纤维中具有改变的纤维强度、尤其提高的纤维强度的植物。
在又一个实施方案中,本发明提供了用于鉴定植物中编码无功能GLUC1.1蛋白的GLUC1.1基因的试剂盒,所述的GLUC1.1基因包含与SEQ ID NO:1从第2410至第3499位核苷酸具有至少92%序列同一性的核酸序列,所述试剂盒包含引物和/或探针,它们用于确定植物的基因组DNA中存在导致无功能GLUC1.1蛋白产生的GLUC1.1基因的核苷酸序列中的多态性位点。在一个方面,该试剂盒包含用于确定T核苷酸在与SEQ ID NO:1中第3050核苷酸位置相对应的核苷酸位置处存在或者用于确定C核苷酸在与SEQ ID NO:1中第2674、第2675或第2676核苷酸位置相对应的核苷酸位置处缺失的引物和/或探针。
仍在另一个实施方案中,本发明提供了区分编码无功能GLUC1.1蛋白的GLUC1.1基因与编码功能性GLUC1.1蛋白的GLUC1.1基因的试剂盒,所述的GLUC1.1基因均包含与SEQ ID NO:1从第2410至第3499位核苷酸具有至少92%序列同一性的核酸序列,该试剂盒包含用于确定多态性位点存在于所述GLUC1.1基因的核苷酸序列中的引物和/或探针。在一个方面,本发明提供试剂盒,其包含用于分别区分海岛棉、达尔文棉或树棉特定等位基因与陆地棉特定等位基因的多态性位点的的引物和/或探针,所述的多态性位点选自由以下标记物组成的组:位于SEQ ID NO:1中第2765和第2766位置处核苷酸之间的多态性序列标记物GLUC1.1A-SNP2、位于SEQ ID NO:1中第2911核苷酸位置处的SNP标记物GLUC1.1A-SNP3、位于SEQ ID NO:1中第3050核苷酸位置处的SNP标记物GLUC1.1A-SNP5、位于SEQ ID NO:1中第3202核苷酸位置处的SNP标记物GLUC1.1A-SNP6、位于SEQ ID NO:1中第2674、第2675或第2676核苷酸位置处的SNP标记物GLUC1.1A-SNP7和位于SEQ ID NO:1中第3170核苷酸位置处的SNP标记物GLUC1.1A-SNP8。在另一个方面,该试剂盒包含选自由以下对象组成的组中的至少两个引物和/或探针:在其3’最末端分别包含SEQ ID NO:37和38以鉴定多态性序列标记物GLUC1.1A-SNP2的引物、分别包含SEQ ID NO:41和42以鉴定SNP标记物GLUC1.1A-SNP3的引物、分别包含SEQ ID NO:39和40以鉴定SNP标记物GLUC1.1A-SNP3的探针、分别包含SEQ ID NO:62和63以鉴定SNP标记物GLUC1.1A-SNP5的引物,和分别包含SEQ ID NO:60和61以鉴定SNP标记物GLUC1.1A-SNP5的探针。
附图简述
图1:来自陆地棉(‘GhGLUC1.1A-gDNA’与SEQ ID NO:1从第2246至第3753位核苷酸相对应,‘GhGLUC1.1A-cDNA’与SEQ ID NO:3相对应,‘GhGLUC1.1D-gDNA’与SEQ ID NO:7从第3206至第4694位核苷酸相对应,并且‘GhGLUC1.1D-cDNA’与SEQ ID NO:9相对应)和海岛棉(‘GbGLUC1.1A-gDNA’与SEQ ID NO:5相对应,‘GbGLUC1.1A-cDNA’与SEQ ID NO:54相对应,‘GbGLUC1.1D-gDNA’与SEQ ID NO:11相对应,并且‘GbGLUC1.1D-cDNA’与SEQ ID NO:13相对应)的A和D亚基因组特异性GLUC1.1基因的基因组和cDNA序列的比对。推定的TATA框以粗体字指示,推定的起始密码子和推定的第一外显子分别以粗体字和以粗体字用箭头指示,推定的内含子序列和第二外显子序列用箭头规律地指示,推定的内含子序列在‘/’之间进一步指示,推定的(提早)终止密码子以斜体字指示并下划标出。
图2:来自陆地棉(‘GhGLUC1.1A’与SEQ ID NO:2和4相对应并且‘GhGLUC1.1D’与SEQ ID NO:8和10相对应)和海岛棉(‘GbGLUC1.1A’与SEQ ID NO:6和55相对应并且‘GbGLUC1.1D’与SEQID NO:12和14相对应)的A和D亚基因组特异性GLUC1.1蛋白的氨基酸序列的比对。推定的信号肽以斜体字指示,将推定的翻译后剪接位点显示为‘><’,GH17标签以粗体字指示。突出显示在这四个序列中至少三个序列之间相同的氨基酸。虚线显示GbGLUC1.1A中丢失的蛋白质区段。
图3:基于大麦1,3-1,4-β-葡聚糖酶的X射线结构(1aq0;图3a和b;左),陆地棉(图3a;右)和海岛棉(图3b;右)的GLUC1.1A蛋白的蛋白质模型。1aq0的活性中心位于由桶内平行β-折叠链的羧基端所限定桶的底部处的开放裂隙中(Müller等人,1998,J.Biol.Chem 273(6):3438-3446)并由氨基酸指示氨基酸,并且这些氨基酸的位置编号在图3a和b左侧的1aq0蛋白质模型的左上部分显示。1aq0(图3a,左)中的活性中心残基Glu288、Glu232和Tyr33与GhGLUC1.1A(图3a,右)中的Glu308、Glu249和Tyr48相对应并且不存在于GbGLUC1.1A(图3b,右)中。1aq0(图3A,左)中的糖基化位点Asn190与GhGLUC1.1A(图3a,右)中的Asn 202相对应并且也不存在于GbGLUC1.1A(图3b,右)中。图3b进一步显示了在GbGLUC1.1A(图3b;右)的第82、第83和第84位置处不存在于GhGLUC1.1A中的苏氨酸、组氨酸和谷氨酰胺(见例如图7)位于一个远处环中,其中所述的环不是该活性中心的部分并且不参与糖基化。
图4:显示未处理的纤维(‘未处理’)和用外源葡聚糖酶处理的纤维(‘处理’)之间纤维强度上差异的箱线图(如通过测量单一纤维的断裂力所确定;在Y轴上以cN表示),所述纤维衍生自陆地棉栽培品种FM966,为欧洲在温室中培育的(‘FM966 Astene’)、美国在田间培育的(‘FM966Sellers’)和澳大利亚在田间培育的(‘FM966 Australia’);衍生自陆地棉栽培品种Coker312,为欧洲在温室中培育的(‘Coker 312’);衍生自海岛棉栽培品种PimaS7,为欧洲于温室中培育的(‘PimaS7’);和衍生自海岛棉栽培品种PimaY5,为澳大利亚在田间培育的(‘PimaY5’)。
图5:显示未处理的纤维(‘未处理’)和用外源葡聚糖酶处理的纤维(‘处理’)之间胼胝质含量上差异的箱线图(如通过苯胺蓝染色纤维的荧光度量所确定;在Y轴上显示为绿色荧光对蓝色荧光的比),所述纤维衍生自陆地棉栽培品种FM966,为欧洲在温室中培育的(‘FM966 Astene’)、美国在田间培育的(‘FM966 Sellers’)和澳大利亚在田间培育的(‘FM966Australia’);衍生自陆地棉栽培品种Coker312,为欧洲于温室中培育的(‘Coker 312’);衍生自海岛棉栽培品种PimaS7,为欧洲于温室中培育的(‘PimaS7’);和衍生自海岛棉栽培品种PimaY5,为澳大利亚在田间培育的(‘PimaY5’)。
图6:来自陆地棉(‘GhGLUC1.1A_gDNA’与SEQ ID NO:1从第2348至第3554位核苷酸相对应并且“GhGLUC1.1D_gDNA’与SEQ IDNO:7从第3311至第4496位核苷酸相对应)、毛棉(Gossypiumtomentosum)(‘GtGLUC1.1A_gDNA’与SEQ ID NO:15相对应,并且‘GtGLUC1.1D_gDNA’与SEQ ID NO:25相对应)、海岛棉(‘GbGLUC1.1A_gDNA’与SEQ ID NO:5相对应,并且‘GbGLUC1.1D_gDNA’与SEQ ID NO:11相对应)、达尔文棉(‘GdGLUC1.1A_gDNA’与SEQ ID NO:17相对应,并且‘GdGLUC1.1D_gDNA’与SEQ ID NO:27相对应)、黄褐棉(Gossypiummustelinum)(‘GmGLUC1.1A_gDNA’与SEQ ID NO:19相对应,并且‘GmGLUC1.1D_gDNA’与SEQ ID NO:29相对应)、树棉(‘GaGLUC1.1A_gDNA’与SEQ ID NO:21相对应)、草棉(‘GheGLUC1.1A_gDNA’与SEQ ID NO:23相对应)和雷蒙德氏棉(Gossypium raimondii)(‘GrGLUC1.1D_gDNA’与SEQ ID NO:31相对应)的A和D亚基因组特异性GLUC1.1基因的基因组DNA序列的比对。下划标出用来产生从起始密码子至终止密码子的完整编码序列的引物SE077和SE078的位置以及用来产生部分编码序列的引物SE003和SE002的位置。推定的起始密码子和推定的第一外显子分别以粗体字和以粗体字用箭头指示,推定的内含子序列和第二外显子序列用箭头规律地指示,推定的内含子序列在‘/’之间进一步指示,推定的(提早)终止密码子以斜体字指示并下划标出。存在于例如陆地棉FM966和海岛棉Pima S7或达尔文棉的GLUC1.1A或GLUC1.1D序列之间5个多态性位点(4个单核苷酸多态性(SNP)和一个延伸的插入/缺失))以箭头指示并命名为‘GLUC1.1D-SNP1’和‘GLUC1.1A-SNP2、3、5和6’。等位基因变体显示如下:[陆地棉等位基因/海岛棉或达尔文棉等位基因]。存在于例如陆地棉FM966和树棉的GLUC1.1A序列之间的一个多态性位点(1个SNP)以箭头指示并命名为‘GLUC1.1A-SNP7’。等位基因变体显示如下:[陆地棉等位基因/树棉等位基因]。存在于例如海岛棉Pima S7或达尔文棉的GLUC1.1A序列之间的一个多态性位点(1个SNP)以箭头指示并命名为‘GLUC1.1A-SNP8’。等位基因变体显示如下:[海岛棉等位基因/达尔文棉等位基因]。
图7:来自陆地棉(‘GhGLUC1.1A_prot’与SEQ ID NO:2和4相对应,并且‘GhGLUC1.1D_prot’与SEQ ID NO:8和10相对应;全长序列)、毛棉(‘GtGLUC1.1A_prot’与SEQ ID NO:16相对应,并且‘GtGLUC1.1D_prot’与SEQ ID NO:26相对应;部分序列)、海岛棉(‘GbGLUC1.1A_prot’与SEQ ID NO:6和55相对应,并且GbGLUC1.1D_prot’与SEQ ID NO:12和14相对应;全长序列)、达尔文棉(‘GdGLUC1.1A_prot’与SEQ ID NO:57相对应,并且‘GdGLUC1.1D_prot’与SEQ ID NO:59相对应;全长序列)、黄褐棉(‘GmGLUC1.1A_prot’与SEQ ID NO:20相对应,并且‘GmGLUC1.1D_prot’与SEQ ID NO:30相对应;部分序列)、树棉(‘GaGLUC1.1A_prot’与SEQ ID NO:22相对应;全长序列)、草棉(‘GheGLUC1.1A_prot’与SEQ ID NO:24相对应;全长序列)和雷蒙德氏棉(GrGLUC1.1D_prot’与SEQ ID NO:32相对应;部分序列)的A和D亚基因组特异性GLUC1.1蛋白的氨基酸序列的比对。推定的信号肽以斜体字指示,将推定的翻译后剪接位点显示为‘><’,GH17标签以粗体字指示。突出显示与上部序列即GhGLUC1.1A_prot中氨基酸不同的氨基酸。
图8:GLUC1.1A和GLUC1.1D在海岛棉中的表达。提取来自海岛棉的(发育中)纤维的cDNA文库的DNA并使之均衡(equalized)。PCR片段使用寡核苷酸引物SE002和SE003(SEQ ID No 35和36)扩增并且用限制酶AlwI消化。GLUC1.1A的PCR扩增产物产生3个片段(479bp+118bp+59bp),而GLUC1.1D的PCR扩增产物仅产生2个片段(538bp+118bp)。泳道1和12:1kb大小标记物;泳道2至9:在0,5,10,15,20,25,30和40DPA时GbGLUC1.1A表达和GbGLUC1.1D表达;泳道10:阴性(无模板;NTC);泳道11:阳性对照(来自Pima S7的基因组DNA)。
图9:跨度覆盖陆地棉GLUC1.1A基因的165250bps DNA片段(SEQ ID NO:53)示意图。框:逆转录转座子区域;*:CIR280同源性区域的位置;箭头:编码用以下缩写所示蛋白质的DNA片段:SHMT(丝氨酸羟甲基转移酶);GrpE/HSP-70(GrpE蛋白/HSP-70辅因子);ARF17:与At-ARF17相似的推定的植物生长素应答因子;eIF-5-1:可能的真核翻译起始因子F因子5-1;Avr9:推定的Avr9激发子应答蛋白;VPS9:与液泡蛋白分选相关蛋白VPS9相似;HAT:推定的组蛋白乙酰转移酶基因;Gluc1.1:GLUC1.1A编码区;MEKK1:推定的有丝分裂原激活的蛋白激酶激酶激酶1;PIP5K1:磷脂酰肌醇-4-磷酸5-激酶1。
详述的实施方案
本发明基于以下出乎意料的发现:与包含纤维强度基因座的陆地棉直向同源物的陆地棉植物的纤维强度相比,陆地棉植物中染色体A05上纤维强度基因座的海岛棉直向同源物的存在导致该陆地棉植物的纤维强度提高。
因此,在第一方面,本发明提供非天然存在的棉属植物及其部分和后代,其包含位于染色体A05上的纤维强度的数量性状基因座(QTL)的至少一个优异等位基因。
如本文中所用,术语“非天然存在的”或“栽培的”当谈及植物使用时,意指具有已经被人修饰过的基因组的植物。转基因产纤维植物例如是非天然存在的产纤维植物,该植物含有外源核酸分子,例如,包含转录区域的嵌合基因,其中所述的转录区域在转录时产生了能够减少本发明GLUC基因表达的生物学活性RNA分子,并且因此已经被人遗传地修饰。此外,将因暴露于诱变剂而在内源GLUC基因中(例如在调节元件或在编码序列中)含有例如突变的产纤维植物也视为非天然存在的产纤维植物,因为它已经被人遗传地修饰。另外,将某个特定物种(如陆地棉)的在内源GLUC基因中含有例如天然不在这个特定植物物种中存在的下述突变的产纤维植物也视为非天然存在的产纤维植物,其中所述的突变因采用产纤维植物的另一个物种(如海岛棉)的例如定向育种方法(如标记物辅助育种和选择或渐渗法)所致。相反,仅含有自发或天然存在突变的产纤维植物,即没有被人遗传地修饰过的植物不是如本文中定义的"非天然存在植物",并且因此不包含在本发明内。本领域技术人员理解尽管非天然存在的产纤维植物一般具有与天然存在的产纤维植物相比被改变的核苷酸序列,然而非天然存在的产纤维植物也可以被人遗传地修饰,而不改变其核苷酸序列,例如通过修饰其甲基化模式。
术语“数量性状”在本文中指性状,如纤维强度,其表型特征在程度上不同并可以归因于两个或多个基因与其环境之间的相互作用。
如本文中所用,术语“基因座(locus)”(复数形式是loci)或“位点”意指染色体上例如存在基因、遗传标记物或QTL的一个或多个特定位置。
“数量性状基因座(QTL)”是与决定所讨论性状的基因紧密连锁的一段DNA(如染色体臂、染色体区、核苷酸序列、基因等)。“QTL作图”涉及使用遗传标记物或分子标记物如AFLP、RAPD、RFLP、SNP、SSR等、可视多态性和等位基因酶产生基因组图谱并确定该基因组上的特定区域与目的性状的遗传性的关联程度。由于所述标记物不是必需涉及基因,故QTL作图结果涉及一段DNA与性状的关联程度,而非直接指向负责该性状的基因。使用不同的统计方法来确定该关联程度是否显著。如果一个分子标记物和某基因或基因座在遗传性上具有比本应从独立分配所期望那样更大的关联性,则称该分子标记物与此基因或基因座连锁,即该标记物和此基因座在分离群体中共分离并且位于相同的染色体上。“连锁”指该标记物与此基因座或基因(或两个基因座或两个标记物相互)的遗传距离。连锁越接近,使该标记物与此基因或基因座分离的重组事件发生的可能性越小。遗传距离(图距)从重组频率计算并用厘摩尔根(cM)表示[Kosambi(1944),Ann.Eugenet.12:172-175]。
如本文中所用,“纤维强度基因座”或“强度基因座”指棉属物种的染色体A05上同参与调节纤维强度的基因紧密连锁的一段DNA。“纤维强度基因座”是所述与“(纤维强度)因果基因”连锁的QTL。
如本文中所用,“纤维”,如“棉花纤维”,指产纤维植物(如棉花)的种毛、更具体地是单个细胞,其在开花或恰在此前从胚珠外珠被的表皮启动。已经充分记录了棉花纤维的形态发育(Basra和Malik,1984,Int Revof Cytology 89:65-113;Graves和Stewart,1988,见上文;Ramsey和Berlin,1976,American Journal of Botany 63(6):868-876;Ruan和Chourey,1998,Plant Physiology 118:399-406;Ruan等人2000,Aust.J.Plant Physiol.27:795-800;Stewart,1975,Am.J.Bot.62,723-730)。棉花纤维,尤其来自陆地棉的棉花纤维,经历4个重叠的发育阶段:纤维细胞启动、延伸、次生细胞壁生物合成和成熟。纤维细胞启动是一个快速过程。白色绒纤维在开花后立即开始发育并持续直至开花后(DPA)约3日,继之是纤维细胞延伸(直至约10至约17DPA)。取决于生长条件,次生细胞壁生物合成启动并继续至约25至约40DPA,继而是成熟过程直至约45至约60DPA。次生细胞壁合成阶段和成熟阶段在本文统称为“纤维强度建立阶段”。仅约25至30%的表皮细胞分化成商业重要的棉绒纤维(Kim和Triplett,2001)。大部分细胞不分化成纤维或发育成短纤维或绒毛。在纤维延伸和次生壁代谢期间,纤维细胞快速伸长,合成次生壁组分并显示巨大的细胞改变、分子改变和生理改变。纤维延伸与细胞快速生长及膨大(Seagull,1991,在Biosynthesis and biodegradation of cellulose(Haigler,C.H.和Weimer,P.J.,编著)第1432163页,MarcelDekker,New York)和恒定合成大量细胞代谢物和细胞壁组分(如纤维素)偶联。成熟棉花纤维中约95%的干重是纤维素(Pfluger和Zambryski,2001,Curr Biol 11:R436-R439;Ruan等人,2001,Plant Cell 13:47-63)。非细胞样组分对纤维细胞发育也是重要的(Hayashi和Delmer,1988,Carbohydr.Res.181:273-277;Huwyler等人,1979,Planta146:635-642;Meinert和Delmer,1977,Plant Physiol 59:1088-1097;Peng等人,2002,Science 295:147-150)。与其他植物细胞相比,棉花纤维不在次生壁中含有木质素,但是具有认为与细胞快速生长和膨大相关的大液泡(Basra和Malik,1984,见上文;Kim和Triplett,2001,Plant Physiology 127:1361-1366;Mauney,1984,见上文;Ruan和Chourey,1998,见上文;Ruan等人,2000,见上文;Van‘t Hof,1999,American Journal of Botany86:776-779)。
如本文中所用,“纤维强度”可以通过确定一束纤维的强度即“纤维束强度”或通过确定单根纤维的强度来确定。单根纤维强度越高并且单根纤维断裂延伸性的变异越低,则纤维束越紧密,并且纱线抗拉强度将是单根纤维强度的总和;理想地,纤维束韧度会等于总的单根纤维断裂韧度,如果该束范围内的全部纤维具有相等的断裂延伸性并且没有松弛(Liu等人,2005年2月,Textile Res.J)。
如本文中所用,“纤维束强度”指通常以克/特表述的一种度量单位。纤维束强度的这种商业性大容量棉纤维测试仪(HVI)度量单位(“HVI强度”)也叫作“韧度”。一个特单位等于1,000米纤维的以克计的重量。因此,所报道的强度是使大小1个特单位的一束纤维断裂所要求的以克计的力。例如可以根据USDA标准进行棉花纤维束强度的测量。将一撮棉花夹在相距八分之一英寸的两组夹持器夹口中,并且确定断裂纤维所要求的力。表1可以用作解读纤维强度测量的指南。
表1:HVI纤维强度测量的解读
强度的程度 HVI*强度(克/特)
很强的 31或更大
强的 29-30
平均的 26-28
中等的 24-25
弱的 23或更小
*大容量精确测试仪
备选地,可以通过例如在FAVIMAT Robot(Textechno)上如http://www.textechno.com/上和实施例中所述开展单根纤维拉伸试验,通过确定“单根纤维强度”来比较纤维的强度。简而言之,将单根纤维夹在两个纤维夹持器之间,可连续调节量规长度在5和100mm之间(设定在例如8mm上)和拉断(draw-off)夹持器速度在0.1和100mm/分钟之间(设定在例如4mm/分钟),并且确定断裂纤维所要求的力(“断裂力”)(cN)。可以在实施例中找到具体棉花品种的平均断裂力。
如本文中所用,“染色体A05”指A基因组二倍体棉属植物(如草棉或树棉)或AD异源四倍体棉属植物(如陆地棉、海岛棉和达尔文棉)中(根据Wang等人,2006,Theor Appl Genet 113(1):73-80编号)的染色体A05。在一个实施方案中,棉属植物是包含根据Wang等人(2006,Theor Appl Genet113(1):73-80)编号为A01至A13的13对A基因组染色体的A基因组二倍体棉属植物,如草棉或树棉。在另一个实施方案中,棉属植物是包含根据Wang等人(上文)分别编号为A01至A13和D01至D13的13对A基因组和13对D基因组染色体的AD基因组异源四倍体棉属植物,如陆地棉、海岛棉和达尔文棉。
在一个实施方案中,非天然存在的棉属植物是陆地棉、草棉或树棉植物,优选地是陆地棉植物,并且纤维强度基因座的优异等位基因从海岛棉衍生。
海岛棉、尤其海岛棉栽培品种Pima S7、种子是公开可获得的并且可以例如从棉花保藏中心(USDA,ARS,Crop Germplasm Research,2765F&B Road,College Station,Texas 77845;http://www.ars-grin.gov/)获得。
术语纤维强度基因座的“优异等位基因”在本文中指纤维强度基因座的等位基因,其中与不包含优异等位基因(即包含非优异等位基因)的这种产纤维植物中的纤维强度相比,该等位基因在产纤维植物的基因组中的存在导致更高的纤维强度。
如本文中所用,术语“等位基因”意指基因或标记物在特定基因座处的或数量性状基因座(QTL)的任意一个或多个可变形式。在生物的二倍体或异源四倍体(双二倍体)细胞中,给定基因、标记物或QTL的等位基因位于染色体上的特定位置或一个或多个基因座处。一个等位基因存在于成对同源染色体的每条染色体上。如本文中所用,术语“同源染色体”意指这样的染色体,它们含有相同生物学特征的信息并且含有在相同的基因座和相同的数量性状基因座处的相同基因或标记物,但可能含有这些基因、标记物或数量性状基因座的不同等位基因。同源染色体是减数分裂期间配对的染色体。代表某生物全部生物学特征的“非同源染色体”形成一个组,并且细胞中的组数目称作倍性。二倍体生物含有两组非同源染色体,其中每条同源染色体遗传自不同的亲本。在异源四倍体(双二倍体)物种如棉花中,实质上存在两组二倍体基因组,因此这两个基因组的染色体称作“同源染色体”(并且类似地,这两个基因组的基因、标记物和基因座称作同源基因、标记物或基因座)。二倍体或异源四倍体(双二倍体)植物物种可以在特定基因座处包含巨大数目的不同等位基因。
术语某种基因或蛋白质或QTL的“直向同源物”在本文中指另一个物种中存在的同源基因或蛋白质或QTL,其具有与所述基因或蛋白质或QTL相同的功能,但是(通常)依次从下述时间点趋异,其中在所述时间点上携带所述基因或数量性状基因座的物种趋异(即所述基因或数量性状基因座因物种形成作用从共同祖先进化)。例如海岛棉GLUC基因或纤维强度基因座的直向同源物因此可以在其他植物物种(例如树棉、达尔文棉等)中基于两个序列的比较(例如基于全序列范围或特定区域范围内的序列同一性百分数)和/或功能分析来鉴定。
在一个实施方案中,纤维强度基因座的优异等位基因是从海岛棉、尤其海岛棉栽培品种PimaS7可获得的,即,与不包含该海岛棉等位基因,但包含例如陆地棉等位基因的棉属植物(如陆地棉植物)中的纤维强度相比,海岛棉纤维强度等位基因在该棉属植物如陆地棉植物中的存在导致提高的纤维强度。
仍在另一个实施方案中,该海岛棉纤维强度等位基因位于海岛棉的染色体A05上的AFLP标记物P5M50-M126.7与SSR标记物CIR280之间。在另一个实施方案中,该海岛棉纤维强度等位基因位于海岛棉的染色体A05上的AFLP标记物P5M50-M126.7与SSR标记物BNL3992之间。又在另一个实施方案中,该海岛棉等位基因位于海岛棉的染色体A05上的AFLP标记物P5M50-M126.7与SSR标记物CIR401c之间。在又一个实施方案中,海岛棉的纤维强度QTL等位基因的LOD峰值位于SSR标记物NAU861或GLUC1.1标记物与SSR标记物CIR401c之间,特别在距SSR标记物NAU861或GLUC1.1标记物约0至5cM处,更具体地在约4cM处、尤其在约4.008cM处,和在距SSR标记物CIR401c约0至12cM,更具体地在约10cM处,尤其在约10.52cM处。
如本文中所用,“(遗传或分子)标记物”指在特定基因座处的多态性基因座,即多态性核苷酸(所谓单核苷酸多态性或SNP)或多态性DNA序列。标记物指在基因组中具有固定位置的可测量遗传特征,其通常以孟德尔方式遗传并且可以用于对目的性状作图。例如,将纤维强度性状标记物在海岛棉的染色体A05上作图为尤其位于标记物的P5M50-M126.7与CIR280、P5M50-M126.7与BNL3992、P5M50-M126.7与CIR401之间,并与标记物NAU861,GLUC1.1和其他标记物连锁,如实施例中例如表6中所示。因此,遗传标记物可以是短DNA序列,如围绕单个碱基对即单核苷酸多态性或SNP的序列;或是长DNA序列,如微卫星或简单序列重复(SSR)。标记物的本质取决于所用的分子分析法并可以在DNA、RNA或蛋白质水平检测。遗传作图可以使用分子标记物,如但不限于RFLP(限制性片段长度多态性;Botstein等人(1980),Am J Hum Genet 32:314-331;Tanksley等人(1989),Bio/Technology 7:257-263)、RAPD[随机扩增的多态性DNA;Williams等人(1990),NAR 18:6531-6535],AFLP[扩增片段长度多态性;Vos等人(1995)NAR 23:4407-4414]、SSR或微卫星[Tautz等人(1989),NAR 17:6463-6471]进行。适宜的引物或探针由所用作图方法决定。
术语“”(是荷兰KeyGene N.V.,Wageningen的注册商标)、“AFLP分析”和“AFLP标记物”根据标准术语[Vos等人(1995),NAR23:4407-4414;EP0534858;http://www.keygene.com/keygene/techs-apps/使用]。简而言之,AFLP分析是借助PCR扩增检测多个DNA限制性片段的DNA指纹技术。AFLP技术通常包括以下步骤:i)用两种限制酶、优选六聚体切割酶和八聚体切割酶如EcoRI、PstI和MseI限制性消化DNA;(ii)将双链接头如EcoRI、PstI和MseI接头连接至限制性片段的末端;(iii)使用互补于所述接头和限制位点序列的两条引物扩增所述限制性片段的亚群并通过1至3个“选择性”核苷酸在其3'末端延伸,即通过使用延伸进入限制性片段的引物实现选择性扩增,从而扩增这些片段,在所述片段中引物延伸部分匹配在所述限制性位点侧翼分布的核苷酸。AFLP引物因此具有特定序列并且每条AFLP引物具有专门代码(引物代码及其序列可以在Keygene网站http://www.keygene.com/keygene/pdf/PRIMERCO.pdf上找到;该文献通过引用的方式并入本文);(iv)扩增的限制性片段在变性凝胶板或毛细管上进行凝胶电泳;(v)借助放射自显影、磷成像术或其他方法观察DNA指纹。使用这种方法,可以在不知道核苷酸序列的情况下通过PCR观察成组的限制性片段。如本文中所用,AFLP标记物是具有特定大小的DNA片段,它通过实施AFLP分析而产生并作为凝胶上的条带被看到。每个AFLP标记物由用来扩增它的引物组合命名,后附所扩增DNA片段的大致长度(以碱基对计),例如P5M50-M126.7指AFLP引物组合P05(或Keygene代码P11,它是带有额外核苷酸AA的PstI引物;见表2)和M50(它是带有额外核苷酸CAT的MseI引物;见表2),该引物组合在海岛棉中的使用产生126.7bp的扩增DNA片段(见表2)。应当理解这些片段的大小可以根据实验室条件和所用设备略微变动。本文中每次通过提到引物组合和片段的具体大小指称AFLP标记物时,应当理解这种大小是约略的并且包含或意图包括不同实验室中观察到的轻微变动。每个AFLP标记物代表基因组中的某个基因座。
术语“SSR”指简单序列重复或微卫星[Tautz等人(1989),NAR17:6463-6471]。短的简单序列段作为高度重复性元件出现在全部真核基因组中。简单序列基因座通常显示广泛的长度多态性。这些简单的序列长度多态性(SSLP)可以通过聚合酶链反应(PCR)分析法检测并用于同一性检验、群体研究、连锁分析和基因组作图。如本文中所用,“SSR标记物”指表示为CIRx、NAUx和BNLx(其中x是一个数字)的标记物,它们是用来产生不同棉属物种遗传图的公开可获得的标记物(见http://www.cottonmarker.org/的棉花微卫星数据库)。
“(遗传或分子)标记物”,如AFLP或SSR标记物,可以是显性(纯合个体和杂合个体不是可区分的)或共显性(区分纯合个体和杂合个体,例如,通过条带强度区分)的,如下表2中所例举。“(遗传或分子)标记物”,如AFLP或SSR标记物,可以与基因或基因座以“互引相”或以“互斥相”连锁。如,互引地与某基因或基因座连锁的显性标记物存在于具有该基因或基因座的个体中并且不存在于没有该基因或基因座的个体中,而互斥地与某基因或基因座连锁的显性标记物不存在于具有该基因或基因座的个体中并且存在于没有该基因或基因座的个体中。
标记物的不同等位基因可以存在于不同的植物物种中。如本文中所用,“与纤维强度基因座连锁的标记物的海岛棉或陆地棉等位基因”指具有分别从海岛棉或陆地棉衍生并对其特异的标记物的一种形式。表2例举说明如何可以鉴定或区分不同等位基因的不同标记物:第1列指示海岛棉和/或陆地棉的染色体A05上的不同标记物基因座,第2列对每个标记物基因座指示可以用来鉴定特定标记物基因座存在或不存在的特异性引物对,第3列指示海岛棉(尤其栽培品种Pima S7;显示为‘Pima’)和陆地棉(尤其栽培品种FM966;显示为‘FM’)的特定标记物等位基因是否产生扩增的DNA片段,并且如果产生,则指示扩增DNA片段的大小,第4列指示第1列中所示标记物是否为如上文所定义的显性或共显性标记物。
表2:检测染色体A05上标记物的特定海岛棉或陆地棉等位基因
如上文所示,海岛棉纤维强度等位基因在染色体A05上的位置可以通过连锁的AFLP和/或SSR标记物如AFLP标记物P5M50-M126.7和SSR标记物BNL3992、CIR401b和NAU861确定。然而,应当理解这些AFLP和SSR标记物可以转换成其他类型的分子标记物。当谈到本发明中的特定(分子或遗传)标记物时,应当理解该定义包括用来检测最初通过AFLP和SSR标记物所鉴定的遗传变异的其他类型的分子标记物。例如,如果使用已知方法将AFLP标记物转换成另一种分子标记物,则这种其他标记物被此定义包括。例如,使用如Meksem等人[(2001),Mol GenGenomics 265(2):207-214]、Negi等人[(2000),TAG 101:146-152],Barret等人(1989),TAG 97:828-833]、Xu等人[(2001),Genome 44(1):63-70]、Dussel等人[(2002),TAG 105:1190-1195]或Guo等人[(2003),TAG 103:1011-1017]中所述的标准技术,AFLP标记物可以转换成序列特异性标记物,例如但不限于STS(测序的标记位点)或SCAR(序列表征的扩增区域)标记物。例如,Dussel等人[(2002),TAG 105:1190-1195]将与抗性连锁的AFLP标记物转换成基于PCR的加标签位点标记物如indel(插入/缺失)标记物和CAPS(切割的扩增多态性序列)标记物。
例如AFLP标记物转换成STS标记物通常涉及从AFLP凝胶纯化DNA片段并将该DNA片段克隆和测序。AFLP片段(条带)的克隆和测序可以使用已知方法实施[Guo等人TAG 103:1011-1017]。基于标记物序列,可以开发(内部)基因座特异性PCR引物[Paran和Michelmore(1993),TAG85:985-993],所述引物扩增具有不同大小的片段或其中该PCR产物在扩增后用限制酶切割以揭示多态性。由于内部PCR引物经常不揭示与EcoRI、MseI或PstI(或其他酶)限制性位点不同相关的多态性,反向PCR[Hartl和Ochmann(1996),在:Harwood A,editor,Methods inmolecular biology vol58:basic DNA and RNA protocols,Humana Press,Totowa NJ第293-301页]或PCR步行法[Negi等人(2000),TAG101:146-152;Siebert等人,(1995),NAR 23:1087-1088]可以用来鉴定侧翼序列,所述侧翼序列然后可以用来产生基于PCR的简单的基因座特异性标记物。使用如Sci-Ed(Scientific&Educational Software PO Box 72045,Durham,NC 27722-2045USA)提供的计算机软件程序,可以轻易地设计引物。STS标记物的多态性可以通过凝胶电泳检测或可以使用荧光定量测定法如技术(Roche Diagnostics)检测。
在另一个实施方案中,海岛棉的纤维强度QTL等位基因包含核苷酸序列的至少一个海岛棉直向同源物,所述的核苷酸序列包含于SEQ IDNO:53中所示的跨度覆盖陆地棉GLUC1.1A基因的基因组DNA序列中(见图9和序列表)。
在另一个实施方案中,海岛棉的纤维强度QTL等位基因至少包含编码如下文进一步描述的无功能GLUC1.1蛋白的GLUC1.1基因。在一个方面,海岛棉GLUC1.1基因位于距海岛棉纤维强度等位基因的LOD峰值约0至5cM处,更具体地在约4cM处。在另一个方面,海岛棉GLUC1.1基因位于NAU861标记物的约0至2cM处、约0至1cM处、更具体地在约0.008cM处,其中所述的NAU861标记物位于海岛棉的纤维强度QTL等位基因中。
在另一个实施方案中,非天然存在的棉属植物是陆地棉、海岛棉、草棉或树棉植物,优选地是陆地棉植物,并且其中优异纤维强度等位基因从达尔文棉衍生。在一个方面,达尔文棉的纤维强度QTL等位基因至少包含如下文进一步描述的GLUC1.1基因。
仍在另一个实施方案中,非天然存在的棉属植物是陆地棉、海岛棉或草棉,优选地是陆地棉植物,并且其中优异纤维强度等位基因从树棉衍生。在一个方面,树棉的纤维强度QTL等位基因至少包含如下文进一步描述的GLUC1.1基因。
在一个特定实施方案中,非天然存在的棉属植物的纤维的胼胝质含量与同等棉属植物的纤维的胼胝质含量相比增加,所述的同等棉属植物不包含纤维强度基因座的至少一个优异等位基因。
“胼胝质”指植物多糖,其包含通过β-1,3键连接在一起的葡萄糖残基并命名为β-葡聚糖。认为胼胝质由胼胝质合酶在细胞壁处制造并由β-1,3-葡聚糖酶降解。可以通过用苯胺蓝(一种对1,3-β-葡聚糖特异的染料)着染纤维来测量纤维的胼胝质含量。在紫外线下,胼胝质沉积物呈现强烈的黄绿色荧光。分析图像并将绿色/蓝色比用作胼胝质的度量。“纤维素”是高等植物细胞壁的主要结构多糖。成串的β-1,4-连接的葡萄糖残基在合成后很快装配以形成坚固、化学抵抗的微纤维。它们的机械性能连同它们在细胞壁中的取向影响细胞在不同方向上的扩展并决定成熟细胞和器官的许多最终机械性能。
在一个特定实施方案中,非天然存在的棉属植物的纤维的强度与同等棉属植物的纤维的强度相比提高,所述的同等棉属植物不包含纤维强度基因座的至少一个优异等位基因。
如本文中所用,“纤维强度的提高”指特定产纤维植物物种如棉花的纤维的平均强度明显高于通常观察到的这个特定植物物种的纤维的平均强度。纤维强度主要由品种决定。然而,它可能受植物营养匮乏和天气影响。
在这个实施方案的一个方面,非天然存在的棉属植物是对海岛棉纤维强度等位基因纯合的陆地棉植物。在这个实施方案的又一个方面,该棉属植物的纤维的强度平均在约5%与约10%之间地,更具体地是约7.5%地,高于对陆地棉纤维强度等位基因纯合的陆地棉植物的纤维强度。仍在这个实施方案的又一个方面,该棉属植物的纤维的强度平均在约1.6g/tex与约3.3g/特之间地,更具体地是约2.5g/tex地,高于对陆地棉纤维强度等位基因纯合的陆地棉植物的纤维强度。还在这个实施方案的又一个方面,与对陆地棉纤维强度等位基因纯合的陆地棉植物平均在约32.2g/tex与约33.8g/tex间、更具体是约33.0g/tex的纤维强度相比,该棉属植物的纤维的强度平均在约34.6g/tex与约36.3g/tex之间,更具体地是约35.5g/tex。
“品种”(缩写为var.)或“栽培品种”(缩写为cv.)在本文中遵照UPOV习惯使用,并且指在最低已知级别的单一植物学分类群内的植物群,所述植物群可以通过由表达给定基因型或基因型组合所致的特征来定义,可以因至少一个所述特征的表达与任何其他植物群区分并且因为其适合以恒定方式(稳定)繁殖而视为一个单位。
如本文中所用,术语“杂合的”意指两个不同等位基因位于某个特定基因座处,但各自在细胞中相应的同源染色体对上定位时存在的遗传情况。相反,如本文中所用,术语“纯合的”意指两个相同等位基因位于某个特定基因座处,但各自在细胞中相应的同源染色体对上定位时存在的遗传情况。
“产纤维植物”指产生如上文所定义纤维的植物物种,如棉花植物。就棉属物种而言,A基因组二倍体棉属物种和AD基因组异源四倍体棉属物种已知产生可纺纤维。在植物学上,存在商业重要的三个主要棉花群落。第一群,陆地棉(AADD)原产于墨西哥和中美洲并已经被开发广泛用于美国,占超过95%的美国产量。该群在美国称作美洲Upland棉,并且它们的纤维长度从约7/8至约15/16英寸(约22-约33mm)变化。在世界范围,陆地棉占据约90%的棉花产量。第二植物学群海岛棉(AADD)具有早期南美洲来源,其占约5%的美国产量和约8%的世界范围产量。尽管纤维长度从约11/4至约19/16英寸(约32-约40mm)变化,海岛棉在美国称作美洲Pima,不过通常又称作特长纤维(Extra Long Staple,ELS)棉。第三群,草棉(AA)和树棉(AA),包括具有长度约1/2至约1英寸(约13-约25mm)更短的纤维的棉花植物,它们原产于印度和东亚。在美国没有栽培来自该群的任何物种。
如本文中所用,“纤维长度”指较长的一半纤维的平均长度(上半部平均长度)。在美国,它通常以1英寸的100位或32位报告(见表3;1英寸是25.4mm)。该长度例如根据美国农业部(USDA)标准通过使一"缕"平行纤维通过传感器点进行测量。当来自棉花样品的纤维被夹持器夹紧,并随后进行精梳和刷棉以拉直并使纤维平行时,形成该纤维缕。纤维长度大多由品种决定,但是棉花植物暴露于极端温度、水胁迫或营养匮乏可能缩短长度。在轧花机上过度清洗和/或干燥也可以导致更短的纤维长度。纤维长度影响纱线强度、纱线平整度和纺丝过程的效率。可以从给定纤维成功产生的纱线的细度也受纤维的长度影响。
表3:美洲Upland和Pima棉的棉花纤维长度换算表
来源:http://www.cottoninc.com/;1英寸=2.54cm
如本文中所用,“工业相关的纤维长度”指特定棉花物种的纤维的长度,该长度平均至少等于或不明显小于通常观察到的这个特定植物品种的纤维的长度。对于陆地棉,工业相关的纤维长度报道从约7/8至15/16英寸(约22-约33mm)变动。对于海岛棉,工业相关的纤维长度报道从11/4至19/16英寸(约32-约40mm)变动。对于草棉(AA)和树棉(AA),,工业相关的纤维长度报道从1/2至1英寸(约13-约25mm)变动。
无论何时谈及本发明的“植物”或“诸植物”时,应当理解本文中也包括植物部分(细胞、组织或器官、种子、纤维、切开的部分如根、叶、花、花粉等)、仍保留亲本突出特征(尤其纤维特性)的该植物的后代、如通过自交或杂交获得的种子,例如(通过两个近交亲本系杂交获得的)杂交种子、杂交植物和从本文中所包括那些对象衍生的植物部分,除非另外说明。
术语“纤维强度等位基因检测测定法”在本文中指(直接或间接)指示本发明纤维强度基因座的特定等位基因存在或不存在的测定法。在一个实施方案,允许确定特定纤维强度等位基因在任何单株植物中的该基因座处是否是纯合或杂合的。
在本发明的另一个方面,提供了用于产生和/或选择包含纤维强度基因座的至少一个优异等位基因的棉属植物及其部分和后代的方法,
在一个实施方案中,该纤维强度基因座的优异等位基因是海岛棉等位基因并且所述方法包括步骤:基于具有与该纤维强度基因座连锁的标记物(如与上文和表6和表13中所示海岛棉纤维强度等位基因连锁的标记物)的海岛棉等位基因,鉴定包含该海岛棉纤维强度等位基因的棉属植物。
在特定方面,此方法包括步骤:确定与该纤维强度基因座连锁的标记物的海岛棉等位基因在某植物的基因组DNA中存在,所述标记物选自由以下标记物组成的组:AFLP标记物P5M50-M126.7、SSR标记物CIR280、SSR标记物BNL3992、SSR标记物CIR401c、SSR标记物NAU861、与包含于SEQ ID NO:53中的基因组DNA序列相对应的该植物基因组DNA序列中的多态性位点;和在该植物基因组DNA中GLUC1.1A基因的核苷酸序列中的多态性位点,如下文和表13中标示为GLUC1.1A-SNP2、3、5、6和8的SNP标记物,其中所述GLUC1.1A基因的核苷酸序列与SEQ ID NO:5的GLUC1.1A基因的核苷酸序列相对应。
在又一个实施方案中,该纤维强度基因座的优异等位基因是达尔文棉等位基因并且此方法包括步骤:基于具有与该纤维强度基因座连锁的标记物(如与上文和表13中所示达尔文棉纤维强度等位基因连锁的标记物)的达尔文棉等位基因,鉴定包含该达尔文棉纤维强度等位基因的棉属植物。
在特定方面,此方法包括步骤:确定该植物的基因组DNA的GLUC1.1A基因的核苷酸序中存在达尔文棉等位基因的多态性位点,如下文和表13中标示为GLUC1.1A-SNP2、3、5、6和8的SNP标记物,其中所述GLUC1.1A基因的核苷酸序与SEQ ID NO:56的GLUC1.1A基因的核苷酸序列相对应。
在又一个实施方案中,该纤维强度基因座的优异等位基因是树棉等位基因并且此方法包括步骤:基于具有与该纤维强度基因座连锁的标记物(如与上文和表13中所示树棉纤维强度等位基因连锁的标记物)的树棉等位基因,鉴定包含该树棉纤维强度等位基因的棉属植物。
在特定方面,此方法包括步骤:确定该植物的基因组DNA的GLUC1.1A基因的核苷酸序列中存在树棉等位基因的多态性位点,如下文和表13中标示为GLUC1.1A-SNP7的SNP标记物,其中所述GLUC1.1A基因的核苷酸序列与SEQ ID NO:21的GLUC1.1A基因的核苷酸序列相对应。
基于克隆该纤维强度基因座,与该纤维强度基因座连锁的标记物可以用于标记物辅助选择(MAS)或作图。MAS涉及针对连锁标记物的存在或不存在筛选植物。特别针对存在分布于该基因座或基因侧翼或与该基因座或基因连锁的标记物来筛选植物。基于所述标记物的存在/不存在,在育种程序期间选择或抛弃植物。MAS可以明显地加快育种程序和特定基因座或基因渐渗入另一个遗传背景中,并且也可以减少基因型x环境相互作用的问题。MAS也用于将不同的纤维强度基因座合并在一个植物中。特定纤维强度等位基因(如海岛棉纤维强度等位基因)的存在或不存在可以从与这个特定等位基因连锁的分子标记物(如上文所示的AFLP和SSR标记物(见例如表2)或从它们衍生的标记物)存在或不存在而推断出来。例如,海岛棉植物,尤其海岛棉栽培品种Pima S7植物,可以与陆地棉植物杂交,并且随后对源自这种杂交的后代植物筛选一个或多个与海岛棉纤维强度等位基因连锁的AFLP和/或SSR标记物的存在,例如通过使用海岛棉等位基因鉴定方案筛选。
育种方法如杂交法、自交法和回交法是本领域熟知的[见,AllardRW(1960)Principles of Plant Breeding.John Wiley&Sons,New York,和Fehr WR(1987)Principles of Cultivar Development,第1卷,Theory andTechniques,Collier Macmillan Publishers,伦敦.ISBN 0-02-949920-8]。纤维强度基因座的优异等位基因,如海岛棉纤维强度等位基因,可以通过单独使用常规育种方法或通过额外使用MAS转移至其他育种系或品种。在常规育种方法中,在田间或在受控环境试验中评估增加的胼胝质含量和/或提高的纤维强度表型,旨在选择或抛弃包含或缺少优异纤维强度等位基因的植物。可以进行不同的杂交旨在将优异纤维强度等位基因如海岛棉纤维强度等位基因转移至其他棉属物种或品种的品系,如A基因组二倍体棉属植物品系,如草棉或树棉植物品系,或转移到AD异源四倍体棉属植物品系,如陆地棉和海岛棉植物品系中,特别转移到不同于Pima S7品种的海岛棉植物品系中。该育种程序可以涉及杂交以产生F1(第一后代),随后是几个自交世代(产生F2、F3、等)。该育种程序也可以涉及回交(BC)步骤,其中后代与亲本品系之一(称作回交亲本)回交。育种者选择农艺学重要的性状,如高产量、高纤维品质、疾病抗性等,并因此开发原种培育品系(具有优良农艺特征的品系)。另外,培育植物以符合纤维品质标准,如美洲Pima或美洲Upland纤维品质。
如本文中所用,“海岛棉或陆地棉等位基因鉴定方案”指鉴定纤维强度基因座中的海岛棉和/或陆地棉等位基因,包括步骤:从植物组织如叶组织或种子提取DNA并且使用例如旨在鉴定海岛棉或陆地棉等位基因的特定引物对,如表2中所示的那些引物对,针对一个或多个连锁的AFLP和/或SSR标记物实施连锁标记物分析,如AFLP分析和/或SSR分析。海岛棉或陆地棉等位基因鉴定方案可以在从单株植物获得的DNA上或从大群(或汇集物)获得的DNA上实施。在一个实施方案中,提供了用于检测海岛棉和/或陆地棉纤维强度等位基因在棉属DNA中存在的试剂盒。这种试剂盒例如包含了能够检测与海岛棉和/或陆地棉纤维强度等位基因连锁的DNA标记物(如AFLP和/或SSR标记物)的引物或探针。该试剂盒可能还包含可以用作阳性对照或阴性对照的样品和用于AFLP和/或SSR分析的额外试剂。所述样品可以组织样品或DNA样品。作为阳性对照,可以包括例如海岛棉种子,尤其来自栽培品种Pima S7的海岛棉种子。作为阴性对照,可以包括例如陆地棉种子,尤其来自栽培品种FM966的陆地棉种子。
在又一方面,提供了区分纤维强度基因座的优异和非优异等位基因存在的方法。在一个实施方案中,提供了区分海岛棉等位基因和陆地棉等位基因存在的方法,包括步骤:确定与纤维强度基因座连锁的标记物(如与上文所示纤维强度基因座连锁的标记物,例如,表2和表13中所示的那些标记物)的海岛棉和/或陆地棉等位基因的存在。
因此,在一个实施方案中,提供了通过确定与该纤维强度基因座连锁的标记物的海岛棉和陆地棉等位基因在某植物的基因组DNA中存在,用于区分海岛棉等位基因和陆地棉等位基因存在的方法,所述的标记物选自由以下标记物组成的组:AFLP标记物P5M50-M126.7、SSR标记物CIR280、SSR标记物BNL3992、SSR标记物CIR401、SSR标记物NAU861、与包含于SEQ ID NO:53中的基因组DNA序列相对应的该植物基因组DNA序列中的多态性位点;和在该植物基因组DNA中GLUC1.1A基因的核苷酸序列中的多态性位点,如下文和表13中标示为GLUC1.1A-SNP2、3、5、6和8的SNP标记物,其中所述GLUC1.1A基因的核苷酸序列与SEQ ID NO:5的GLUC1.1A基因的核苷酸序列相对应。
根据本发明的另一个方面,提供了用于改变棉属植物中纤维的胼胝质含量、尤其增加纤维的胼胝质含量的方法,包括步骤:渐渗棉属植物中染色体A05上的棉花纤维强度基因座的优异等位基因,如海岛棉等位基因。
根据本发明的又一个方面,提供了用于改变棉属植物中纤维的特性、尤其提高纤维的强度的方法,包括步骤:渐渗棉属植物中染色体A05上的棉花纤维强度基因座的优异等位基因,如海岛棉等位基因。
本发明基于还以下出乎意料的发现:位于强度基因座的支撑间隔中的GLUC1.1A基因的功能性及其表达时间在陆地棉与海岛棉之间不同。发现尽管陆地棉植物包含在纤维发育的纤维强度建立阶段期间、更具体地在纤维成熟阶段期间功能性表达的GLUC1.1A基因,然而海岛棉植物包含在纤维强度建立阶段期间以无功能表达的GLUC1.1A基因。在另一方面,GLUC1.1D基因在两种棉属物种中在整个纤维强度建立期间功能地表达。还发现:添加外源的内切-1,3-β-葡聚糖酶至海岛棉的纤维减低胼胝质含量和纤维强度。基于这些研究结果,认为著名的海岛棉纤维强度至少部分地由纤维中更高的胼胝质含量引起,并且这种更高的胼胝质含量可能因缺少功能性表达的A亚基因组特异的纤维特异性内切-1,3-β-葡聚糖酶基因所致。进一步认为通过消除GLUC基因的特定等位基因在产纤维植物中纤维强度建立阶段期间的功能性表达,同时维持特定的其他GLUC基因在纤维强度建立阶段期间的功能性表达,可能精细地调节在纤维强度建立阶段期间所产生功能性GLUC蛋白的量和/或类型,因此影响纤维中胼胝质的降解,这转而影响所产生纤维的强度和长度。认为纤维中不同GLUC蛋白的绝对量和相对量因此可以以如此方式调节,从而实现纤维长度与强度之间的合适平衡。
因此,在又一个方面,本发明提供非天然存在的产纤维植物及其部分和后代,其特征在于,在纤维发育的纤维强度建立阶段期间、尤其在纤维发育的成熟阶段期间功能表达的至少一个纤维特异性GLUC基因的至少一个等位基因的功能性表达被消除。
术语“基因”意指DNA序列,其包含在细胞中转录成RNA分子(例如转录成包含内含子序列的前mRNA,其随后被剪接成成熟的mRNA,或直接转录成无内含子序列的mRNA)的与调节区(例如启动子)有效连接的区域(转录的区域)。基因(基因组DNA)因此可以包含几个有效连接的序列,如启动子、包含例如参与翻译起始的序列的5’前导序列、(蛋白质)编码区(带内含子)和包含例如转录终止位点的3’非翻译序列。“cDNA序列”指包含5’非翻译区、无内含子的编码区和3’非翻译区及聚腺苷酸尾的核酸序列。“内源基因”用来区分“外来基因”、“转基因”或“嵌合基因”,并且指来自某个植物属、物种或品种的一个植物的基因,此基因不是通过转化作用导入该植物(即它不是一个“转基因”),但是它通常存在于这个属、物种或品种的植物中,或所述基因通过正常育种技术或通过体细胞杂交例如通过原生质体融合而从该基因通常存在的另一个植物属、物种或品种的植物导入该植物。类似地,基因的“内源等位基因”不是通过植物转化作用导入植物或植物组织中,但是为例如通过植物诱变和/或选择被产生、从另一个植物物种通过例如标记物辅助的选择被渐渗,或通过筛选天然的植物群体获得。
“基因的表达”或“基因表达”指其中与适宜调节区、尤其启动子有效连接的DNA区域转录成RNA分子的过程。该RNA分子随后在细胞内部(通过转录后过程)被进一步加工,例如通过RNA剪接和翻译起始进行加工,并翻译成氨基酸链(多肽)并且由翻译终止密码子进行翻译终止。术语“功能性表达”在本中用来表示产生有功能的即生物学活性的蛋白质;术语“未功能性表达”用来表示产生功能(生物学活性)显著降低或无功能的蛋白质或表示没有产生蛋白质或产生显著减少量的蛋白质。
出于实践目的,术语“纤维特异的”或“纤维细胞特异的”就基因的表达而言指基因在植物(如棉花植物)的纤维细胞中的高度特异性表达。换句话说,DNA在不同于纤维细胞的组织中的转录物水平低于检测限或非常低(低于每微克总RNA约0.2皮克)。
术语“纤维强度建立阶段”通常在本文中指如上文所定义的纤维发育的次生细胞壁合成及成熟阶段。
术语“GLUC基因”在本文中指编码内切-1,3-β-葡聚糖酶(GLUC)蛋白的核酸序列。
术语“核酸序列”(或核酸分子)指处于单链或双链形式的DNA或RNA分子,尤其编码本发明蛋白质或蛋白质片段的DNA。“内源核酸序列”指植物细胞内的核酸序列,例如存在于植物细胞的核基因组内的内源GLUC基因(其等位基因)。“分离的核酸序列”用来指不再位于其天然环境的,处于例如在体外或重组细菌宿主或植物宿主细胞中的核酸序列。
术语“蛋白质”和“多肽”互换地使用并指由氨基酸的链组成的分子,而不指具体作用模式、大小、三维结构或起源。蛋白质的“片段”或“部分”因此可以仍称作“蛋白质”。“分离的蛋白质”用来指不再位于其天然环境的,处于例如在体外或重组细菌宿主或植物宿主细胞中的蛋白质。“氨基酸”是蛋白质和酶的基本构件。它们由转运RNA根据遗传密码掺入蛋白质,同时信使RNA由核糖体解码。在蛋白质最终组装期间和之后,氨基酸组成决定蛋白质或酶的空间和生物化学特性。氨基酸主链决定蛋白质的一级序列,但是侧链的性质决定该蛋白质的特性。如本文中所用,“相似氨基酸”指具有相似氨基酸侧链的氨基酸,即具有极性、非极性或几乎中性侧链的氨基酸。如本文中所用,“不相似的氨基酸”指具有不同氨基酸侧链的氨基酸,例如,带极性侧链的氨基酸不相似于带非极性侧链的氨基酸。极性侧链通常倾向于存在于蛋白质的表面上,在那里它们可以与细胞中存在的含水环境相互作用(“亲水”氨基酸)。另一方面,“非极性”氨基酸倾向于位于该蛋白质的中心内,在那里它们可以与相似的非极性邻近氨基酸相互作用(“疏水”氨基酸)。具有极性侧链的氨基酸的示例是精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、组氨酸、赖氨酸、丝氨酸和苏氨酸(均亲水,除疏水的半胱氨酸之外)。具有非极性侧链的氨基酸的示例是丙氨酸、甘氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、脯氨酸和色氨酸(均疏水,除疏中性的甘氨酸之外)。
“酶”是包含酶促活性(如有功能)的蛋白质,即生物学活性的内切-1,3-β-葡聚糖酶或葡聚糖内切-1,3-β-D-葡糖苷酶(GLUC)蛋白(EC3.2.1.39)。GLUC蛋白属于糖基水解酶家族17(GH17)酶组并且能够水解1,3-β-D-葡聚糖中的1,3-β-D-葡萄糖苷键,包括称作胼胝质的长链1,3-β-D-葡聚糖(也见http://www.cazy.org/fam/GH17.html)。GH17组由以下氨基酸识别标签鉴定:[LIVMKS]-X-[LIVMFYWA](3)-[STAG]-E-[STACVI]-G-[WY]*-P-[STN]-X-[SAGQ],其中E,如GhGLUC1.1A(SEQ ID NO:2和4)中的Glu249和其他GLUC1.1蛋白中的相似或相同氨基酸(例如,如图7中所示)是活性中心残基。如本文中所述,GLUC1.1酶的GH17识别信号还在用*标示的位置处含有保守的色氨酸(W)残基,如GhGLUC1.1A(SEQ ID NO:2和4)中的Trp252和其他GLUC1.1蛋白中的相似或相同氨基酸(例如,如图7中所示),其中所述色氨酸残基预测参与同葡聚糖底物的相互作用。
在一个实施方案中,在纤维强度建立阶段期间功能性表达的纤维特异性GLUC基因是GLUC1.1基因。
术语“GLUC1.1基因”在本文中指编码GLUC1.1蛋白的核酸序列。特别地,如本文中所用,“GLUC1.1基因”指一种GLUC基因,其编码与SEQ ID NO:3具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、100%序列同一性的cDNA序列或包含与SEQ ID NO:1的第2410位置处核苷酸至第3499位置处核苷酸具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、100%序列同一性的编码序列。
如本文中所用,“GLUC1.1蛋白”指与SEQ ID NO:4具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、100%序列同一性的GLUC蛋白。
如本文中所用,功能性“GLUC1.1蛋白”指能够水解1,3-β-D-葡聚糖中1,3-β-D-糖苷键的GLUC1.1蛋白,其与SEQ ID NO:4具有至少90%、至少95%、至少96%、至少97%、至少98%、至少99%序列同一性并且包含与SEQ ID NO:4的GLUC1.1蛋白的活性中心残基相似的氨基酸残基。如本文中所用,无功能“GLUC1.1蛋白”指不能够水解1,3-β-D-葡聚糖中1,3-β-D-糖苷键的GLUC1.1蛋白。特别地,无功能GLUC1.1蛋白缺少与SEQ ID NO:4的GLUC1.1蛋白的活性中心残基相似的一个或多个氨基酸残基。
如本文中所用,“活性中心”或“催化位点”指一种酶的三维结构中的位置,所述位置参与底物结合,如1,3-β-D-葡聚糖与GLUC酶的结合,并参与该酶的生物学活性,如GLUC酶水解1,3-β-D-葡聚糖中的1,3-β-D-糖苷键。如本文中所用,“活性中心(氨基酸)残基”指位于酶的活性中心内部并在底物结合中或在酶活性中发挥重要作用的氨基酸残基。如本文中所用,“糖基化位点”指一种酶的三维结构中被糖基化的位置,即(支链)低聚糖与之结合的位点,其中所述位置可以在提高该蛋白质的稳定性如热稳定性中发挥作用。如本文中所用,“糖基化位点(氨基酸)残基”指在酶的糖基化位点内(支链)低聚糖与之结合的氨基酸残基。预测如本文中所述的内切-1,3-β-葡聚糖酶的三维结构表明大麦1,3-1,4-β-葡聚糖酶的活性中心和糖基化位点(如Müller等人,1998,J of Biol Chem 273(6):3438-3446描述;在http://www.rcsb.org/pdb/可免费使用的蛋白质数据库(Protein Data Bank)中称作“1aq0”)是保守的,例如,在如本文中所述的陆地棉GLUC1.1A和D、海岛棉GLUC1.1D和草棉GLUC1.1A蛋白,而如本文中所述的海岛棉GLUC1.1A蛋白、达尔文棉GLUC1.1A蛋白和树棉GLUC1.1A蛋白缺少位于这些位点内部的最保守氨基酸(见,例如表4、图3和实施例)。其他GLUC1.1蛋白中的活性中心残基和糖基化残基可以通过将不同GLUC1.1蛋白的氨基酸序列与本发明的GLUC1.1蛋白(如SEQ ID NO:4中GhGLUC1.1A的氨基酸序列)比对并鉴定其他GLUC1.1蛋白中相同或相似的残基来确定。
表4:具有商业意义的三个主要棉花群的GLUC1.1A和D蛋白中活性中心残基和糖基化位点残基的氨基酸区域和位置
-:不存在;ND:未确定
术语“靶向肽”、“转运肽”或“信号肽”指将蛋白质靶向胞内细胞器的氨基酸序列。如本文中所述的GLUC1.1蛋白包含在其氨基端的信号肽,如在图2和图7中推定的翻译后剪接位点之前所示的氨基酸序列。“成熟蛋白”指不含信号肽的蛋白质,如不含在图2和图7中推定的翻译后剪接位点之前所示氨基酸序列的如本文中所述的GLUC1.1蛋白。“前体蛋白”或“前酶原”指带有其信号肽的成熟蛋白。
在另一个实施方案中,产纤维植物是棉属植物。在特定方面,棉属GLUC1.1等位基因是GLUC1.1A或D等位基因。
如本文中所用,“GLUC1.1A基因”指位于棉属二倍体或异源四倍体物种的A亚基因组(“GLUC1.1A基因座”)上并编码GLUC1.1A蛋白的GLUC1.1基因。特别地,GLUC1.1A基因编码与SEQ ID NO:3具有至少97%、至少98%、至少99%序列同一性的cDNA序列或包含与SEQ ID NO:1的第2410位置处核苷酸至第3499位置处核苷酸具有至少95%、至少96%、至少97%、至少98%、至少99%序列同一性的编码序列。类似地,“GLUC1.1D基因”指位于棉属二倍体或异源四倍体物种的D亚基因组(“GLUC1.1D基因座”)上并编码GLUC1.1D蛋白的GLUC1.1基因。特别地,GLUC1.1D基因编码与SEQ ID NO:9具有至少97%、至少98%、至少99%序列同一性的cDNA序列或包含与SEQ ID NO:7的第3337位置处核苷酸至第4444位置处核苷酸具有至少95%、至少96%、至少97%、至少98%、至少99%序列同一性的编码序列。
如本文中所用,“GLUC1.1A蛋白”指由位于棉属二倍体或异源四倍体物种的A亚基因组上的GLUC1.1基因编码并且与SEQ ID NO:4具有至少95%、至少96%、至少97%、至少98%、至少99%序列同一性的GLUC1.1蛋白。类似地,“GLUC1.1D蛋白”指由位于棉属二倍体或异源四倍体物种的D亚基因组上的GLUC1.1基因编码并且与SEQ ID NO:10具有至少95%、至少96%、至少97%、至少98%、至少99%序列同一性的GLUC蛋白。
在另一个实施方案中,产纤维植物是陆地棉植物。在特定方面,陆地棉GLUC1.1等位基因是GhGLUC1.1A或GhGLUC1.1D等位基因,优选地是GhGLUC1.1A等位基因。
如WO2008/083969中所述,陆地棉的GLUC1.1A和GLUC1.1D基因可以因切开的所扩增多态性序列(CAPS)标记物的存在(利用存在于GhGLUC1.1A的核苷酸序列中、不存在于GhGLUC1.1D的核苷酸序列中的AlwI限制酶识别位点)和因它们表达的时相(GhGLUC1.1D在整个纤维强度建立阶段(取决于生长条件,从约14至17DPA)期间表达,而GhGLUC1.1A的启动延迟直至纤维成熟晚期阶段开始(取决于生长条件,约30-40DPA))加以区分。利用存在于GbGLUC1.1A的核苷酸序列中、不存在于GbGLUC1.1D的核苷酸序列中的AlwI限制酶识别位点,海岛棉的GLUC1.1A和GLUC1.1D基因也可以通过CAPS标记物的存在而区分。然而,这两个基因均在整个纤维强度建立阶段(取决于生长条件,从约14至17DPA)期间表达。不过,GbGLUC1.1A的表达水平比GbGLUC1.1D的表达水平低得多。
在一个实施方案中,通过诱变而消除至少一个GLUC等位基因的功能性表达。
如本文中所用,“诱变”指植物细胞(例如,棉属植物种子或其他部分,如花粉等)受到在所述细胞中诱导突变的技术处理的过程,所述的技术例如是与诱变剂如化学物质(如甲磺酸乙酯(EMS)、乙基亚硝基脲(ENU)等)接触或电离辐射(中子(如在快中子诱变法等)、α射线、γ射线(如钴60源提供的γ射线)、X-射线、紫外辐射等)或这些诱变剂的两种或多种的组合。因此,想要的一个或多个GLUC等位基因的诱变可以利用化学手段如通过一种或多种植物组织与甲磺酸乙酯(EMS)、乙基亚硝基脲等接触,利用物理手段如X-射线等或通过γ辐射(如钴60源提供的γ辐射)实现。尽管通过辐射产生的突变经常是巨大缺失或其他严重损伤如易位或复杂的重排,然而通过化学诱变产生的突变经常是更离散的损伤如点突变。例如,EMS使鸟嘌呤碱基烷基化,这导致碱基错配:烷基化的鸟嘌呤会与胸腺嘧啶碱基配对,从而主要产生G/C至A/T转换。诱变后,使用已知技术从处理的细胞再生出棉属植物。例如,所得的棉属植物种子可以根据常规培育方法种植并且在自我授粉后,种子在该植物上形成。可以收获因这种自我授粉在当前或后续世代中形成的额外种子并对其筛选突变体GLUC等位基因的存在。几项技术已知用来筛选特定的突变体等位基因,例如,DeleteageneTM(缺失-一个-基因;Li等人,2001,Plant J 27:235-242)使用聚合酶链反应(PCR)测定法来筛选通过快中子诱变法产生的缺失突变体,TILLING(基因组中定向诱导的局部损伤;McCallum等人,2000,NatBiotechnol 18:455-457)鉴定EMS诱导的点突变等。在下文实施例中描述筛选特定突变体GLUC等位基因存在的额外技术。
如本文中所用,“野生型”(也书写为“野生型(wildtype)”或“野生型(wild-type)”)一般指植物或基因如其在自然界中最常见存在的形式。“野生型植物”指一种植物,其具有天然群体中该植物的最常见表型。“野生型等位基因”指产生该野生型表型所需要的基因的等位基因。相反,“突变植物”指一种植物,该植物具有天然群体中该植物的不同罕有表型或通过人工介入,例如通过诱变产生,并且“突变体等位基因”指产生该突变表型所需要的基因的等位基因。
如本文中所用,术语“野生型GLUC”(例如野生型GLUC1.1A或GLUC1.1D)意指在植物、尤其棉属植物内发现的天然存在的GLUC等位基因,其编码功能性GLUC蛋白(例如分别编码功能性GLUC1.1A或GLUC1.1D)。相反,如本文中所用,术语“突变体GLUC”(例如突变体GLUC1.1A或GLUC1.1D)指不编码功能性GLUC蛋白的GLUC等位基因,即这样的GLUC等位基因,其编码无功能性GLUC蛋白(例如分别编码无功能性GLUC1.1A或GLUC1.1D),其中所述的无功能性GLUC蛋白如本文中所用指没有生物学活性或与相应的野生型功能性GLUC蛋白相比具有显著降低的生物学活性的GLUC蛋白,或不编码GLUC蛋白或编码显著减少量的GLUC蛋白。这种“突变体GLUC等位基因”是在其核酸序列中包含一个或多个突变的GLUC等位基因,由此所述突变优选地在体内导致细胞中显著减少(绝对或相对)量的功能性GLUC蛋白。如本文中所用,“全敲除GLUC1.1A等位基因”是一种突变体GLUC1.1A等位基因,其中所述等位基因以纯合状态在植物(例如带有两个全敲除GLUC1.1A等位基因和两个野生型GLUC1.1D等位基因的陆地棉植物)中的存在导致该植物中纤维强度的提高。编码GLUC蛋白的核酸序列的突变体等位基因在本文中命名为“gluc”(例如分别为gluc1.1a或gluc1.1d)。突变体等位基因可以是“天然突变体”等位基因,它们是自然界中存在(例如无人为施加诱变剂的情况下自发产生)的突变体等位基因,如海岛棉GLUC1.1A等位基因、达尔文棉GLUC1.1A等位基因和树棉GLUC1.1A等位基因,或是“诱导的突变体”等位基因,它们通过人工介入例如通过诱变被诱导出来。
因此在该实施方案的一个方面,在本文中提供GLUC突变植物,其中所述突变体等位基因选自GLUC1.1A和/或GLUC1.1D基因。因此,在特定方面,这些GLUC突变植物的基因型可以描述为GLUC1.1A/gluc1.1a;GLUC1.1D/gluc1.1d;GLUC1.1A/gluc1.1a,GLUC1.1D/GLUC1.1D;或GLUC1.1A/GLUC1.1A,GLUC1.1D/gluc1.1d。
在该实施方案的又一个方面,在本文中提供纯合GLUC突变植物或植物部分,其中所述突变体等位基因选自GLUC1.1A和GLUC1.1D基因。因此在特定方面,在本文中提供纯合的GLUC突变植物,其中该植物的基因型可以描述为:gluc1.1a/gluc1.1a;gluc1.1d/gluc1.1d;gluc1.1a/gluc1.1a,GLUC1.1D/GLUC1.1D或GLUC1.1A/GLUC1.1A;gluc1.1d/gluc1.1d。
在本发明的又一个方面,纯合的GLUC突变植物或植物部分包含进一步的突变体等位基因,其中该突变植物或植物部分对这个额外突变体GLUC等位基因是杂合的。因此在又一个特定方面,在本文中提供包含一个进一步的突变体等位基因的纯合GLUC突变植物,其中该植物的基因型可以描述为:GLUC1.1-A/gluc1.1-a,gluc1.1-d/gluc1.1-d或gluc1.1a/gluc1.1a,GLUC1.1D/gluc1.1d。
在另一个实施方案中,至少一个GLUC等位基因的功能性表达通过渐渗GLUC基因的无功能表达的直向同源GLUC等位基因或诱变的等位基因被消除。
在这个实施方案的一个方面,无功能表达的直向同源GLUC等位基因可以从特定棉花物种(例如从海岛棉、达尔文棉或树棉)分离。
又在另一个实施方案,GLUC基因的至少一个等位基因的功能性表达通过导入嵌合基因被消除,其中所述的嵌合基因包含以下有效连接的DNA元件:
(a)植物可表达的启动子,
(b)转录的DNA区域,其转录时产生能够减少GLUC等位基因表达的抑制性RNA分子,和
(c)3’末端区域,其包含在植物的细胞中有功能的转录终止和多腺苷酸化信号。
几种方法在本领域中可用来生产抑制性或沉默RNA分子,即,表达时减少特定基因或基因群表达的RNA分子,包括所谓“正义”或“反义”RNA技术。
因此,在一个实施方案中,编码抑制性RNA分子的嵌合基因基于所谓的反义技术。换句话说,嵌合基因的编码区域包含该GLUC等位基因的核苷酸序列的互补序列中至少19或20个连续核苷酸的核苷酸序列。这种嵌合基因可以通过将(如本申请中他处所述分离的或鉴定的)包含来自该GLUC等位基因的至少19或20个核苷酸的DNA片段以反方向与植物可表达启动子和参与转录终止与聚腺苷酸化的3’末端形成区域有效地连接来构建。
在另一实施方案中,编码抑制性RNA分子的嵌合基因基于所谓的共抑制技术。换句话说,嵌合基因的编码区域包含该GLUC等位基因的核苷酸序列的至少19或20个连续核苷酸的核苷酸序列。这种嵌合基因可以通过将包含来自该GLUC等位基因的至少19或20个核苷酸的DNA片段以正方向与植物可表达启动子和参与转录终止与聚腺苷酸化的3’末端形成区域有效地连接来构建。
上文所提及的嵌合基因在减少GLUC等位基因表达方面的效率可以通过包含如下DNA元件进一步增强,所述的DNA元件导致异常的、未多腺苷酸化的抑制性RNA分子表达或导致抑制性RNA分子滞留在细胞的细胞核中。适合该目的的一种这样的DNA元件是编码自剪接核酶的DNA区域,如(通过引用方式并入的)WO 00/01133中所述。适合该目的的另一种这样的DNA元件是编码RNA核定位或滞留信号的DNA区域,如(通过引用方式并入的)WO03/076619中所述。
下调目的基因表达的一种方便且非常有效的方法使用了所谓的双链RNA(dsRNA)或干扰性RNA(RNAi),如在例如(通过引用方式并入的)WO99/53050中所述。在这项技术中,将RNA分子导入植物细胞,其中该RNA分子能够形成跨至少约19至约21个核苷酸的双链RNA区,并且其中这个双链RNA区域的两条链之一在核苷酸序列上与靶基因大致相同(“有义区”),而另一条链在核苷酸序列上与靶基因或有义区的互补序列大致相同(“反义区”)。预期为了沉默靶基因的表达,带有19个连续核苷酸序列的核苷酸序列可以具有一个错配,或有义区和反义区可以有一个核苷酸不同。为实现此类RNA分子或编码性嵌合基因的构建,可以利用如WO 02/059294中所述的载体。
因此,在该实施方案的一个方面,该嵌合基因包含以下有效连接的DNA元件:
(a)植物可表达的启动子,优选地,控制在纤维细胞中偏好性转录的植物可表达的启动子;
(b)转录的DNA区域,当转录时,所述DNA区域产生下述的双链RNA分子,所述双链RNA分子能够减少该GLUC等位基因的表达,并且该RNA分子包含第一和第二RNA区域,其中:
i)第一RNA区域包含与该GLUC等位基因的核苷酸序列具有至少约94%序列同一性的至少19个连续核苷酸的核苷酸序列;
ii)第二RNA区域包含与所述第一RNA区域的至少19个连续核苷酸互补的核苷酸序列;
iii)所述第一和第二RNA区域能碱基配对,以在第一和第二区域的至少19个连续核苷酸之间形成双链RNA分子;以及
(c)3’末区域,其包含在植物的细胞中有功能的转录终止和多腺苷酸化信号。
第一或第二RNA区域(有义或反义区)的长度可以在约19个核苷酸(nt)直至与该GLUC等位基因的长度(以核苷酸计)相等的长度范围内变化。有义或反义核苷酸序列的总长度因此可以是至少约25nt,或至少约50nt,或至少约100nt,或至少约150nt,或至少约200nt,或至少约500nt。预期对有义或反义核苷酸序列的总长度没有上限。然而出于实践原因(例如嵌合基因的稳定性),预期有义或反义核苷酸序列的长度不应当超过5000nt,特别地不应当超过2500nt并且可以限于约1000nt。
可以理解,有义或反义区域的总长度越长,对这些区域与所述GLUC等位基因中相应序列或其互补序列之间的序列同一性要求将越不严格。优选地,目的核酸应当与相应的靶序列具有至少约75%,特别地至少约80%,更特别地至少约85%,非常特别地约90%,尤其地约95%,更尤其地约100%的序列同一性,非常尤其地与靶序列或其互补序列的相应部分相同。然而,优选目的核酸总是包括与靶核酸的相应部分具有100%序列同一性的约19个连续核苷酸、特别地约25nt、更特别地约50nt、尤其地约100nt、非常尤其地约150nt的序列。优选地,为了计算序列同一性并设计相应的有义或反义序列,应当使空位的数目最小化,特别对较短的有义序列而言如此。
为了本发明的目的,两个相关核苷酸序列或氨基酸序列的“序列同一性”(表述为百分数)指两条最优比对的序列中具有相同残基的位置的数目(x 100)除以所比较位置的数目。空位(即,比对中一个残基存在于一个序列中但不存在于另一个序列中的位置)视为具有不相同残基的位置。根据欧洲分子生物学开放软件包(The European Molecular BiologyOpen Software Suite)(EMBOSS,Rice等人,2000,Trends in Genetics 16(6):276-277;例如见http://www.ebi.ac.uk/emboss/align/index.html)中的Needleman和Wunsch总体比对算法(Needleman和Wunsch,1970,J MolBiol 48(3):443-53),使用默认设置(空位开口罚分=10(用于核苷酸)/10(用于蛋白质)和空位延伸罚分=(0.5用于核苷酸)/0.5(用于蛋白质)),通过在全部长度范围内比对两个序列而找到这两个序列的“最佳比对”。对于核苷酸,所用的默认评分矩阵是EDNAFULL,并且对于蛋白质,默认评分矩阵是EBLOSUM62。
如本文中所用,“基本上同一的”、“基本上相似的”或“对应于”指当如上文所定义最佳比对时共享至少某个最小百分数的(如下文进一步定义的)序列同一性的诸序列。如本文中所用,“在与(特定核苷酸序列中的核苷酸或核苷酸序列的)某个位置相对应的位置处(的核苷酸或核苷酸序列)”指两个基本上相似的序列的(核苷酸或核苷酸序列),它们在这两个基本上相似序列的最佳比对中彼此对齐。
编码本发明dsRNA的嵌合基因可以包含内含子,例如异源内含子,根据(通过引用的方式并入本文的)WO 99/53050的公开内容,该内含子位于例如正义与反义RNA区域之间的间隔序列中。
对于本发明优选的是:在反义、正义或双链RNA分子中所包括的靶特异性基因序列包含至少一个核苷酸,并且优选地包含对于待下调其表达的特定GLUC等位基因特异的更多核苷酸。此类特定核苷酸至少在图6中通过灰色框标示。
在一个优选的实施方案中,特别地使抑制性RNA分子适于下调GLUC1.1基因的A-亚基因组等位基因。在另一优选的实施方案中,特别地使生物学活性RNA分子适于下调GLUC1.1基因的D亚基因组特异性等位基因。
使用合成性微小RNA下调植物细胞中特定基因的表达提供了靶基因的非常高的序列特异性,并且因此允许方便地将密切相关的等位基因区分为其表达待下调的靶基因。
因此,在本发明的另一个实施方案中,抑制性RNA或沉默RNA或生物学活性RNA分子可以是被设计、合成和/或调节以靶向特定亚基因组等位基因并且导致其切割的微小RNA分子,所述等位基因优选是产纤维植物(例如棉花植物)中的GLUC1.1基因的A亚基因组等位基因。已经描述了产生和使用针对特定靶基因的miRNA的多种方法(包括但不限于Schwab等人(2006,Plant Cell,18(5):1121-1133)、WO2006/044322、WO2005/047505、EP 06009836,所述文献通过引用的方式并入)。通常,修饰在靶基因识别部分中的现存miRNA支架,从而产生的miRNA现在指导RISC复合体切割从靶核酸转录而来的RNA分子。可以修饰或合成miRNA支架,从而miRNA现在包含纤维选择性的β-1,3-内切葡聚糖酶编码性核苷酸序列(例如WO2008/083969的序列表中所述的序列)的亚基因组等位基因之一的21个连续核苷酸,并且根据下文所述规则允许错配。
因此,在一个实施方案中,本发明提供嵌合基因,其包含以下有效连接的DNA区:
(a)植物可表达的启动子;
(b)在植物细胞中导入并转录时被加工成miRNA的DNA区域,其中该miRNA能够识别该植物的一个GLUC等位基因而非另一个GLUC等位基因的mRNA(如A亚基因组特异性GLUC等位基因而非D亚基因组特异性GLUC等位基因的mRNA)并指导对该mRNA的切割;并且任选地
(c)参与转录终止与聚腺苷酸化的3’DNA区域。
所提到的被加工成miRNA的DNA区域可以包含下述核苷酸序列,所述的核苷酸序列与GLUC等位基因的至少21个连续核苷酸的核苷酸序列基本上互补,条件是允许一个或多个以下错配:在该miRNA 5’末端处的核苷酸与该RNA分子中相应的核苷酸序列之间的错配;在该miRNA第1位置至第9位置中的任一个核苷酸与该RNA分子中相应的核苷酸序列之间的错配;在该miRNA第12位置至第21位置中的任一个核苷酸与该RNA分子中相应的核苷酸序列之间的三个错配,条件是不存在超过2个连续错配。
如本文中所用,“miRNA”是长度约20至22个核苷酸的RNA分子,其可以载入RISC复合体中并指导对另一个RNA分子的切割,其中所述的另一个RNA分子包含与该miRNA分子的核苷酸序列基本上互补的核苷酸序列,其中可以存在以下一个或多个错配:在所述miRNA 5’末端处的核苷酸与靶RNA分子中相应的核苷酸序列之间的错配;在所述miRNA第1位置至第9位置中的任一个核苷酸与靶RNA分子中相应的核苷酸序列之间的错配;在所述miRNA第12位置至第21位置中的任一个核苷酸与靶RNA分子中相应的核苷酸序列之间的三个错配,条件是不存在超过2个连续错配。在该miRNA第10和第11位置不允许错配(全部miRNA位置均从该miRNA分子的5’端开始标识)。
miRNA由蛋白质(例如DCL蛋白质)从存在于任何植物细胞中的前“miRNA”分子加工而来并且装载到RISC复合体上,在此该miRNA可以指导对靶RNA分子的切割。
如本文中所用,“前miRNA”分子是约100个至约200个核苷酸、优选地约100个至约130个核苷酸的RNA分子,该RNA分子可以采用下述二级结构,所述二级结构包含双链RNA茎和单链RNA环并且在双链RNA茎中还包含miRNA的核苷酸序列(及其互补序列)。优选地,该miRNA及其互补物位于距离该miRNA双链RNA茎的游离末端约10个至约20个核苷酸处。单链环区域的序列和长度并非关键并且可以相当大程度地变动,例如,长度在30至50nt之间。优选地,未配对和配对的RNA结构之间的自由能差异在-20与-60kcal/摩尔之间,特别地在-40kcal/摩尔左右。该miRNA与miRNA*之间的互补性无需是完美的并且可以容忍未配对核苷酸的约1至3个凸起。可以通过本领域常用的计算机算法如mFOLD预测RNA分子所采用的二级结构。通过在5’端的互补性程度来确定来自前miRNA中的双链RNA茎的特定链,所述的特定链因DCL活性被释放并装载到RISC复合体上,因此在其5’端最少参与已切割的dsRNA茎中不同链的核苷酸之间成氢键作用的链被装载到RISC复合体上,并且将决定靶RNA分子降解的序列特异性。但是,如果经验上来自特定合成性前miRNA分子的miRNA分子不是有功能性(因为“错误”的链被装载到RISC复合物上),会立刻显而易见的是:可以通过交换miRNA分子及其互补物在前miRNA分子的dsRNA茎的各自链上的位置解决这个问题。如本领域已知,涉及两个氢键的A与U之间的结合作用或涉及两个氢键的G和U之间的结合作用不如涉及三个氢键的G和C之间的结合作用强。
天然存在的miRNA分子可以包含于它们天然存在的前miRNA分子中,但是通过将通常从此类现存前miRNA分子加工而来的miRNA分子的核苷酸序列交换成另一个目的miRNA的核苷酸序列,它们也可以被导入现存的前miRNA分子支架中。前miRNA的支架也可以是完全合成的。类似地,合成的miRNA分子可以包含于现存的前miRNA分子支架或合成性前miRNA支架中或从它们加工而来。
可以通过向植物细胞提供包含植物可表达启动子的基因将前miRNA分子(并且由此还有miRNA分子)方便地导入植物细胞,其中所述的植物可表达启动子与转录时产生所述前miRNA分子的DNA区域有效相连。所述植物可表达启动子可以是与该前miRNA分子天然连接的启动子,或者它可以是异源启动子。
用于特异性下调GhGLUC1.1A基因表达的合适miRNA分子和前微RNA分子在WO2008/083969的序列表条目SEQ ID No 13、14、17、18和19中描述。
用于特异性下调GhGLUC1.1D基因表达的合适miRNA分子和前微RNA分子在WO2008/083969的序列表条目SEQ ID No 15、16、20和21中描述。
如本文中所用,术语“植物可表达的启动子”意指能够控制(启动)植物细胞中转录的DNA序列。这包括植物来源的任何启动子,还包括能够指导植物细胞中转录的非植物来源的任何启动子,即,病毒来源或细菌来源的某些启动子,例如CaMV35S,地三叶病毒启动子No.4或No.7或T-DNA基因启动子等。
偏好地控制纤维细胞中转录起始和维持的植物可表达启动子是下述启动子,其中与该植物的其他细胞或组织中相比,所述启动子在纤维细胞和下方的表皮细胞中以更高水平驱动有效连接的DNA区域转录。此类启动子包括来自棉花的来自纤维特异性β-微管蛋白基因的启动子(如WO0210377所述)、来自棉花的来自纤维特异性肌动蛋白基因的启动子(如WO0210413所述)、来自棉花的纤维特异性脂质转移蛋白基因的启动子(如US5792933所述)、来自棉花的扩展蛋白基因的启动子(WO9830698)或来自棉花中几丁质酶基因的启动子(US2003106097)或在US6259003或US6166294中所述的纤维特异性基因的启动子。也可使用如本文中所述的纤维选择性启动子。
本发明也包括本文所述的嵌合基因以及包含这些嵌合基因的植物、种子、组织以及从此类植物产生的纤维。
用于转化植物的方法是本领域熟知的并且对本发明是不太重要的。转化棉花植物的方法也是本领域熟知的。例如在美国专利5,004,863或美国专利6,483,013中描述了农杆菌介导的棉花转化,并且在WO92/15675中报导了通过微粒轰击进行的棉花转化。
本发明的嵌合基因可以使用本领域熟知的方法以稳定方式或以瞬时方式导入植物中。嵌合基因可以导入植物,或可以如EP 1339859中所述在植物细胞内部产生。
嵌合基因可以通过转化法导入能够衍生胚发生的(embryogenic)愈伤组织的棉花植物,例如Coker 312、Coker310、Coker 5Acala SJ-5、GSC25110、FIBERMAX 819、Siokra 1-3、T25、GSA75、Acala SJ2、Acala SJ4、Acala SJ5、Acala SJ-C1、Acala B1644、Acala B1654-26、AcalaB1654-43、Acala B3991、Acala GC356、Acala GC510、Acala GAM1、Acala C1、Acala Royale、Acala Maxxa、Acala Prema、Acala B638、AcalaB1810、Acala B2724、Acala B4894、Acala B5002、non Acala“picker”Siokra、“stripper”品种FC2017、Coker 315、STONEVILLE 506、STONEVILLE 825、DP50、DP61、DP90、DP77、DES119、McN235、HBX87、HBX191、HBX107、FC 3027、CHEMBRED A1、CHEMBREDA2、CHEMBRED A3、CHEMBRED A4、CHEMBRED B1、CHEMBREDB2、CHEMBRED B3、CHEMBRED C1、CHEMBRED C2、CHEMBREDC3、CHEMBRED C4、PAYMASTER 145、HS26、HS46、SICALA、PIMAS6ORO BLANCO PIMA、FIBERMAX FM5013、FIBERMAX FM5015、FIBERMAX FM5017、FIBERMAX FM989、FIBERMAX FM832、FIBERMAX FM966、FIBERMAX FM958、FIBERMAX FM989、FIBERMAX FM958、FIBERMAX FM832、FIBERMAX FM991、FIBERMAX FM819、FIBERMAX FM800、FIBERMAX FM960、FIBERMAX FM966、FIBERMAX FM981、FIBERMAX FM5035、FIBERMAX FM5044、FIBERMAX FM5045、FIBERMAX FM5013、FIBERMAX FM5015、FIBERMAX FM5017或FIBERMAX FM5024,及具有来源于其基因型的植物。
如本文中所用的“棉花”包括陆地棉、海岛棉、树棉和草棉。“棉花祖先植物”包括树棉、草棉、雷蒙德氏棉和长萼棉(Gossypium longicalyx)和Gossypium kirkii。
本发明的方法和手段也可以用于其它植物物种,例如,大麻、黄麻、亚麻和木本植物,包括但不限于松属某些物种(Pinus spp.)、杨属某些物种(Populus spp.)、云杉属某些物种(Picea spp.)、桉属某些物种(Eucalyptus spp.)等。
获得的转化植物可以在常规育种方案中用来产生具有相同特征的更多转化植物,或用来在相同或相关植物物种的其它品种中或在杂交植物中导入本发明的嵌合基因。从转化植物中获得的种子含有作为稳定基因组插入物的本发明嵌合基因,并且也由本发明包括。
在一个实施方案中,与未消除至少一个GLUC等位基因功能性表达的植物中纤维发育的纤维强度建立阶段期间所产生的功能性GLUC蛋白的量相比,功能性GLUC蛋白的量在纤维发育的纤维强度建立阶段期间产纤维植物的纤维中显著减少。
“显著减少量的功能性GLUC蛋白”(例如功能性GLUC1.1A或GLUC1.1D蛋白)指与不包含突变体GLUC等位基因的细胞所产生功能性GLUC蛋白的量相比,由包含该突变体GLUC等位基因的细胞产生的功能性GLUC蛋白的量减少至少30%、40%、50%、60%、70%、80%、90%、95%或100%(即该细胞不产生功能性GLUC蛋白)。该定义包括产生在体内没有生物学活性的“无功能”GLUC蛋白(例如截短的GLUC蛋白)、功能性GLUC蛋白的绝对量减少(例如因GLUC基因中的突变导致不产生功能性GLUC蛋白)和/或产生与功能性野生型GLUC蛋白的活性相比具有显著降低的生物学活性的GLUC蛋白(如一种GLUC蛋白,其中如上文及下文例举的对所编码GLUC蛋白的生物学活性重要的一个或多个氨基酸残基被替换为另一个氨基酸残基)。如本文中所用,术语“突变体GLUC蛋白”指由突变体GLUC核酸序列(“gluc等位基因”)编码的GLUC蛋白,其中与非突变体野生型GLUC序列(“GLUC等位基因”)所编码的GLUC蛋白的活性相比,该突变在体内导致显著降低的GLUC活性和/或无GLUC活性。
在又一个实施方案中,与其中未消除至少一个GLUC等位基因表达的同等产纤维植物的纤维的胼胝质含量相比,非天然存在的产纤维植物的纤维具有更高的胼胝质含量。
在这个实施方案的特定方面,与其中未消除至少一个GLUC等位基因表达的同等产纤维植物的纤维的强度相比,非天然存在的产纤维植物的纤维的强度提高。
在这个实施方案的一个方面,非天然存在的棉属植物是对海岛棉GLUC1.1A等位基因纯合的陆地棉植物。在这个实施方案的又一个方面,该棉属植物的纤维的强度平均在约5%与约10%之间地、更具体地是约7.5%地高于对陆地棉GLUC1.1A等位基因纯合的陆地棉植物的纤维强度。仍在这个实施方案的又一个方面,该棉属植物的纤维的强度平均在约1.6g/tex与约3.3g/特之间地、更具体地是约2.5g/tex地高于对陆地棉GLUC1.1A等位基因纯合的陆地棉植物的纤维强度。还在这个实施方案的又一个方面,与对陆地棉GLUC1.1A等位基因纯合的陆地棉植物平均在约32.2g/tex与约33.8g/tex之间、更具体是约33.0g/tex的纤维强度相比,该棉属植物的纤维的强度平均在约34.6g/tex与约36.3g/tex之间,更具体地是约35.5g/tex。
在本文中还提供来自棉属物种的野生型和突变体GLUC1.1基因/等位基因的核酸序列,以及野生型和突变GLUC1.1蛋白。也提供了产生突变体和野生型GLUC1.1等位基因并在棉属植物中合并它们的方法,以及提供在其基因组中包含野生型和突变体GLUC1.1等位基因特定组合的棉属植物和植物部分,其中这些植物产生具有改变的纤维强度的纤维并且所述植物优选地正常生长并具有正常表型。使用这些植物将突变体GLUC1.1等位基因转移至其他植物也是本发明的一个实施方案,任一所述植物的植物产物也是本发明的实施方案。另外,提供了用于标记物辅助选择(MAS)的试剂盒和方法以合并或或检测GLUC基因和/或等位基因。下文详述本发明每一个实施方案。
提供了来自棉属物种、尤其来自陆地棉和海岛棉,但也来自其他棉属物种的GLUC1.1基因的编码功能性GLUC1.1蛋白的野生型(GLUC1.1)核酸序列和突变(gluc1.1)核酸序列(其包含一个或多个突变,优选地包含导致所编码GLUC1.1蛋白的生物学活性显著降低或导致无GLUC1.1蛋白产生的突变)。例如,包含A和/或D基因组的棉属物种可以包含可在本发明的单个植株中鉴定和合并的GLUC1.1A或GLUC1.1D基因的不同等位基因。另外,诱变方法可以用来在野生型GLUC1.1A或GLUC1.1D等位基因中产生突变,因此产生根据本发明使用的突变体等位基因。因为特定的GLUC1.1等位基因优选地在棉属植物中通过杂交和选择合并,所以在一个实施方案中,在棉属植物内(即内源地)提供GLUC1.1和/或gluc1.1核酸序列。
然而,本文中也提供分离的GLUC1.1和gluc1.1核酸序列(例如通过克隆从植物分离或通过DNA合成法以合成方式产生)以及其变体和任意的这些序列的片段,因为这些序列可以用来确定哪个序列内源地存在于植物或植物部分中、该序列是否编码有功能的蛋白质或功能显著降低或无功能的蛋白质(例如通过在重组宿主细胞中表达和酶测定法确定)和用于选择特定等位基因并将其从一个棉属植物转移至另一个棉属植物中,旨在产生这样的植物,其具有想要的有功能且突变的等位基因的组合。
如序列表中所述,GLUC1.1A和/或GLUC1.1D的核酸序列已经从陆地棉、从海岛棉、从毛棉(Gossypium tomentosum)、从达尔文棉、从黄褐棉(Gossypium mustelinum)、从树棉(Gossypium arboreum)、从草棉(Gossypium herbaceum)、和从雷蒙德氏棉分离。描述了陆地棉、毛棉、黄褐棉和草棉的野生型GLUC1.1A序列和陆地棉、毛棉、海岛棉、达尔文棉、黄褐棉和雷蒙德氏棉的野生型GLUC1.1D序列,同时参比野生型GLUC1.1A和GLUC1.1D序列,在下文和实施例中描述了这些序列的突变gluc1.1a和/或gluc1.1d序列和与这些序列基本上相似的序列。另外,描述了海岛棉、达尔文棉和树棉的突变体GLUC1.1A序列,同时在下文和实施例中描述了这些序列的备选性突变gluc1.1a序列和与这些序列基本上相似的序列。编码GLUC1.1A和D蛋白的基因组DNA和相应的前mRNA包含被1个内含子断开的2个外显子(从5’端开始编号为外显子1和2)。在cDNA和加工过的相应mRNA(即剪接的RNA)中,内含子被除去并且外显子被连接,如序列表和图1和图6中所述。外显子序列在进化上更保守并且因此可比内含子序列变动更小。
本发明的“GLUC1.1A核酸序列”或“GLUC1.1A变体核酸序列”是下述核酸序列,其编码与SEQ ID NO:4具有至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列,或是下述核酸序列,其编码与SEQ ID NO:3具有至少97%、至少98%、至少99%序列同一性的cDNA序列或包含与SEQ ID NO:1的第2410位置处核苷酸至第3499位置处核苷酸具有至少95%、至少96%、至少97%、至少98%、至少99%序列同一性的编码序列。这些核酸序列也可以称作与序列表中提供的GLUC1.1A序列“基本上相似”或“基本上相同”或“相对应”。
本发明的“GLUC1.1D核酸序列”或“GLUC1.1D变体核酸序列”是下述核酸序列,其编码与SEQ ID NO:10具有至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列,或是下述核酸序列,其编码与SEQ ID NO:3具有至少97%、至少98%、至少99%序列同一性的cDNA序列或包含与SEQ ID NO:7的第3337位置处核苷酸至第4444位置处核苷酸具有至少95%、至少96%、至少97%、至少98%、至少99%序列同一性的编码序列。这些核酸序列也可以称作与序列表中提供的GLUC1.1A序列“基本上相似”或“基本上相同”或“相对应”。
因此,本发明提供了编码野生型的、功能性GLUC1.1A和GLUC1.1D蛋白的核酸序列,包括其变体和片段(如下文进一步定义),以及任意这些核酸序列的突变核酸序列,由此与野生型蛋白相比,所述核酸序列中的突变优选地导致一个或多个氨基酸被插入、缺失或替换。优选地,该核酸序列中的突变产生一个或多个氨基酸改变(即相对于野生型氨基酸序列,插入、缺失和/或替换一个或多个氨基酸),由此GLUC1.1蛋白的生物学活性显著降低。突变GLUC1.1蛋白的生物学活性显著降低指与野生型蛋白的活性相比,酶促活性降低至少30%、至少40%、50%或更多、至少90%或100%(无生物学活性)。
本文中提供了内源核酸序列和分离的核酸序列。根据本发明另一个方面,还提供了上文所定义的GLUC1.1序列和GLUC1.1变体核酸序列的片段,用作引物或探针和用作试剂盒的组分(进一步见下文)。(如定义的)GLUC1.1或gluc1.1核酸序列或其变体的“片段”可以具有多种长度,如GLUC1.1或gluc1.1序列(或变体序列)的至少10、12、15、18、20、50、100、200、500、1000个连续核苷酸。
如序列表中所述,GLUC1.1A和/或GLUC1.1D的核酸序列已经从陆地棉、从海岛棉、从毛棉、从达尔文棉、从黄褐棉、从树棉、从草棉并从雷蒙德氏棉分离。描述了陆地棉、毛棉、黄褐棉和草棉的野生型GLUC1.1A序列和陆地棉、毛棉、海岛棉、达尔文棉、黄褐棉和雷蒙德氏棉的野生型GLUC1.1D序列,同时参比野生型GLUC1.1A和GLUC1.1D序列,在下文和实施例中描述了这些序列的突变gluc1.1a和/或gluc1.1d序列和与这些序列基本上相似的序列。另外,描述了海岛棉、达尔文棉和树棉突变的GLUC1.1A序列,同时在下文和实施例中描述了这些序列的备选突变gluc1.1a序列和与这些序列基本上相似的序列。编码GLUC1.1A和D蛋白的基因组DNA和相应的前mRNA包含被1个内含子断开的2个外显子(从5’端开始编号为外显子1和2)。在cDNA和加工过的相应mRNA(即剪接的RNA)中,内含子被除去并且外显子被连接,如序列表和图1和图6中所述。外显子序列在进化上更保守并且因此可比内含子序列变动更小。
如序列表中所述的来自陆地棉、来自海岛棉、来自毛棉、来自达尔文棉、来自黄褐棉、来自树棉、来自草棉和来自雷蒙德氏棉的GLUC1.1A和/或GLUC1.1D的核酸序列编码来自这些棉属物种的野生型、功能性GLUC1.1蛋白。另外,序列表中所述的海岛棉、达尔文棉和树棉的突变体GLUC1.1A序列编码来自这些棉属物种的野生型、无功能GLUC1.1蛋白。因此,这些序列对于从中分离它们的棉属物种是内源的。可以对其他棉属物种、品种、育种品系或野生种(wild accessions)筛选编码相同GLUC1.1A和GLUC1.1D蛋白或其变体的其他GLUC1.1A和GLUC1.1D等位基因。例如,核酸杂交技术(例如DNA印迹法,例如使用严格杂交条件)或基于PCR-的技术可以用来鉴定对于其他棉属植物为内源的GLUC1.1等位基因。为了对此类植物或植物组织筛选GLUC1.1等位基因的存在,可以使用序列表中提供的GLUC1.1核酸序列或任意这些核酸序列的变体或片段。例如。可以使用完整序列或片段作为探针或引物。例如,特异性或简并性引物可以用来从植物或植物组织的基因组DNA扩增编码GLUC1.1蛋白的核酸序列。这些GLUC1.1核酸序列可以使用标准分子生物学技术予以分离和测序。生物信息学分析随后可以用来表征等位基因,例如旨在确定该序列对应于哪个GLUC1.1等位基因和哪种GLUC1.1蛋白或蛋白质变体由该序列编码。
可以通过如本领域已知的重组DNA技术分析核酸序列是否编码功能性GLUC1.1蛋白,例如,在宿主细胞(例如细菌如大肠杆菌(E.coli))中表达该核酸分子并分析所得蛋白质或细胞的内切-1,3-β-葡聚糖酶活性。
另外,应当理解可以通过对核酸数据库筛选基本上相似的序列以硅片(in silico)方式鉴定GLUC1.1核酸序列和其变体(或这些核酸序列的片段)。类似地,可以化学地合成核酸序列。也提供了本发明核酸分子的片段,其在下文进一步描述。片段包括仅编码成熟蛋白的核酸序列或包含全部或部分外显子序列和/或内含子序列的更小片段等。
相对于野生型核酸序列而言包含一个或多个核苷酸缺失、插入或替换的核酸序列是本发明的另一个实施方案,而这类突变核酸分子的片段也是本发明的另一个实施方案。如下文进一步所述,使用多种已知方法,可以产生和/或鉴定此类突变核酸序列(称作gluc1.1序列)。再次地,此类核酸分子以内源形式和以分离的形式提供。在一个实施方案中,突变在所编码GLUC1.1蛋白的氨基酸序列中导致一种或多种改变(缺失、插入和/或替换)(即,它不是“沉默突变”)。在另一个实施方案中,与野生型蛋白相比,核酸序列中的突变导致所编码的GLUC1.1蛋白的显著降低或彻底消除的生物学活性。
所述核酸分子因此可以包含一种或多种突变,如:
(a)“错义突变”,它是核酸序列中导致一种氨基酸替换为另一种氨基酸的改变;
(b)“无义突变”或“终止密码子突变”,它是在核酸序列中导致提前终止密码子导入并因此导致翻译终止(产生截短的蛋白质)的改变;植物基因含有翻译终止密码子“TGA”(RNA中是UGA)、“TAA”(RNA中是UAA)和“TAG”(RNA中是UAG);因此导致这些密码子之一出现于正在翻译的成熟mRNA中(在可读框中)的任何核苷酸替换、插入、缺失将终止翻译。
(c)一个或多个氨基酸的“插入突变”,这归因于该核酸的编码序列中添加了一个或多个密码子;
(d)一个或多个氨基酸的“缺失突变”,这归因于该核酸的编码序列中删除了一个或多个密码子;
(e)“移码突变”,其导致核酸序列在该突变下游的一个不同可读框中翻译。移码突变可能具有多个原因,如一个或多个核苷酸插入、缺失或重复,以及影响前mRNA剪接的突变(剪接位点突变)也可以导致移码;
(f)“剪接位点突变”,该突变改变或消除前mRNA序列的正确剪接,产生具有不同于野生型的氨基酸序列的蛋白质。例如。可能在RNA剪接期间漏过一个或多个外显子,从而产生缺少由所漏过外显子编码的氨基酸的蛋白质。备选地,可读框可以因不正确的剪接而改变,或可以留下一个或多个内含子或可以产生另外的剪接供体或受体,或可以在另外的位置(例如在内含子内部)启动剪接或可以产生另外的聚腺苷酸化信号。正确的前mRNA剪接是一个复杂过程,它可能受GLUC1.1编码基因的核苷酸序列中的多种突变影响。在高等真核生物如植物中,主要剪接体剪接在5'剪接位点(供体位点)含有GU和在3'剪接位点(受体位点)含有AG的内含子。约99%的真核生物核基因剪接位点中遵循GU-AG法则(或GT-AG法则;见Lewin,Genes VI,Oxford University Press 1998,第885-920页,ISBN0198577788),而在5’和3’剪接位点含有其他双核苷酸如GC-AG和AU-AC的内含子仅分别占约1%和0.1%。
如已经提到的那样,希望该核酸序列中的突变优选地导致在体内包含显著降低的酶活性或无酶活性的突变蛋白。基本上,产生相对于野生型蛋白而言包含至少一个氨基酸插入、缺失和/或替换的蛋白质的任意突变可以导致显著降低的酶活性或无酶活性。然而,可以理解在该蛋白质的某些部分中的突变更可能导致突变GLUC1.1蛋白的功能降低,如产生截短蛋白的突变,由此功能性结构域如催化结构域的显著部分丢失。
本文中所述的棉属植物的功能性GLUC1.1蛋白具有约325至337个氨基酸长度并且包含许多结构性和功能性结构域。这些结构域包括以下结构域:约14-26个氨基酸的氨基端质体靶向肽,随后是构成成熟GLUC1.1蛋白的肽。成熟GLUC1.1蛋白包含如上表4中所示的活性中心和糖基化氨基酸残基。
因此,在一个实施方案中,提供了包含一个或多个任意类型上文所述突变的核酸序列。在另一个实施方案中,提供了包含一个或多个缺失突变、一个或多个终止密码子(无义)突变和/或一个或多个剪接位点突变的gluc1.1序列。提供了任意的上述突变核酸序列本身(处于分离的形式),同样也提供了内源地包含此类序列的植物和植物部分。
如本文中所用,GLUC1.1等位基因中的缺失突变是GLUC1.1等位基因中这样的突变,其中至少1个、至少2、3、4、5、10、20、30、50、100、200、500、1000个或更多个碱基从相应的野生型GLUC1.1等位基因中缺失并且因此该缺失导致突变体GLUC1.1等位基因转录并翻译成具有显著降低的体内活性或没有体内活性的突变蛋白。缺失可以导致移码和/或它可以导入一个提早终止密码子或可以导致编码序列的一个氨基酸或更多个氨基酸(例如大部分)移除等。缺失导致生物学活性显著降低的突变蛋白的确切根本分子基础不是重要的。本文中也提供了其中特定GLUC1.1等位基因彻底缺失的植物和植物部分,即缺少一个或多个GLUC1.1等位基因的植物和植物部分。
如本文中所用,GLUC1.1等位基因中的无义突变是GLUC1.1等位基因中这样的突变,其中一个或多个翻译终止密码子被导入相应野生型GLUC1.1等位基因的编码性DNA和相应的mRNA序列。翻译终止密码子是TGA(mRNA中是UGA)、TAA(UAA)和TAG(UAG)。因此,编码序列(外显子序列)中导致符合可读框的终止密码子产生的任何突变(缺失、插入或替换)将导致翻译终止和氨基酸链的截短。在一个实施方案中,包含无义突变的突变体GLUC1.1等位基因是其中符合可读框的终止密码子因单核苷酸替换(如CAG至TAG、TGG至TAG、TGG至TGA或CGA至TGA的突变)被导入GLUC1.1密码子序列中的GLUC1.1等位基因。在另一个实施方案中,包含无义突变的突变体GLUC1.1等位基因是其中符合可读框的终止密码子因双核苷酸替换(如CAG至TAA、TGG至TAA、CGG至TAG或TGA、CGA至TAA的突变)被导入GLUC1.1密码子序列中的GLUC1.1等位基因。在又一个实施方案中,包含无义突变的突变体GLUC1.1等位基因是其中符合可读框的终止密码子因三核苷酸替换(如CGG至TAA的突变)被导入GLUC1.1密码子序列中的GLUC1.1等位基因。截短的蛋白质缺少由该突变下游的编码性DNA编码的氨基酸(即GLUC1.1蛋白的羧基端部分)并保持由该突变上游的编码性DNA编码的氨基酸(即GLUC1.1蛋白的氨基端部分)。在一个实施方案中,该无义突变存在于活性中心的第二个保守Glu残基、Trp残基、第一个Glu残基和/或所述Tyr残基之前的任何地方,从而至少保守Glu残基、Trp残基、第一个Glu残基和/或所述Tyr残基缺失,从而导致截短蛋白质的显著降低的活性。与野生型蛋白相比,突变蛋白质截短得越多,它丢失任何酶活性的可能性越大。因此在另一个实施方案中,提供了包含无义突变的突变体GLUC1.1等位基因,其中所述的无义突变产生缺少第二个保守Glu的截短蛋白质、缺少第二个保守Glu残基和所述Trp残基的截短蛋白质、缺少第二个保守Glu残基、所述Trp残基和第一Glu残基的截短蛋白质、缺少第二个保守Glu残基、所述Trp残基、第一Glu残基和所述Tyr残基的截短蛋白质或具有更少氨基酸长度的截短蛋白质。在又一个实施方案中,该无义突变产生不翻译成蛋白质的一个或多个外显子,如外显子1、外显子2或外显子1和2。
如本文中所用,GLUC1.1等位基因中的剪接位点突变是GLUC1.1等位基因中这样的突变,其中相应的野生型功能性GLUC1.1等位基因中的突变导致前mRNA的异常剪接,因此产生具有显著降低的活性或没有活性的突变蛋白。该突变可以位于共有剪接位点序列中。例如,表5描述了如果被突变,则可能影响正确剪接的共有序列。GT-AG剪接位点通常具有其他保守的核苷酸,如在(外显子中的)内含子5’端上的2个高度保守的核苷酸,经常是5’-AG-3’。在GT双核苷酸的3’侧(因此在内含子中)上,可以发现一个四重核苷酸5’-AAGT-3’的高度保守性。这意味可以将8个核苷酸鉴定为在供体位点处高度保守。
表5:共有剪接位点序列
^表示剪接位点;R=A或G;Y=C或T;N=A、C、G或T(但经常是G);n=多个核苷酸;粗体=内含子序列中共有的双核苷酸。Pu=嘌呤碱基;Py=嘧啶碱基。
在本领域中描述了剪接位点结构和共有序列,并且用于鉴定外显子和剪接位点序列的计算机程序如NetPLAntgene、BDGP或Genio、est2genome、FgeneSH等是可获得的。基因组序列或前mRNA序列与已翻译蛋白质的比较可以用来确定或验证剪接位点和异常剪接作用。
本文中包括了改变前mRNA剪接的任何突变(一个或多个核苷酸的插入、缺失和/或替换)并且因此产生具有显著降低的生物学活性的蛋白质。在一个实施方案中,包含剪接位点突变的突变体GLUC1.1等位基因是这样的GLUC1.1等位基因,其中改变的剪接过程因GLUC1.1转录的DNA区域中导入上文以粗体所述的共有双核苷酸的一个或多个核苷酸替换引起。例如,^GU可以例如突变成供体剪接位点中的^AU和/或AG^可以突变成受体剪接位点序列中的AA^。在另一个实施方案中,包含剪接位点突变的突变体GLUC1.1等位基因是这样的GLUC1.1等位基因,其中改变的剪接过程因GLUC1.1转录的DNA区域中于外显子序列的保守核苷酸中导入一个或多个核苷酸替换引起。
还提供来自棉属物种、尤其来自陆地棉和海岛棉,但也来自其他棉属物种(如下文所示那些棉属物种)的功能性GLUC1.1氨基酸序列和无功能GLUC1.1氨基酸序列(包含一个或多个突变,优选地是导致GLUC1.1蛋白显著降低的生物学活性或无生物学活性的突变)。另外,诱变方法可以用来在野生型功能性GLUC1.1等位基因中产生突变,因此产生可以编码其他无功能GLUC1.1蛋白的突变型无功能GLUC1.1等位基因。在一个实施方案中,在棉属植物内(即内源地)提供功能性和/或无功能GLUC1.1氨基酸序列。然而,本文中也提供分离的GLUC1.1氨基酸序列(例如从植物分离或以合成方式产生)以及其变体和任意的这些序列的片段。
如序列表和图2及图7中所述,已经确定来自陆地棉、来自海岛棉、来自毛棉、来自达尔文棉、来自黄褐棉、来自树棉、来自草棉和来自雷蒙德氏棉的GLUC1.1A和GLUC1.1D的氨基酸序列。描述了陆地棉、毛棉、黄褐棉和草棉的野生型功能性GLUC1.1A序列和陆地棉、毛棉、海岛棉、达尔文棉、黄褐棉和雷蒙德氏棉的野生型功能性GLUC1.1D序列,同时参比野生型功能性GLUC1.1A和GLUC1.1D序列,下文中描述了这些序列的突变型无功能GLUC1.1A序列和与这些序列基本上相似的序列。另外,描述了海岛棉、达尔文棉和树棉的野生型无功能GLUC1.1A序列,同时在下文和实施例中描述了这些序列的备选(突变型)无功能GLUC1.1A序列和与这些序列基本上相似的序列。
如上所述,本文中所述的棉属植物的功能性GLUC1.1蛋白具有约325至337个氨基酸长度并且包含许多结构性和功能性结构域。GLUC1.1蛋白的氨基端部分的序列在进化上比成熟GLUC1.1蛋白的序列更少保守。成熟GLUC1.1蛋白的序列因此比前体蛋白质序列变动更少。
本发明的“GLUC1.1A氨基酸序列”或“GLUC1.1A变体氨基酸序列”是与SEQ ID NO:4具有至少95%、至少96%、至少97%、至少98%、至少99%或至少100%序列同一性的氨基酸序列。这些氨基酸序列也可以称作与序列表中提供的GLUC1.1A序列“基本上相似”或“基本上同一”或“相对应”。
本发明的“GLUC1.1D氨基酸序列”或“GLUC1.1D变体氨基酸序列”是与SEQ ID NO:10具有至少95%、至少96%、至少97%、至少98%、至少99%或至少100%序列同一性的氨基酸序列。这些氨基酸序列也可以称作与序列表中提供的GLUC1.1D序列“基本上相似”或“基本上同一”或“相对应”。
因此,本发明提供了野生型有功能的和无功能的GLUC1.1A和GLUC1.1D蛋白的氨基酸序列,包括其变体和片段(如下文进一步定义),以及任意这些氨基酸序列的突变型无功能氨基酸序列,其中所述氨基酸序列中的突变优选地导致GLUC1.1蛋白的生物学活性显著降低。(野生型或突变型)无功能GLUC1.1蛋白的生物学活性显著降低指与有功能蛋白的活性相比,酶活性(即,内切-1,3-β-葡聚糖酶活性)降低至少30%、至少40%、50%或更多、至少90%或100%(无生物学活性)。
本文中提供了内源氨基酸序列和分离的氨基酸序列。(如定义的)GLUC1.1氨基酸序列或其变体的“片段”可以具有多种长度,如GLUC1.1序列(或变体序列)的至少10、12、15、18、20、50、100、200、400个连续氨基酸。
序列表中所述的氨基酸序列是来自棉属物种的野生型GLUC1.1蛋白。因此,这些序列对于分离它们的棉属植物是内源的。如上所述,可以对其他棉属物种、品种、育种品系或野生种筛选具有相同氨基酸序列的其他(有功能的或无功能的)GLUC1.1蛋白或其变体。
另外,应当理解可以通过对氨基酸数据库筛选基本上相似的序列以硅片上方式鉴定GLUC1.1氨基酸序列和其变体(或任一这些氨基酸序列的片段)。也提供本发明氨基酸分子的片段。片段包括成熟蛋白的氨基酸序列或包含全部或部分氨基酸序列的更小片段等。
相对于野生型(有功能的或无功能的)氨基酸序列包含一个或多个氨基酸缺失、插入或替换的氨基酸序列是本发明的另一个实施方案,且这类突变氨基酸分子的片段也是本发明的另一个实施方案。如上所述,使用多种已知方法,可以产生和/或鉴定此类突变氨基酸序列。再次地,此类氨基酸分子以内源形式和以分离的形式提供。
在一个实施方案中,与野生型蛋白相比,氨基酸序列中的突变导致GLUC1.1蛋白的显著降低或彻底消除的生物学活性。基本上如上所述,导致相对于野生型蛋白而言包含至少一个氨基酸插入、缺失和/或替换的蛋白质的任意突变可以导致显著降低的酶活性(或无酶活性)。然而,可以理解在该蛋白质的某些部分中的突变更可能导致突变GLUC1.1蛋白的功能降低,如导致截短蛋白的突变,由此功能性结构域如活性中心或糖基化位点(见上文)的显著部分丢失或突变,其中具有催化功能或参与底物特异性的保守氨基酸残基被替换。
因此在一个实施方案中,提供了包含一个或多个缺失突变或插入突变的突变GLUC1.1蛋白,由此所述缺失或插入导致具有显著降低的体内活性或无体内活性的突变蛋白。此类突变GLUC1.1蛋白是与野生型GLUC1.1蛋白相比缺失或插入至少1个、至少2、3、4、5、10、20、30、50、100、200、300、400个或更多个氨基酸的GLUC1.1蛋白,由此所述缺失或插入导致具有显著降低的体内活性或无体内活性的突变蛋白。
在另一个实施方案中,提供了被截短的突变GLUC1.1蛋白,由此所述的截短产生了具有显著降低的体内活性或无体内活性的突变蛋白。这类截短的GLUC1.1蛋白是在相应野生型(成熟)GLUC1.1蛋白的羧基端部分中缺少功能性结构域如活性中心残基和/或糖基化位点残基并保持相应野生型(成熟)GLUC1.1蛋白的氨基端部分的GLUC1.1蛋白。因此在一个实施方案中,提供了截短的GLUC1.1蛋白,其包含相应野生型(成熟)GLUC1.1蛋白的氨基端部分直至但不包括(如上所述的)第二个保守Glu残基。与野生型蛋白相比,突变蛋白质截短得越多,它丢失任何酶活性的可能性越大。在另一个实施方案中,提供了截短的GLUC1.1蛋白,其包含相应野生型(成熟)GLUC1.1蛋白的氨基端部分直至但不包括(如上所述的)保守Trp和/或第一个Glu残基。在又一个实施方案中,提供了截短的GLUC1.1蛋白,其包含相应野生型(成熟)GLUC1.1蛋白的氨基端部分直至但不包括(如上所述的)保守Tyr残基或缺少甚至更多的氨基酸。
在又一个实施方案中,提供了包含一个或多个替换突变的突变GLUC1.1蛋白,由此所述替换产生具有显著降低的体内活性或无体内活性的突变蛋白。此类突变GLUC1.1蛋白是其中具有催化功能或参与底物结合或特异性的保守氨基酸残基(例如,上文所述的那些保守氨基酸残基)被替换的GLUC1.1蛋白。因此在一个实施方案中,提供了突变GLUC1.1蛋白,其包含具有催化功能的保守氨基酸残基(如保守的第一或第二Glu、Trp和/或Tyr残基)的替换。在另一个实施方案中,提供了突变GLUC1.1蛋白,其包含参与糖基化的保守氨基酸残基(如保守的Asn残基)的替换。
在本发明的另一个方面,提供了使用本领域常用的一系列方法,例如使用基于PCR的方法来扩增gluc1.1基因组或cDNA的部分或全部,用于产生突变体gluc1.1等位基因(例如通过诱变法诱导)和/或鉴定突变体gluc1.1等位基因的方法。
如本文中所用,术语“诱变”指其中植物细胞(例如,多颗棉属种子或其他部分,如花粉)受到在所述细胞的DNA中诱导突变的技术处理的过程,所述的技术例如是与诱变剂如化学物质(如甲磺酸乙酯(EMS)、乙基亚硝基脲(ENU)等)接触或电离辐射(中子(如在快中子诱变法等)、α射线、γ射线(如钴60源提供的γ射线)、X-射线、紫外辐射等)或这些诱变剂的两种或多种的组合。因此,一个或多个GLUC1.1等位基因的想要的诱变可以利用化学手段如通过一种或多种植物组织与甲磺酸乙酯(EMS)、乙基亚硝基脲等接触,利用物理手段如X-射线等或通过γ辐射(如钴60源提供的γ辐射)实现。
诱变后,使用已知技术从处理的种子长出或从处理的细胞再生出棉属植物。例如,所得的棉属植物种子可以根据常规培育方法种植并且在自我授粉后,种子形成植物。可以收获因这种自我授粉在当前或后续世代中形成的额外种子并且使用本领域常用的技术,例如基于聚合酶链反应(PCR)的技术(扩增gluc1.1等位基因)或基于杂交的技术,例如DNA印迹分析和/或对gluc1.1等位基因直接测序,筛选突变体GLUC1.1等位基因的存在。为筛选突变体GLUC1.1等位基因中点突变(所谓单核苷酸多态性或SNP)的存在,可以使用本领域常规的SNP检测方法,例如基于寡核苷酸连接(oligoligation)的技术、基于单碱基延伸的技术或基于限制性位点不同的技术,如TILLING。
如上所述,对特定野生型(有功能的或无功能的)GLUC1.1等位基因的(自发以及诱导的)诱变导致一个或多个缺失、插入或替换的核苷酸在所得的突变体GLUC1.1等位基因中存在(在下文称作“突变区”)。突变体GLUC1.1等位基因可以因此由一个或多个缺失、插入或替换的核苷酸在野生型GLUC1.1等位基因中的位置和构型表征。野生型GLUC1.1等位基因中已经分别插入、缺失或替换一个或多个核苷酸的位点也称作“突变区”。如本文中所用,“5’或3’侧翼区或序列”指该突变的(或相应的野生型)GLUC1.1等位基因中至少20bp,优选至少50bp、至少750bp、至少1500bp和直至5000bp DNA的DNA区域或序列,该DNA区域或序列不同于含有一个或多个缺失、插入或替换的核苷酸的DNA,优选地不同于来自该突变的(或相应的野生型)GLUC1.1等位基因的紧挨该突变体GLUC1.1等位基因(或在相应的野生型GLUC1.1等位基因)中该突变区上游并且直接与之相邻存在(5’侧翼区或序列”)或者紧挨该突变区下游并且与之相直接邻存在(3’侧翼区或序列”)的DNA。
为鉴定特定突变体GLUC1.1等位基因或包含特定突变体GLUC1.1等位基因的植物或植物材料或包含植物材料(其包含特定突变体GLUC1.1等位基因)的产品所开发的工具是基于该特定突变体GLUC1.1等位基因与相应野生型GLUC1.1等位基因的基因组特征相比的特定基因组特征,如包含突变区、分子标记物或侧翼区和/或突变区序列的基因组区域的特定限制性图谱。
一旦特定的突变体GLUC1.1等位基因已经测序,则可以借助分子生物学技术开发下述引物和探针,所述引物和探针特异性识别样品的核酸(DNA或RNA)中该突变体GLUC1.1等位基因的5’侧翼区、3’侧翼区和/或突变区内的序列。例如,可以开发鉴定生物学样品(如植物的、植物材料或包含植物材料的产品的样品)中该突变体GLUC1.1等位基因的PCR方法。这种PCR基于至少两条特异性“引物”。分别识别该突变体GLUC1.1等位基因的5’或3’侧翼区内序列的一条引物和分别识别该突变体GLUC1.1等位基因的3’或5’侧翼区内序列的另一条引物;或识别该突变体GLUC1.1等位基因的5’或3’侧翼区内序列的一条引物和识别该突变体GLUC1.1等位基因的突变区内序列的另一条引物;或分别识别该突变体GLUC1.1等位基因的5’或3’侧翼区内序列的一条引物和识别下述序列(如下文进一步描述)的另一条引物,其中所述的序列跨度覆盖该特定的突变体GLUC1.1等位基因的3’或5’侧翼区与突变区之间的交界区。
所述引物优选地具有15与35个核苷酸之间的序列,它们在优化的PCR条件下“特异性识别”5’或3’侧翼区内的序列、突变区内的序列或跨度覆盖该特定突变体GLUC1.1等位基因的3’或5’侧翼区与该突变区之间交界区的序列,从而特异性片段(“突变体GLUC1.1特异性片段”或区分性扩增子)从包含该特定突变体GLUC1.1等位基因的核酸样品扩增出来。这意味在优化的PCR条件下仅扩增所指向的突变体GLUC1.1等位基因并且不扩增植物基因组中的其他序列。
适合本发明的PCR引物可以是以下引物:
-长度范围从17nt至约200nt的寡核苷酸,在它们3’端包含选自特定突变体GLUC1.1等位基因的5’侧翼序列中的至少17个连续核苷酸、优选20个连续核苷酸的核苷酸序列(即,例如分布在本发明突变体GLUC1.1等位基因中一个或多个所缺失、插入或替换的核苷酸5’侧翼的序列,如分布在上文所述的缺失突变、无义突变或剪接位点突变5’侧翼的序列或分布在上文所示的潜在终止密码子突变或剪接位点突变5’侧翼的序列)(识别5’侧翼序列的引物);或
-长度范围从17nt至约200nt的寡核苷酸,在它们3’端包含选自特定突变体GLUC1.1等位基因的3’侧翼序列中的至少17个连续核苷酸、优选20个连续核苷酸的核苷酸序列(即,例如分布在本发明突变体GLUC1.1等位基因中一个或多个所缺失、插入或替换的核苷酸3’侧翼的序列的互补序列,如分布在上文所述的缺失突变、无义突变或剪接位点突变3’侧翼的序列的互补序列或分布在上文所示的潜在终止密码子突变或剪接位点突变3’侧翼的序列的互补序列)(识别3’侧翼序列的引物);或
-长度范围从17nt至约200nt的寡核苷酸,在它们3’端包含选自特定突变体GLUC1.1等位基因的突变区的序列中至少17个连续核苷酸、优选20个连续核苷酸的核苷酸序列(即,例如具有在本发明GLUC1.1基因中所插入或替换的核苷酸的序列或其互补序列)(识别突变序列的引物)。
引物当然可以比提到的17个连续核苷酸更长,并且可以长例如20、21、30、35、50、75、100、150、200nt或甚至更长。所述引物可以完全由选自侧翼序列和突变序列的所提及核苷酸序列中的核苷酸序列组成。然而,引物在其5’端(即3’存在的17个连续核苷酸外侧的)核苷酸序列是较不重要的。因此,所述引物的5’序列可以根据需要由选自侧翼序列或突变序列的核苷酸序列组成,但是可以含有几个(例如1、2、5、10个)错配。所述引物的5’序列甚至可以完全由与侧翼序列或突变序列不相关的核苷酸序列(例如代表限制酶识别位点的核苷酸序列)组成。这类不相关序列或带错配的侧翼DNA序列应当优选地不长于100个、更优选地不长于50个或甚至25个核苷酸。
另外,合适的引物可以在其3’端包含下述核苷酸序列或由该核苷酸序列组成,所述的核苷酸序列跨度覆盖侧翼序列与突变序列之间的交界区(即,例如,在分布于本发明突变体GLUC1.1等位基因中一个或多个所缺失、插入或替换核苷酸5’侧翼的序列与具有一个或多个所插入或替换核苷酸的序列或分布于一个或多个所缺失核苷酸3’侧翼的序列之间的交界区,如在分布于本发明GLUC1.1基因中上文所述缺失突变、无义突变或剪接位点突变5’侧翼的序列与具有该无义突变或剪接位点突变的序列或分布于所述缺失突变3’侧翼的序列之间的交界区,或在分布于如上文所示潜在的终止密码子或剪接位点突变5’侧翼的序列与具有该潜在的终止密码子突变或剪接位点突变的序列之间的交界区,条件是所提及的位于3’的核苷酸序列不排他地从所述突变区或侧翼区衍生。
技术人员也将迅速明白:恰当选择的PCR引物对还应当不包含彼此互补的序列。
出于本发明的目的,“SEQ ID NO:X中所示的核苷酸序列的互补序列”是可以通过下述方式从所示核苷酸序列衍生的核苷酸序列,即将所示核苷酸根据Chargaff法则()替换为其互补性核苷酸并以5’至3’方向(即以所示核苷酸序列的相反方向)读取该序列。
在实施例中描述适合鉴定特定突变体GLUC1.1等位基因的引物的示例。
如本文中所用,SEQ ID No.Z从第X位置至第Y位置的核苷酸序列”指包括两个核苷酸终点的核苷酸序列。
优选地,扩增的片段具有在50和1000个核苷酸之间的长度,如,在50和500个核苷酸之间的长度或在100和350个核苷酸之间的长度。特异性引物可以具有这样的序列,该序列在80和100%之间与特定突变体GLUC1.1等位基因的5’或3’侧翼区内的序列、其突变区内的序列、跨度覆盖其3’或5’侧翼区与突变区之间交界区的序列相同,条件是错配仍允许在优化的PCR条件下用这些引物特异地鉴定该特定突变体GLUC1.1等位基因。但是,可允许错配的范围可以轻易地以实验方式确定并且是本领域技术人员已知的。
“突变体GLUC1.1特异性片段”的检测和/或鉴定可以按多种方式进行,例如,通过凝胶电泳或毛细管电泳后检查大小或通过基于荧光的检测方法。突变体GLUC1.1特异性片段可以直接进行测序。用于检测扩增的DNA片段的其他序列特异性方法也是本领域已知的。
本领域中描述了标准PCR方案,如在'PCR ApplicationsManual"(Roche Molecular Biochemicals,第2版,1999)和其他参考文献中。PCR的最适条件(包括特异性引物的序列)在“PCR鉴定方案”中对每种特定突变体GLUC1.1等位基因详述。然而,可以理解PCR鉴定方案中的许多参数可能需要针对具体实验室条件调整并且可以作轻微修改以获得相似的结果。例如,制备DNA的不同方法的使用可能需要调整例如所用的引物数量、聚合酶、MgCl2浓度或复性条件。类似地,其他引物的选择可以决定用于PCR鉴定方案的其他最适条件。但是,这些调整对本领域技术人员将是显而易见的,并且在目前的PCR应用手册(如上文援引的那本手册)中进一步详述。
在实施例中描述了鉴定特定突变体GLUC1.1等位基因的PCR鉴定方案的示例。
备选地,特异性引物可以用来扩增突变体GLUC1.1特异性片段,所述片段可以用作鉴定生物学样品中特定突变体GLUC1.1等位基因的“特异性探针”。生物学样品的核酸与该探针在允许该探针与此核酸中相应片段杂交的条件下接触导致核酸/探针杂交体的形成。可以检测这种杂交体的形成(例如将该核酸或探针标记),由此这种杂交体的形成表示存在特定突变体GLUC1.1等位基因。本领域中已经描述了基于与特异性探针(在固相载体上或在溶液中)杂交的这类鉴定方法。该特异性探针优选地是在优化条件下与特定突变体GLUC1.1等位基因的5’或3’侧翼区内和/或其突变区内的某区域(下文称作“GLUC1.1突变特异性区域”)特异性杂交的序列。优选地,此特异性探针包含长度在20与1000bp之间、50与600bp之间、100至500bp之间、150至350bp之间的序列,该序列与特定区域的核苷酸序列至少80%、优选地80与85%之间、更优选地85与90%之间、尤其优选地90与95%之间、最优选地95%与100%之间相同(或互补)。优选地,该特异性探针将包含与特定突变体GLUC1.1等位基因的特定区域相同(或互补)的约15个至约100个连续核苷酸的序列。
适合本发明的特异探针可以是以下探针:
-长度范围从20nt至约1000nt的寡核苷酸,包含选自特定突变体GLUC1.1等位基因的5’侧翼序列中的至少20个连续核苷酸的核苷酸序列(即,例如分布在本发明突变体GLUC1.1等位基因中一个或多个所缺失、插入或替换核苷酸的5’侧翼的序列,如分布在上文所述的缺失突变、无义突变或剪接位点突变5’侧翼的序列或分布在上文所示的潜在终止密码子突变或剪接位点突变5’侧翼的序列),或与该核苷酸序列具有至少80%序列同一性的序列(识别5’侧翼序列的探针);或
-长度范围从20nt至约1000nt的寡核苷酸,包含选自特定突变体GLUC1.1等位基因的3’侧翼序列中的至少20个连续核苷酸的核苷酸序列(即,例如分布在本发明突变体GLUC1.1等位基因中一个或多个所缺失、插入或替换的核苷酸3’侧翼的序列,如分布在上文所述的缺失突变、无义突变或剪接位点突变3’侧翼的序列或分布在上文所示的潜在终止密码子突变或剪接位点突变3’侧翼的序列),或与该核苷酸序列具有至少80%序列同一性的序列(识别3’侧翼序列的探针);或
-长度范围从20nt至约1000nt的寡核苷酸,包含选自特定突变体GLUC1.1等位基因的突变序列中的至少20个连续核苷酸的核苷酸序列(即,例如具有在本发明GLUC1.1基因中所插入或替换的核苷酸的序列或其互补序列)(识别突变序列的引物),或与该核苷酸序列具有至少80%序列同一性的序列(识别3’侧翼序列的探针)。
所述探针可以完全由选自侧翼序列和突变序列的所提及核苷酸序列中的核苷酸序列组成。然而,探针在其5'或3'端的核苷酸序列是较不重要的。因此,所述探针的5'或3'序列可以根据需要由选自侧翼序列或突变序列的核苷酸序列组成,但是可以由与侧翼序列或突变序列不相关的核苷酸序列组成。这类不相关的序列应当优选地不长于50个、更优选地不长于25个或甚至不长于20个或15个核苷酸。
另外,合适的探针可以包含下述核苷酸序列或由下述核苷酸序列组成,所述的核苷酸序列跨度覆盖侧翼序列与突变序列之间的交界区(即,例如,在分布于本发明突变体GLUC1.1等位基因中一个或多个所缺失、插入或替换核苷酸5’侧翼的序列与具有一个或多个所插入或替换核苷酸的序列或分布于所缺失核苷酸3’侧翼的序列之间的交界区,如在分布于本发明GLUC1.1基因中上文所述缺失突变、无义突变或剪接位点突变5’侧翼的序列与具有该无义突变或剪接位点突变的序列或分布于所述缺失突变3’侧翼的序列之间的交界区,或在分布于上文所示潜在终止密码子或剪接位点突变5’侧翼的序列与具有该潜在终止密码子突变或剪接位点突变的序列之间的交界区,条件是所提及的核苷酸序列不排他地从所述突变区或侧翼区衍生。
在实施例中描述了适合鉴定特定突变体GLUC1.1等位基因的特异性探针的示例。
对杂交至特异性探针的“突变体GLUC1.1特异性区域”的检测和/或鉴定可以按多种方式进行,例如,通过凝胶电泳后检查大小或通过基于荧光的检测方法。用于检测杂交至特异性探针的“突变体GLUC1.1特异性区域”的其他序列特异性方法也是本领域已知的。
备选地,使用其他方法,如使用PCR来筛选由快中子诱变法所产生的缺失突变体的“Delete-a-geneTM”方法(Li和Zhang,2002,FunctIntegr Genomics 2:254-258综述)、通过使用检测碱基对改变的变性高效液相色谱法(DHPLC)而鉴定EMS诱导的点突变的TILLING(基因组中定向诱导的局部损伤)法、通过异源双链体分析法(McCallum等人,2000,NatBiotech 18:455和McCallum等人2000,Plant Physiol.123,439-442)等,可以产生并鉴定包含一个或多个突变体GLUC1.1等位基因的植物或植物部分。如所提及,TILLING使用针对突变的高通量筛选法(例如使用Cel 1切割突变体-野生型DNA异源双链体并使用测序凝胶系统检测)。因此,本文中包括了TILLING鉴定包含一种或多种组织中一个或多个突变体gluc1.1等位基因的植物、种子和组织的用途以及用于产生和鉴定此类植物的方法。因此在一个实施方案中,本发明的方法包括步骤:诱变植物种子(例如EMS诱变)、汇集植物个体或DNA、PCR扩增目的区域、异源双链体形成与高通量检测、鉴定突变植物、对突变PCR产物测序。可以理解其他诱变和选择方法可以同等地用来产生此类突变植物。
作为在GLUC1.1等位基因中诱导突变的替代,可以通过本领域已知的方法鉴定天然(自发)突变等位基因。例如,可以使用ECOTILLING(Henikoff等人2004,Plant Physiology 135(2):630-6)来筛选多个植物或植物部分中天然突变体gluc1.1等位基因的存在。就上述的诱变技术而言,优选地筛选包含A和/或D基因组的棉属物种,从而随后可以将鉴定到的gluc1.1等位基因通过杂交(种间或种内杂交)和选择而导入其他棉属物种,如陆地棉。在ECOTILLING中,通过上文所述的TILLING方法学筛选育种品系或相关物种中的天然多态性,其中将植物个体或汇集物用于PCR扩增gluc1.1靶、异源双链体形成和高通量分析。随后可以选择具有所需要突变的各株植物,其中所述的突变随后可以用于育种程序中以掺入想要的突变等位基因。
可以随后对鉴定的突变等位基因测序并且序列可以与野生型等位基因比较以鉴定突变。任选地,可以通过在同种或异种宿主中表达并在酶测定法中测验该突变GLUC1.1蛋白的功能性来检验功能性。使用这种方法,可以鉴定多个突变体gluc 1.1等位基因(和包含这些等位基因中一个或多个等位基因的棉属植物)。想要的突变等位基因可以随后通过如下文进一步描述的杂交和选择方法与想要的野生型等位基因组合。最后,产生了包含想要数目的突变体gluc1.1和想要数目的野生型GLUC1.1等位基因的单株植物。
适合作为PCR引物或特异性探针用于检测特定突变体GLUC1.1等位基因的寡核苷酸也可以用来开发确定特定突变体GLUC1.1等位基因接合性状态的方法。
为确定特定突变体GLUC1.1等位基因的接合性状态,可以开发基于PCR的测定法以确定突变体和/或相应野生型GLUC1.1特异性等位基因的存在。
为确定特定突变体GLUC1.1等位基因的接合性状态,特异性识别野生型GLUC1.1等位基因的两条引物可以按如此方式设计,从而它们彼此相向并使突变区位于所述引物之间。这些引物可以是分别特异性识别5’和3’侧翼序列的引物。这套引物允许同时诊断性地PCR扩增该突变体以及相应的野生型GLUC1.1等位基因。
备选地,为确定特定突变体GLUC1.1等位基因的接合性状态,特异性识别野生型GLUC1.1等位基因的两条引物可以按如此方式设计,从而它们彼此相向并且二者之一特异性识别突变区。这些引物可以是分别特异性识别野生型GLUC1.1等位基因的5’或3’侧翼区及突变区序列的引物。这套引物,连同特异性识别该突变体GLUC1.1等位基因中突变区序列的第三引物,允许同时诊断性地PCR扩增该突变体GLUC1.1基因以及野生型GLUC1.1基因。
备选地,为确定特定突变体GLUC1.1等位基因的接合性状态,特异性识别野生型GLUC1.1等位基因的两条引物可以按如此方式设计,从而它们彼此相向并且二者之一特异性识别5’或3’侧翼区与突变区之间的交界区。这些引物可以是分别特异性识别野生型GLUC1.1等位基因的5’或3’侧翼序列和在其突变区与3’或5’侧翼区之间交界区的引物。这套引物,连同分别识别该突变体GLUC1.1等位基因的突变区与3’或5’侧翼区之间交界区的第三引物,允许同时诊断性地PCR扩增该突变体GLUC1.1基因以及野生型GLUC1.1基因。
备选地,可以通过使用特异性识别突变体和野生型GLUC1.1等位基因的备选引物组确定特定突变体GLUC1.1等位基因的接合性状态。
如果该植物对突变体GLUC1.1基因或相应野生型GLUC1.1基因为纯合,则上文所述的诊断性PCR测定法将产生对突变体或野生型GLUC1.1等位基因典型、优选在长度方面典型的单一PCR产物。如果该植物对此突变体GLUC1.1等位基因是半合子的,则两种特异性PCR产物将出现,从而反映突变体和野生型GLUC1.1等位基因均扩增。
可以通过如此方式鉴定野生型和突变体GLUC1.1特异性PCR产物,例如通过凝胶电泳或毛细管电泳后估计大小(例如,针对包含许多插入或缺失的核苷酸的突变体GLUC1.1等位基因,其造成从野生型和突变体GLUC1.1等位基因扩增的片段之间的大小不同,从而所述片段可以在凝胶上可视地分开);通过凝胶电泳或毛细管电泳后评价这两个不同片段的存在或不存在,由此突变体GLUC1.1等位基因的诊断性PCR扩增可以任选地与野生型GLUC1.1等位基因的诊断性PCR扩增各自进行;通过扩增片段的直接测序;或通过基于荧光的检测方法。
在实施例中描述了适合确定特定突变体GLUC1.1等位基因接合性的引物的示例。
备选地,为确定特定突变体GLUC1.1等位基因的接合性状态,可以开发基于杂交的测定法以确定突变体和/或相应野生型GLUC1.1特异性等位基因的存在。
为确定特定突变体GLUC1.1等位基因的接合性状态,特异性识别野生型GLUC1.1等位基因的两个特异性探针可以按如此方式设计,从而每个探针特异性识别GLUC1.1野生型等位基因内的序列并且突变区位于该探针所识别的序列之间。这些探针可以是分别特异性识别5’和3’侧翼序列的探针。使用这些探针之一、优选地使用这两个探针,允许同时诊断性地杂交该突变体以及相应的野生型GLUC1.1等位基因。
备选地,为确定特定突变体GLUC1.1等位基因的接合性状态,特异性识别野生型GLUC1.1等位基因的两个特异性探针可以按如此方式设计,从而这两个探针之一特异性识别GLUC1.1野生型等位基因内该突变区上游或下游、优选地该突变区上游的序列并且这两个探针之一特异性识别该突变区。这些探针可以是分别特异性识别野生型GLUC1.1等位基因5’或3’侧翼区(优选地5'侧翼区)和突变区的序列的探针。使用这些探针之一、优选地使用这两个探针,任选地连同特异性识别突变体GLUC1.1等位基因中突变区序列的第三探针,允许诊断性地杂交该突变体以及野生型GLUC1.1基因。
备选地,为确定特定突变体GLUC1.1等位基因的接合性状态,识别野生型GLUC1.1等位基因的特异性探针可以按如此方式设计,从而该探针特异性识别野生型GLUC1.1等位基因的5’或3’侧翼区(优选地5'侧翼区)与突变区之间的交界区。该探针,任选地连同特异性识别突变体GLUC1.1等位基因的5’或3’侧翼区(优选地5'侧翼区)与突变区之间交界区的第二探针,允许诊断性地杂交该突变体以及野生型GLUC1.1基因。
备选地,可以通过使用特异性识别突变体和野生型GLUC1.1等位基因的备选探针组确定特定突变体GLUC1.1等位基因的接合性状态。
如果该植物对突变体GLUC1.1基因或相应野生型GLUC1.1基因为纯合,则上文所述的诊断性杂交测定法将产生对突变体或野生型GLUC1.1等位基因典型、优选在长度方面典型的单一特异性杂交产物,如一个或多个杂交DNA(限制性)片段。如果该植物对此突变体GLUC1.1等位基因是半合子的,则两种特异性杂交产物将出现,从而反映突变体和野生型GLUC1.1等位基因均杂交。
可以通过如此方式鉴定野生型和突变体GLUC1.1特异性杂交产物,例如通过凝胶电泳或毛细管电泳后估计大小(例如,针对包含许多插入或缺失的核苷酸的突变体GLUC1.1等位基因,其造成来自野生型和突变体GLUC1.1等位基因的杂交DNA(限制性)片段之间的大小不同,从而所述片段可以在凝胶上可视地分开);通过凝胶电泳或毛细管电泳后评价这两个不同特异性杂交产物的存在或不存在,由此突变体GLUC1.1等位基因的诊断性杂交可以任选地与野生型GLUC1.1等位基因的诊断性杂交扩增各自进行;通过杂交DNA(限制性)片段的直接测序;或通过基于荧光的检测方法。
在实施例中描述了适合确定特定突变体GLUC1.1等位基因接合性的探针的示例。
另外,使用本文中提供的特定突变体GLUC1.1等位基因特定的序列信息,也可以开发专用于特定突变体GLUC1.1等位基因的检测方法,其不同于基于PCR或杂交的扩增方法。这类备选的检测方法包括基于侵入性切割特定核酸结构的线性信号扩增检测方法,也称作InvaderTM技术(如在通过引用方式并入本文的例如美国专利5,985,557“核酸的侵入性切割”,美国专利6,001,567“通过入侵者定向切割作用检测核酸序列”中描述);基于RT-PCR的检测方法,如Taqman;或其他检测方法,如SNPlex。
在本发明的另一个方面,提供试剂盒。如本文中所用,“试剂盒”指一组试剂,它们旨在用于实施本发明的方法、更具体地是鉴定生物学样品中的特定突变体GLUC1.1等位基因或确定包含特定突变体GLUC1.1等位基因的植物材料的接合性状态。更具体地,本发明试剂盒的一个优选实施方案包含如上所述的用于鉴定特定突变体GLUC1.1等位基因的至少两条特异性引物或用于确定接合性状态的至少两条或三条特异性引物。任选地,该试剂盒可以还包含在PCR鉴定方案中本文所述的任何其他试剂。备选地,根据本发明的另一个实施方案,该试剂盒可以包含用于鉴定特定突变体GLUC1.1等位基因的至少一个特异性探针,其与生物学样品的核酸特异性杂交以鉴定如上文所述的特定突变体GLUC1.1等位基因的存在,或用于确定接合性状态的至少两个或三个特异性探针。任选地,该试剂盒还可以包含使用所述特异性探针鉴定生物学样品中特定突变体GLUC1.1等位基因的任何其他试剂(如但不限于杂交缓冲液、标记物)。
本发明的试剂盒可以用于以下目的:质量控制(例如,种子批的纯度)、检测特定突变体GLUC1.1等位基因在植物材料或包含植物材料或从该植物材料衍生的材料(如但不限于棉籽、原棉、棉包、纱线、织物、服装等)中的存在或不存在,并且可以为所述目的专门调整该试剂盒的组分。
如本文中所用的术语“引物”包括能够引发新生核酸在模板依赖性过程如PCR中合成的任意核酸。一般而言,引物是具有10至30个核苷酸的寡核苷酸,但是可以使用更长的序列。可以提供双链形式的引物,尽管单链形式是优选的。探针可以作为引物使用,不过它设计旨在与靶DNA或RNA结合并且无需用于扩增过程中。
当谈及特异性引物时,如本文中所用的术语“识别”指以下事实:特异性引物在本发明方法中所述的条件(如PCR鉴定方案的条件)下与特定突变体GLUC1.1等位基因中的核酸序列特异性杂交,由此特异性通过存在阳性对照和阴性对照而确定。
当谈及特异性探针时,本文中所用的术语“杂交”指以下事实:该探针在标准严格条件下与特定突变体GLUC1.1等位基因的核酸序列中的特定区域结合。如本文中所用,标准严格条件指用于本文中所述杂交的条件或指如Sambrook等人,1989(Molecular Cloning:A LaboratoryManual,2版,Cold Spring Harbour Laboratory Press,NY)所述的常规杂交条件,此常规杂交条件例如可以包括以下步骤:1)将植物基因组DNA片段或BAC文库DNA固定在滤膜上,2)此滤膜在65℃于6×SSC、5×Denhardt试剂、0.5%SDS和20μg/ml变性载体DNA中预杂交1至2小时,3)添加已经被标记的杂交探针,4)孵育16至24小时,5)将滤膜在68℃于6×SSC 0.1SDS中洗涤一次持续30分钟,6)将滤膜在68℃于2×SSC,0.1%SDS中洗涤三次(在30ml中洗涤2次持续30分钟和在500ml中洗涤1次持续10分钟),和7)使该滤膜在-70℃暴露于X射线4至48小时。
如本文中所用,"生物学样品"是植物、植物材料或包含植物材料的产品的样品。术语“植物”意图包括处于任何成熟期的棉属植物组织以及取自或衍生自任意如此植物的任何细胞、组织或器官,包括但不限于任何纤维、种子、叶、茎、花、根、单个细胞、配子、细胞培养物、组织培养物或原生质体。如本文中所用,“植物材料”指从植物获得或衍生的材料。包含植物材料的产品涉及使用植物材料产生或可以被植物材料污染的食品、饲料或其他产品,如原棉、棉包、纱线、织物、服装等。在本发明的上下文中,可以理解对此类生物学样品检测特定突变体GLUC1.1等位基因特异的核酸的存在,所述存在暗示所述样品中核酸的存在。因此本文中所指的用于鉴定生物学样品中特定突变体GLUC1.1等位基因的方法涉及鉴定生物学样品中包含该特定突变体GLUC1.1等位基因的核酸。
本发明也涉及一种棉属植物中的一个或多个特定突变体GLUC1.1等位基因转移至另一种棉属植物,涉及在一个植物中组合多个特异GLUC1.1等位基因,涉及包含一个或多个特定突变体GLUC1.1等位基因的植物、从这些植物获得的后代并涉及从这些植物衍生的植物细胞或植物材料。
因此,在本发明的一个实施方案中,提供了用于将无功能表达的GLUC1.1等位基因从一种棉属植物转移至另一种棉属植物的方法,包括以下步骤:
(a)将包含无功能表达的如上所述GLUC1.1等位基因的棉属植物与第二棉属植物杂交,
(b)收集来自该杂交的F1杂交种子,
(c)任选地,回交从F1种子衍生的F1植物以产生一个或多个世代(x),收集来自所述杂交的BCx种子,并在每个世代中鉴定从BCx种子衍生的包含无功能表达的如上所述GLUC1.1等位基因的BCx植物,
(d)自交从F1或BCx种子衍生的F1或BCx植物,
(e)收集来自所述自交的F1S1或BCx S1种子,
(f)鉴定从F1S1或BCx S1种子衍生的包含无功能表达的如上所述GLUC1.1等位基因的F1S1或BCx S1植物。
在本发明的另一个实施方案中,提供了用于在一种棉属植物中合并至少两个无功能表达的GLUC1.1等位基因的方法,包括以下步骤:
(a)如上所述,将无功能表达的GLUC1.1等位基因从一种棉属植物转移至另一种棉属植物,
(b)重复步骤(a)直至所希望数目和/或类型的无功能表达的GLUC1.1等位基因在第二植物中被合并。
在本发明的又一个实施方案中,提供了用于改变产纤维植物(如棉属植物)中纤维的胼胝质含量的方法,包括步骤:
(a)消除在纤维发育的纤维强度建立阶段期间功能性表达的至少一个纤维特异性GLUC基因的至少一个等位基因的功能性表达,
(b)鉴定产生纤维的植物,其中与未消除该GLUC基因功能性表达的相应植物的纤维的胼胝质含量相比,所述植物的胼胝质含量增加。
仍在本发明的另一个实施方案中,提供了用于改变产纤维植物(如棉属植物)中纤维特性、尤其提高纤维强度的方法,包括步骤:
(c)消除在纤维发育的纤维强度建立阶段期间功能性表达的至少一个纤维特异性GLUC基因的至少一个等位基因的功能性表达,
(d)鉴定产生纤维的植物,其中与未消除该GLUC基因功能性表达的相应植物的纤维的强度相比,所述植物的纤维强度提高。
在本发明的另一个方面,提供了具有提高的纤维强度的植物纤维,其从本发明的产纤维植物、尤其如本文中所提供陆地棉植物的产纤维植物衍生,还从其他棉属物种衍生。例如,其中在纤维发育的纤维强度建立阶段期间功能性表达的至少一个纤维特异性GLUC基因(如GLUC1.1A和/或GLUC1.1D基因)的表达可以被消除的棉属物种,例如毛棉、黄褐棉、草棉或雷蒙德氏棉。
本发明中也包括本发明纤维的用途,例如在原棉、棉包、纱线、织物、服装等生产中的用途。
本发明中也包括其他应用,如将具有特定胼胝质含量和/或特定改良强度的本发明纤维与具有较低胼胝质含量和/或较少纤维的其他纤维混合以增加例如棉包、纱线、织物、服装等中的平均胼胝质含量和/或纤维强度;从而使之更适合特定应用,如但不限于产生生物柴油、更坚韧纺织品等也包括在本发明中。
应当清楚,每逢RNA分子的核苷酸序列通过参照相应DNA分子的核苷酸序列定义时,该核苷酸序列中的胸腺嘧啶(T)都应当被替换为尿嘧啶(U)。是否指DNA分子或RNA分子将从本申请的上下文中显而易见。
可以理解当提及单数形式的某个词汇(例如一株植物或一个根)时,本文中也包括复数形式(例如多株植物、多个根)。因此,借助非限定冠词"a(一个)"或"an(一种)"对某要素的称谓不排除存在多于一个该要素的可能,除非上下文清楚地要求应当存在一个所述要素且仅存在一个该要素。非限定冠词"a"或"an"因此通常意指"至少一个"。
如本文中所用,“包含”应当解释为:特指如所提及的所述特征、整数、步骤或组分存在,但是并不排除一个或多个特征、整数、步骤或组分或其组的存在或添加。因此,例如,包含一个核苷酸序列或氨基酸序列的核酸或蛋白质可以包含比实际所引述更多的核苷酸或氨基酸,即,包含于更大的核酸或蛋白质中。包含以功能方式或结构方式定义的DNA区域的嵌合基因可以包含额外的DNA区域等。包含某个性状的植物因此可以包含额外的性状等。
以下非限制性实施例描述了鉴定棉花中染色体A05上的纤维强度基因座和表征位于强度QTL的1-LOD支撑间隔中的GLUC1.1基因。除非在实施例中另外指出,否则全部重组DNA技术按照Sambrook等人(1989)Molecular Cloning:A Laboratory Manual,2版,Cold SpringHarbor Laboratory Press,NY和Ausubel等人(1994)Current Protocols inMolecular Biology,Current Protocols,USA的第1和2卷中所述的标准方案实施。在BIOS Scientific Publications Ltd(UK)和Blackwell ScientificPublications,UK联合出版的Plant Molecular Biology Labfax(1993)(R.D.D.Croy著)中描述了用于植物分子操作的标准材料与方法。
在说明书和实施例通篇范围内,参照序列表中所示的以下序列:
SEQ ID NO:1:来自A-亚基因组特异性陆地棉栽培品种Fiber Max966中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:2:由SEQ ID NO:1编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:3:来自A-亚基因组特异性陆地棉栽培品种Fiber Max966中内切-1,3-β-葡聚糖酶基因的扩增的cDNA片段
SEQ ID NO:4:由SEQ ID NO:3编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:5:来自A-亚基因组特异性海岛棉栽培品种PimaS7中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:6:由SEQ ID NO:5编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:7:来自D-亚基因组特异性陆地棉栽培品种Fiber Max966中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:8:由SEQ ID NO:7编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:9:来自D-亚基因组特异性陆地棉栽培品种Fiber Max966中内切-1,3-β-葡聚糖酶基因的扩增的cDNA片段
SEQ ID NO:10:由SEQ ID NO:9编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:11:来自D-亚基因组特异性海岛棉栽培品种PimaS7中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:12:由SEQ ID NO:11编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:13:来自D-亚基因组特异性海岛棉栽培品种PimaS7中内切-1,3-β-葡聚糖酶基因的扩增的cDNA片段
SEQ ID NO:14:由SEQ ID NO:13编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:15:来自A-亚基因组特异性毛棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:16:由SEQ ID NO:15编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:17:来自A-亚基因组特异性达尔文棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:18:由SEQ ID NO:17编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:19:来自A-亚基因组特异性黄褐棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:20:由SEQ ID NO:19编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:21:来自A-亚基因组特异性树棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:22:由SEQ ID NO:21编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:23:来自A-亚基因组特异性草棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:24:由SEQ ID NO:23编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:25:来自D-亚基因组特异性毛棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:26:由SEQ ID NO:25编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:27:来自D-亚基因组特异性达尔文棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:28:由SEQ ID NO:27编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:29:来自D-亚基因组特异性黄褐棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:30:由SEQ ID NO:29编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:31:来自D-亚基因组特异性雷蒙德氏棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:32:由SEQ ID NO:31编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID No 33:用于扩增内切-1,3-β-葡聚糖酶基因组片段的正向引物SE077
SEQ ID No 34:用于扩增内切-1,3-β-葡聚糖酶基因组片段的反向引物SE078
SEQ ID No 35:用于扩增内切-1,3-β-葡聚糖酶基因组片段的正向引物SE002
SEQ ID No 36:用于扩增内切-1,3-β-葡聚糖酶基因组片段的反向引物SE003
SEQ ID NO:37:用于扩增内切-1,3-β-葡聚糖酶基因组片段、尤其用于区分多态性位点GLUC1.1A-SNP2的不同变体的正向引物p1.3GlucaAf
SEQ ID NO:38:用于扩增内切-1,3-β-葡聚糖酶基因组片段、尤其用于区分多态性位点GLUC1.1A-SNP2的不同变体的反向引物p1.3GlucaAr
SEQ ID NO:39:用于检测多态性位点GLUC1.1A-SNP3的海岛棉变体的探针TM249-GCM1
SEQ ID NO:40:用于检测多态性位点GLUC1.1A-SNP3的陆地棉变体的探针TM249-GCV1
SEQ ID NO:41:用于扩增内切-1,3-β-葡聚糖酶基因组片段、尤其用于区分多态性位点GLUC1.1A-SNP3的不同变体的正向引物TM249-GCF
SEQ ID NO:42:用于扩增内切-1,3-β-葡聚糖酶基因组片段、尤其用于区分多态性位点GLUC1.1A-SNP3的不同变体的反向引物TM249-GCR
SEQ ID NO:43:扩增与标记物P5M50-M126.7相对应的基因组DNA片段、尤其用于区分标记物P5M50-M126.7的不同变体的AFLP引物P5
SEQ ID NO:44:扩增与标记物P5M50-M126.7相对应的基因组DNA片段、尤其用于区分标记物P5M50-M126.7的不同变体的AFLP引物M50
SEQ ID NO:45:扩增与标记物NAU861相对应的基因组DNA片段、尤其用于区分标记物NAU861的不同变体的正向SSR引物
SEQ ID NO:46:扩增与标记物NAU861相对应的基因组DNA片段、尤其用于区分标记物NAU861的不同变体的反向SSR引物
SEQ ID NO:47:扩增与标记物CIR401相对应的基因组DNA片段、尤其用于区分标记物CIR401的不同变体的正向SSR引物
SEQ ID NO:48:扩增与标记物CIR401相对应的基因组DNA片段、尤其用于区分标记物CIR401的不同变体的反向SSR引物
SEQ ID NO:49:扩增与标记物BNL3992相对应的基因组DNA片段、尤其用于区分标记物BNL3992的不同变体的正向SSR引物
SEQ ID NO:50:扩增与标记物BNL3992相对应的基因组DNA片段、尤其用于区分标记物BNL3992的不同变体的反向SSR引物
SEQ ID NO:51:扩增与标记物CIR280相对应的基因组DNA片段、尤其用于区分标记物CIR280的不同变体的正向SSR引物
SEQ ID NO:52:扩增与标记物CIR280相对应的基因组DNA片段、尤其用于区分标记物CIR280的不同变体的反向SSR引物
SEQ ID NO:53:跨度覆盖陆地棉中GLUC1.1A基因的165250bpsDNA片段的DNA序列
SEQ ID NO:54:来自A-亚基因组特异性海岛棉栽培品种PimaS7中内切-1,3-β-葡聚糖酶基因的扩增的cDNA片段
SEQ ID NO:55:由SEQ ID NO:54编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:56:来自A-亚基因组特异性达尔文棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:57:由SEQ ID NO:56编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:58:来自D-亚基因组特异性达尔文棉中内切-1,3-β-葡聚糖酶基因的扩增的基因组DNA片段
SEQ ID NO:59:由SEQ ID NO:58编码的内切-1,3-β-葡聚糖酶蛋白
SEQ ID NO:60:用于检测多态性位点GLUC1.1A-SNP5的海岛棉变体的探针
SEQ ID NO:61:用于检测多态性位点GLUC1.1A-SNP5的陆地棉变体的探针
SEQ ID NO:62:用于扩增内切-1,3-β-葡聚糖酶基因组片段、尤其用于区分多态性位点GLUC1.1A-SNP5的不同变体的正向引物
SEQ ID NO:63:用于扩增内切-1,3-β-葡聚糖酶基因组片段、尤其用于区分多态性位点GLUC1.1A-SNP5的不同变体的反向引物
SEQ ID No 64:用于扩增内切-1,3-β-葡聚糖酶基因组片段的正向引物G1.1-SGA-F
SEQ ID No 65:用于扩增内切-1,3-β-葡聚糖酶基因组片段的正向引物G1.1-f1-F1
实施例
实施例1:鉴定和表征棉花染色体A05上与纤维强度连锁的数量性状基因座(QTL)
1.1发现QTL
根据标准流程发现与棉花纤维特性相关的数量性状基因座。简而言之,选择具有目的纤维表型的亲本棉花植物系,产生分离群体和确定特定染色体区域的存在对可度量棉花纤维表型的影响。亲本系是陆地棉栽培品种FM966(用作初始杂交中的母本;下文缩写为“FM”;特别以其高纤维产量著称,但是与海岛棉品种相比纤维品质较低)和海岛棉栽培品种PimaS7(用作初始杂交中的父本;下文缩写为“Pima”;特别以其优异纤维品质著称,但是与陆地棉品种相比纤维产量较低)。在温室和在田地中产生和评估具有两个亲本系的回交群。
1.2评价从针对海岛棉Pima S7亲本系第一回交衍生的植物(“PimaBC1F1群体”)
最初在具有119株个体的BC1F1作图群体[(FM x Pima)x Pima;回交亲本用作父本]中检测到染色体A05上纤维强度的QTL。在温室中标准培育条件下培育该群体。基于来自119株个体的扩增片段长度多态性PCR(AFLP-PCR或AFLP)标记物数据和简单序列重复(SSR或微卫星)标记物数据,使用JoinMap软件(绘图第8和第13版;Stam,1993,Plant J 3:739-744),构建具有约800个标记物的基因组尺度遗传图。通过大容量棉花测试仪(HVI)(美国农业部,农业销售服务部)对来自119株单株植物的88株植物中的样品测量纤维强度。使用MapQTL软件(Van Ooijen和Maliepaard,1996,植物基因组IV摘要,互联网站点:http://www.intl-pag.org)开展QTL作图。最终QTL数据基于受限的多重QTL作图(rMQM;Jansen,1993,Genetics 135:205-211;Jansen和Stam,1994,Genetics 136:1447-1455)分析。
在染色体A05上检测到与纤维强度相关的清晰QTL(也称作“强度基因座”或“Stren基因座”)。该QTL具有一个尖的LOD(奇数对数)计分峰,最大值LOD 4.92在距离染色体A05顶端98.61cM的位置处,1-LOD支撑间隔14cM(从91.515cM至105.61cM)。该1-LOD QTL支撑间隔旁侧有85.515cM处的一个AFLP标记物P5M50-M126.7,和109.13cM处的一个微卫星标记物CIR401c。在该QTL支撑间隔内部一个微卫星标记物NAU861(94.61cM)和GLUC1.1基因(94.602cM)以距离LOD最大值位置近地(约4cM)存在(表6)。上表2中显示了用来区分具有所述标记物的陆地棉与海岛棉等位基因的引物对。
表6:与FM和Pima BC1F1群体中纤维强度基因座连锁的标记物在染色体A05上的估计位置(根据JoinMap第8和第13版)
如上文所述,使用如13表中所示的SNP标记物GLUC1.1A-SNP2和如下文实施例6中所述的引物p1.3GlucaAf(SEQ ID NO:37)和p1.3GlucaAr(SEQ ID NO:38),将GLUC1.1A基因绘图绘在强度基因座的支撑间隔内(LOD 4.431)。对海岛棉Pima S7的GLUC1.1A等位基因(PimaGLUC1.1A等位基因或Gbgluc1.1A)纯合的植物与Gbgluc1.1A杂合的植物相比具有高9.7%的纤维强度(Ho/He比为109.7%)。该QTL解释了此群体中17.8%的纤维强度变异。
1.3评价从针对陆地棉FM966亲本系第一回交衍生的植物(“FMBC1F1群体”)
QTL作图也在具有130株个体的互补性BC1F1群体[(FM xPima)x FM;回交亲本用作父本]中进行。对来自130株单株植物的94株植物中的样品测量纤维强度。在这个FM BC1F1群体中没有检测到在旁侧具有标记物P5M50-M126.7和CIR401的区域中的纤维强度QTL(最大LOD=0.42,即低于临界阈值LOD=3)。然而,与对陆地棉FM966的GLUC1.1A等位基因纯合(FM GLUC1.1A等位基因或GhGLUC1.1A)的植物相比,对该群体的海岛棉Pima S7的GLUC1.1A等位基因杂合的植物在技术上没有显出高约1至约2%的纤维强度。连同来自Pima BC1F1群体的数据,这表明海岛棉Pima S7的GLUC1.1A等位基因提供了优异纤维强度。
1.4评价从针对陆地棉FM966亲本系第四回交衍生的植物(“FMBC4F1群体”)
为了改善陆地棉中、尤其陆地棉栽培品种FM966中的纤维品质,通过单种子后代并在4个世代(FM BC4F1群体)期间不做选择,将海岛棉亲本系的基因组片段回交至FM BC1F1群体。预期携带候选强度基因座的染色体A05的Pima区域存在于许多的这些渐渗品系中。
在温室中的标准培育条件下培育源自75株FM BC3F1植物的总共219株FM BC4F1植物(每个品系平均3株姊妹植物)。将全部植物针对450个SSR标记物作基因分型并且来自全部植物的纤维的强度由HVI测量(见上文)。在强度基因座的区域中,14株和23株FM BC4F1植物分别对NAU861和GLUC1.1A标记物是杂合的,而分别有196株和194株植物对NAU861标记物和陆地棉FM966的GLUC1.1A等位基因纯合。
表7汇总了处于杂合状态的不同Pima标记物等位基因与处于纯合状态的同等FM标记物等位基因在FM BC1F1和FM BC4F1群体中存在(He/Ho比)对纤维强度的影响。显示为CIRx、NAUx、JESPRx和BNLx的标记物是公开可获得的标记物(见在http://www.cottonmarker.org/的棉花微卫星数据库)。显示为‘引物组合X和Y扩增的片段大小’的标记物是AFLP标记物(Vos等人,1995,NAR 23:4407-4414)。
在FM BC1F1和FM BC4F1群体中均观察到因Pima GLUC1.1A等位基因的存在对纤维强度的相似影响(即与对FM GLUC1.1A等位基因纯合的植物相比,对Pima GLUC1.1A等位基因杂合的植物显示约1至约2%更高的纤维强度)。
表7:与FM BC1F1和FM BC4F1群体中纤维强度基因座连锁的标记物的不同等位基因组合(He相对于Ho FM)在染色体A05上的估计位置(根据JoinMap第8和第13版)和对纤维强度的影响
1.5评价从针对陆地棉FM966亲本系第四回交的F2世代衍生的植物(“FM BC4F2群体”)
作为后续步骤,在密西西比州在夏天大田条件下在BC4F2家族中进行QTL验证。FM BC4F2植物分离为3个遗传组:对FM标记物等位基因纯合的植物、对Pima标记物等位基因纯合的植物和对FM及Pima标记物等位基因杂合的植物。在大多数情况下,对每个品系75-80株植物进行基因分型并分析来自约50株单株植物的纤维样品。这允许检验杂合和纯合条件下FM或Pima标记物等位基因(和预测的连锁基因)的影响。
田间试验包括对携带来自Pima S7的强度基因座的染色体A05区域的多个部分分离的4个FM BC4F2家系(称为第6、10、20和94品系)。使用6个标记物:BNL0542、BNL3995、CIR139a、NAU861、GLUC1.1A、BNL3992检验分离。
第6品系的全部BC4F2植物对具有所检验标记物的FM等位基因纯合。第94品系仅产生38株FM BC4F2植物和这些植物中仅10株产生足够用于单株植物分析的纤维。其余两个品系第10和第20品系产生大量的植物并具有优良的标记物分离。第10品系含有Pima染色体A05的一个区段,其携带以GLUC1.1基因为中心的强度基因座。第二种品系(第20品系)含有Pima染色体A05的一个区段,该区段被移动至强度基因座支撑区的底端。
在第10品系中,证实了以下预期:对Pima GLUC1.1A等位基因纯合的植物产生更强的纤维。对Pima GLUC1.1A等位基因纯合的植物的纤维强度是平均2.5克/特,高于对FM GLUC1.1A等位基因纯合的植物的纤维强度(35.5g/tex相对于33.0g/tex,或纤维强度提高7.5%)。对两个标记物NAU861和BNL3992观察到相似结果,所述标记物均与GLUC1.1A在两侧中任意侧紧密连锁。纯合FM植物、纯合Pima植物和杂合植物之间纤维强度的差异在Anova中是不显著的,但是它们在纯合FM植物和其余两个组之间在成对t-检验中是显著的。
在第20品系中,具有标记物NAU861和BNL3992的Pima等位基因不提供更强的纤维。该品系对QTL支撑间隔尾部中的Pima染色体A05区域的一个较低部分分离。该品系也不含有GLUC1.1A基因的Pima等位基因。
表8中的数据强化了第10品系在纤维强度的“标记物性状表现”(MTP,计算为两个标记物组(HoFM-HoPima)平均性状表现的差异与这两个标记物组中性状表现的平均标准差之比)方面的结果。显示了对带有标记物NAU861、GLUC1.1A和BNL3992的Pima等位基因纯合的植物比对带有这些标记物的FM等位基因纯合的植物(负MTP)具有更强的纤维。然而,表现的差异小于平均标准差(MTP值在0与-1之间)。
因此,田间试验数据提供了支持以下观点的证据:染色体A05上存在与纤维强度相关的QTL,所述QTL靠近GLUC1.1A基因或与之叠合,与来自海岛棉PimaS7的优异等位基因靠近或叠合。
因FM BC4F2群体中植物数目小,不可能对该QTL位置精确作图。在这个方面,可以指出:具有下述标记物(BNL3992)的Pima等位基因也随衍生自PimaS7的增强的纤维强度分离,其中所述标记物包括于第10品系中渐渗的Pima片段中,但是位于Pima BC1F1图上原始支撑间隔之外的位置。这可以由以下事实解释:在原始BC1群体中,已发生了足够多的重组来将这种标记物置于该QTL支撑间隔外侧,而在(较小的)BC4F2群体中,它更高频率地与QTL因果基因保持连锁。
表8:与FM BC4F2植物品系中纤维强度基因座连锁的标记物的不同等位基因组合(HH FM与HH Pima)在染色体A05上的估计位置和对纤维强度(显示为MTP)的影响
第2列罗列了染色体A05上与强度基因座连锁的标记物。显示为CIRx、NAUx和BNLx的标记物是公开可获得的标记物(见在http://www.cottonmarker.org/的棉花微卫星数据库)。显示为‘引物组合X和Y扩增的片段大小’的标记物是AFLP标记物(Vos等人,1995,NAR23:4407-4414)。第1列标出了使用JoinMap软件绘图第8版所构建FMBC1F1作图群体的遗传图(以cM表示)上它们的图位置。对BC4F1植物产生的BC4F2家系6,10,20和94标出所述标记物的图解基因型:a=纯合FM966,h=杂合。使用标以*的标记物的标记物数据研究该图解基因型中‘h’区域的分离。对于针对FM966标记物纯合的植物组(基因型“HH FM”)和针对Pima标记物纯合的植物组(基因型“HH Pima”),比较纤维强度的平均表型表现。标记物性状表现(MTP)表述为((平均表型HH FM-平均表型HH Pima)/0.5x(SD HH FM+SD HH Pima))。正MTP意指FM表现高于Pima表现。负MTP意指Pima表现高于FM表现。高于1的MTP和低于-1的MTP意指超过平均标准差(SD)的Δ表现。纤维强度特性的数据是基于60株植物当中的纯合分离。
实施例2:鉴定和表征与棉花染色体A05上纤维强度基因座连锁的葡聚糖酶基因
2.1表征位于强度基因座的支撑间隔中的GLUC1.1A基因
如实施例1.2中所述,将GLUC1.1基因绘图于染色体A05上对纤维强度预测的QTL的支撑间隔内,这表明GLUC1.1A候选基因可能是纤维强度的因果基因。如实施例1中还描述,该优异等位基因来自Pima亲本系,而非来自FM亲本系。
基于WO2008/083969中所述的GhGLUC1.1A和D核苷酸序列(分别是SEQ ID NO:1和7),设计2条引物(正向引物SE077(SEQ ID NO:33)和反向引物SE078(SEQ ID NO:34))以扩增海岛棉的基因组DNA片段(反应混合物和PCR条件如实施例4中所述)。衍生出两个基因组DNA序列:针对GbGLUC1.1A的一个序列(SEQ ID NO:5)和针对GbGLUC1.1D的一个序列(SEQ ID NO:11)。
也使用这2条引物(正向引物SE077(SEQ ID NO:33)和反向引物SE078(SEQ ID NO:34))以从源自陆地棉和海岛棉的cDNA文库扩增GLUC1.1A和GLUC1.1D cDNA(反应混合物和PCR条件如实施例4中所述)。衍生了GhGLUC1.1A(SEQ ID NO:3)、GhGLUC1.1D(SEQ ID NO:9)和GbGLUC1.1D(SEQ ID NO:13)的cDNA序列。使用正向引物G1.1-SGA-F(SEQ ID NO:64)和反向引物SE078(SEQ ID NO:34)以从源自海岛棉的cDNA文库扩增GLUC1.1A cDNA。衍生了GbGLUC1.1A的cDNA序列(SEQ ID NO:54)。
来自陆地棉和海岛棉的A和D亚基因组特异性GLUC1.1基因的基因组和cDNA序列的比对表明:与来自陆地棉的GLUC1.1A和D基因和来自海岛棉的GLUC1.1D基因相比,来自海岛棉的GLUC1.1A基因显示一个c至t核苷酸替换(在SEQ ID NO:5的第712位置),所述的核苷酸替换产生一个推定的提前终止密码子(cga成为tga)(图1),其中预测所述的提前终止密码子导致海岛棉中截短的GLUC1.1A蛋白产生(图2)。与陆地棉直向同源物相比,该海岛棉GLUC1.1A氨基酸序列缺少GH17标签(图2)。
2.2表征来自不同棉属物种的GLUC1.1A蛋白
使用来自Sybyl7.3的FUGUETM和ORCHESTRARTM技术,基于隶属葡糖苷酶羟化酶GH17家族的大麦1,3-1,4-β-葡聚糖酶(蛋白质数据库中的1aq0)的X-射线结构(图3,左)的蛋白质建模显示:海岛棉GLUC1.1A蛋白(图3b,右)丢失(位于氨基酸及其位置编号所示的区域内、在1aq0的蛋白质模型的左上半部显示并在Müller等人,1998,J Biol Chem 273:3438-3446中描述的)活性中心与底物结合裂隙,其中发现所述的活性中心与底物结合裂隙存在于陆地棉GLUC1.1A和D蛋白中和海岛棉GLUC1.1D蛋白中(图3a,右)。因此预测海岛棉的GLUC1.1A蛋白是无活性的。
2.3表征跨度覆盖来自不同棉属物种的GLUC1.1等位基因的基因组区域
使用454DNA测序法(454Life Sciences)分别实施跨度覆盖陆地棉GLUC1.1A(SEQ ID NO:53)和GLUC1.1D等位基因(未显示)的约165kb和136kb区域的DNA测序:首先使用GLUC1.1基因的部分作为针对FMBAC文库的探针,通过杂交鉴定了具有跨度覆盖每种GhGLUC1.1等位基因的基因组DNA的BAC克隆。将诸多BAC克隆分离,通过PCR证实并归类成等位基因。将选择的BAC克隆测序以定义邻近基因,这通过生物信息学注释软件程序和EST检索而容易实施(见图9)。BAC序列数据也鉴定了位于相邻基因(HAT)上的额外分子标记物(CIR280)(对于FM BC1群体中染色体A05上估计的位置,见表6和表7)。
实施例3:分析葡聚糖酶在纤维强度中的生物学作用
3.1确定无活性GbGLUC1.1A酶与纤维强度之间的联系
为确定无活性GbGLUC1.1A酶与纤维强度之间是否存在联系,通过向源自(包含据预测无活性的GLUC1.1A的)海岛棉的纤维以及源自(包含据预测有活性的GLUC1.1A的)陆地棉的纤维外源地添加1,3-β-葡聚糖酶来分析葡聚糖酶活性对纤维强度的影响。如果无活性GbGLUC1.1A酶与纤维强度之间确实存在联系,则预期海岛棉纤维的强度会显著降低。
各根纤维用来自罗曼蜗牛(Helix pomatia)(Fluka,49103)的β-1,3-D-葡聚糖酶处理。10mg纤维在10mM乙酸钠缓冲液(pH 5)中孵育并且添加500μl葡聚糖酶(1mg/ml)。这些纤维在真空下浸润10分钟并在37℃孵育过夜。使用Favimat R装置(Textechno)在单根纤维拉伸试验中以8mm量规长度(gauge length)和速度4mm/分钟测量各根棉花纤维的强度。测量的强度以力(cN)记录。结果经统计方式分析并呈现于表9和图4中。
表9:来自不同陆地棉和海岛棉品种的未处理纤维(无GLUC)和用葡聚糖酶(GLUC)处理的纤维的胼胝质含量(由苯胺蓝着染纤维的绿色/蓝色荧光比(绿色/蓝色比)所度量)和强度(由断裂力(cN)所度量)
对葡聚糖酶处理过的Pima纤维观察到强度的显著降低并且对来自多个陆地棉品系的纤维观察到强度较不显著但仍可察觉地降低。在这个方面,重要的是注意到,次生细胞壁形成的程度和纤维素含量对陆地棉中的纤维强度有贡献,而更强韧的海岛棉纤维具有比那些陆地棉纤维更低的纤维素含量。互补实验因此指出Gbgluc1.1A等位基因在纤维强度基因座内的存在对Pima纤维的著名强度有贡献。
3.2确定1,3-β-D-葡聚糖含量与纤维强度之间的联系
1,3-β-D-葡聚糖,包括称作胼胝质的长链1,3-β-D-葡聚糖,是1,3-β-葡聚糖酶的底物。苯胺蓝是一种专用于1,3-β-葡聚糖的染料。这种染料用来确定:用1,3-β-葡聚糖酶处理并显示降低的纤维强度的纤维是否也在棉花纤维壁中显示降低水平的1,3-β-葡聚糖底物。
使用0.067M K2HPO4(pH 9)中的0.05%苯胺蓝溶液。纤维在真空下孵育15分钟。在紫外线下,胼胝质沉积物呈现强烈的黄绿色荧光。分析图像并将绿色/蓝色比用作胼胝质的度量。计算3幅图像的平均值。
如表9和图5中所示,这项染色技术显示用该葡聚糖酶处理的棉花纤维具有较低水平的1,3-β-葡聚糖和升高的1,3-β-葡聚糖水平与增强的纤维强度关联。
3.3葡聚糖酶处理对纤维强度和胼胝质含量影响的统计分析
统计地分析处理(未处理的减去处理的)的影响。结果呈现于表10中。
表10:葡聚糖酶处理(未处理的减去处理的)对源自不同陆地棉和海岛棉品种的胼胝质含量和纤维强度影响的统计分析
统计地分析该处理与胼胝质含量及纤维强度之间的相关性。在表11中呈现陆地棉的结果并且在表11中呈现海岛棉的结果。
表11:葡聚糖酶处理陆地棉纤维、它们的胼胝质含量及它们的强度之间相关性的统计分析
表12:葡聚糖酶处理海岛棉纤维、它们的胼胝质含量及它们的强度之间相关性的统计分析
总之,具有更高1,3-β-葡聚糖含量的棉花纤维显示更高的纤维强度,并且因外源供应的1,3-β-葡聚糖酶所致的1,3-β-葡聚糖含量降低显著地降低海岛棉中的纤维强度和胼胝质含量,这表明1,3-β-葡聚糖或胼胝质在棉花纤维强度中具有特殊作用,此作用可以受酶如GLUC1.1调节。
实施例4:鉴定不同棉花物种中的GLUC1.1A等位基因
GLUC1.1序列从6个不同陆地棉品种(Guazuncho;DP16;Cooker312(C312);Fiber Max 966(FM966);Acala SJ2;Acala Maxxa)、从5个不同海岛棉品种(PimaS7;Tanguis LMW 1737-60;TanguisCN(C.P.R.)712-60;Sea Island Tipless;VH8)、从草棉、毛棉、达尔文棉、树棉、雷蒙德氏棉、Gossypium kirkii、长萼棉(Gossypium longicalyx)和黄褐棉分离。
基于WO2008/083969中所述的GhGLUC1.1A和D核苷酸序列(分别是SEQ ID NO:1和7),设计引物对(正向引物SE077(SEQ ID NO:33)和G1.1-f1-F1(SEQ ID NO:65)以及反向引物SE078(SEQ ID NO:34)或者正向引物SE002(SEQ ID NO:35)和反向引物SE003(SEQ ID NO:36))以分别扩增全长或部分基因组DNA片段。所用反应混合物含有:2μl DNA(200ng/μl基因组DNA),1μl正向引物(10pM),1μl反向引物(10pM),4μl5x高保真缓冲液,0.2μl Phusion酶(Finnzymes),0.4μl dNTP's(10mM),11.4μl水(MilliQ)。所用PCR方案如下:98℃1分钟;30次:98℃10秒(变性),56℃30秒(复性),72℃1分钟(延伸);58℃30秒;72℃10分钟;4℃。
来自全部所检验海岛棉品系和来自达尔文棉的GLUC1.1A序列显示一个单核苷酸替换(分别在SEQ ID NO:5的第712位置处和在SEQ IDNO:17的第470位置处或在SEQ ID NO:56的第761位置处的c至t;还见表13中的GLUC1.1A-SNP5),所述的单核苷酸替换在它们的序列中产生一个提前终止密码子(cga成为tga)(图6;由于分别来自不同陆地棉品种和不同海岛棉品种的GLUC1.1序列彼此相同,故比对中仅分别包括FM966和PimaS7品种的GLUC1.1序列)。来自树棉的GLUC1.1A序列显示一个单核苷酸替换(c核苷酸在SEQ ID NO:21第327与第328位置之间缺失),这也在该序列中其下游处产生一个提前终止密码子(在SEQ ID NO:21的第373-375位置处的tga)(图6)。来自海岛棉、来自达尔文棉和来自树棉的GLUC1.1A序列的提前终止密码子产生预期截短的GLUC1.1A蛋白序列(图7;分别是具有179个(SEQ ID NO:6)、179个(SEQ ID NO:57)和78个(SEQ ID NO:22)氨基酸的GLUC1.1A蛋白),而来自全部所测试其他棉属物种的GLUC1.1A序列不显示提前终止密码子并据预测产生完整的GLUC1.1蛋白(图6和7)。
如上文所示,海岛棉因其优异纤维品质、尤其因纤维强度、长度和细度在商业上被认可。达尔文棉是海岛棉的最密切近亲并且某些人甚至将它视为海岛棉的变种而非一个独立物种。然而,达尔文棉产生稀疏、不可纺织的、土黄色或棕色纤维,长度通常小于1.3cm(见例如Wendel和Percy,1990,Bioch.Systematics And Ecology 18(7/8):517-528)。由于来自达尔文棉的纤维不作商业使用,很少获得关于其商业相关的纤维品质(如纤维强度)的信息。
实施例5:商业种质中GLUC1.1基因的基因分型
使用如制造商所提供的Illumina GoldenGate SNP基因分型和珠阵列技术,通过确定(如图6和表13中所示的)GLUC1.1A-SNP3、5和6以及GLUC1.1D-SNP1在总计73个陆地棉品种、1个海岛棉品种、2个树棉品种、1个草棉品种和1个黄褐棉品种中的基因型,确定市售种质中GLUC1.1A和GLUC1.1D基因的基因型。简而言之,使用区分性DNA聚合酶和连接酶(Illumina),GoldenGate基因分型测定法使用等位基因特异性延伸和连接用于基因型鉴定(genotype calling)。
表13:GLUC1.1D-SNP1和GLUC1.1A-SNP2、3、5、6、7和8分别在不同棉属物种的GLUC1.1D和A基因中的位置和基因型(G.h.:陆地棉,G.b.:海岛棉;G.t.:毛棉;G.d:达尔文棉;G.m.:黄褐棉;G.a.:树棉;G.he.:草棉;G.r.:雷蒙德氏棉)
结果证实:GLUC1.1A-SNP3、5和6及GLUC1.1D-SNP1在分析的不同棉属物种及品种中的基因型如图6和表13中所示。特别地,GLUC1.1A-SNP5在不同棉属物种及品种中的基因型显示,不同于海岛棉的全部所分析棉属物种及品种包含在陆地棉GLUC1.1A中存在的cga密码子,而非海岛棉Pima S7的gluc1.1A中存在的tga终止密码子。
实施例6:检测棉属植物中编码无活性GLUC1.1蛋白的GLUC1.1等位基因和/或转移编码无活性GLUC1.1蛋白的GLUC1.1等位基因至包含有编码活性GLUC1.1蛋白的相应GLUC1.1等位基因的棉属品系
编码无活性GLUC1.1酶的GLUC1.1等位基因(如Gbgluc1.1A等位基因、Gdgluc1.1A等位基因或Gagluc1.1A等位基因)由以下方法转移至包含有编码活性GLUC1.1酶的相应GLUC1.1等位基因的棉花品系如陆地棉育种系中。
含有编码无活性GLUC1.1酶的GLUC1.1等位基因的植物(如含有编码无活性GLUC1.1A酶的GLUC1.1A等位基因的海岛棉植物、达尔文棉植物或树棉植物)或含有编码无活性GLUC1.1酶的突变体GLUC1.1等位基因的诱变陆地棉植物(供体植物)与含有编码活性GLUC1.1酶的相应GLUC1.1等位基因的植物(如含有编码活性GLUC1.1A酶的GLUC1.1A等位基因的陆地棉植物)(回交亲本)杂交。用以下渐渗方案(编码无活性GLUC1.1酶的GLUC1.1等位基因缩写成gluc,而编码活性GLUC1.1酶的GLUC1.1等位基因缩写成GLUC)。
初始杂交:gluc/gluc(供体)X GLUC/GLUC(回交亲本)
F1植物:GLUC/gluc
BC1杂交:GLUC/gluc(F1)X GLUC/GLUC(回交亲本)
BC1植物:50%GLUC/gluc和50%GLUC/GLUC
使用特定测定法(例如PCR、TaqManTM、InvaderTM等;还见下文),针对gluc1.1等位基因选择50%GLUC/gluc。
BC2杂交:GLUC/gluc(BC1)X GLUC/GLUC(回交亲本)
BC2植物:50%GLUC/gluc和50%GLUC/GLUC
使用特定测定法(例如PCR、TaqManTM、InvaderTM等;还见下文),针对gluc1.1等位基因选择50%GLUC/gluc。
重复回交直至BC4至BC5(例如,如果供体植物是海岛棉植物并且回交亲本是陆地棉植物)或直至BC3(例如,如果供体植物和回交亲本是陆地棉植物)。
BC3-5植物:50%GLUC/gluc和50%GLUC/GLUC
使用特定测定法(例如PCR、TaqManTM、InvaderTM等;还见下文),针对gluc1.1等位基因选择50%GLUC/gluc。
为减少回交的数目(例如,如果供体植物和回交亲本是陆地棉植物,则回交至BC2;或者如果供体植物是海岛棉植物并且回交亲本是陆地棉植物,则回交至至BC3到BC4),可以在每个世代中使用对该回交亲本遗传背景特异的分子标记物。
BC3-5S1杂交:GLUC/gluc X GLUC/gluc
BC3-5S1植物:25%GLUC/GLUC和50%GLUC/gluc和25%gluc/gluc
使用gluc1.1等位基因的分子标记物选择含有gluc1.1等位基因的植物。使用gluc1.1和GLUC1.1等位基因的分子标记物选择对gluc1.1等位基因纯合的个体BC3-5S1植物(gluc/gluc)。这些植物随后用于纤维生产。
可以用来检测特定gluc1.1或GLUC1.1等位基因或用来区分特定gluc1.1和GLUC1.1等位基因的分子标记物例如是单核苷酸多态性(SNP)或多态性核苷酸序列。
作为示例,可以用来区分Gbgluc1.1A或Gdgluc1.1A等位基因和GhGLUC1.1A等位基因;和可以用来区分GbGLUC1.1D或Gdgluc1.1D等位基因和GhGLUC1.1D等位基因或用来检测DNA样品或植物中它们的存在的SNP和多态性核苷酸序列分别是在图6和表13中标识为GLUC1.1A-SNP3、5和6的SNP及在图6和表13中标示为GLUC1.1A-SNP2的多态性核苷酸序列以及在图6和表13中标识为GLUC1.1D-SNP1的SNP。
特别地,可以用来在包含提前终止密码子tga的Gbgluc1.1A或Gdgluc1.1A等位基因和取而代之地包含cga密码子的相应GhGLUC1.1A等位基因之间区分的SNP是在图6和表13中标识为GLUC1.1A-SNP5的SNP。
此类SNP和多态性核苷酸序列的基因型可以例如使用PCR测定法确定。
作为示例,开发了PCR测定法以确定实施例1中所述BC1群植物的在图6和表13中标识为GLUC1.1D-SNP1的SNP的基因型和在图6和表13中标识为GLUC1.1A-SNP2的多态性核苷酸序列的基因型,目的是对陆地棉和海岛棉的GLUC1.1D和A基因分别作图。更具体地,开发以下PCR测定法以基于在图6和表13中标识为GLUC1.1A-SNP2的SNP的基因型而区分Gbgluc1.1A等位基因和GhGLUC1.1A等位基因:
-引物:
正向:5’TAT CCC TCT CGA TGA GTA CGA C 3’
(p1.3GlucaAf-SEQ ID NO:37)
反向:5’CCC AAT GAT GAT GAA CCT GAA TTG3’
(p1.3GlucaAr-SEQ ID NO:38)
-扩增子大小:对于陆地棉,134bps,并且对于海岛棉,143bps
-PCR条件:5μl gDNA(20ng/μl)+15μl PCR混合物(PCR混合物:2μl 10x Taq PCR缓冲液,1μl标记的p1.3GlucaAf(100pmol/μl),0.2μlp1.3GlucaAr(100pmol/μl),0.25μl dNTPs(20mM),0.5μl MgCl2(50mM),0.2μl Taq聚合酶,10.85μl MiliQ)
-正向引物的标记:0.1μl 10×T4激酶缓冲液,0.2μlp1.3GlucaAf(100pmol/μl),0.01μl T4激酶,0.1μl P33γATP,0.59μl MilliQ=1μl;在37℃1小时和在65℃10分钟
-PCR特征:95℃5分钟;35次:94℃45秒,58℃45秒,72℃1分钟;72℃10分钟。
-凝胶分析:PCR片段在4.5%变性丙烯酰胺凝胶上分开
-凝胶对BIOMAX MR胶片过夜曝光
备选地,可以例如对图6和表13中标识为GLUC1.1A-SNP3、5和6和GLUC1.1D-SNP1的SNP使用如实施例5所示Illumina GoldenGateSNP基因分型法确定此类SNP的基因型。
备选地,可以通过如此方式确定此类SNP和多态性核苷酸序列的基因型,即借助本领域已知的标准测序技术直接测序以确定存在于植物中的完整GLUC1.1核苷酸序列,随后分析所获得的序列,例如与本文中所述的GLUC1.1序列比对(见例如图6和7)。
备选地,此类SNP和多态性核苷酸序列的基因型可以通过Taqman测定法确定。TaqMan测定流程和数据的解读如制造商(AppliedBiosystems)所述那样进行。简而言之,对GLUC1.1基因中多态性位点的特定变体特异的探针结合该模板DNA,如果这种特定变体存在。该探针具有在其3'末端附着的荧光报道分子或荧光团如6-羧基荧光素(缩略语:FAM)和VIC(来自Applied Biosystems的专利染料)和在其5'末端附着的猝灭分子(例如,四甲基罗丹明(缩略语:TAMRA)或二氢环吡咯并吲哚三肽‘小沟结合物’(缩略语:MGB))。探针附着的荧光团与猝灭分子之间的密切接近抑制来自该荧光团的荧光。在采用能够扩增包含该多态性位点的DNA片段的两条引物的PCR期间,当DNA合成开始时,Taq聚合酶的5'至3'外切核酸酶活性降解该探针中已经与模板复性的那个部分。探针的降解从中释放该荧光团并破坏与猝灭分子的密切接近,因此解除猝灭作用并允许该荧光团的荧光。因此,实时PCR热循环仪中检测到的荧光直接正比于释放的荧光团和PCR中存在的DNA模板的量。因此开发以下区别性Taqman探针和引物以区分GLUC1.1A-SNP3和GLUC1.1A-SNP5(见图6和表13)的不同变体:
表14a
表14b
表14a中显示了对Gbgluc1.1A或相应GhGLUC1.1A靶基因中多态性位点特异的探针,如表14a中分别标识为“5’FAM-AACTCGCTCGCCTCA 3”和“5’VIC-AACTCGCTGGCCTCA 3’的对Gbgluc1.1A和GhGLUC1.1A中GLUC1.1A-SNP3特异的探针和能够扩增包含该多态性位点的片段并因此可以与所述探针联合使用的正向与反向引物。通常,每个探针组由两个探针(每个探针对包含变体核苷酸(例如,表14中加下划线的核苷酸)或变体核苷酸序列的GLUC1.1靶基因中多态性位点的一种变体特异)(例如,具有SEQ ID NO:39的探针对Gbgluc1.1A的GLUC1.1A-SNP3特异并且具有SEQ ID NO:40的探针对GhGLUC1.1A的GLUC1.1A-SNP3特异)和能够扩增包含该多态性位点的片段的两条引物组(例如具有SEQ ID NO:41的引物对GLUC1.1A-SNP3上游的核苷酸序列特异并且具有SEQ ID NO:42的引物对GLUC1.1A-SNP3下游的核苷酸序列特异,从而两种引物的使用导致包含GLUC1.1A-SNP3的DNA片段扩增)组成。
备选地,此类SNP和多态性核苷酸序列的基因型可以通过InvaderTM技术(Third Wave Agbio)确定。
实施例7:比较GLUC1.1A和GLUC1.1D在海岛棉中和陆地棉中纤维生长和发育期间的表达
如WO2008/083969中所述,对海岛棉分析GLUC1.1A和GLUC1.1D在纤维生长和发育期间的表达并且将它与GLUC1.1A和GLUC1.1D在陆地棉的纤维生长和发育期间的表达比较。
从海岛棉的cDNA文库提取DNA,使浓度均等并使用引物SE002(SEQ ID NO:35)和SE003(SEQ ID NO:36)进行PCR扩增,其中所述的cDNA文库从0和5DPA的纤维细胞和种子和从10、15、20、25、30和40DPA的纤维细胞产生。所用PCR反应混合物含有:1μl模板DNA(200ng/μl),5μl 5×GreenGoTaq缓冲液,0.75μl SE002(10μM),0.75μlSE003(10μM),0.5μl dNTP(20mM),0.25μl GoTaq聚合酶,16.75μlMilliQ水(总计25μl)。所用PCR条件如下:95℃5分钟;5次:95℃1分钟,58℃1分钟,72℃2分钟;25次:92℃30秒,58℃30秒,72℃1分钟;72℃10分钟。冷却至4℃。PCR产物的预期长度是655bp。PCR扩增后,使用10μl模板;1μl AlwI酶、2μl NEB 4限制性缓冲液、7μl MQ水,用AlwI消化液(在37℃温育3小时)消化PCR片段。在EtBr染色的1.5%TAE凝胶上分析得到的片段。A亚基因组等位基因特异性PCR片段的预期条带大小是:479bp、118bp和59bp。D亚基因组等位基因特异性PCR片段的预期条带大小是:538bp和118bp。
图8的泳道2至泳道9代表在0、5、10、15、20、25、30和40DPA的GbGLUC1.1A和D表达。图8中条带强度的差异对应于表达的相对差异。包括阴性对照(无模板;NTC;图8,泳道10)和阳性对照(来自Pima S7的基因组DNA;图8,泳道11)。GhGLUC1.1A和D以及GbGLUC1.1A和D基因的表达谱可以总结如下。
开花后的天数(DPA): 0 5 10 15 20 25 30 40
GhGLUC1.1 - - - D D ND A&D A&D
GbGLUC1.1 - - - A&D A&D A&D A&D A&D
因此尽管GLUC1.1A在陆地棉中的表达仅在30DPA开始,然而海岛棉中的GLUC1.1A从15DPA起表达。然而,如上文所示,预计GbGLUC1.1A基因编码无功能的GLUC1.1A蛋白。

Claims (12)

1.非天然存在的棉属(Gossypium)植物及其部分和后代,其包含至少一个优异纤维强度等位基因,其中所述植物是陆地棉(Gossypium hirsutum)植物且所述纤维强度等位基因衍生自海岛棉(Gossypium barbadense)染色体A05上的纤维强度基因座,所述衍生自海岛棉的纤维强度等位基因位于海岛棉的染色体A05上的以下标记物之间:
a.AFLP标记物P5M50-M126.7与SSR标记物CIR280之间,
b.AFLP标记物P5M50-M126.7与SSR标记物BNL3992之间,
c.AFLP标记物P5M50-M126.7与SSR标记物CIR401c之间,或
d.SSR标记物NAU861或GLUC1.1基因与SSR标记物CIR401c之间,
所述陆地棉植物包含陆地棉的染色体A05上的选自CIR139a、BNL3029.A和NAU1042.A的至少一个标记物基因座的等位基因。
2.权利要求1的植物,其中所述陆地棉植物还包含陆地棉的染色体A05上的选自BNL0542、E43M49-M260.0、E31M48-M188.5、E43M53-M460.0、CIR294.A和BNL3995的至少一个标记物基因座的等位基因。
3.权利要求1的植物,其中衍生自海岛棉的纤维强度等位基因的LOD峰位于:
-距离SSR标记物NAU861或GLUC1.1基因约0至5cM处,或
-距离SSR标记物CIR401约0至12cM处。
4.权利要求3的植物,其中衍生自海岛棉的纤维强度等位基因的LOD峰位于距离SSR标记物NAU861或GLUC1.1基因约4.008cM处。
5.权利要求3的植物,其中衍生自海岛棉的纤维强度等位基因的LOD峰位于距离SSR标记物CIR401c约10cM处。
6.权利要求3的植物,其中衍生自海岛棉的纤维强度等位基因的LOD峰位于距离SSR标记物CIR401c约10.52cM处。
7.权利要求1的植物,其中衍生自海岛棉的纤维强度等位基因包含编码无功能GLUC1.1蛋白的GLUC1.1基因。
8.权利要求7的植物,其中衍生自海岛棉的纤维强度等位基因包含GLUC1.1基因,所述GLUC1.1基因的特征在于,T核苷酸在与SEQ ID NO:5的第712核苷酸位置相对应的核苷酸位置处存在。
9.权利要求1的植物,其中纤维的胼胝质含量与同等棉属植物的纤维的胼胝质含量相比增加,所述的同等棉属植物不包含衍生自海岛棉的纤维强度等位基因的至少一个优异等位基因。
10.权利要求1的植物,其中纤维的强度与同等棉属植物的纤维的强度相比增加,所述的同等棉属植物不包含衍生自海岛棉的至少一个纤维强度等位基因。
11.权利要求10的植物,其中纤维的强度平均
a.提高了约5%与约10%之间,
b.提高了约1.6g/tex与约3.3g/tex之间,或
c.在约34.6g/tex与约36.3g/tex之间。
12.权利要求10的植物,其中陆地棉植物是对衍生自海岛棉的纤维强度等位基因纯合的陆地棉植物。
CN201510415973.6A 2008-05-26 2009-05-25 改变产纤维植物中纤维强度的方法和手段 Pending CN104969864A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP08075514 2008-05-26
EP08075514.3 2008-05-26
US12893808P 2008-05-27 2008-05-27
US61/128,938 2008-05-27
CN200980124338.5A CN102076857B (zh) 2008-05-26 2009-05-25 改变产纤维植物中纤维强度的方法和手段

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200980124338.5A Division CN102076857B (zh) 2008-05-26 2009-05-25 改变产纤维植物中纤维强度的方法和手段

Publications (1)

Publication Number Publication Date
CN104969864A true CN104969864A (zh) 2015-10-14

Family

ID=40933597

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200980124338.5A Expired - Fee Related CN102076857B (zh) 2008-05-26 2009-05-25 改变产纤维植物中纤维强度的方法和手段
CN201510415973.6A Pending CN104969864A (zh) 2008-05-26 2009-05-25 改变产纤维植物中纤维强度的方法和手段

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200980124338.5A Expired - Fee Related CN102076857B (zh) 2008-05-26 2009-05-25 改变产纤维植物中纤维强度的方法和手段

Country Status (5)

Country Link
US (2) US9121074B2 (zh)
EP (1) EP2350288A1 (zh)
CN (2) CN102076857B (zh)
MX (2) MX2010012883A (zh)
WO (1) WO2009143995A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107447018A (zh) * 2017-09-06 2017-12-08 中国农业科学院麻类研究所 一种黄麻InDel分子标记及开发方法与应用
CN110904131A (zh) * 2019-12-13 2020-03-24 南京农业大学 一种棉花GhGlu19基因及其在提高棉花产量中的应用
CN112662687A (zh) * 2021-01-22 2021-04-16 华中农业大学 推迟玉米花期的方法、试剂盒、基因
CN114891828A (zh) * 2022-04-30 2022-08-12 南京农业大学 棉花β-1,3-葡聚糖酶基因GhGLU18在改良棉花纤维品质中的应用
CN116676294A (zh) * 2023-06-20 2023-09-01 中国农业科学院棉花研究所 GhGLU18A蛋白、编码基因及其在调控植物纤维强度、马克隆值中的应用

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112012018108A2 (pt) 2010-01-22 2015-10-20 Bayer Ip Gmbh combinações acaricidas e/ou inseticidas de ingredientes ativos
WO2012050962A1 (en) * 2010-09-29 2012-04-19 University Of Georgia Research Foundation, Inc. Hybrid cotton plants with improved fiber quality and yield traits
CN103313971B (zh) 2010-11-15 2015-12-02 拜耳知识产权有限责任公司 N-芳基吡唑(硫代)甲酰胺
US9265252B2 (en) 2011-08-10 2016-02-23 Bayer Intellectual Property Gmbh Active compound combinations comprising specific tetramic acid derivatives
CN103842507A (zh) 2011-10-04 2014-06-04 拜耳知识产权有限责任公司 通过抑制酵母氨酸脱氢酶基因控制真菌和卵菌的RNAi
CN104244716B (zh) 2012-02-27 2017-05-03 拜耳知识产权有限责任公司 包含噻唑基异噁唑啉和杀真菌剂的活性化合物组合产品
WO2013139949A1 (en) 2012-03-23 2013-09-26 Bayer Intellectual Property Gmbh Compositions comprising a strigolactame compound for enhanced plant growth and yield
EP2662370A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG 5-Halogenopyrazole benzofuranyl carboxamides
EP2662364A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG Pyrazole tetrahydronaphthyl carboxamides
MX2014013489A (es) 2012-05-09 2015-02-12 Bayer Cropscience Ag 5-halogenopirazolindanil carboxamidas.
EP2662363A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG 5-Halogenopyrazole biphenylcarboxamides
EP2662360A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG 5-Halogenopyrazole indanyl carboxamides
EP2662362A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG Pyrazole indanyl carboxamides
EP2662361A1 (en) 2012-05-09 2013-11-13 Bayer CropScience AG Pyrazol indanyl carboxamides
JP6262208B2 (ja) 2012-05-09 2018-01-17 バイエル・クロップサイエンス・アクチェンゲゼルシャフト ピラゾールインダニルカルボキサミド類
EP2735231A1 (en) 2012-11-23 2014-05-28 Bayer CropScience AG Active compound combinations
MX2015006328A (es) 2012-11-30 2015-09-07 Bayer Cropscience Ag Mezcla fungicida o pesticida binaria.
EA030020B1 (ru) 2012-11-30 2018-06-29 Байер Кропсайенс Акциенгезельшафт Двойные фунгицидные смеси
BR112015012055B1 (pt) 2012-11-30 2021-01-12 Bayer Cropscience Ag composição fungicida ternária, seu processo de preparação, método para controlar um ou mais microrganismos nocivos, semente resistente a microrganismos nocivos e seu método de tratamento
UA116222C2 (uk) 2012-11-30 2018-02-26 Байєр Кропсайєнс Акцієнгезелльшафт Потрійні фунгіцидні і пестицидні суміші
UA116223C2 (uk) 2012-11-30 2018-02-26 Байєр Кропсайєнс Акцієнгезелльшафт Подвійна фунгіцидна суміш
AR093996A1 (es) 2012-12-18 2015-07-01 Bayer Cropscience Ag Combinaciones bactericidas y fungicidas binarias
EP2935218A1 (en) 2012-12-19 2015-10-28 Bayer CropScience AG Difluoromethyl-nicotinic- tetrahydronaphtyl carboxamides
JP2016522800A (ja) 2013-04-12 2016-08-04 バイエル・クロップサイエンス・アクチェンゲゼルシャフト 新規トリアゾリンチオン誘導体
MX2015014365A (es) 2013-04-12 2015-12-07 Bayer Cropscience Ag Derivados de triazol novedosos.
WO2014170364A1 (en) 2013-04-19 2014-10-23 Bayer Cropscience Ag Binary insecticidal or pesticidal mixture
BR112015026235A2 (pt) 2013-04-19 2017-10-10 Bayer Cropscience Ag método para melhorar a utilização do potencial de produção de plantas transgênicas envolvendo a aplicação de um derivado de ftaldiamida
WO2014177514A1 (en) 2013-04-30 2014-11-06 Bayer Cropscience Ag Nematicidal n-substituted phenethylcarboxamides
TW201507722A (zh) 2013-04-30 2015-03-01 Bayer Cropscience Ag 做為殺線蟲劑及殺體內寄生蟲劑的n-(2-鹵素-2-苯乙基)-羧醯胺類
US10093907B2 (en) 2013-09-24 2018-10-09 Basf Se Hetero-transglycosylase and uses thereof
WO2018019676A1 (en) 2016-07-29 2018-02-01 Bayer Cropscience Aktiengesellschaft Active compound combinations and methods to protect the propagation material of plants
US20190211002A1 (en) 2016-09-22 2019-07-11 Bayer Cropscience Aktiengesellschaft Novel triazole derivatives
WO2018054829A1 (en) 2016-09-22 2018-03-29 Bayer Cropscience Aktiengesellschaft Novel triazole derivatives and their use as fungicides
CN106929574B (zh) * 2017-02-22 2020-12-29 中国农业科学院棉花研究所 陆地棉4号染色体与纤维强度相关的snp分子标记
CN107338247B (zh) * 2017-07-21 2020-10-27 河北农业大学 与陆地棉纤维强度关联的snp分子标记及其应用
CN109055591B (zh) * 2018-03-31 2022-05-27 中国农业科学院棉花研究所 一种与棉花纤维长度主效qtl连锁的分子标记及其应用
CN108396074B (zh) * 2018-05-10 2019-04-02 湖北省农业科学院畜牧兽医研究所 基于白三叶转录组序列开发的est-ssr引物组及其应用
US20210323950A1 (en) 2018-06-04 2021-10-21 Bayer Aktiengesellschaft Herbicidally active bicyclic benzoylpyrazoles
WO2020186030A1 (en) 2019-03-14 2020-09-17 The Procter & Gamble Company Cleaning compositions comprising enzymes
US10988715B2 (en) 2019-03-14 2021-04-27 The Procter & Gamble Company Method for treating cotton
CN109880932B (zh) * 2019-04-25 2021-02-19 中国农业科学院棉花研究所 用于鉴别杂交棉品种中棉1279的ssr引物对及其产品以及鉴别方法
CN110512019B (zh) * 2019-05-22 2022-08-12 中国农业科学院棉花研究所 一种与棉花纤维长度主效qtl连锁的分子标记及其应用
CN112094862B (zh) * 2019-12-17 2022-04-19 华中农业大学 一种带有标记的棉花雄性不育系的创制方法
CN111041126B (zh) * 2020-01-16 2022-05-03 石河子大学 用于鉴别新陆中系列棉花品种的多态性分子标记及其应用
CN114196780A (zh) * 2021-12-31 2022-03-18 石河子大学 一种新疆海岛棉毛细管电泳dna指纹图谱的构建方法及棉花品种鉴定方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1836043A (zh) * 2003-08-15 2006-09-20 联邦科学与工业研究组织 改变产纤维植物中纤维特征的方法和手段

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
DE69227872T3 (de) 1991-03-06 2003-12-04 Monsanto Technology Llc St Louis Partikel-auslösende transformation von baumwolle
US5846717A (en) 1996-01-24 1998-12-08 Third Wave Technologies, Inc. Detection of nucleic acid sequences by invader-directed cleavage
AU672760B2 (en) 1991-09-24 1996-10-17 Keygene N.V. Selective restriction fragment amplification: a general method for DNA fingerprinting
JP3313964B2 (ja) 1995-02-21 2002-08-12 東洋紡績株式会社 ワタ繊維組織特異的遺伝子
US5792933A (en) 1995-10-04 1998-08-11 Mississippi State University Fiber-specific protein expression in the cotton plant
US5985557A (en) 1996-01-24 1999-11-16 Third Wave Technologies, Inc. Invasive cleavage of nucleic acids
AU5732298A (en) 1997-01-07 1998-08-03 Calgene, Inc. Plant expansin promoter sequences
US6259003B1 (en) 1997-01-21 2001-07-10 Toyo Boseki Kabushiki Kaisha Cotton plant promoters
JP5015373B2 (ja) 1998-04-08 2012-08-29 コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガニゼイション 改良表現型を得るための方法及び手段
US6405019B1 (en) 1998-06-30 2002-06-11 Ericsson, Inc. Method and apparatus for controlling a performance characteristic of an electronic device
US6483013B1 (en) 1999-05-19 2002-11-19 Bayer Bioscience N.V. Method for agrobacterium mediated transformation of cotton
AU782244B2 (en) 2000-08-01 2005-07-14 Temasek Life Sciences Laboratory Limited Isolation and characterization of a fiber-specific actin promoter from cotton
CN1190490C (zh) 2000-08-01 2005-02-23 分子农业生物学院 来自棉花的纤维特异性β-微管蛋白启动子的分离和鉴定
DE10061150A1 (de) 2000-12-08 2002-06-13 Icon Genetics Ag Verfahren und Vektoren zur Erzeugung von transgenen Pflanzen
CA2429397C (en) 2001-01-26 2014-06-03 Commonwealth Scientific And Industrial Research Organisation Methods and means for producing efficient silencing construct using recombinational cloning
US20030106097A1 (en) 2001-07-30 2003-06-05 Haigler Candace H. Chitinase encoding DNA molecule from cotton expressed preferentially in fibers during secondary cell wall deposition and the corresponding promoter
BR0308424A (pt) 2002-03-14 2005-02-22 Commw Scient Ind Res Org Métodos e meios para infra-regular eficientemente a expressão de qualquer gene de interesse em células e organismos eucarióticos
US8106180B2 (en) 2003-08-07 2012-01-31 Whitehead Institute For Biomedical Research Methods and products for expression of micro RNAs
US7332657B2 (en) 2003-12-17 2008-02-19 Dow Agrosciences Llc Cotton cultivar PHY 800 Pima
AU2005295948A1 (en) 2004-10-12 2006-04-27 The Rockefeller University MicroRNAs
CN1796572A (zh) * 2004-12-22 2006-07-05 中国农业科学院棉花研究所 棉花产量性状或纤维品质的分子标记
CN101578371B (zh) 2007-01-11 2014-04-16 拜尔作物科学公司 亚基因组特异性等位基因在棉花中的差异表达及其用途

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1836043A (zh) * 2003-08-15 2006-09-20 联邦科学与工业研究组织 改变产纤维植物中纤维特征的方法和手段

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SAHA S ET AL.: "Genetic dissection of chromosome substitution lines of cotton to discover novel Gossypium barbadense L. alleles for improvement of agronomic traits", 《THEOR APPL GENET》 *
SUKUMAR SAHA ET AL.: "Effect of chromosome substitutions from Gossypium barbadense L. 3-79 into G. hirsutum L. TM-1 on agronomic and fiber traits", 《THE JOURNAL OF COTTON SCIENCE》 *
YOU-LO HSIEH, XIAO-PING HU AND ANJIA WANG: "Single Fiber Strength Variations of Developing Cotton Fibers—Strength and Structure of G. hirsutum and G. barbedense", 《TEXTILE RESEARCH JOURNAL》 *
施静轩: "新疆长绒棉理化性能与微观结构的研究", 《上海纺织科技》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107447018A (zh) * 2017-09-06 2017-12-08 中国农业科学院麻类研究所 一种黄麻InDel分子标记及开发方法与应用
CN107447018B (zh) * 2017-09-06 2019-10-25 中国农业科学院麻类研究所 一种黄麻InDel分子标记及开发方法与应用
CN110904131A (zh) * 2019-12-13 2020-03-24 南京农业大学 一种棉花GhGlu19基因及其在提高棉花产量中的应用
CN110904131B (zh) * 2019-12-13 2023-03-17 南京农业大学 一种棉花GhGlu19基因及其在提高棉花产量中的应用
CN112662687A (zh) * 2021-01-22 2021-04-16 华中农业大学 推迟玉米花期的方法、试剂盒、基因
CN112662687B (zh) * 2021-01-22 2023-09-26 华中农业大学 推迟玉米花期的方法、试剂盒、基因
CN114891828A (zh) * 2022-04-30 2022-08-12 南京农业大学 棉花β-1,3-葡聚糖酶基因GhGLU18在改良棉花纤维品质中的应用
CN116676294A (zh) * 2023-06-20 2023-09-01 中国农业科学院棉花研究所 GhGLU18A蛋白、编码基因及其在调控植物纤维强度、马克隆值中的应用
CN116676294B (zh) * 2023-06-20 2024-04-16 中国农业科学院棉花研究所 GhGLU18A蛋白、编码基因及其在调控植物纤维强度、马克隆值中的应用

Also Published As

Publication number Publication date
EP2350288A1 (en) 2011-08-03
WO2009143995A1 (en) 2009-12-03
US9121074B2 (en) 2015-09-01
MX349774B (es) 2017-08-10
MX2010012883A (es) 2010-12-14
CN102076857A (zh) 2011-05-25
CN102076857B (zh) 2015-08-19
US20110093970A1 (en) 2011-04-21
US20160097055A1 (en) 2016-04-07

Similar Documents

Publication Publication Date Title
CN102076857B (zh) 改变产纤维植物中纤维强度的方法和手段
CN102839150B (zh) 包括一个突变体indehiscent等位基因的芸薹属植物
US9057073B2 (en) Differential expression of subgenome specific alleles in cotton and uses thereof
EP1349446A1 (en) Modification of sucrose synthase gene expression in plant tissue and uses therefor
US10383295B2 (en) Methods of creating drought tolerant corn plants using markers linked to cold shock domain-containing proteins and compositions thereof
JP2017018114A (ja) 形質遺伝子移入のためのトウモロコシにおける褐色中肋−3遺伝子特異的マーカーの使用
CN105087573A (zh) 一种鉴定水稻Wx-mw基因的方法及其在优质水稻培育中的应用
EP2355651A2 (en) Genetic loci associated with northern leaf blight resistance in maize
CN101495626A (zh) 新型蔗糖合酶的鉴定及其在纤维改性中的用途
US10093991B2 (en) Compositions and methods for the detection of the shrunken2-R mutation in maize
US8633351B2 (en) Genetic loci associated with cell wall digestibility in maize
WO2022075335A1 (ja) イネ科植物及びその作製方法
CN113481224B (zh) 一个改良棉花产量性状的糖苷水解酶基因和启动子及其应用
US7498492B2 (en) Modification of sucrose synthase gene expression in plant tissue and uses therefor
CN105247055A (zh) 用于增强植物茎机械强度的组合物和方法
AU2002220363B2 (en) Modification of sucrose synthase gene expression in plant tissue and uses therefor
US20140283214A1 (en) Maize sugary enhancer sequences
Stonaker Evolution of plant-specific Snf2 proteins and RNA polymerases and their function in maintaining paramutations in Zea mays
ZA200303930B (en) Modification of sucrose synthase gene expression in plant tissue and uses therefor.
AU2002220363A1 (en) Modification of sucrose synthase gene expression in plant tissue and uses therefor

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151014