CN105229174A - 与肾状线虫抗性连锁的标志物 - Google Patents

与肾状线虫抗性连锁的标志物 Download PDF

Info

Publication number
CN105229174A
CN105229174A CN201480026791.3A CN201480026791A CN105229174A CN 105229174 A CN105229174 A CN 105229174A CN 201480026791 A CN201480026791 A CN 201480026791A CN 105229174 A CN105229174 A CN 105229174A
Authority
CN
China
Prior art keywords
mark
dasctp
plant
dcte1
matter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480026791.3A
Other languages
English (en)
Inventor
R·布亚拉普
R·雷恩
M·G·麦克弗森
S·P·库姆帕特拉
C-S·A·钱纳巴萨瓦拉齐娅
J·W·斯平克斯
K·帕利亚门特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Corteva Agriscience LLC
Original Assignee
Dow AgroSciences LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow AgroSciences LLC filed Critical Dow AgroSciences LLC
Publication of CN105229174A publication Critical patent/CN105229174A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8285Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for nematode resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本公开涉及用于鉴定具有肾状线虫(reniform?nematode)抗性性状的棉花植物的方法和组合物。一些实施方案涉及鉴定、选择和/或构建肾状线虫抗性植物和种质的分子标志物,或者鉴定和反选择相对易感植物的分子标志物。本公开还涉及通过利用至少一种本文所述的标志物的方法产生的包含肾状线虫抗性性状的棉花植物。

Description

与肾状线虫抗性连锁的标志物
优先权声明
本申请要求获得于2013年3月15日提交的题为“与肾状线虫连锁的标志物”(MarkersLinkedtoReniformNematodeResistance)的美国临时专利申请序列号No.61/799,059的利益。
技术领域
本公开涉及植物疾病抗性。在一些实施方案中,本公开涉及肾状线虫抗性,例如在棉花中的肾状线虫抗性。在具体的实施方案中,本公开涉及用于鉴定生物中肾状线虫抗性的组合物和方法,例如,与肾状线虫抗性紧密连锁的分子标志物。进一步的实施方案涉及用于将肾状线虫抗性性状引入到宿主生物体内、例如通过使用与肾状线虫抗性紧密连锁的分子标志物引入到宿主生物体内的组合物和方法。
背景
棉花(Gossypiumspp.)是遍及世界的一种重要的纤维和油料种子作物。在大多数其它产棉国家,包括美国,棉花是作为一年生作物种植的,虽然其自然生长习性是多年生的。棉属(Gossypium)包括大约50个已知的物种,它们原产于美洲、亚洲、非洲和澳大利亚的干旱和半干旱地区。Fryxell(1992)Rheedea2:108-65。这些物种根据其染色体大小和种间杂交(inter-specificcross)的染色体配对可以分成多个基因组群,包括8个二倍体植物群和1个四倍体植物群(即“AD”基因组)。大部分棉纤维是由陆地棉(“陆地棉”(“Uplandcotton”))产生的,它是四倍体AD基因组群中的一个物种。而且,尽管棉花种植在很大程度上依赖这些高产陆地棉栽培种,但是它们与其它植物类群相比,遗传变化较少,并且被认为易受病原体和昆虫感染。Brubaker&Wendel(1994)Am.J.Bot.81:1309-26;Bowmanetal.(1996)CropSci.36:577-81。
近年来,美国许多地区和其它国家的棉花产量受到一种寄生虫——肾状线虫(“RN”)(肾形肾状线虫(Rotylenchulusreniformis))的影响。肾状线虫在棉花中的寄生涉及形成合胞体,从而为发育中的雌性(developingfemale)提供营养,并且发生在此进食位点(feedingsite)的事件可能决定棉株对线虫的易感性程度。Agudeloetal.(2005)J.Nematology37:185-9;Reboisetal.(1975)J.Nematology7:122-39。
可供用于对抗RN作物伤害的工具很少。例如,杀线虫剂如和土壤熏蒸剂如已用于减少肾状线虫对棉花产量的有害影响,但是当按照指示使用时,这些杀线虫剂仅部分有效。宿主植物抗性将是管理肾状线虫感染的在经济上最可行的手段,但是没有陆地棉栽培种对RN有抗性。Robinsonetal.(1999)CropSci.39:850-8;Koenningetal.(2004)PlantDis.88:100-13;Useryetal.(2005)Nematropica35:121-33;Weaveretal.(2007)CropSci.47:19-24。
肾状线虫抗性已经在野生二倍体物种中被鉴定,例如长萼棉(G.longicalyx)(Digheetal.(2009)CropSci.49:1151-64)和旱地棉(G.aridium)(Romanoetal.(2009),同上)以及双二倍体表型:印加棉(IncaCotton)GB713(Gutiérrezetal.(2011)TAGTheor.Appl.Genet.122:271-80)。已经鉴定,从长萼棉基因和旱地棉的渗入而获得的RN抗性由单个显性基因负责遗传。Robinsonetal.(2007)CropSci.47:1865-77。此外已经鉴定,从树棉和旱地棉(Rose&Standley)Skovsted渗入而获得的RN抗性由两个不同基因座处的显性基因负责遗传。Sacks&Robinson(2009)FieldCropsRes.112:1-6。鉴定尽可能多的RN抗性的有用资源是重要的。当遇到突破抗性的线虫群体或种群,或者发展出这样的群体或种群时,多种抗性来源可能证明是有价值的资源。
将性状(例如RN抗性)从其它来源基因渗入到陆地棉中是一个耗时且困难的过程,这是因为例如,棉花遗传复杂,涉及倍性的不同,并且存在各种基因组和亚基因组,其中许多是不相容的或者相容性低的。Robinson(2007),Annu.Rev.Phytopathol.45:263-88;Percivaletal.(1999),“Taxonomyandgermplasmresources,”收录于Cotton:Origin,History,Technology,andProduction.Smith&Cothren(eds.),NewYork,NY,JohnWiley&Sons,第33-63页。而且,由于染色体配对困难导致种间杂交的植株存活率较低,获得具有期望的渗入遗传材料、且在农艺学上合适的后代的概率则更低。参见Romanoetal.(2009)TAGTheor.Appl.Genet.120:139-50。在可能的情况下,人们已将感兴趣的性状通过六倍体桥系(hexaploidbridgingline)从二倍体物种渗入到陆地棉中。参见例如Robinsonetal.(2007),同上;Konanetal.(2007)Plt.Breed126:176-81。
植物育种程序将来自两个或多个栽培种或来自广泛多样来源的期望性状组合成育种池(breedingpool),通过自交和选择期望的表型从育种池开发栽培种。目标是在单一品种中组成来自亲本种质的期望性状的改良组合。这些重要的性状可以包括更高的种子产量、对疾病和昆虫的抗性、更好的茎和根、对干旱和热的耐受性,和更好的农艺学品质。在这样的程序中需要许多步骤来开发包含一种或多种期望性状的新栽培种。植物育种首先要分析和确定现有种质的问题和弱点,建立程序目标,并确定特定的育种目标。在任何两个种质可能不相容的或者相容性差的情况下,特别是在遗传学复杂的植物如棉花中,必须选择具有满足程序目标的性状的种质。
每一个育种程序应当包括对育种程序效率的周期性的客观的评价。评价标准因目的和目标而异,但是应当包括每年从选择获得的收益(根据与合适标准的比较),被推进的育种系的整体价值,和每单位输入(例如,每年、花费的每美元,等)所产生的成功栽培种的数目。然后,对有希望的推进育种系,以3年以上的时间在可代表目标产业区域的环境下加以彻底检测,并与合适的标准进行比较。从最佳的品系中选出新产业栽培种的候选者;那些在少数性状方面仍有缺陷的可以用作亲本,以产生用于进一步选择的新群体。从第一次杂交开始,这些过程,最终引向上市销售和分配步骤,通常需要8-12年。因此,新栽培种的开发是一个耗时的过程,需要精确的前瞻性规划、资源的高效使用,和尽可能少的方向改变。
植物育种中最困难的任务是鉴定遗传优良的个体。一种鉴定优良植物的方法是观察其相对于其它实验植物和广泛种植的标准栽培种的性能。如果单次观察不能得出结论,则可以利用重复观察,以更好地估计其遗传价值。这个任务是极其困难的,因为(对于大多数性状),真实的基因型价值会被其它混杂的植物性状或环境因素所掩盖。
从业者对育种和选择方法的选择取决于植物复制的模式、要改良的性状的可遗传性、产业上使用的栽培种的类型(例如F1杂交栽培种,纯系栽培种,等),和性状遗传的复杂性。对于高度可遗传的性状,在单一位置评估的优良个体植物的选择可能是有效的,但是对于遗传性低的性状,需要根据从对相关植物家系的重复评估获得的平均值进行选择。流行的选择方法普遍包括系谱选择、修正的系谱选择、混合选择、和轮回选择。回交育种可用于将一个或几个对高度可遗传性状有利的基因转移到期望的栽培种中。各种轮回选择技术可用于改良受许多基因控制的数量遗传性状。
育种者首先选择和杂交两个或多个亲本系,随后是重复的自交和选择,产生许多新的遗传组合。育种者理论上可以通过杂交、自交和诱变产生数以十亿计的不同遗传组合。这样的育种者不能在细胞水平上对过程进行直接控制。因此,两个育种者永远不会开发出具有相同性状的相同品系,乃至非常相似的品系。
每年,植物育种者会选择用于推进到下一代的种质。将该种质在多种独特且不同的地理、气候和土壤条件下种植。然后在种植季节期间或结束时,进行进一步的选择。所开发出的栽培种是不可预期的。这种不可预期性是育种者的选择所致的,该选择在独特的环境中发生,并且无法在DNA水平上加以控制(使用常规的育种程序),会产生数以百万计的不同可能的遗传组合。除了可能以非常粗疏和大致的方式预测之外,本领域的普通育种人员无法预测他所开发出的最终所得品系。类似地,同一育种者不能通过使用完全相同的原始亲本和相同的选择技术两次产生出相同的栽培种。在开发优良新棉花栽培种的过程中,这种不可预测性造成了金钱及其它方面的资源的大量耗费。
当标志物辅助选择(MAS)可用时,可以使用标志物辅助选择提供时间、成本和劳动力上显著的优势(与在后代植物选择中的进行基因分型相比)。单核苷酸多态性(SNP)标志物已经在多种作物改良计划中成为用于MAS的优选标志物,因为它们具有高丰度、易于自动化,并且有高通量基因分型平台可用。然而,在栽培的棉花物种中,高度的基因组复杂性、狭窄的遗传基础、异源四倍体性质,以及参考基因组的缺乏阻碍了候选SNP标志物的开发。
公开
与肾状线虫抗性连锁的分子标志物可用于在棉花中帮助肾状线虫抗性性状的标志物辅助选择。本文公开了一些特定的标志物,它们被鉴定处于棉花基因组的肾状线虫抗性QTL区域的内部或附近,它们在亲本陆地棉基因型和RN抗性源之间具有多态性,其中这些标志物与肾状线虫抗性表型连锁(例如,紧密连锁)。在实施方案中,与肾状线虫抗性连锁的分子标志物可以选自下组:表2-4中列出的标志物、和与表2-4中列出的任何标志物连锁的标志物。例如,与肾状线虫抗性连锁的分子标志物可以选自下组:表3-4中列出的标志物、以及与表3-4中列出的任何标志物连锁的标志物。这些标志物可以在对肾状线虫侵染有抗性的棉花植物和栽培种的标志物辅助选择中提供卓越的效用。
本文描述了鉴定包含肾状线虫抗性的第一棉花植物或这样的棉花植物中包含的种质的方法。例如,可利用特定的标志物鉴定包含源自印加棉(IncaCotton)GB713亲本的肾状线虫抗性QTL的肾状线虫抗性陆地棉或种质。在一些实例中,包含肾状线虫抗性的第一棉花植物或种质可以是对肾状线虫感染和/或损伤的易感性比在该第一植物或种质的亲本植物或种质中所观察到的易感性低(即,降低)的植物或种质。在一些实例中,包含肾状线虫抗性的第一棉花植物或种质可以是对肾状线虫感染和/或损伤的易感性比在与该第一植物或种质属于相同物种(例如,陆地棉)的特定常规植物或种质中所观察到的易感性低(即,降低)的植物或种质。这些方法的一些实施方案可以包括在第一棉花植物或种质中确定至少一个与肾状线虫抗性连锁的标志物。
还描述了产生包含肾状线虫抗性的棉花植物或种质的方法。这些方法的一些实施方案可以包括将至少一个与肾状线虫抗性连锁的标志物从第一棉花植物或种质(例如海岛棉植物或种质)渗入到第二棉花植物或种质(例如陆地棉植物或种质)中,以产生可能包含肾状线虫抗性的棉花植物或种质。通过前述方法产生的棉花植物或种质也包括在具体的实施方案中。
一些实施方案包括用于产生转基因棉花植物的方法。此类方法的实例可包括将一个或多个外源核酸分子引入到目标棉花植物或其后代中,其中所述外源核酸中的至少一个包含棉花基因组核苷酸序列,所述棉花基因组核苷酸序列与至少一个与肾状线虫抗性连锁的标志物连锁;或者其中所述外源核酸中的至少一个包含这样的核苷酸序列,该核苷酸序列能与另一核苷酸序列特异性杂交,所述另一核苷酸序列与至少一个与肾状线虫抗性连锁的标志物连锁。
一些实施方案包括用于鉴定可能包含肾状线虫抗性的棉花植物的系统和试剂盒。此类系统和试剂盒的具体实例可包括一组核酸探针,其中每一个核酸探针均包含能与另一核苷酸序列特异性杂交的核苷酸序列,所述另一核苷酸序列在棉花中与至少一个与肾状线虫抗性连锁的标志物连锁。用于鉴定可能包含肾状线虫抗性的棉花植物的系统和试剂盒的具体实例可包括检测器,其被配置以检测一个或多个来自所述核酸探针组或其扩增子的信号输出,藉此鉴定至少一个与肾状线虫抗性连锁的标志物的存在或不存在。具体的实例包括这样的指令,该说明将该至少一个标志物的存在或不存在与可能具有肾状线虫抗性相关联。
通过下文参考附图的多个实施方案的详细说明,前述和其它特征将更容易想到。
附图简述
图1包括研究(a-e)中所有样品的log10(X+1)比值的频率分布。
图2包括根据表型筛选中的RN计数数据进行的世代均值分析(generation-meananalysis)。
图3包括染色体21上的QTL区的图,黑色文本显示了峰LOD位置和连锁的标志物。
图4包括QTL区中标志物-性状关联的图形表示,具有RN抗性性状的LOD和%解释。
图5包括SNP检测管道(pipeline)的流程图描述。
序列表
附随的序列表中列出的核酸序列用核苷酸碱基的标准字母缩写显示,如37C.F.R.§1.822中定义的。仅显示了每个核酸序列的一条链,但是应当理解,当提到所显示的链时,也包括了互补链。在附随的序列表中:
SEQIDNO:1-21显示了与棉花染色体21上的主要肾状线虫抗性QTL连锁的SNP标志物。
SEQIDNO:22-27显示了与棉花染色体21上的QTL连锁的SSR标志物。
详细说明
I.多个实施方案的概览
本发明的实施方案涉及与四倍体海岛棉(Gossypiumbarbadense)基因型印加棉(IncaCotton)GB713的肾状线虫抗性紧密连锁的特定分子标志物。在一些实施方案中,这些标志物及其等同物可用于将肾状线虫抗性从这个来源渗入到农艺学上期望的棉花物种或栽培种中(例如,以克服栽培棉花中对肾状线虫的宿主抗性的缺乏),或者在棉花植物或种质中鉴定所述性状。出于许多原因,期望产生与常规栽培种相比具有增加的对肾状线虫感染和/或损伤的抗性的棉花(例如,陆地棉)。还期望鉴定尽可能多的肾状线虫抗性来源,其目的是,例如,提供针对突破抗性的线虫群体或种群的保护,和/或在单一种质中组合多个线虫抗性QTL以提供改进的抗性。本文的实施方案提供了高通量且高成本效率的策略和过程,用于设计和实施RN抗性渗入程序。
一些实施方案包括,例如,方法和组合物,用于鉴定包含来自四倍体海岛棉基因型印加棉(IncaCotton)GB713的肾状线虫抗性的棉花植物,和/或携带可预测并确定这种肾状线虫抗性性状的基因型的种质。一些实施方案包括制作此类棉花植物和种质的方法。此类方法可以包括,例如但不仅限于,渗入期望的肾状线虫抗性标志物等位基因,和/或遗传转化方法。在具体的实施方案中,包括通过例如前述方法制得的棉花植物和/或种质。用于选择包含肾状线虫抗性的棉花植物和/或携带可预测和确定肾状线虫抗性性状的基因型的种质的系统和/或试剂盒也是某些实施方案的特征。
利用MAS来鉴定和选择包含肾状线虫抗性性状的棉花植物,包括上述鉴定和选择的过程能够为产生害虫抗性的、农艺学期望的棉花植物提供一条高效的、环境友好的途径。本发明的实施方案提供了若干棉花标志物基因座和QTL染色体间隔(chromosomeinterval),它们与肾状线虫抗性展现统计学显著的共分离(因此能够预测并确定肾状线虫抗性)。对这些标志物或者与这些标志物连锁(因此与其等价)的额外基因座的检测可用于标志物辅助棉花育种程序,以产生肾状线虫抗性的植物和种质。
一些实施方案提供了用于鉴定显示肾状线虫抗性的第一棉花植物或种质(例如,品系或品种)的方法。在一些实例中,在第一棉花植物或种质中检测与来自四倍体海岛棉基因型印加棉(IncaCotton)GB713的肾状线虫抗性连锁(例如紧密连锁)的一个或多个标志物座位(例如多个标志物座位)中的至少一个等位基因。在实例中,标志物基因座可以选自:表2-4中的基因座;与表2-4中示出的任何标志物连锁的标志物,包括:DASCTP_4812_64;DASCTP_60046_472;DCTE1_261396_78;DASCTP_60046_46;DCTE1_278814_262;DCTE1_214911_694;DCTE1_233925_865;DCTE1_232591_126;DCTE1_365870_69;DASCTP_39375_356;DCTE1_240643_347;DCTE1_208529_965;DCTE1_271930_223;DASCTP_59246_191;DASCTP_28910_164;DASCTP_1656_527;DASCTP_51689_504;DCTE1_214869_124;DASCTP_8602_496;DASCTP_8602_418;DASCTP_10515_556;BNL3279;BNL4011;GH132;和与至少一个前述QTL标志物连锁的其它标志物。
在一些实例中,可以在同一植物或种质中选择或鉴定多个标志物基因座。例如,表2-4中示出的标志物基因座和与表2-4中示出的任何标志物基因座连锁的标志物基因座的所有组合,可以包含在待在植物或种质中选择或鉴定的多个标志物基因座中。在一些实例中,可以通过如下过程(在本文中称作“HAPSNP管道”)提高对部分同源棉花基因组的标志物检测的效率,该过程包括使用序列组装程序产生具有高严格性的序列重叠群(contig),首先检测假定的SNP,生成单倍型信息和基因座在各基因型中的等位基因频率;利用等位基因和单倍型频率区分来自同源SNP的旁系同源/部分同源SNP,从而强化鉴定高品质SNP的能力。这可以根据国际专利申请No.PCT/US13/020211公开的方法完成。
在一些实施方案中,肾状线虫抗性棉花植物包括来自海岛棉印加棉(IncaCotton)GB713的RN抗性QTL的异源核酸(例如,至少一个基因),其能够赋予包含该异源核酸的棉花植物或种质以RN抗性,或改善包含该异源核酸的棉花植物或种质的RN抗性。根据具体实例的分子标志物可用于鉴定此类核酸并对其测序。
II.缩写
AFLP扩增片段长度多态性
ASH等位基因特异性杂交
cM厘摩
EST表达序列标签
LG连锁群
LOD几率对数(以10为底)
MAS标志物辅助选择
NASBA基于核酸序列的扩增
PCR聚合酶链式反应
QTL数量性状基因座
RAPD随机扩增的多态性DNA
RFLP限制性片段长度多态性
RIL重组近交系
RKN根结线虫
RN肾状线虫
RT-PCR反转录酶-PCR
SNP单核苷酸多态性
SSCP单链构型多态性
SSR简单序列重复
III.术语
如本申请(包括权利要求)中使用的,除非在内容中另有明确的说明,否则单数和单数形式的术语(例如,“一”、“一个”和“该”)包括复数指代。因此,例如,称谓“植物”、“该植物”或“一个植物”也指示多个植物。类似地,称谓“标志物”、“该标志物”或“一个标志物”也指示多个标志物。而且,根据上下文,术语“植物”也可以用于指示该植物的在遗传上相似或相同的后代。类似地,术语“核酸”可以指核酸分子的多个拷贝。类似地,术语“探针”可以指许多相似或相同的探针分子,术语“标志物”可以指许多相似或相同的标志物。
数值范围包括限定该范围的数字,并且包括该限定范围内的每一个整数和非整数分数。除非另有说明,否则本文中所有的全部技术和科学术语具有和本领域普通技术人员所共同理解的相同的含义。
为了便于考察本公开所述的各个实施方案,下面提供了对特定术语的解释:
分离的:“分离的”生物组分(例如核酸或蛋白质)是与该组分自然出现的生物体细胞中的其它生物组分(即,其它染色体和染色体外DNA和RNA,和蛋白质)基本上分离的、与之分别产生的,或从中提纯的,同时在该组分中导致化学和功能的改变。例如但不仅限于,可以通过断裂连接核酸与染色体中其余DNA的化学键将核酸从染色体上分离。“分离的”核酸分子和蛋白质包括通过标准纯化技术纯化的核酸分子和蛋白质。术语还包括通过在宿主细胞内重组表达制备的核酸和蛋白质,以及化学合成的核酸分子、蛋白质和肽。
核酸分子:如本文所使用的,术语“核酸分子”可以指核苷酸的聚合形式,其可以包括RNA的有义和反义链,cDNA,基因组DNA,和上述的合成形式和混合聚合物。核苷酸可以指核糖核苷酸、脱氧核糖核苷酸,或任一类型核苷酸的修饰形式。如本文所使用的,“核酸分子”与“核酸”和“多核苷酸”是同义的。该术语包括DNA的单链和双链形式。核酸分子可以包括天然存在和经过修饰的核苷酸的任一种或两种,它们通过天然存在的和/或非天然存在的核苷酸键连接在一起。
核酸分子可以被化学或生物化学修饰,或者可以含有非天然的或衍生的核苷酸碱基,这是本领域技术人员容易意识到的。这些修饰包括,例如,标签、甲基化、一个或多个天然存在的核苷酸用类似物取代,核苷酸间修饰(例如,不带电荷的连接键:例如,甲基膦酸酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等;带电荷的连接键:例如,硫代磷酸酯、二硫代磷酸酯等;侧基部分:例如,肽;嵌入剂:例如,吖啶、补骨脂素,等;螯合剂;烷化剂;和经过修饰的连接键:例如,α-异头核酸等)。术语“核酸分子”还包括任何拓扑构象,包括单链、双链、部分双链体、三重重复、发夹状(hairpinned)、环状和挂锁构象。
定位群体:如本文所使用的,术语“定位群体”可以指用于遗传定位的植物群体(例如,棉花植物群体)。定位群体通常从亲本基因型的受控杂交获得,亲本基因型可以由两个近交系提供。关于亲本选择的决定,用于开发定位群体的交配设计,和所用的标志物类型,均取决于待定位的基因、标志物的可得性、和分子图谱。定位群体中的植物亲本应当在核酸序列和表型水平上均对感兴趣的性状具有充分的变异。利用亲本核酸序列的变异在定位群体植物中跟踪重组事件。
提供信息的多态性标志物的可得性取决于核酸序列变异的量。因此,在特定的亲本基因型的杂交中可能不会鉴定出特定的信息标志物,尽管这样的标志物可能存在。
“遗传图”是给定物种的一个或多个染色体(或连锁群)上基因座之间的遗传连锁关系的描述,可以通过分析定位群体加以确定。在一些实例中,遗传图可以显示成图形或表格的形式。术语“遗传定位”(geneticmapping)可以指通过使用遗传标志物、定位群体中标志物的分离、和重组频率的标准遗传原则来限定基因座的连锁关系的过程。“遗传图位置”是指遗传图上的某个位置(相对于同一连锁群或染色体上周围的遗传标志物),在给定的物种内在该位置处可以发现特定的标志物。相对地,“基因组的物理图”是指给定物种中标志物之间的绝对距离(例如,以碱基对或以分离的和重叠的邻接基因片段度量)。基因组的物理图不一定反映某物种在物理图的不同点之间的测交中观察到的实际重组频率。
杂交:如本文所使用的,术语“杂交”(或“杂交的”)是指通过授粉产生后代(例如,细胞、种子和植物)的配子融合。这个术语既包括有性杂交(即,一个植物被另一个授粉)也包括自交(即,自花授粉,例如使用来自同一植物的花粉和胚珠)。
回交:回交方法可用于将核酸序列引入到植物中。回交技术已经广泛使用了数十年,用于将新性状引入到植物中。Jensen,N.编辑.PlantBreedingMethodology,JohnWiley&Sons,Inc.,1988。在典型的回交方案中,原始的感兴趣栽培种(轮回亲本)与携带待转移感兴趣基因的第二栽培种(非轮回亲本)杂交。然后,该杂交所得的子代再次与轮回亲本杂交,重复这个过程直到获得这样的植物,其中不但来自非轮回亲本的被转移的基因,轮回植物的基本上全部的期望形态和生理特征也均被回收在被转换的植物中。
渗入(introgression):如本文所使用的,术语“渗入”是指将遗传座位处的等位基因传递到遗传背景中。在一些实施方案中,基因座处的特定等位基因形式的渗入可以以这样的形式发生:藉由同一物种的两个亲本之间的有性杂交将该等位基因形式传递到至少一个后代中,其中至少一个所述亲本在其基因组中具有该特定的等位基因形式。包含该特定等位基因形式的后代可以和具有期望遗传背景的品系反复回交。可以在回交后代中选择该特定的等位基因形式,从而产生新的品种,其中该特定的等位基因形式已被固定在遗传背景中。在一些实施方案中,特定等位基因形式的渗入可以以下述形式发生:两个供体基因组之间的重组(例如,在融合的叶绿体中),其中至少一个供体基因组在其基因组中具有该特定的等位基因形式。渗入可以涉及特定等位基因形式的传递,其可以是,例如但不仅限于,标志物等位基因的选定的等位基因形式;QTL;和/或转基因。
种质:如本文所使用的,术语“种质”是指归属或来自单个植物或植物群体(例如,植物品系、品种、家族)的遗传材料,和从植物或植物群衍生的克隆。种质可以是生物体或细胞的一部分,或者它可以是从生物体或细胞分离的(例如,分离的)。一般地,种质可提供具有特定分子组成的遗传材料,其是植物遗传品质的基础。如本文所使用的,“种质”是指特定植物的细胞;种子;特定植物的组织(例如,可以长出新植物的组织);和特定植物的非种子部分(例如,叶、茎、花粉和细胞)。
如本文所使用的,术语“种质”与“遗传材料”是同义的,并可用于指可以繁殖出植物的种子(或其它植物材料)。“种质库”可以指不同种子或其它遗传材料的有组织的集合(其中每个基因型被唯一地鉴定),从中可以培养出已知的栽培种,并可以产生新的栽培种。在实施方案中,在本文描述的方法或植物中使用的种质来自棉花品系或品种。在具体的实例中,种质是棉花品系或品种的种子。在具体的实例中,种质是来自棉花品系或品种的核酸样品。
基因:如本文所使用的,术语“基因”(或“遗传元件”)可以指具有功能意义的可遗传的基因组DNA序列。术语“基因”还可用于指,例如但不仅限于,由可遗传的基因组DNA序列编码的cDNA和/或mRNA。
基因型:如本文所使用的,术语“基因型”是指个体(或个体的群)在一个或多个具体基因座处的遗传构成。个体或个体的群的基因型由该个体从其亲本继承的一个或多个基因座处的等位基因形式所定义和描述。术语“基因型”还可用于指个体在单个基因座处、多个基因座处,或其基因组的所有基因座处的遗传构成。“单倍型”是个体在多个遗传基因座处的基因型。在一些实例中,单倍型所述的遗传基因座可以是物理和遗传连锁的;即各基因座可以位于同一染色体节段上。
良种(elite):如本文所使用的,术语“良种”是指基于卓越的农艺学性能而被选育和选择的品种或栽培种。良种棉花品系包括,例如但不仅限于,DP555BG/RR,DP445BG/RR,DP444BG/RR,DP454BG/RR,DP161B2RF,DP141B2RF,DP0924B2RF,DP0935B2RF,DP121RF,和DP174RF(Deltapine);ST5599BR,ST5242BR,ST4554B2RF,ST4498B2RF,和ST5458B2RF(Stoneville);FM9058F,FM9180B2F,FM1880B2F,和FM1740B2F(Fiber-Max);PHY485WRF,PHY375WRF,和PHY745WRF(PhytoGen);和MCS0423B2RF,和MCS0508B2RF(CottonStates)。
数量性状基因座:在生物体的基因组中可以定位与特定的数量表型相关的特定染色体基因座(或间隔)。每一个这样的基因座被称作“数量性状基因座”或QTL。如本文所使用的,术语“数量性状基因座”是指这样DNA序列段,其已经被鉴定为可能是如下所述的数量性状或表型的基础DNA序列(例如,基因、非编码序列,和/或基因间序列):该数量性状或表型在程度上有变异,且可以归因为两个或多个DNA序列(例如,基因、非编码序列,和/或基因间序列)或其表达产物与其环境之间的相互作用。因此,术语“数量性状基因座”包括具有至少两个等位基因的多态性遗传基因座,这些等位基因在至少一个遗传背景下(例如,在至少一个育种群体或后代中)会对表型性状的表达会产生不同的影响。在实践中,可以分子鉴定QTL,以帮助定位基因组中含有参与规定数量性状(例如RN抗性)的序列的区域。
如本文所使用的,术语“QTL间隔”可以指与QTL性状的基础基因连锁的DNA段。QTL间隔通常,但不必须,大于QTL自身。QTL间隔可以包含位于QTL5′和/或3′侧的DNA段。
已经开发了多种实验范式用于鉴定和分析QTL。参见例如Jansen(1996)TrendsPlantSci.1:89。已经发表的关于作物物种中QTL定位的报道大部分是基于双亲本杂交的应用。参见LynchandWalsh(1997)GeneticsandAnalysisofQuantitativeTraits,SinauerAssociates,Sunderland。通常,这些范式涉及将一对或多对亲本杂交,亲本可以是,例如,来自两个近交株的单独一对,或者是属于不同近交株或系的多个有亲缘或无亲缘的亲本,它们中的每一个显示不同的有关感兴趣的表型性状的特征。通常,这种实验方案涉及从两个趋异(divergent)近交系的单次杂交中衍生100-300个分离后代,其中两个趋异近交系是为了例如使品系之间的表型和分子标志物差异最大化而选择的。对亲本和分离后代的多个标志物基因座进行基因分型,并对一种到数种数量性状(例如,RN性状)进行评估。然后,在分离后代中鉴定在基因型值和表型变异度之间的统计学显著相关性,作为QTL。
这种实验方案的长处或短处决定于近交杂交的使用,因为所得的F1亲本都具有相同的连锁相(等位基因在亲本代中的合同方式)。因此,在F1植物自交之后,所有的分离F2后代都是有信息的,并且连锁不平衡被最大化,连锁相是已知的,只有两个QTL等位基因,并且(除了回交后代之外)每个QTL等位基因的频率为0.5。
本领域技术人员已知许多用于确定标志物是否与QTL(或另一标志物)遗传连锁的统计学方法,这些方法包括但不仅限于,标准线性模型(例如,ANOVA或回归作图;HaleyandKnott(1992)Heredity69:315);和最大似然性方法(例如,期望最大化算法;LanderandBotstein(1989)Genetics121:185-99;Jansen(1992)Theor.Appl.Genet.85:252-60;Jansen(1993)Biometrics49:227-31;Jansen(1994)“Mappingofquantitativetraitlocibyusinggeneticmarkers:anoverviewofbiometricalmodels,”收录于J.W.vanOoijenandJ.Jansen(编辑),BiometricsinPlantbreeding:applicationsofmolecularmarkers,pp.116-24,CPRO-DLOMetherlands;Jansen(1996)Genetics142:305-11;和JansenandStam(1994)Genetics136:1447-55)。
统计方法实例包括:单点标志物分析;区间作图(LanderandBotstein(1989)Genetics121:185);复合区间作图;惩罚回归分析(penalizedregressionanalysis);复杂系谱分析(complexpedigreeanalysis);MCMC分析;MQM分析(Jansen(1994)Genetics138:871);HAPLO-IM+分析;HAPLO-MQM分析;和HAPLO-MQM+分析;贝叶斯MCMC;岭回归;身份-血统分析(identity-by-descentanalysis);和Haseman-Elston回归,其中任一个均适合于本发明具体实施方案的内容。可用于在具体实例中鉴定和定位QTL的复杂育种群体的可选择统计方法在美国专利6,399,855和PCT国际专利公开No.WO0149104A2中有描述。所有这些方法都是计算密集型的,通常在包含专门软件的基于计算机的系统的帮助下执行。合适的统计包可以从各种公共和产业来源获得,并且是本领域技术人员已知的。
标志物:虽然编码蛋白质的特定DNA序列一般在物种之间是充分保守的,但是其它的DNA区域(例如,非编码DNA和内含子)倾向于发展和积累多态性,因此在同一物种的个体之间可能是不同的。基因组变异可以是任何来源,例如,变异可能是由于DNA的插入、缺失、重复、重复DNA元件、点突变、重组事件、和转座元件的存在和序列所致。这些区域可能含有有用的分子遗传标志物。一般地,在后代中分离的任何差异性遗传的多态性性状(包括核酸多态性)都是潜在的标志物。
如本文所使用的,术语“标志物”和“分子标志物”是指在鉴定连锁基因座时用作参考点的核酸或其编码的产物(例如,蛋白质)。因此,标志物可以指能够用于鉴定具有特定等位基因的植物的基因或核酸。标志物可以描述为给定基因组座位处的变异。遗传标志物可以是短DNA序列,例如单碱基对改变(单核苷酸多态性或“SNP”)周围的序列,或者是长DNA序列,例如微卫星/简单序列重复(“SSR”)。“标志物等位基因”或“标志物等位基因形式”是指具体个体中存在的标志物的版本。如本文所使用的,术语“标志物”可以指染色体DNA的克隆节段,或者可以/还可以指与染色体DNA的克隆节段互补的DNA分子。该术语还指与基因组标志物序列互补的核酸序列,例如核酸引物和探针。
标志物可以被描述为,例如,生物体的遗传图中的特定位置处的特定多态性遗传元件。遗传图可以是基因组(或基因组的一部分,例如单个染色体)的图形表示,其中染色体上地标(landmark)与地标之间的距离用地标与地标之间的重组频率来度量。遗传地标可以是多种已知的多态性标志物的任意一种,例如但不仅限于:简单重复序列(SSR)标志物;限制性片段长度多态性(RFLP)标志物;和单核苷酸多态性(SNP)标志物。作为一个实例,SSR标志物可以源自于基因组或表达的核酸(例如,表达序列标签(EST))。
其他标志物包括,例如但不仅限于,EST;扩增片段长度多态性(AFLP)(Vosetal.(1995)Nucl.AcidsRes.23:4407;Beckeretal.(1995)Mol.Gen.Genet.249:65;Meksemetal.(1995)Mol.Gen.Genet.249:74);随机扩增多态性DNA(RAPD);和同工酶标志物。同工酶标志物可以用作遗传标志物,例如,来跟踪与特定的第一标志物连锁的同工酶标志物或其他类型的标志物。同工酶是多种形式的酶,它们在氨基酸序列上(因此,在其编码核酸序列上)彼此不同。一些同工酶是多聚酶,含有略有不同的亚基。其它的同工酶是多聚体的或单体的,但都是在原酶(pro-enzyme)氨基酸序列的不同位点处从原酶上切下来的。同工酶可以在蛋白质水平或核酸水平上进行表征和分析。因此,在具体实施例中,本文所述的任何基于核酸的方法均可用于分析同工酶标志物。
“遗传标志物”包括在群体中有多态性的等位基因,该群体中的等位基因可以通过一种或多种分析方法(例如RFLP分析,AFLP分析,同工酶标志物分析,SNP分析和SSR分析)进行检测和区分。术语“遗传标志物”还可以指在鉴定遗传连锁基因座(例如QTL)时可用作参考点的遗传座位(“标志物基因座”)。这些标志物也可称作“QTL标志物”。
上述物理地标的性质(和用于检测它们的方法)各不相同,但是所有这些标志物都可以根据多核苷酸长度和/或序列加以物理区分(以及和任何一种特定标志物的多个等位基因相区分)。已经确立了许多用于检测分子标志物和鉴定标志物等位基因的方法。本领域技术人员已知有多种多样的规程用于检测这种变异性,并且这些规程对于它们旨在检测的多态性类型通常是特异的。这些规程包括,例如但不仅限于,PCR扩增和单链构象多态性(SSCP)的检测,例如,通过电泳;和自主持续的序列复制(3SR)(见ChanandFox(1999)ReviewsinMedicalMicrobiology10:185-96)。
分子标志物技术一般会提高通过MAS的植物育种效率。与期望的表型性状(例如QTL)显示连锁不平衡的分子标志物等位基因为在植物群体中选择期望的性状提供了有用的工具。实现MAS方法的关键组成部分是:在植物种质中创建密集的(有信息的)分子标志物遗传图;基于标志物与表型变异度之间的统计学关联检测至少一个QTL;基于QTL分析结果定义一系列具体的有用的标志物等位基因;和将这些信息用于和/或外推到当前系列的育种种质中,为做出基于标志物的选择决定提供可能。
可以观察同一物种(例如棉花)的不同群体中的遗传变异性,例如在定位群体中确定的遗传变异性。尽管遗传图在同一物种的群体之间可能发生变异,但是来自一个群体的遗传图和多态性标志物信息一般仍然可用于属于不同亚种的多个群体,以实现鉴定和/或选择包含与该标志物连锁的性状的植物和/或种质,和反选择包含不良性状的植物和/或种质的目的。
在本文所述具体MAS方案中使用的两种类型的标志物是SSR标志物和SNP标志物。SSR标志物包括任何类型的导致核酸序列长度变异的分子异质性。示例性SSR标志物是短DNA节段(最长达数百个碱基对),其由多个串联重复的两个或三个碱基对序列构成。这些重复序列由于复制保真度较差(例如,由于聚合酶滑移),产生长度可变的高度多态性DNA区域。SSR似乎在基因组中是随机分布的,并且一般侧翼有保守的区域。SSR标志物还可以来自RNA序列(呈cDNA、部分cDNA或EST等形式)以及基因组材料。
SSR标志物的异质性使它们非常适合用作分子遗传标志物。例如,SSR基因组变异度是遗传的,并且是多等位基因、共显性和可重复检测的。日益复杂的基于扩增的检测技术(例如,基于PCR的技术)的推广为检测样品之间的核苷酸序列的异质性提供了多种灵敏的方法。探针(例如,核酸引物)可以被设计成和SSR的侧翼保守区杂交,并且探针可用于扩增可变SSR区。从SSR区产生的不同大小的扩增子具有特征性的并且可重现的大小。观察到的来自植物群体的某一个体或者不同个体的两个同源染色体的、不同大小的SSR扩增子限定了SSR标志物等位基因。只要存在至少两个可产生大小不同的PCR产物的SSR标志物等位基因,该SSR便可用作标志物。
连锁(不)平衡:如本文所使用的,术语“连锁平衡”是指两个标志物独立分离的状态,即标志物在后代中随机组合。显示连锁平衡的标志物被认为是不连锁的(无论它们是否位于同一染色体)。如本文所使用的,术语“连锁不平衡”是指两个标志物以非随机的方式分离的状态;即标志物具有小于50%的重组频率(因此根据定义,在同一连锁群上的间隔小于50cM)。在一些实例中,显示连锁不平衡的标志物被认为是连锁的。
连锁、紧密连锁和极紧密连锁:如本文所使用的,基因或标志物之间的连锁可以指如下的现象,其中某个染色体上的基因或标志物有显著的被一起传递到下一代的个体中的概率。因此,一个标志物与另一个标志物或基因的连锁可以用重组频率度量和/或表示。两个基因或标志物彼此越接近,这个概率越接近“1”。因此,术语“连锁”可以指一个或多个基因或标志物以大于0.5的概率(这是从当标志物/基因位于不同染色体上时的自由组合出发预期的)与另一个基因一起传递。当基因的存在对个体的表型有贡献时,与该基因连锁的标志物可以称作与该表型连锁。因此,术语“连锁”可以指标志物和基因之间,或者标志物和表型之间的关系。
两个连锁的标志物或基因在染色体上彼此分离时,相对遗传距离(由杂交频率决定,并且用厘摩(cM)度量)一般与物理距离(用碱基对度量)成比例。1厘摩的定义是:显示1%重组频率(即,两个标志物在每100次细胞分裂中发生一次杂交事件)的两个遗传标志物之间的距离。一般地,一个标志物与另一个标志物或基因越接近(无论它们之间的距离用遗传距离度量还是用物理距离度量),它们连锁得越紧密。由于染色体距离与性状之间的重组事件的频率大致成比例,所以有一个近似的物理距离与重组频率相关联。
如本文所使用的,术语“连锁”可以指被小于大50cM的遗传距离所分隔的一个或多个基因或标志物。因此,两个“连锁的”基因或标志物可以相隔小于约45cM;小于约40cM;小于约35cM;小于约30cM;小于约25cM;小于约20cM;小于约15cM;小于约10cM;和小于约5cM。
如本文所使用的,术语“紧密连锁”可以指彼此距离在约35cM之内的一个或多个基因或标志物。因此,两个“紧密连锁的”基因或标志物可以分隔小于36cM;小于35cM;小于34cM;小于约33cM;小于约32cM;小于约31cM;小于约30cM;小于约29cM;小于约28cM;小于约27cM;小于约26cM;小于约25cM;小于约24cM;小于约23cM;小于约22cM;小于约21cM;小于约20cM;小于约19cM;小于约18cM;小于约17cM;小于约16cM;小于约15cM;小于约14cM;小于约13cM;小于约12cM;小于约11cM;小于约10cM;小于约9cM;小于约8cM;小于约7cM;小于约6cM;小于约5cM;乃至更小的遗传距离。
如本文所使用的,术语“极紧密连锁”可以指彼此距离在约5.0cM之内的一个或多个基因或标志物。因此,两个“极紧密连锁的”基因或标志物可以相隔小于6.0cM;小于5.5cM;小于5.0cM;小于约4.5cM;小于约4.0cM;小于约3.5cM;小于约3.0cM;小于约2.5cM;小于约2.0cM;小于约1.5cM;小于约1.0cM;和小于约0.5cM。
某个标志物与编码对某个表型有贡献的多肽的基因越接近(无论是按照遗传距离还是物理距离度量),该特定标志物与该表型越紧密连锁。鉴于前述内容可以认识到,与某基因或表型连锁的标志物包括那些与该基因或表型紧密连锁的标志物,和那些与之极紧密连锁的标志物。在一些实施方案中,某个标志物与对RN抗性表型有贡献的基因越接近(无论是按照遗传距离还是物理距离度量),该标志物与RN抗性表型越紧密连锁。因此,棉花中RN抗性表型的连锁、紧密连锁和极紧密连锁的遗传标志物可用于MAS程序,来鉴定包含RN抗性(与亲本品种和/或至少一种特定的常规栽培种相比)的棉花品种,鉴定包含RN抗性的个体棉花植物,和将这个性状育种到其它棉花品种中(例如,“AD”基因组棉花,如陆地棉)以提高对RN感染和/或损伤的抗性。
在一些实施方案中,分子标志物与表型之间的连锁关系可以表示为“概率”或“调整概率(adjustedprobability)”。在此语境中,概率值是“某一表型与特定标志物等位基因之存在或不存在的特定组合是随机的”的统计学似然性。因此,概率得分越低,表型和特定标志物等位基因形式将会共分离的可能性越大。在一些实例中,概率得分可以描述为“显著”或“不显著”。在具体的实例中,随机组合的概率得分为0.05(p=0.05(5%概率))被认为是共分离的“显著”指示。然而,在其它实例中,显著概率可以是任何小于50%(p=0.5)的概率。例如,显著概率可以小于0.25;小于0.20;小于0.15;和/或小于0.1。
在一些实施方案中,与RN抗性表型连锁的标志物可以从表2-4中示出的染色体18和21的棉花QTL标志物中选择。在一些实施方案中,与RN抗性表型连锁的标志物可以从与表2-4中示出的QTL标志物的距离在约10cM之内标志物中选择。因此,与RN抗性表型连锁的标志物和表2-4中示出的QTL标志物(例如,表3-4中示出的QTL标志物)的距离可以在例如10cM;9cM;8cM;7cM;6cM;5cM;4cM;3cM;2cM;1cM;0.75cM;0.5cM;0.25cM之内;或更小。例如,标志物可以位于表2-4中示出的两个QTL标志物之间。
植物育种者可以有利地使用分子标志物,通过鉴定与期望表型(例如RN抗性)显示统计学显著的共分离概率(表现为连锁不平衡)的标志物等位基因,来鉴定期望的个体。通过鉴定与数量性状共分离的分子标志物或分子标志物集群,育种者因此鉴定QTL。通过鉴定和选择与期望表型相关的标志物等位基因(或来自多个标志物的期望等位基因),植物育种者能够通过选择合适的分子标志物等位基因(即MAS)快速选择表型。被置于遗传图上的分子标志物越多,该图指导MAS的潜在用处越大,MAS过程中能够使用的遗传背景越多。
标志物组:如本文所使用的,标志物或探针“组”是指可用于鉴定包含感兴趣性状的个体的标志物或探针(或由其得来的数据)的特定组合。在一些实施方案中,与RN抗性表型连锁的一组标志物可用于鉴定包含RN抗性的棉花植物。对应于标志物组或探针组的数据(或者使用这些标志物或探针得来的数据)可以存储在电子介质中。标志物组中的每个标志物均可能对性状鉴定有用,而从该组选出的个别标志物,以及包括这些标志物中的一些但不是全部的亚组,也可能有效地鉴定包含感兴趣性状的个体。
等位基因:如本文所使用的,术语“等位基因”是指出现在特定基因座的两种或更多种不同核苷酸序列中的一种。例如,一种等位基因可能出现在一个染色体上,而另一种等位基因可能出现在另一个同源染色体上,就像例如在杂合个体的不同染色体上,或者出现在群体的不同纯合或杂合个体中出现的那样。在一些实施方案中,特定基因座处的特定等位基因可能与农艺学期望的表型(例如,RN抗性)连锁。在一些实施方案中,基因座处的特定等位基因可能允许鉴定不包含农艺学期望表型的植物(例如,RN易感植物),从而能够将那些植物从育种程序或播种中除去。标志物等位基因可以和有利的表型一起分离,从而提供鉴定包含该表型的植物的好处。“染色体片段的等位基因形式”可以是指这样的染色体节段,其包含标志物等位基因核苷酸序列,该序列有助于,或者连锁于,物理上位于该染色体节段上的一个或多个遗传座位处的特定表型。
“等位基因频率”可以指等位基因在植物、品系或品系群体中存在于某个基因座处的频率(用比例或百分比表示)。因此,对于等位基因“A”,基因型为“AA,”“Aa,”“AB,”或“aa”的二倍体个体具有的等位基因频率分别为1.0,0.5,0.5,或0.0。品系中的等位基因频率可以通过将来自该品系的个体样本的等位基因频率求平均来估计。类似地,品系群体中的等位基因频率可以通过对构成该群体的品系的等位基因频率求平均来计算。对于具有有限数目个体或品系的群体,等位基因频率可以表示为含有该等位基因的个体或品系(或任何其它特定分组)的计数。
如果某标志物与某性状连锁,并且该标志物等位基因的存在是该期望性状或性状形式将在包含该等位基因的植物中出现的指示,则该标志物等位基因与该性状“正”相关。如果某标志物与某性状连锁,并且该标志物等位基因的存在是该期望性状或性状形式不会在包含该等位基因的植物中出现的指示,则该标志物等位基因与该性状“负”相关。
“纯合”个体在给定的基因座处仅有一种形式的等位基因(例如,在两个同源染色体中每一个的特定基因座处具有相同的等位基因拷贝的二倍体植物)。如果在基因座处存在多于一种等位基因形式,则个体是“杂合的”(例如,在基因座处具有一个拷贝的第一等位基因形式、以及一个拷贝的第二等位基因形式的二倍体个体)。术语“均质性”是指群体的成员在一个或多个感兴趣的特定基因座处具有相同的基因型(即,相同的等位基因频率)。相反,术语“异质性”是指群体中的个体在一个或多个感兴趣的特定基因座处的基因型不同。
可以使用任何能够用于表征基因座处的核苷酸序列的技术来鉴定标志物等位基因。用于标志物等位基因检测的方法包括,例如但不仅限于,分子鉴定方法(例如,标志物扩增子的扩增和检测)。例如,SSR标志物或SNP标志物的等位基因形式可以通过基于扩增的技术进行检测。在典型的基于扩增的检测方法中,标志物基因座或标志物基因座的一部分被扩增(使用,例如,PCR、LCR和转录,以从感兴趣的棉花植物分离的核酸作为扩增模板),并对所得扩增标志物的扩增子进行检测。在一些实施方案中,可以使用植物RNA作为用于扩增反应的模板。在一些实施方案中,可以使用植物基因组DNA作为用于扩增反应的模板。在一些实施中,QTL标志物是SNP标志物,并且被检测的等位基因是SNP标志物等位基因,检测的方法是等位基因特异性杂交(ASH)。在一些实例中,QTL标志物是SSR标志物,并且被检测的等位基因是SSR标志物等位基因。
ASH技术基于短的、单链寡核苷酸探针与完全互补的单链靶核酸的稳定退火。可以通过检测附着在探针上的同位素或非同位素标志物实现检测。对于每种多态性,可以设计两个或多个不同的ASH探针,使它们在除多态性位点之外的区域具有相同的DNA序列。每个探针可以与一个等位基因序列完美同源,从而使探针的范围能够区分所有已知的可选等位基因序列。当每个探针与靶DNA在合适的探针设计和杂交条件下杂交时,探针与靶DNA之间的单碱基错配会阻止杂交。这样,只有一个备选探针会与和等位基因同源的靶样品杂交。对两个等位基因而言为杂合或异源的样品会与两个备选的探针均杂交。
ASH标志物可用作显性标志物,其中通过仅一个探针的杂交与否来确定仅一个等位基因的存在与否。备选的等位基因可以由杂交的缺失来推断。在实例中,ASH探针和靶分子可以是RNA或DNA分子;在与探针互补的序列之外,靶分子可以包括任何长度的核苷酸;探针可以被设计成与DNA靶的任一条链杂交;并且可以改变探针的大小以符合不同杂交条件的需要。
扩增可变序列是指在同一物种的成员之间显示高度的核苷酸残基变异性的植物基因组扩增序列。所有生物均具有可变的基因组序列,并且每个生物体(除了克隆之外)具有一组不同的可变序列。一旦被鉴定,特定可变序列的存在即可用于预测表型性状。在一些实例中,来自植物的DNA可以用作模板,使用DNA可变序列侧翼的引物进行扩增。可变序列可以被扩增并随后测序。
自主持续序列复制(self-sustainedsequencereplication)也可以作为替代或附加用于鉴定遗传标志物。自主持续序列复制是指一种核酸扩增方法,其使用的靶核酸序列在体外基本上恒温的条件下在体外被指数复制,其中使用参与逆转录病毒复制的三种酶活性:逆转录酶;RNA酶H;和DNA依赖的RNA聚合酶。Guatellietal.(1990)Proc.Natl.Acad.Sci.USA87:1874。通过使用cDNA中间物模拟逆转录病毒的RNA复制策略,这种反应积累原始靶物的cDNA和RNA拷贝。
代表被检出的标志物等位基因的数据可以被传送到(例如,电子传送;和通过红外线、无线或光学传播传送)计算机或计算机可读的介质中,用于分析或储存。
例如,可以将扩增引物或扩增引物对与从第一棉花植物或种质分离的基因组核酸混合,其中该引物或引物对互补于或部分互补于标志物基因座的至少一部分,并且该引物或引物对能够使用棉花基因组核酸作为模板引发DNA聚合酶驱动的DNA聚合。该引物或引物对(例如,作为SEQIDNO:27和其等同物的其中之一提供的引物或引物对)使用DNA聚合酶和模板基因组核酸在DNA聚合反应中延伸,产生至少一个扩增子。
“位置克隆”是指一种特定的克隆程序,其中通过靶核酸与标志物在基因组上的接近而鉴定和分离靶核酸。例如,基因组核酸克隆可以包括两个彼此接近的染色体区域的全部或一部分。如果标志物可用于从基因组文库中鉴定基因组核酸克隆,则可以使用标准方法,例如亚克隆和/或测序,来鉴定和/或分离位于该标志物附近的克隆的子序列。
基因座:如本文所使用的,术语“基因座”是指基因组上相应于可测量特征(例如,性状)或多态性的位置。基因座(例如,SNP基因座)由与基因座内含有的DNA杂交的探针定义。
标志物辅助育种:如本文所使用的,术语“标志物辅助育种”可以指直接利用MAS对一个或多个性状(例如,RN抗性)进行育种的方法。在当前的实践中,植物育种者试图鉴定与农艺学期望性状连锁的容易检测的性状,例如花色、种皮外形、或同工酶变体。然后,植物育种者在分离的育种群体中通过跟踪该容易检测的性状的分离来跟踪该农艺学性状。然而,只有极少的这些连锁关系可供植物育种中使用。
标志物辅助育种提供了一种用于改良植物栽培种的时间和成本高效的过程。应用标志物辅助育种的数个实例涉及使用同工酶标志物。参见例如Tanksley和Orton编辑.(1983)IsozymesinPlantBreedingandGenetics,Amsterdam:Elsevier。一个实例是番茄中与线虫害虫抗性基因相关的同工酶标志物。该抗性由命名为Mi的基因控制,位于番茄的第6染色体,并且与一种酸性磷酸酶同工酶Aps1极紧密连锁。使用Aps1同工酶标志物间接选择Mi基因提供了优势,即可以通过标准电泳技术明确地确定群体的分离;该同工酶标志物可以在幼苗组织中打分,从而无需维持植物至成熟;并且同工酶标志物等位基因的共显性使得区分纯合子和杂合子成为可能。见Rick(1983),收录于TanksleyandOrton,同上。
探针:在一些实施方案中,植物中标志物的存在可以通过使用核酸探针进行检测。探针可以是DNA分子或RNA分子。RNA探针可以通过本领域已知的方法合成,例如使用DNA分子模板。探针可以包含标志物的全部或部分的核苷酸序列,和额外的来自植物基因组的邻接核苷酸序列。这在本文中称作“邻接探针”。该额外的邻接核苷酸序列称作原标志物的“上游”或“下游”,这取决于来自植物染色体的邻接核苷酸序列位于原标志物的5′还是3′侧,如常规理解的。本领域普通技术人员会认识到,获得额外的邻接核苷酸序列以包含在标志物内的过程可以几乎无限地重复进行(仅由染色体的长度限制),藉此沿着染色体鉴定其他的标志物。
寡核苷酸探针序列可以合成地或通过克隆加以制备。合适的克隆载体是本领域技术人员众所周知的。寡核苷酸探针可以是标记或无标记的。有许多技术可用于标记核酸分子,包括例如但不仅限于:通过切口平移;随机引发;用末端脱氧转移酶加尾;或类似的方法进行放射性标记,其中所用的核苷酸用例如放射性32P标记。可以使用的其它标记物包括,例如但不仅限于:荧光团(例如,FAM和VIC);酶;酶底物;酶的辅因子;酶抑制剂;等等。或者,作为使用可自身或与其它反应剂一起提供可检测信号的标记物的替代手段,可以使用与受体结合的配体,其中受体被标记(例如,用上述标记物标记)从而自身或与其它试剂一起提供可检测信号。参见例如Learyetal.(1983)Proc.Natl.Acad.Sci.USA80:4045-9。
探针可以含有不与原始标志物邻接的核苷酸序列;这种探针在本文中称作“非邻接探针”。非邻接探针的序列在基因组上与原标志物的序列充分接近,从而使该非邻接探针与相同基因或性状(例如,RN抗性)在遗传上连锁。例如,在一些实施方案中,非邻接探针与表2-4中示出的QTL标志物(例如,表3-4中示出的QTL标志物)的距离可在约10cM;9cM;8cM;7cM;6cM;5cM;4cM;3cM;2cM;1cM;0.75cM;0.5cM;0.25cM之内,或者更小。
探针可以是要检测的标志物的精确拷贝。探针也可以是包含,或者由与主题生物(例如棉花)染色体DNA的克隆节段基本上相同的核苷酸序列构成的核酸分子。如本文所使用的,术语“基本上相同”可以指超过85%相同的核苷酸序列。例如,基本上相同的核苷酸序列可以和参考序列85.5%;86%;87%;88%;89%;90%;91%;92%;93%;94%;95%;96%;97%;98%;99%或99.5%相同。
探针还可以是与被检测标志物(“DNA靶”)的精确拷贝“能特异性杂交”或“特异性互补”的核酸分子。术语“能特异性杂交”或“特异性互补”是指足够程度的互补,从而在核酸分子与DNA靶之间发生稳定而特异的结合。核酸分子不必和特异性杂交的靶序列100%互补。当存在足够程度的互补,从而避免该核酸与非靶序列在期望特异性结合的条件下,例如在严格杂交条件下发生非特异性结合时,核酸分子便能特异性杂交。
导致特定严格程度的杂交条件随着所选杂交方法的本质和杂交核酸序列的组成和长度而改变。一般地,杂交温度和杂交缓冲液的离子强度(特别是Na+和/或Mg++浓度)将决定杂交的严格度,尽管清洗时间也会影响严格度。关于获得具体严格程度所需的杂交条件的计算是本领域普通技术人员已知的,并且在下列文献中有讨论:Sambrooketal.(编辑)MolecularCloning:ALaboratoryManual,第2版,第1-3卷,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY,1989,第9和11章;和HamesandHiggins(编辑)NucleicAcidHybridization,IRLPress,Oxford,1985。关于核酸杂交更详细的说明和指导可以参见,例如Tijssen,“Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays,”收录于LaboratoryTechniquesinBiochemistryandMolecularBiology-HybridizationwithNucleicAcidProbes,部分I,第2章,Elsevier,NY,1993;和Ausubeletal.,编辑,CurrentProtocolsinMolecularBiology,第2章,GreenePublishingandWiley-Interscience,NY,1995。
如本文所使用的,“严格条件”包括如下的条件,其中只有杂交分子与DNA靶之间的错配小于50%时才会发生杂交。“严格条件”包括更具体水平的严格度。因此,如本文所使用的,“中等严格”条件是序列错配超过50%的分子不会杂交的条件;“高严格”条件是序列错配超过20%不会杂交的条件;“极高严格”条件是序列错配超过10%不会杂交的条件。
下面是代表性的非限制性杂交条件:
极高严格度(检测序列同一性至少为90%的序列):在5xSSC缓冲液中65℃杂交16小时;在2xSSC缓冲液中室温清洗2次,每次15分钟;和在0.5xSSC缓冲液中65℃清洗2次,每次20分钟。
高严格度(检测序列同一性至少为80%的序列):在5x-6xSSC缓冲液中65-70℃杂交16-20小时;在2xSSC缓冲液中室温清洗2次,每次5-20分钟;和在1xSSC缓冲液中55-70℃清洗2次,每次30分钟。
中等严格度(检测序列同一性至少为50%的序列):在6xSSC缓冲液中室温杂交16-20小时;在2x-3xSSC缓冲液中室温-55℃清洗2次,每次20-30分钟。
关于上文讨论的所有探针,探针可以包括额外的核酸序列,例如启动子;转录信号;和/或载体序列。上文讨论的任何探针均可用于定义其他和参与棉花RN抗性的基因连锁的标志物,如此鉴定的标志物与本公开中命名的示例性标志物可以是等价的,因此在本发明的范围内。
序列同一性:如本文所使用的,术语“序列同一性”或“同一性”在两个核酸或多肽序列的内容中可以指当将两个序列对齐以在特定比较窗口上实现最大相应度时,两个序列中相同的残基。
如本文所使用的,术语“百分比序列同一性”可以指通过在比较窗口上比较两个最佳比对的序列(例如,核酸序列)确定的数值,其中比较窗口中的序列部分与参考序列(其不含有添加或缺失)相比可能包含添加或缺失(即,缺口),以实现两个序列的最佳比对。百分比通过如下计算:确定在两个序列中都存在的相同核苷酸或氨基酸残基的位置数目以产生匹配位置的数目,然后用匹配位置的数目除以比较窗口中的位置总数,将该结果乘以100,得出百分比序列同一性。
用于比对比较序列的方法是本领域众所周知的。各种程序和比对算法在例如下列文献中有描述:SmithandWaterman(1981)Adv.Appl.Math.2:482;NeedlemanandWunsch(1970)J.Mol.Biol.48:443;PearsonandLipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444;HigginsandSharp(1988)Gene73:237-44;HigginsandSharp(1989)CABIOS5:151-3;Corpetetal.(1988)NucleicAcidsRes.16:10881-90;Huangetal.(1992)Comp.Appl.Biosci.8:155-65;Pearsonetal.(1994)MethodsMol.Biol.24:307-31;Tatianaetal.(1999)FEMSMicrobiol.Lett.174:247-50。序列比对方法和同源性计算的详细论述可以参见,例如Altschuletal.(1990)J.Mol.Biol.215:403-10。
美国国家生物技术信息中心(NCBI)基本局部比对搜索工具(BLASTTM;Altschuletal.(1990))可从多个来源获得,包括美国国家生物技术信息中心(Bethesda,MD)和在互联网上,与多种序列分析程序联合使用。关于如何使用这一程序确定序列同一性的描述,可以在互联网BLASTTM的“help”(帮助)一节中获得。对于核酸序列的比较,可以使用该BLASTTM(Blastn)程序的“Blast2sequences”功能,使用设定为默认参数的缺省BLOSUM62矩阵。当使用这种方法进行评估时,与参考序列具有越大相似性的核酸序列将显示越大的百分比同一性。
外源的:“外源”分子是就多核苷酸的核苷酸序列和/或基因组位置,和多肽的氨基酸序列和/或细胞定位而言,对特定系统(例如,种质、品种、良种品种、和/或植物)非天然的分子。在实施方案中,外源或异源多核苷酸或多肽可以是人为添加到生物系统(例如,植物细胞、植物基因、特定植物物种或品种,和/或植物染色体)中的分子,并且不是该具体生物系统固有的。因此,将某个核酸指定为“外源的”可以表示该核酸来自非天然存在的来源,或者可以表示该核酸具有非天然的构型、遗传位置、或元件排列。
相对地,例如,“天然”/“固有”(native)或“内源”(endogenous)核酸是这样的核酸(例如基因),除了该核酸在自然界中所在的染色体或其他遗传材料上正常存在的核酸元件之外,该核酸不含有其他核酸元件。内源基因转录本由天然染色体基因座处的核苷酸序列编码,不是人为添加到细胞中的。
重组:术语“重组”是指已通过人为干预被改变的材料(例如,重组核酸、重组基因、重组多核苷酸,和/或重组多肽)。例如,重组分子的各部分或元件的排列可能不是天然的排列,和/或重组分子的一级序列已经与其固有序列有某种不同。材料的改变可以产生处于其自然环境或状态内、或从其自然环境或状态移出的重组材料。如果核酸的开放阅读框的核苷酸序列被从其天然环境中移出并被克隆到任何类型的人工核酸(例如载体)中,则核酸的开放阅读框是重组的。产生重组分子(特别是重组核酸)的规程和试剂在本领域是通用的,并且其使用是本领域常规的。术语“重组”在本文中还指包含重组材料的细胞或生物体(例如,包含重组核酸的植物和/或植物细胞)。在一些实例中,重组生物体是转基因生物。
如本文所使用的,术语“引入/导入”在指示将异源或外源核酸转位到细胞内时,是指使用任何本领域可得的任何方法将核酸合并到细胞内。这个术语包括核酸引入方法,包括例如但不仅限于,转染;转化;和转导。
如本文所使用的,术语“载体”是指能够将至少一个核酸节段转移到细胞内的多核苷酸或其它分子。载体可以任选地包括介导载体保持和实现其预期用途的组分/元件(例如,复制必需的序列,赋予药物或抗生素抗性的基因,多克隆位点,和/或能够使被克隆基因表达的操作连接的启动子/增强子元件)。载体可以来自,例如,质粒、噬菌体,或植物或动物病毒。“克隆载体”、“穿梭载体”或“亚克隆载体”一般包括操作连接的元件,以方便克隆和亚克隆步骤(例如,含有多个限制性核酸内切酶位点的多克隆位点)。
如本文所使用的,术语“表达载体”是指包含可以促进编码序列在特定宿主生物体内表达的操作连接的多核苷酸序列的载体。例如,细菌表达载体可以促进编码序列在细菌中表达。植物表达载体可以促进编码序列在植物细胞中表达。促进在原核生物中表达的多核苷酸序列可以包括,例如但不仅限于,启动子;操纵子;和核糖体结合位点。真核表达载体(例如,植物表达载体)包括启动子、增强子、终止和多腺苷酸化信号(和其它序列),它们一般与原核表达载体中使用的不同。
单核苷酸多态性:如本文所使用的,术语“单核苷酸多态性”(SNP)可以指当基因组(或其它共有的序列)在物种的成员之间或者在个体内的配对染色体之间发生单个核苷酸差异时的DNA序列变异。在群体中,可以对SNP指配最小等位基因频率(minorallelefrequency),它是在特定群体中观察到的某基因座处的最低的等位基因频率。对于单核苷酸多态性而言,这就是两个等位基因频率中较小的那个。不同群体预期会显示至少稍微不同的等位基因频率。特定群体可能显示显著不同的等位基因频率。在一些实例中,与RN抗性连锁的标志物是SNP标志物。在准确而快速的基因分型方法中可以使用新进的高通量基因分型技术,如测定(Illumina,SanDiego,CA),将SNP多重化,每个样品进行384重至>100,000重测定。虽然SNP标志物非常有用,但是发现SNP标志物需要获得高品质的DNA序列信息。
SNP可能落入基因的编码序列、基因的非编码区,或基因之间的间隔区内。由于遗传密码的简并性,编码序列内的SNP不一定会改变所产生的蛋白质的氨基酸序列。若SNP的两种形式导致相同的多肽序列,这样的SNP称作“同义的”(有时被称为沉默突变)。如果会产生不同的多肽序列,则它们称为“非同义的。”非同义的改变可能是错义的或无义的,其中错义改变会产生不同的氨基酸,而无义改变会产生提前终止密码子。不位于蛋白质编码区内的SNP可能对基因剪接、转录因子结合,或非编码RNA的序列也会产生影响。SNP通常是双等位基因的,因此容易在植物和动物中被测定。Sachidanandam(2001)Nature409:928-33。
植物:如本文所使用的,术语“植物”可以指整个植物,来自植物的细胞或组织培养物,和/或前述任一个的任何部分。因此,术语“植物”包括,例如但不仅限于,整个植物;植物部分和/或器官(例如,叶、茎和根);植物组织;种子;和植物细胞。植物细胞可以是,例如但不仅限于,植物中和/或植物的细胞,从植物分离的细胞,和通过培养从植物分离的细胞而获得的细胞。因此,术语“棉花植物”可以指,例如但不仅限于,整个棉花植株;多个棉花植株;棉花植株细胞;棉花植株原生质体;棉花组织培养物(例如,能够从中再生棉花植株的);棉花植株愈伤组织;棉花植株部分(例如,棉籽、棉花、棉子叶、棉叶、棉茎、棉芽(cottonbud)、棉根和棉根尖);和棉花植株细胞,其在棉花植株或棉花植株的一部分中是完整的。
“转基因植物”是在其至少一个细胞内含有外源多核苷酸的植物。在实施例中,外源多核苷酸被稳定地整合在细胞基因组内,使得该多核苷酸可以在后继世代中遗传。在一些实例中,外源多核苷酸可以作为重组表达盒的一部分整合到基因组中。术语“转基因(的)”(transgenic)在本文中用于指任何基因型由于外源核酸的存在而被改变的细胞、细胞系、愈伤组织、组织、植物部分或植物。因此,这个术语涵盖最先被改变从而包含外源多核苷酸的转基因生物和细胞,和通过最先的转基因生物或细胞的杂交或无性繁殖而产生的生物和细胞。如本文所使用的,术语“转基因(的)”不包括通过常规植物育种方法(例如,仅非转基因生物体的杂交)或者通过天然发生的事件(例如,随机交叉授精,非重组病毒感染,非重组细菌转化,非重组转座和自发突变)而引入的基因组(染色体或染色体外)改变。
植物“品系”、“品种”或“株系”是由具有相同亲本(parentage)的植物个体组成的群体。属于一个品系的植物一般在一定程度上是近交的,并且一般在大多数遗传基因座上是纯合且同源的。“亚系”可以指来自共同祖先的后代的近交子集,这些后代在遗传上与来自同一祖先的其它相似近交的后代子集可区分。在一些实施方案中,可以通过在F3-F5代近交来自单个棉花植物的种子,直到残余的分离基因座在大多数或全部基因座上均是纯合的,来产生“亚系”。
产业棉花品种通常是这样产生的:由2个遗传不同的亲本之间受控杂交,来自该杂交的F3至F5的单个植物自花授粉,将产生的后代聚集(aggregating)(“汇集(bulking)”)而得。虽然这样的品种通常似乎是均质的,但是来自选定的植物的自花授粉品种最终(例如,到F8代为止)会变成如下所述的纯合植物的混合物,在这些纯合植物中,任何在最初选择的F3-F5植物中为杂合的基因座处的表型都可能有变异。在本文所述的实施方案中,通过对来源于选定的F3至F5植物的自花授粉后代个体的种子样品进行基因分型而产生多个基于标志物的亚系,这些亚系基于DNA水平上一个或多个特定基因座处的质量标志物多态性而彼此不同。这样的种子样品可以作为种子,或者作为从种子生长的植物组织直接接受基因分型。在一些实例中,汇集在一个或多个特定标志物基因座处有相同基因型的种子,从而产生在与感兴趣性状(例如RN抗性)连锁的一个或多个基因座处遗传均一的亚系。
“良种品系”或“良种株系”是指对优良农艺性能进行选育和选择(通常通过多轮选择)而得到的农艺学上优良的品系。良种棉花品系有很多,而且是本领域技术人员已知的。良种群体是一批良种品系或来自良种品系的个体,可用于代表本领域在给定作物物种(例如,棉花)的可用农艺学良种基因型方面的技术发展水平。类似地,良种种质或良种种质株是农艺学优良的种质。良种种质可以从具有优良农艺学性能的植物获得,并能够用于产生具有优良农艺学性能的植物,例如现有的或新开发的良种品系的棉花。
与良种品系相对,“外来品系”或“外来株”(或“外来种质”)是指从不属于可用的良种棉花品系或种质株的棉花获得的品系或种质。在两个棉花植物或种质杂交的语境中,外来种质和与其杂交的良种种质在血统上不是密切近缘的。最常见地,选择外来种质是为了将新的遗传元件(例如,感兴趣的等位基因形式)引入到育种程序中。
“祖先品系”是指用作或者已经用作遗传材料的来源,例如开发良种品系的遗传材料来源的亲本系。“祖先群体”是指这样的一群祖先,用于开发良种品系的遗传变异的主体是由它们贡献的。“后代”是祖先的后代,且后代与其祖先之间可能相隔许多代的育种。例如,良种品系是其祖先的后代。系谱可用于描述后代与其每个祖先之间的关系。系谱可以跨越一代或多代,因此系谱可以描述后代与其相距1,2,3,4,或更多代的祖先的关系。
性状或表型:术语“性状”和“表型”在本文中可互换使用,指示可测量或可观察的可遗传特征。在一些实例中,表型可由单个基因或遗传基因座直接控制(即,单基因性状)。在其它实例中,表型可能是多个基因相互作用的结果(复杂性状)。因此,QTL可以通过单基因机制或通过多基因机制发挥作用。在一些实例中,性状或表型可以被指派“表型值”,其对应于为该表型性状测得的数量值。
术语“分子表型”可以指能够在(一个或多个)分子的群体的水平上检测的表型。在一些实例中,分子表型可以只能在分子水平检测到。表型的可检测分子可以是核酸(例如,基因组DNA或RNA);蛋白质;和/或代谢物。例如,分子表型可以是一个或多个基因产物的表达谱(例如,在植物发育的特定阶段,或响应环境条件或胁迫)。
性状和表型:术语“性状”和“表型”在本文中可互换使用。为本公开的目的,特别感兴趣的性状包括农艺学重要的性状,例如可以在作物植物中表达的性状。
肾状线虫(RN)抗性:为本公开的目的,特别感兴趣的性状是“肾状线虫抗性”。某一棉花植物或种质是否包含RN抗性可以通过本领域已知的多种方法的任何一种加以确定,例如,测量一个或多个植物或种质植物中的RN重现(reproduction)的测定技术。
IV.棉花中肾状线虫抗性的标志物
本发明的实施方案包括与肾状线虫抗性连锁的标志物,例如在通过四倍体海岛棉基因型印加棉(IncaCotton)GB713与陆地棉的杂交产生的棉花中与肾状线虫抗性连锁的标志物。这些标志物可用于,例如但不仅限于,鉴定有更大可能包含RN抗性表型的棉花植物和种质;选择这些棉花植物和种质(例如,在标志物辅助选择程序中);和鉴定和选择没有更大可能包含RN抗性表型的棉花植物和种质。使用本文所述的一个或多个标志物与本领域当前可得的组合物和方法相比,可以在棉花育种所涉及的时间、成本和劳动力方面为植物育种者提供优势。例如,与当前可得的用于此目的的标志物相比,本文所述的一个或多个标志物可以在棉花RN抗性的标志物辅助育种中提供更为优异的结果。
本文公开了特定的标志物,它们被鉴定为位于棉花基因组第21染色体的RN抗性主QTL区域内或附近,在亲本基因型中是多态性的。这些QTL标志物中有与棉花RN抗性表型连锁的特定标志物等位基因。在一些实施方案中,与棉花中RN抗性表型连锁的QTL标志物从表2-4中提供的标志物子集中选出。例如但不仅限于,与棉花中RN抗性表型连锁的主要QTL标志物可以选自下组:DASCTP_4812_64;DASCTP_60046_46;DASCTP_60046_472;DCTE1_261396_78;DCTE1_278814_262;DCTE1_214911_694;DCTE1_233925_865;DCTE1_232591_126;DCTE1_365870_69;DASCTP_39375_356;DCTE1_240643_347;DCTE1_208529_965;DCTE1_271930_223;DASCTP_59246_191;DASCTP_28910_164;BNL3279;DASCTP_1656_527;DASCTP_51689_504;BNL4011;DCTE1_214869_124;DASCTP_8602_496;DASCTP_8602_418;GH132;和DASCTP_10515_556。
定位群体可用于确定与RN抗性连锁的标志物。在一些实施方案中,这样的定位群体可以来自GB713xRN敏感性陆地棉品种的杂交,但也可以/还可以使用其它群体。可以使用任何合适的软件平台确定连锁的标志物基因座。例如但不仅限于,在具体实例中可以使用QTL制图器,和MAPMANAGER-。在一些实施方案中,例如当在连锁分析中使用软件时,反映检测到的等位基因信息的数据可以在使用期间或者使用之前被电子传输或电子存储,例如在计算机可读介质中。
在一些实施方案中,通过在第一棉花植物或种质中检测多个标志物等位基因来鉴定可能包含RN抗性表型的第一棉花植物或种质。例如但不仅限于,具体的实施方案包括用于鉴定可能包含RN抗性表型的植物或种质的方法,其中与RN抗性连锁的标志物等位基因从下列分子标志物中检测:DASCTP_4812_64;DASCTP_60046_46;DASCTP_60046_472;DCTE1_261396_78;DCTE1_278814_262;DCTE1_214911_694;DCTE1_233925_865;DCTE1_232591_126;DCTE1_365870_69;DASCTP_39375_356;DCTE1_240643_347;DCTE1_208529_965;DCTE1_271930_223;DASCTP_59246_191;DASCTP_28910_164;BNL3279;DASCTP_1656_527;DASCTP_51689_504;BNL4011;DCTE1_214869_124;DASCTP_8602_496;DASCTP_8602_418;GH132;DASCTP_10515_556;及其等同物。
根据一些实施方案的用于鉴定可能包含RN抗性表型的植物或种质的方法包括从这些分子标志物中检测超过一个与低RN抗性连锁的标志物等位基因。具体的实施方案包括用于鉴定可能包含RN抗性表型的植物或种质的方法,其中从分子标志物中检测标志物等位基因,上述分子标志物与从这些标志物中选出的至少一个与RN抗性连锁的标志物连锁。
在一些实施方案中,被检测的标志物是与RN抗性正相关的等位基因形式。或者,被检测的标志物是与RN抗性负相关的等位基因形式,在这种情况下,等位基因可以被反选择。在选择检测超过一个标志物等位基因的情况下,为每个标志物选择等位基因;因此检测2个或多个等位基因。在一些实例中,标志物可以包括超过一个有利的(例如,正相关的)等位基因形式;在这样的实例中,可以选择这些有利等位基因形式的任何一个。
因此,在单个植物、种质或植物群体中可以同时检测多个标志物等位基因。在这样的方法的实例中,可以选择含有来自超过一个与RN抗性连锁的标志物的正相关等位基因的植物或种质。在具体的实例中,来自超过一个与RN抗性连锁的标志物的正相关等位基因可以被渗入到靶(例如,受体)棉花种植中。本领域的技术人员会理解,在同一植物或种质中从超过一个RN抗性QTL标志物中同时选择(和/或渗入)正相关等位基因可以在植物或种质中产生附加的(例如,协同的)表型。
尽管具体的标志物等位基因可以和RN抗性表型共分离,这些标志物基因座不一定是促成(例如,负责)RNA抗性的QTL基因座的一部分。例如,不要求共分离的标志物包含在促成或赋予RN抗性的基因内(例如,作为基因开放阅读框的一部分)。特定标志物等位基因与RN抗性表型之间的关联可能是由于共分离标志物等位基因与RN抗性QTL等位基因之间在该RN抗性等位基因所来源的祖先棉花品系中原始“偶合”连锁相导致的。
在指称两个遗传元件(例如,促成RN抗性的遗传元件与附近的标志物)之间的关系时,“偶合”相连锁是指如下的情况,其中RN抗性QTL处的正相关等位基因与同一染色体链上的相应连锁标志物基因座的正相关等位基因物理关联。在“偶合相”中,两个等位基因被继承了该染色体链的后代一起继承。在“排斥”相连锁中,感兴趣基因座处的正相关等位基因(例如,RN抗性的QTL)与附近标志物基因座处通常负相关的等位基因物理连锁,因此两个通常正相关的等位基因不会引起遗传(即,两个基因座彼此“不共相”)。
如本文所述的,“正相关”的标志物等位基因是在本文所述的定位群体中与期望表型(例如,RN抗性)共分离的标志物等位基因。然而,鉴于前述,应当理解,由于排斥相连锁的可能性,在涉及不同群体的其它实施方案中,可以等价地使用其它等位基因形式的标志物。
类似地,在一些实施方案中可以进一步地/取而代之地使用不与RN抗性共分离的连锁标志物等位基因形式,因为这样的等位基因形式可用于鉴定不可能包含RN抗性表型的植物。例如,这样的等位基因可以在育种期间用于排除目的(例如,反选择),以鉴定与RN抗性负相关的等位基因,和/或从后续轮次的育种中去除RN易感植物或种质。
QTL标志物至少具有一个正相关等位基因,尽管在一些实例中,QTL标志物可以具有两个或多个在群体中发现的正相关等位基因。这样的标志物的任何正相关等位基因可用于,例如,鉴定或构建RN抗性棉花品系。在一些实例中,在植物中鉴定(或向植物渗入)与RN抗性连锁的不同标志物的1、2、3或更多个正相关等位基因,并且这些正相关标志物的全部或其子集可以在MAS期间被正向或反向选择。在一些实施方案中,鉴定至少一个这样的植物或种质,其具有至少一个这样的与RN抗性表型正相关的等位基因。
标志物基因座自身是性状,因此可以通过标准连锁分析进行分析,例如通过在分离过程中跟踪该标志物基因座。因此,在一些实施方案中,确定标志物之间的连锁,例如,1cM等于第一标志物等位基因有1%的机会在单一世代中通过与第二基因座(其可以是任何其它性状,(例如,第二标志物基因座),或者是另一个包含QTL或包含于QTL中的性状基因座)交换而分离。
与QTL标志物(例如表2-4中提供的QTL标志物和其等同物)连锁的遗传标志物,当它们与给定的QTL标志物足够接近(例如,足够紧密连锁)从而使该遗传标志物与QTL标志物显示低重组频率时,是特别有用的。在一些实施方案中,连锁的标志物和QTL标志物显示约10%或更低的重组频率(即,给定标志物在QTL的约10cM之内)。根据定义,这些连锁基因座在至少90%的情况下会共分离。确实,标志物与QTL标志物越接近,该标志物作为期望性状的指标的效率和优势越大。然而,与QTL相距超过例如约10cM的标志物也是有用的,特别是在与其它连锁标志物组合时。
因此,在一些实施方案中,连锁的基因座例如QTL标志物基因座和第二标志物基因座显示约10%或更小的基因座间重组频率;例如但不仅限于,约9%或更小,约8%或更小,约7%或更小,约6%或更小,约5%或更小,约4%或更小,约3%或更小,约2%或更小。在一些实例中,相关基因座(例如标志物基因座和靶基因座,如QTL)显示约1%或更小的重组频率;例如但不仅限于,约0.75%或更小,约0.5%或更小,和约0.25%或更小。因此,在具体的实施方案中,各基因座可以相距约10cM;约9cM;约8cM;约7cM;约6cM;约5cM;约4cM;约3cM;约2cM;约1cM;约0.75cM;约0.5cM;约0.25cM;或更小。在一些实例中,特定的连锁标志物可以通过观察棉花基因组的遗传图加以确定。
在一些方面中,连锁可以表示为重组频率极限,或者表示为遗传或物理距离范围。例如,在一些实施方案中,两个连锁的基因座是相距小于50cM图单位的两个基因座。在一些实例中,连锁的基因座是相距小于40cM的两个基因座。在一些实例中,连锁的基因座是相距小于30cM的两个基因座。在一些实例中,连锁的基因座是相距小于25cM的两个基因座。在一些实例中,连锁的基因座是相距小于20cM的两个基因座。在一些实例中,连锁的基因座是相距小于15cM的两个基因座。在一些实例中,连锁可以表示为具有上限和下限的范围;例如但不仅限于,约10至20cM;约10至30cM;约10至40cM;约0.5至约10cM;约0.1至约9cM;约0.1至约8cM;约0.1至约7cM;约0.1至约6cM;约0.1至约5cM;约0.1至约4cM;约0.1至约3cM;约0.1至约2cM;约0.1至约1cM;和约0.1至约0.5cM。
在一些实施方案中,本文所述的标志物(例如,表2-4中示出的那些标志物,和与至少一个前述者连锁的标志物)与RN抗性正相关。因此,这些标志物可能与RN抗性QTL和/或性状足够接近,以至于这些标志物中的一个或多个可用作RN抗性性状的预测子。这样的预测能力在MAS中是极其有用的,在本文中对此有更详细的讨论。
本文所述的与RN抗性表型和/或QTL标志物连锁的具体标志物的使用不一定仅限于任何具体的棉花遗传图或方法学。需要注意,可能由于各种因素,连锁标志物的列表在图与图、和方法学与方法学之间可能有所不同。例如,被置于任何两个图上的标志物可能不是相同的,并且一个图可能具有比另一个图更大的标志物密度。另外,用于构建遗传图的定位群体、方法学和算法可能不同。本领域的技术人员会认识到,一个遗传图不一定比另一个的准确度更大或更小,并且技术人员还会认识到,任何棉花遗传图均可用于确定与具体标志物连锁的标志物。例如,具体的连锁标志物可以从本领域已知的任何遗传图确定(例如,实验图或整合图),并可以从任何新绘制的定位数据组确定。
本发明的实施方案不仅限于任何具体的棉花群体或使用任何特定方法学(例如,任何特定软件或任何特定软件参数组)来鉴定或确定具体标志物与RN抗性表型的连锁。鉴于本公开,本领域的普通技术人员能够将本文所述标志物的特征推演到任何感兴趣的棉花基因池或群体,并在这样做的时候使用任何具体的软件和软件参数。
V.棉花中肾状线虫抗性标志物的检测
用于检测(鉴定)携带RN抗性标志物基因座的特定等位基因的棉花植物或种质的方法是一些实施方案的特征。在一些实施方案中,本领域中可用的多种标志物检测方案的任一种均可用于检测标志物等位基因,这取决于被检测标志物的类型。在实例中,用于标志物检测的合适方法可以包括通过,例如但不仅限于,PCR、LCR和基于转录的扩增方法(例如,ASH、SSR检测、RFLP分析和许多其它方法)扩增和鉴定所得的扩增标志物。
一般地,遗传标志物的检测依赖核酸的一种或多种属性。例如,一些检测遗传标志物的技术利用探针核酸与对应于该遗传标志物的核酸(例如,使用棉花基因组DNA分子作为模板产生的扩增核酸)的杂交。在具体的实施方案中,杂交模式,包括例如但不仅限于,溶液相、固相、混合相、和原位杂交测定,可用于等位基因检测。关于核酸杂交的的广泛指导可以在例如下列文献中找到,Tijssen(1993)LaboratoryTechniquesinBiochemistryandMolecularBiology-HybridizationwithNucleicAcidProbesElsevier,NY。
与群体成员之间遗传多态性对应的标志物可以通过许多方法中的任何一种进行检测,此类方法例如但不仅限于,基于核酸扩增的方法;和多态性标志物区的核苷酸测序。在一些实例中,许多检测方法(包括基于扩增的和基于测序的方法)可以容易地修改以适于高通量分析,例如通过使用可得的高通量测序方法,例如杂交测序。
用于扩增SSR型标志物基因座的扩增引物包含在一些实施方案的具体实施例中。表3-4提供了用于扩增本文所述具体标志物的具体引物和引物对。然而,本领域的技术人员会立刻认识到,给定引物任一侧上的其它序列也可用于代替给定的引物,只要该引物能够扩增包含待检测等位基因的核苷酸序列即可。而且,用于等位基因检测的确切探针可能不同。例如,能够鉴定待检测标志物扩增子区域的任何探针可以代替本文列出的示例性探针。而且,扩增引物和检测探针的构造(configuration)也可以不同。因此,实施方案不仅限于本文具体引述的引物和探针。尽管本文提供了许多具体的引物实例(见表3-4),用于本发明的合适引物可以用任何合适的软件程序设计,例如但不仅限于,
可以通过本领域可得的已建立方法检测的分子标志物包括,但不仅限于:ASH或其它用于检测SNP的方法;AFLP检测;扩增可变序列检测;RAPD检测;RFLP检测;自主复制序列系统检测;SSR检测;SSCP检测;和同工酶标志物检测。尽管表2-4中提供的示例性标志物是SNP和SSR标志物,但是任何前述标志物类型均可在具体的实施方案中用来鉴定包含对棉花RN抗性表型有贡献的遗传元件的染色体节段。
例如,包含RFLP的标志物可以通过,例如,使待检测核酸的探针(其通常是亚片段或相应于亚片段的合成寡核苷酸)与经限制性消化的基因组DNA杂交来进行检测。选择限制酶以在不同个体或群体中提供至少两种可选择的(或多态性的)长度的限制片段。为每个杂交确定一种或多种产生信息性片段的限制酶是简单的程序,在提供了靶DNA序列之后可以容易地由本领域的技术人员实现。在合适的基质(例如,琼脂糖或聚丙烯酰胺)中根据长度进行分离并转移到膜(例如,硝酸纤维素或尼龙)之后,可以让带标记探针在导致探针与靶平衡结合的条件下杂交,随后通过清洗除去多余的探针,并检测该标志物探针。
在一些实施方案中,扩增步骤被用作标志物基因座的检测/基因分型的一部分。然而,扩增步骤并不是在所有情况下都是标志物检测必需的。例如,通过对基因组DNA样品进行Southern印迹可以简单地检测非扩增的基因组DNA。在扩增/检测方法中也可以省略单独的检测探针,例如但不仅限于通过下述方式:进行实时扩增反应,借助扩增引物掺入产物时受到的修饰、扩增子中标记核苷酸的掺入、和通过监视扩增子的分子旋转性质相对于未扩增前体的改变(例如,通过荧光极化),来检测产物的形成。
PCR、RT-PCR、实时PCR和LCR被特别广泛地用作扩增和检测核酸(例如,包括标志物基因座的核酸)的扩增和扩增检测方法。关于这些和其它扩增方法的使用的细节可以参见许多标准教科书的任一种,包括例如:Sambrook编辑,MolecularCloning-ALaboratoryManual(2000)第3版,第1-3卷,ColdSpringHarborLaboratory,ColdSpringHarbor,NY;CurrentProtocolsinMolecularBiology(2002年增补)F.M.Ausubeletal.,编辑,CurrentProtocols,ajointventurebetweenGreenePublishingAssociates,Inc.andJohnWiley&Sons,Inc.;和PCRProtocolsAGuidetoMethodsandApplications(1990)Innisetal.编辑)AcademicPressInc.,SanDiego,CA。关于植物中核酸检测的其它细节也可以参见,例如PlantMolecularBiology(1993)Croy(编辑)BIOSScientificPublishers,Inc。
关于足以指导技术人员完成具体的体外扩增和检测方法的技术,包括聚合酶链式反应(PCR)、连接酶链式反应(LCR)、Qβ复制酶扩增、和其它RNA聚合酶介导的技术(例如NASBA),的额外细节及其实例也可以参见例如美国专利4,683,202;ArnheimandLevinson(1991)J.NIHRes.3:81-94;Kwohetal.(1989)Proc.Natl.Acad.Sci.USA86:1173;Guatellietal.(1990),同上;Lomelletal.(1989)J.Clin.Chem.35:1826;Landegrenetal.(1988)Science241:1077-80;VanBrunt(1990)Biotechnology8:291-4;WuandWallace(1989)Gene4:560;Barringeretal.(1990)Gene89:117;和SooknananandMalek(1995)Biotechnology13:563-4。通过PCR扩增大核酸的改良方法,其可能在图位克隆的一些应用中有用,在Chengetal.(1994)Nature369:684及其引用的参考文献中有更详细的描述,其中可以产生长达40kb的PCR扩增子。
许多可得的生物教科书对PCR和相关扩增方法有更广泛的讨论。技术人员会意识到,利用逆转录酶和聚合酶(例如通过RT-PCR)可以将几乎任何RNA转变成适合于限制性消化、PCR扩增和测序的双链DNA。
在一些实施方案中,可用核酸探针检测包含标志物等位基因核苷酸序列的核酸。此类探针可以,例如,在图位克隆中用于分离与标志物等位基因序列连锁的核苷酸序列。可用于具体实施方案的核酸探针并不受任何具体尺寸限制的制约。在一些实施方案中,核酸探针可以是,例如但不仅限于,至少20个核苷酸长;至少50个核苷酸长;至少100个核苷酸长;至少200个核苷酸长。标志物基因座的核酸探针可以克隆和/或合成。
任何合适的标记物均可在具体实例中和探针一起使用。适于和核酸探针一起使用的可检测标记物包括任何可以通过光谱、放射性同位素、光化学、生物化学、免疫化学、电学、光学、或化学手段检测的组合物。因此,杂交探针可以使用例如,放射自显影、荧光成像、或其他类似的检测技术进行检测,这取决于待检测的具体标记物。有用的标记物包括生物素(用标志物的链霉亲和素偶联物染色)、磁珠、荧光染料、放射性标记物、酶和比色标记物。其他标记物包括结合于用荧光团、化学发光剂、和酶标志物的抗体或特异性结合靶的配体。探针还可以包括放射性标记的PCR引物,用于产生放射性标记的扩增子。关于标记核酸的标记策略和相应的检测策略的更多信息可以参见,例如,Haugland(1996)HandbookofFluorescentProbesandResearchChemicals,第6版,MolecularProbes,Inc.,EugeneOR;和Haugland(2001)HandbookofFluorescentProbesandResearchChemicals,第8版,MolecularProbes,Inc.,Eugene,OR(有光盘版可用)。在具体的实例中,使用双标记的荧光寡核苷酸探针,例如探针(AppliedBiosystems)实施PCR检测和定量。
在一些实施方案中,引物不被标记,而可以,例如,在对标志物PCR扩增子进行尺寸解析(例如,通过琼脂糖凝胶电泳)后,将标志物PCR扩增子可视化。在具体的实例中,通过将PCR扩增子在尺寸解析之后用溴化乙啶染色,可以将对相应于不同标志物等位基因的不同大小的扩增子可视化。
实施方案中使用的引物不仅限于能够产生任何特定大小的扩增子的引物。例如,用于扩增特定标志物基因座和等位基因的引物不仅限于扩增相关基因座的整个区域者。引物可以产生长于或短于等位基因定义中给出的长度的任何合适长度的扩增子。在实例中,扩增子可以是,例如但不仅限于,至少20个核苷酸长;至少50个核苷酸长;至少100个核苷酸长;和至少200个核苷酸长。
用于制造寡核苷酸和包含寡核苷酸的有用组合物(例如,探针、引物、分子信标、PNA、和LNA)的合成方法一般是本领域技术人员众所周知的。例如,寡核苷酸可以根据在例如BeaucageandCaruthers(1981)TetrahedronLetts.22(20):1859-62中描述的固相亚磷酰胺酯法加以化学合成。这些方法可以采用自动化的合成仪,例如但不仅限于,在Needham-VanDevanteretal.(1984)NucleicAcidsRes.12:6159-68中所述。寡核苷酸(包括经过修饰的寡核苷酸)还可以从许多商业来源订购,例如但不仅限于,TheMidlandCertifiedReagent公司;TheGreatAmericanGeneCompany;ExpressGen有限公司;和OperonTechnologies有限公司。类似地,PNA可以从许多来源中的任一个订购,例如但不仅限于,PeptidoGenic;HTIBio-Products有限公司;BMABiomedicalsLtd(U.K.);和Bio.Synthesis有限公司。
在一些实施方案中,可以使用计算机实现的方法检测标志物等位基因。例如,可以将包含标志物序列的核酸序列存储在计算机中。可以使用合适的核酸搜索算法(例如但不仅限于在BLASTTM中提供的),或者甚至更简单的文字处理器(wordprocessor)来鉴定期望的标志物基因座序列(或其同源物)。
在一些实施方案中,标志物等位基因用基于PCR的检测方法进行检测,其中包含该标志物的PCR扩增子的大小和序列指示特定标志物等位基因的存在与否。在一些实例中,PCR引物与多态性标志物区两侧的保守区杂交。如此用于扩增分子标志物的引物有时称作“PCR标志物”或简称为“标志物”。
开发作物物种中分子标志物的一个主要动机是通过标志物辅助选择(MAS)提高植物育种效率的可能性。可以利用与感兴趣的性状或基因连锁的遗传标志物来鉴定这样的植物:它们在一个或多个基因座处包含期望的标志物等位基因,因此预期会将期望的标志物等位基因与感兴趣的性状或基因一起传递给它们的后代。遗传标志物可用于鉴定在一个基因座或者在多个非连锁的或连锁的基因座(例如,单倍型)处含有特定基因型的植物。类似地,可以将本文所述的标志物等位基因渗入到任何期望的棉花遗传背景、种质、植物、品系、品种等中,作为设计用于提高棉花产量或一般性改良棉花品种的整体MAS育种程序的一部分。
根据一些实施方案,本文所述的标志物提供了一种鉴定包含RN抗性(或RN易感性)的棉花植物和种质的手段:鉴定在某个基因座(如表2-4中示出的那些基因座)处包含特定的等位基因的植物和种质,以及与前述的至少一个连锁的标志物基因座。通过鉴定缺少与RN抗性共分离的标志物等位基因的植物,可以鉴定RN易感性植物和种质(或者对RN感染和/或伤害具有较低抗性的植物),用于例如将其从随后的杂交和育种中排除。
根据前述,本发明的实施方案包括具有显著的概率与贡献于或赋予RN抗性表型的QTL共分离的分子标志物。这些QTL标志物可以在期望性状(例如RN抗性)的标志物辅助选择中应用,并具有其它的用途。本发明的实施方案不仅限于任何特定的检测或分析这些标志物的方法。
使用数据挖掘和生物信息学工具在各物种基因型中比较DNA序列信息与可得的同源序列通常有助于发现SNP标志物。SNP标志物开发通常涉及同源序列之间的序列比较或者在参考基因组上定位,多重序列比对,用于SNP发现的数据挖掘,假定的SNP位置处等位基因频率的估算,和挑选候选SNP用于验证。这个过程对于遗传复杂性低的二倍体物种而言是相对简单的。然而,SNP检测的假阳性率随着基因组复杂性、基因组大小和可得序列信息的增加而增大。
例如,多个植物物种(例如棉花)在长期的进化中在其核基因组中具有了多个单倍体系列的染色体,因此促成了多倍体植物物种的发生。这些多倍体物种可以被进一步分类成同源多倍体(即,具有相似的多个单倍体基因组系列者(例如“AAAA”))和异源多倍体(即,具有多个不同亚基因组系列者(例如“AADD”))。棉花是一种异源四倍体,具有A和D亚基因组。因此,SNP发现在这样的四倍体作物物种中具有高度的挑战性,因为它是多倍体,基因组复杂性高,基因组尺寸大。四倍体棉花具有52个染色体,2500MB的基因组,它们被平均分配成13对A和D基因组。Hendrix&Stewart(2005)Ann.Bot.95(5):789-97。
SNP检测程序,例如AutoSNP(Batleyetal.(2003)PlantPhysiol.132:84-91),通常使用等位基因频率作为鉴定候选SNP的度量。然而,仅用这样的方法可能对于多倍体(例如棉花)并不可靠,因为它们在其基因组中具有大量旁系同源序列,进而导致高的SNP检测假阳性率。这需要开发能够用于大而高复杂性基因组并且假SNP检测率风险更低的新型强力SNP检测管道。
鉴于前述,为了在棉花和芥花中增加从同源序列检测SNP的效率、并降低由于同源基因组导致的高假阳性率,一些实施方案使用“HAPSNP”管道。在具体的实施方案中,可在以高严格性生成的序列重叠群中搜索推定的SNP,藉此用于在不同棉花基因型(例如来自不同棉花物种或者物种内部的基因型)中生成单倍型和等位基因频率,将旁系同源/部分同源的SNP与同源SNP区分开来。单倍型集群管道可使用汇编算法(assemblyalgorithm)(例如,CAP3;Huang&Madan(1999)GenomeRes.9(9):868-77),SNP挖掘算法(例如,QualitySNP;Tangetal.(2006)BMCBioinformatics7(1):438),作为SNP调用模块(callingmodule)、SNP过滤模块、单倍型调用模块(callingmodule)和SNP序列格式化模块(formattingmodule)的一部分。使用了从陆地棉和海岛棉基因型产生的序列来演示这个管道。
在单倍型集群管道中,SNP可以被分类成(1)来自单个基因座的真实SNP;(2)在一个基因型中异源但其它基因型中同源的SNP;和(3)在每个基因型中均旁系同源/部分同源的SNP。真实的SNP标志物和在一个基因型中异源但其它基因型中同源的SNP可选择用于基因分型和定位目的。重叠群信息可用于产生具有侧翼序列信息的SNP标志物,以供直接用于高通量基因分型平台测定的设计,例如但不仅限于,(Illumina)测定。在一些实例中,HAPSNP管道可以实现更高的验证率(validationrate),这部分是由于其能够高效率地在计算机上分类前述三种不同类型的SNP。
VI.将肾状线虫抗性标志物渗入到棉花中
如前所述,棉花植物或种质的鉴定,所述棉花植物或种质包含与RN抗性表型连锁的一种或多种标志物等位基因,为实施棉花的标志物辅助选择提供了基础。在一些实施方案中,选择至少一个棉花植物,该植物包含至少一个与RN抗性正相关的标志物等位基因;并可以反选择包含与RN抗性负相关的标志物等位基因的棉花植物。
与RN抗性正相关的期望标志物等位基因可以渗入到具有特定遗传背景(例如良种)的棉花中,从而产生渗入有RN抗性的棉花植物或种质。在一些实施方案中,多个RN抗性标志物可以顺次或同时选择和/或渗入到棉花中。可在单个植物或种质内选择的RN抗性标志物的具体组合没有限制,可以包括:标志物的组合,例如表2-4中示出的那些;表2-4中示出的标志物的子集;与表2-4中示出的标志物连锁的任何标志物;或位于棉花染色体21上的本文限定的QTL区间内的任何标志物。
在实施方案中,鉴定与棉花植物RN抗性正相关的QTL标志物等位基因的能力也为选择具有有利标志物基因座的植物提供了方法。例如,可以选择任何被鉴定包含期望标志物等位基因(例如,与RN抗性正相关的标志物等位基因)的植物,同时可以反选择缺少该等位基因(或包含与RN抗性负相关的等位基因)的植物。因此,在具体的实施方案中,在第一植物或种质中鉴定标志物等位基因之后,渗入方法包括选择该第一棉花植物或种质,或选择该第一植物或种质的后代。在一些实例中,结果选出的棉花植物或种质可以和第二棉花植物或种质(例如良种棉花)杂交,从而产生包含该标志物等位基因和第二植物或种质的期望特征和/或等位基因的后代。
在一些实施方案中,渗入RN抗性QTL的方法可包括,例如,提供至少一个与RN抗性连锁的标志物(例如,与RN抗性共分离的标志物);在包含RN抗性QTL的第一棉花植物或种质中确定该标志物等位基因;和将该标志物等位基因渗入到第二棉花植物或种质中,从而产生经渗入的棉花植物或种质。在具体的实施方案中,第二棉花植物或种质与该第一棉花植物或种质相比对RN感染和/或伤害可以是易感的,而经渗入的棉花植物或种质与该第二棉花植物或种质相比将包含RN抗性。如在下文中将更详细讨论的,通过这些和其它实施方案产生的经渗入的棉花植物或种质也包括在本发明的实施方案中。
在一些实施方案中,当通过本文提供的任一种方法产生经渗入的棉花植物或种质时,经渗入的棉花植物或种质可以用该植物或种质支持肾状线虫感染和/或复制的能力来表征。例如但不仅限于,在用~2,000个成体和幼体肾状线虫接种植物约6周之后,经渗入的植物或种质可以包含138至24,806个线虫。可利用所得的RN计数将抗性水平分类成高抗性(<250RN),抗性(>251和<1500RN),弱抗性(moderatelyresistant)(>1501和<9200RN),和易感性(>9200RN)。
除了将所选标志物等位基因渗入到期望的遗传背景中(例如通过标准育种方法)从而将RN抗性QTL渗入到背景中之外,在一些实施方案中,可以使用转基因方法产生RN抗性棉花植物和/或种质。在一些实施方案中,与棉花中的本文所述的至少一个标志物连锁的外源核酸(例如,基因或开放阅读框)可以被引入到靶植物或种质中。例如,与本文所述的至少一个标志物连锁的核酸编码序列可以从棉花基因组DNA克隆(例如,通过图位克隆)并引入到靶植物或种质中。
因此,具体的实施方案包括产生包含RN抗性表型的棉花植物或种质的方法,其中该方法包括将外源核酸引入到靶棉花植物或其后代中,其中该外源核酸与如下所述的核苷酸序列基本上相同:该核苷酸序列与一个或多个标志物基因座上的至少一个正相关标志物等位基因连锁,所述正相关标志物等位基因与RN抗性连锁。在一些实例中,标志物基因座可以选自:表2-4中示出的那些(例如,表3-4中示出的那些),以及与前述的至少一个连锁(例如,显示重组频率不超过10%)的标志物。在一些实施方案中,可以使用多个连锁标志物构建转基因植物。在这多个连锁标志物中使用哪些本文所述的标志物在实践者的裁量范围之内。
许多方法中的任一种均可用于提供外源核酸到棉花植物或种质中。在一些实施方案中,核苷酸序列通过图位克隆分离,并通过与和RN抗性正相关的标志物等位基因的连锁加以鉴定。例如,核苷酸序列可以相应于如下的开放阅读框(ORF),其编码在棉花植物中表达时会导致或促成棉花具有RN抗性的多肽。该核苷酸序列随后可以整合到外源核酸分子中。外源核酸的确切组成可以不同。例如,外源核酸可以包括表达载体,其在引入了该外源核酸的植物中提供该核苷酸序列的表达。
与RN抗性连锁的标志物可以利用包含标志物辅助选择的方法渗入(例如,藉此渗入RN抗性表型)到棉花植物或种质中。在实施方案中,MAS使用已被鉴定为以显著似然性与RN抗性性状共分离的多态性标志物来进行。这些标志物(例如,表2-4中示出的那些)被推定为定位在促成植物RN抗性(与包含野生型基因的植物相比)的基因内部或附近。这些标志物可以认为是该性状的指示物,并可以称作QTL标志物。在实施方案中,测试植物或种质的至少一个QTL标志物中正相关等位基因的存在。
在实施方案中,使用连锁分析来确定哪些多态性标志物等位基因显示以统计学显著的似然性与RN抗性表型共分离。在鉴定出与RN抗性表型正相关的标志物等位基因之后,该标志物可用于对植物品系进行快速、准确的RN抗性等位基因筛选,而不必使植物生长经过整个生命周期以等待表型评估。而且,标志物的鉴定允许对特定的RN抗性等位基因进行遗传选择,即使在实际RN抗性QTL的分子身份未知的情况下。可以从通过杂交产生的后代棉花植物获得小组织样品(例如,来自植物的第一片叶),并用合适的分子标志物进行筛选。藉此,可以快速确定该后代是否应该推进到进一步的育种中。连锁标志物还会消除可能会影响表型表达的环境因素的影响,从而允许以环境中性的方式选择RN抗性棉花。因此,尽管各种环境因素对植物对线虫的易感性的贡献表面上看可能会与本文所述标志物的使用混淆,但实际上这些标志物的一个特别优点就是它们的应用不依赖环境。
在一些包含MAS的实施方案中,多态性QTL标志物基因座可用于选择含有一种或多种与RN抗性表型正相关的标志物等位基因的植物。例如,可以在来自要选择的植物的生物样品中检测与标志物核酸等位基因对应的核酸。这样的检测可以采取探针核酸与标志物等位基因或其扩增子的杂交的形式(例如,使用等位基因特异性杂交、Southern分析、Northern分析、原位杂交,和引物杂交随后对标志物区域进行PCR扩增)。在验证了生物样品中存在(或不存在)具体标志物等位基因之后,选择该植物,并且在一些实例中,可将该植物用于通过选择性育种产生后代植物。
在棉花植物育种期间,RN抗性标志物基因座可以和其它期望性状(例如,高产量)的标志物/基因合并,以开发改良的棉花品种。通过非分子方法(例如,棉花植物中的性状评估)筛选大量样品一般是昂贵、耗时的,并且不可靠。本文所述的与RN抗性QTL连锁的多态性标志物的应用为在育种程序中选择期望的品种提供了一种有效的方法。相对于大田评估,RN抗性的标志物辅助选择的优势包括,例如,MAS可以在一年中的任何时刻进行,与生长季无关。而且,如前文所述的,环境影响与标志物辅助选择大体无关。
当群体中多个与一或多种性状连锁的标志物基因座(例如,与RN抗性连锁的多个标志物)分离时,MAS相对于表型筛选的效率更高,因为所有的标志物基因座可以在实验室里从单个DNA样品一起被评估。在本发明的具体实施方案中,表2-4中示出的多个标志物,以及与前述的至少一个连锁的标志物,可以从单个样品,或者从多个平行的样品同时或顺次地测定。
MAS在植物育种中的另一种应用是帮助通过回交育种恢复轮回亲本基因型。进行回交的目的通常是将一个或少数几个标志物或QTL基因座从供体亲本(例如,包含期望的RN抗性标志物基因座的亲本)渗入到来自回交亲本(例如,原本高产的棉花品系)的、在其他方面理想的遗传背景中。完成的回交轮次越多,轮回亲本对最终渗入品种的遗传贡献越大。在一些实例中,可以进行许多轮回交,例如,因为RN抗性植物可能由于例如低产量、低结实率(fecundity)等是不理想的。相比之下,密集育种程序产生的株系可能具有良种的产量、育性等,与轮回亲本相比还会对RN感染和/或伤害更有抗性。在来自供体源(其可能会或者不会为用作轮回品系的良种品种贡献优良遗传背景)的特定标志物的标志物辅助回交中,从业人员可以选择具有该供体标志物的回交后代,然后利用与轮回品系的反复回交尽可能多地重建轮回品系的基因组。
根据前文,本文所述的标志物和方法可用于指导如下所述的棉花品种的标志物辅助选择或育种:其具有期望的染色体节段的等位基因形式的互补物(系列),所述染色体节段与优良农艺性能(例如,RN抗性,以及任何其它用于产量、疾病抗性等的可得标志物)相关。任何所述的标志物等位基因均可以通过渗入(例如,通过常规育种,通过转化,或两者)引入到棉花品系中,以产生具有优良农艺性能的棉花植物。如果来自植物的核酸对期望的遗传标志物等位基因是阳性的,则在一些实施方案中该植物可以自授精以产生具有相同基因型的纯育系,或者可以将它和包含相同标志物等位基因或其它期望标志物和/或特征的植物杂交,以创建有性杂交的杂交代。
在一些实施方案中,本发明的方法应用于至少一种亲缘的棉花植物,例如来自主题棉花植物系谱的祖先或后代系的亲缘棉花植物,以便能够追踪期望的RN抗性等位基因的遗传。依照这些实施方案的方法应用于的棉花植物之间相隔的代数可以是,例如但不仅限于,1-20代;1-5代;和1、2或3代。例如,本方法可以应用于棉花植物的直接后代或亲本(即,相隔1代)。
遗传多样性在育种程序中是重要的。在多样性有限的情况下,当所有有利的等位基因已被固定在良种群体内时,在育种程序中实现的遗传增益最终到达平台。因此,植物育种的一个目的是在良种池中纳入多样性而不会丧失已经实现的遗传增益,并且使用尽可能少的投资。MAS可提示哪些基因组区域以及哪些来自原始祖先的有利等位基因已经被选择并随时间保留,从而帮助人们从外来种质源(与良种基因池无关的亲本)合并有利变异,以期发现当前在良种基因池中不存在的有利等位基因的努力。因此,在一些实施方案中,本文所述的标志物可用于涉及(良种x外来)棉花品系的杂交的MAS,对分离后代实施MAS,以保持主要的产量等位基因以及特定的RN抗性标志物等位基因。
如前所述,在一些实施方案中可以用本文所述的分子标志物基因座和等位基因(例如,表2-4中示出的那些,和与前述的至少一个连锁的标志物)鉴定RN抗性QTL,然后可以通过熟悉的程序克隆RN抗性QTL。这些RN抗性克隆可以首先通过其与本文所述的遗传连锁被鉴定。例如,“图位基因克隆”利用RN抗性标志物的物理接近性来限定含有RN抗性QTL基因的分离染色体片段。该分离的染色体片段可以通过这些众所周知的方法产生,例如但不仅限于,用一种或多种限制酶消化染色体DNA,使用PCR和任何合适的替代扩增反应扩增染色体区。随后可以将经消化或扩增的片段连接到适合于复制和/或表达所插入片段的载体中。与表型性状相关ORF邻近的标志物可以和DNA克隆(例如,来自基因组DNA文库的克隆)特异性杂交,来鉴定上面有该ORF(或ORF的片段)的克隆。如果标志物与RN抗性QTL基因更远,可以通过对克隆连续多轮的筛选和分离来鉴定含有该ORF的片段,所述克隆共同组成(comprise)一连续的DNA序列。这个过程通常称作“染色体步移”,并可用于产生“重叠群”或“重叠群图”。
足以指导技术人员分离与连锁标志物相关的克隆的方案可以参见,例如,Sambrooketal.(编辑)MolecularCloning:ALaboratoryManual,第2版,第1-3卷,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY,1989;和Ausubeletal.,编辑,CurrentProtocolsinMolecularBiology,第2章,GreenePublishingandWiley-Interscience,NY,1995。
VII.包含肾状线虫抗性标志物的植物
一些实施方案包括用于制造棉花植物的方法,并进一步包括这些棉花植物本身。在具体的实施方案中,这样的方法可以包括使第一亲本棉花植物与第二棉花植物杂交以产生棉花植物后代,所述第一亲本棉花植物包含至少一个与RN抗性正相关的标志物等位基因。可以测定这些棉花植物后代与RN抗性连锁的标志物等位基因,并可以选择期望的后代。这些后代植物或其种子可用于各种用途,包括例如但不仅限于,可以商业销售用于生产棉花;加工以获得期望的棉花产品(例如,棉纤维);和/或进一步用于随后轮次的育种。根据一些实施方案的棉花植物包括如下的后代植物,其包含本文所述标志物的至少一个等位基因形式,从而使进一步的后代能够继承与RN抗性连锁的标志物等位基因。
一些实施方案包括用于产生包含RN抗性的棉花植物(例如,与亲本棉花植物相比具有更高的RN抗性)的方法。在具体的实施方案中,这些方法可以包括通过常规的植物育种、或通过将包含RN抗性QTL的外源DNA(例如转基因)引入到棉花品种或植物中,来产生这样的植物。
在具体的实施方案中,用于产生包含RN抗性的棉花植物的方法可以包括将RN抗性QTL从海岛棉引入到包含根结线虫(RKN;Meloidogyneincognita)抗性的陆地棉中。在一些实例中,包含RN抗性QTL的棉花植物中RKN抗性的存在可以协同增加该棉花植物的RN抗性;即在这样的植物中观察到的RN抗性表型可以比在不包含RKN抗性的相似棉花植物中的RN抗性更大。
在一些实施方案中,与非抗性对照棉花植物相比,包含RN抗性的棉花植物可以对肾状线虫感染和/或伤害显示相对的(comparative)抗性。对照棉花植物可能是除所讨论的疾病抗性等位基因外在遗传上相似的(例如,它可能具有与包含RN抗性的棉花植物一样的亲本品种)。这类植物的相对抗性可以通过在相似的条件下相等地或者近似相等地暴露于肾状线虫感染来测定。
因此,一些实施方案包括用与RN抗性QTL对应的核酸转化的宿主细胞或生物体,它们是使用本文所述的至少一个与RN抗性连锁的标志物鉴定的。在一些实例中,这些核酸可以包括编码对棉花的RN抗性表型有贡献的表达产物的染色体区间(例如,基因组片段)、ORF、和/或cDNA。
宿主细胞可以用包含与RN抗性标志物连锁的ORF的载体(例如,克隆载体、穿梭载体或表达载体)进行遗传工程化(例如,转导、转染、转化等)。载体包括,例如但不仅限于,质粒、噬粒、土壤杆菌、病毒、裸多核苷酸(线性或环状);和偶联的多核苷酸。许多载体可以被引入到细菌中,特别是为了繁殖和扩增的目的。
载体可以通过本领域已知的多种标准方法中的任一种引入到植物组织、培养的植物细胞和植物原生质体中,包括例如但不仅限于:电穿孔(Frometal.(1985)Proc.Natl.Acad.Sci.USA82:5824);用病毒载体如花椰菜花叶病毒(CaMV)感染(见例如美国专利4,407,956);用包含核酸的小微粒弹道渗透(ballisticpenetration)(Kleinetal.(1987)Nature327:70);使用花粉作为载体(PCT国际专利公开No.WO85/01856);和使用携带其中克隆有DNA片段的T-DNA质粒的根癌土壤杆菌或发根土壤杆菌(Fraleyetal.(1983)Proc.Natl.Acad.Sci.USA80:4803)。本发明的某些实施方案中可以采用任何可以高效地将核酸引入到细胞或原生质体中的合适方法,包括但不仅限于本文明确鉴定的特定方法。
工程化的宿主细胞可以在常规的营养培养基或经过修饰的培养基中培养,以例如激活启动子或选择转化体。在一些实施方案中,宿主植物细胞可以培养成转基因植物。在例如下列文献中有从培养的原生质体再生植物的描述,例如:Evansetal.(1983)“ProtoplastIsolationandCulture,”收录于HandbookofPlantCellCultures1,MacMillanPublishingCo.,NY,pp.124-176;Davey(1983)“RecentDevelopmentsintheCultureandRegenerationofPlantProtoplasts,”收录于Protoplasts,Birkhauser,Basel,第12-29页;Dale(1983)“ProtoplastCultureandPlantRegenerationofCerealsandOtherRecalcitrantCrops,”收录于Protoplasts,同上,第31-41页;和Binding(1985)“RegenerationofPlants,”收录于PlantProtoplasts,CRCPress,BocaRaton,FL,第21-73页。可提供关于植物细胞培养和再生的有用细节的其它资源包括Payneetal.(1992)PlantCellandTissueCultureinLiquidSystems,JohnWiley&Sons,Inc.,NY;GamborgandPhillips(编辑)(1995)PlantCell,TissueandOrganCulture;FundamentalMethods,SpringerLabManual,Springer-Verlag(BerlinHeidelbergNY);和R.R.D.Croy(编辑)PlantMolecularBiology(1993)BiosScientificPublishers,Oxford,UK(ISBN0121983706)。
使用上述转化技术中的任一种产生的转化植物细胞可以培养再生具有所转化的基因型、因此具有期望的表型的完整植物。这些再生技术一般依赖于对组织培养生长培养基中某些植物激素的操作,特别依赖于已经与期望的核苷酸序列一起引入到细胞内的杀生物剂和/或除草剂标志物。用于产生完整植物的再生和生长过程一般包括如下步骤:选择转化体细胞和芽;使转化体芽苗生根;和在土壤中生长幼苗。
可对RN抗性作贡献的核酸(例如,包括本文所述标志物的核酸)的植物转化可以用于转化除棉花之外的物种。例如我们设想,当来自对棉花RN抗性表型有贡献的QTL的表达产物在其它农学和园艺学重要的植物物种中转化和表达时,也可以导致更高的线虫抗性。这些物种包括双子叶植物,例如但不仅限于,如下的科:豆科(包括豌豆,豆类(beans),扁豆,花生,山药豆,豇豆,绒豆,大豆,三叶草,紫花苜蓿,羽扇豆,巢豆,荷花,草木樨,紫藤和甜豆)和菊科。其它包含对棉花RN抗性有贡献的核酸(例如,包含本文所述的标志物)的植物可以是来自如下属的植物:葱属、芹属、花生属、芸苔属、辣椒属、鹰嘴豆属、黄瓜属、南瓜属(Curcubita)、胡萝卜属、荞麦属、大豆属、向日葵属、莴苣属、兵豆属(Lens)、番茄属、苜蓿属、豌豆属、绿豆属、马铃薯属、车轴草属、豇豆属等。
VIII.用于检测和/或关联肾状线虫抗性标志物的系统
一些实施方案中也包括系统,包括自动化系统,所述系统用于鉴定包含至少一个与棉花RN抗性表型连锁的标志物的植物、和/或用于将特定连锁标志物等位基因的存在与RN抗性关联。示例性系统可以包括可用于检测本文所述标志物基因座处的等位基因的探针;用于检测探针上的标记物的检测器;合适的流体操作元件和温度控制器,例如混合探针和模板和/或扩增模板;和/或将标记物检测与具体标志物基因座或等位基因的存在相关联的系统说明。
在具体的实施方案中,提供了用于鉴定棉花植物的系统,所述棉花植物是被预测为具有RN抗性的棉花植物。这样的系统包括,例如但不仅限于:一组标志物引物和/或探针,它们配置成检测至少一个与RN抗性连锁的标志物(例如,表2-4中示出的标志物,和与前述的至少一个连锁的标志物)的至少一个等位基因;检测器,其配置成从该组标志物探针或引物或其扩增子检测一个或多个信号输出,藉此鉴定该等位基因的存在与否;以及关于将该等位基因的存在与否与RN抗性相关联的系统说明。
执行标志物检测和/或关联的系统可以包括检测器,其被配置成检测来自一组标记探针或引物或其扩增子的一个或多个信号输出。检测器的精确配置可能取决于用于检测标志物等位基因的标记物的类型。具体的实例可以包括光检测器和/或放射活性检测器。例如,检测到标记探针的光发射或其它性质,可能表明是否存在与该探针相互作用(例如,通过特异性杂交)的标志物等位基因。该检测器任选地监测来自扩增反应的一个或多个信号。例如,检测器可以监测相应于“实时”扩增测定结果的光信号。
有多种多样的信号检测器可供使用,包括例如但不仅限于,光电倍增管;分光光度计;CCD阵列;阵列和阵列扫描仪;扫描探测器;光电管和光电二极管;显微镜工作站;振镜扫描;和微流体核酸扩增检测装置。除了用于检测标志物等位基因的标志物类型之外,检测器的精确配置可能部分地依赖于用户最便于获得的仪器。在一些实例中可使用检测荧光、磷光、放射性、pH、电荷、吸光度、发光、温度、或磁性的检测器。
根据一些实施方案的系统中提供的指令的确切形式可以取决于该系统的部件类似地改变。例如,指令可以作为系统的一个或多个集成单元中的系统软件存在,或者它们可以存在于与检测器操作连接的一个或多个计算机或计算机可读的介质中。在一些实例中,系统指令包括至少一个参考表,参考表包括植物或种质中具体标志物等位基因的存在或不存在与预测的对肾状线虫感染和/或伤害的定性或定量抗性水平的关联。指令还可以指导使用该系统建立用户界面,例如,以便允许用户检查样品分析结果和向系统输入参数。
在具体的实施方案中,系统可以包括用于存储或发送、例如在自动化(例如全自动)系统中存储或传输计算机可读数据的部件,所述计算机可读数据代表或指定被检测的标志物等位基因。例如,可以提供计算机可读介质,其包括缓存、主存和存储内存,和/或其它用于存储计算机编码的电子数据存储部件(例如,硬盘驱动器、软盘驱动器和存储器驱动器)。代表被本发明方法检测到的等位基因的数据还可以通过网络,例如内联网或互联网或其组合,作为发送介质内的计算机数据信号被电子、光学或磁学地传输。或者/并且,系统可通过无线、红外或其它可得的替代传输手段传输数据。
在工作过程中,系统通常包括待分析的样品,例如植物组织,或从组织分离的材料,例如基因组DNA、扩增的基因组DNA、cDNA、扩增的cDNA、RNA、扩增的RNA等。
在一些实施方案中,系统可以由分离的元件构成,或者可以集成为单一的单元,以方便标志物等位基因的检测,和任选地用于额外执行标志物-表型关联。在具体的实施方案中,系统还可以包括样品,例如但不仅限于,来自棉花或者来自选定的棉花植物组织的基因组DNA、扩增的基因组DNA、cDNA、扩增的cDNA、RNA、扩增的RNA等。
在一些实施方案中提供的自动化系统任意地包括用于样品操作的部件,例如机器人设备。例如,自动化系统可以包括机器人液体控制架(liquidcontrolarmature),用于将溶液(例如,植物细胞提取物)从来源转移到目的地(例如从微量滴定板到阵列基板),目的地可以与数字计算机操作连接(例如,在集成的计算机系统中)。自动化系统的一个特征也可以是输入设备,其用于将数据输入到数字计算机中,以控制机器人液体控制架的高通量液体转移(和,任选地,控制控制架向固体支持物的转移)。许多自动化机器人流体处理系统是有市售的。例如,从CaliperTechnologiesCorp.(Hopkinton,MA)可以获得多种自动化系统,这些自动化系统利用各种ZYMATETM系统,并且通常包括机器人和流体处理模块。类似地,常用的机器人,其用于多种实验室系统(例如用于微量滴定托盘操作),也有市售,例如可从BeckmanCoulter,InC(FullertonCA)购买。作为常规机器人的替代,现在可以从CaliperTechnologiesandAgilenttechnologies(PaloAlto,CA)获得多种多样的用于执行流体处理和检测的微流体系统。
在具体的实施方案中,用于分子标志物分析的系统可以包括,例如但不仅限于,包括高通量液体控制软件的数字计算机;包括用于分析标志物标记物数据的图像分析软件的数字计算机;包括数据翻译软件的数字计算机;用于将溶液从来源转移到目的地的机器人液体控制架(armature);用于向系统输入数据(例如为了通过机器人液体控制架控制高通量液体转移)的输入设备(例如,计算机键盘);和用于将来自标志物探针的标记物信号数字化的图像扫描器。
通过照相机或其他设备(例如,光电二极管和数据存储装置)查看和/或记录的光学图像(例如,杂交样式),可以在本文的任何实施方案中被进一步处理。例如但不仅限于,这些图像可以通过将图像数字化和/或在计算机上对图像进行存储和分析来加以处理。有多种市售的外围设备和软件可供用于数字化视频或数字化光学图像的数字化、存储和分析,例如,通过使用各种计算机和编程平台。
一些实施方案还包括可用于在棉花中鉴定包含至少一个与RN抗性表型连锁的标志物的植物,和/或将特定连锁标志物等位基因的存在与RN抗性相关联的试剂盒。在一些实例中,这样的试剂盒可以包括合适的引物或探针,其用于检测至少一个与RN抗性连锁的标志物和具体的标志物等位基因;和指令,说明如何使用这些引物或探针检测该至少一个标志物、并将该标志物等位基因与预测的对肾状线虫感染和/或伤害的抗性定性或定量水平相关联。在一些实例中,试剂盒可以包括用于包装探针、引物和/或指令的包装材料;和对照(例如对照扩增反应,其包括探针、引物或用于扩增的模板核酸,和分子大小标志物)。
在一些实施方案中,用于在棉花中鉴定包含至少一个与RN抗性表型连锁的标志物的植物和/或将特定连锁标志物等位基因的存在与RN抗性相关联的试剂盒或系统可以包括检测本文所述的具体SSR和/或SNPQTL标志物的核酸。例如,系统或试剂盒可以包括能够在棉花核酸模板上通过DNA聚合酶起始DNA聚合以产生棉花标志物扩增子的扩增引物对,其中该标志物扩增子对应于选自下组的标志物:表2-4中示出的棉花标志物、或与前述的至少一个连锁的标志物。例如,可以从表4中示出的引物对或其等同物中选出对SSR标志物特异的引物对。
提供了下面的实施例用于例示某些具体的特征和/或实施方案。不应认为这些实施例将本公开限制于这些例示的具体特征或实施方案。
实施例
这里例示了一些实施方案,包括:在来源于RN敏感性陆地棉品种x印加棉(IncaCotton)GB713的F2群体中鉴定肾状线虫抗性QTL;鉴定与该RN抗性性状紧密连锁的标志物;以及验证并确认该连锁标志物用于在棉花中标志物辅助选择RN抗性植物。在这些实施例中,使用通过测定(Illumina)从181个F2个体中获得的基因型信息生成了具有遍及26条染色体的4062个SNP和5个SSR标志物的连锁图。将这些F2植物种植在用肾状线虫感染的土壤中,收集与抗性相关的数据,表示为线虫繁殖相对于易感标准品种的降低。使用相应的F2RN抗性表型信息(即,从周围土壤到根部的线虫计数数据)来检测两个RN抗性QTL。
在染色体21上标志物DASCTP_28910_164(22.43cM)和DASCTP_1656_527(23.55cM)之间观察到了一个主要QTL,跨越0-32.62cM,最大LOD得分为13.84。根据1000种排列组合,LOD阈值在p=0.05下算得为4.4,p=0.01下算得为5.2。这个QTL解释了29.8%的表型变异。
对标志物进一步转化到KASParTM测定中,以验证和标志物辅助选择新型RN抗性植物。
实施例1:材料和方法
植物材料.将印加棉(IncaCotton)GB713(一种短日照海岛棉)肾状线虫(RN)抗性基因型与RN易感基因型杂交产生F1种子。在下一个冬季,通过F1植物自交获得F2代。
基因组DNA提取和扩增.使用CTABDNA提取方案从个体F2植物和亲本的叶片组织提取基因组DNA。Koheletal.(2001)Euphytica121:163-72。DNA质量通过凝胶电泳进行评估,用Quant-iTTM 定量试剂盒(Invitrogen,Carlsbad,CA)根据制造商的使用说明估测DNA浓度。将DNA浓度标准化到50ng/μL,以便能够使用iSelect(Illumina)测定进行基因分型。
表型分析.在温室研究中,在10cm直径的含有巴氏杀菌细沙壤土的陶罐内萌发214个F2,10个BC1F1和亲本种子,比率为每陶罐1个幼苗。实验设计是具有5个重复的完全随机区组。在播种当天,在这些罐中接种2000条蠕虫状RN,含有幼体和成体线虫。所有盆根据需要进行浇水和施肥。接种6周后,通过计算蠕虫状RN对F2植物进行RN抗性表型测定。参见Robbinsetal.(1994)J.Nematology26:659。
用分子标志物进行基因分型.设计两组iSelect(Illumina)测定,使用通过对陆地棉和海岛棉基因型的简化文库(PstI和EcoRI)进行454测序开发的SNP标志物,随后通过HAPSNP管道对数据进行分析。最后在第一和第二iSelect芯片上分别共制造了5023和8040个测定。
使用来自181个F2基因型和亲本的DNA样品,根据制造商的使用说明进行基因分型。基因型集群的打分用v2011.1软件包(Illumina)中的定制多倍体SNP打分方法(custompolyploidSNPscoringmethod)完成。定位群体中多态性标志物的基因型判读(calls)最先用四个等位基因以三元方式(ternaryfashion)打分,随后转换成A(P06x.4433等位基因),B(GB713等位基因)和H(杂合等位基因)。不明确的基因型记录被转换成缺失数据(用破折号(-)表示)以避免分离伪像(segregationartifact)。基因型数据被格式化成座位文件(locusfile)(.loc)以便用4.0进行分析。见VanOoijen(2006)“JoinMap4,Softwareforthecalculationofgeneticlinkagemapsinexperimentalpopulations,”KyazmaB.V.,Wageningen,NL。
数量性状基因座(QTL)定位.使用6.0(VanOoijen(2009)6,Softwareforthemappingofquantitativetraitlociinexperimentalpopulationsofdiploidspecies,”KyazmaB.V.,Wageningen,NL)对QTL进行定位。6.0要求三个输入文件,包括基因座基因型文件、图文件和定量数据文件。基因座基因型文件(.loc文件)含有分离群体全部基因座的基因型编码。图文件由生成,含有全部基因座的估计图位置。定量数据文件(.qua文件)含有来自定位群体的线虫计数和抗性判读(call)。在.qua文件中,抗性判读从字符数据类型被转换成数字得分:HR=1;R=2;MR=3;S=4。使用两个标志物之间的区间进行了分析,并且以几率对数(LOD)得分的形式计算QTL位于该区间内的似然性。当LOD得分超过连锁群上预定的显著阈值时,即检出一个分离QTL,并且连锁群上具有最大LOD的位置为QTL在图上的估计位置。
实施例2:表型肾状线虫抗性测定
尽管印加棉(IncaCotton)GB713,一种海岛棉基因型,具有光周期性质,用对根结线虫(Meloidogyneincognita)具有高水平抗性的陆地棉基因型(陆地棉)产生了异花授粉。通过传统的杂交实践产生了F2定位群体。通过在这个群体中用~2,000条成体和幼体线虫/盆接种个体6周后从土壤中收集线虫计数数据来进行肾状线虫抗性的表型筛选,线虫计数数据代表RN繁殖程度。表型数据含有每个盆中线虫的数目以及抗性分类为高抗性(HR<250RN),抗性(251<R<1500RN),普通抗性(1501<MR<9200RN)和易感(S>9200RN)。
在表型筛选期间,线虫数目的范围是138-24,806条。在表型测定中,将数值转变成log10(X+1),以便将变异标准化。图1-2中给出了本研究中每个世代的log10(X+1)数值的频率分布和基于线虫计数的世代-均值分析(generation-meananalysis)。根据世代-均值分析,F1,F2,和BC1F1代之间的线虫计数数据有显著差异。在BC1F1代(与易感亲本回交),平均log10(X+1)值偏向易感性亲本。这表明该性状的遗传是通过部分显性的。
对于两个具有13063个SNP标志物和6个简单序列重复(SSR)标志物的棉花定制测定(cottoncustom-builtassays),首先评估了它们检测亲本系之间的多态性,还将它们用于生成基因分型信息。总共有4091个标志物,包括4086个SNP和5个SSR,在亲本之间是多态性的,并且将等位基因判读以三元方式记录用于定位群体。对于共显性和显性标志物,大部分标志物符合1:2:1的典型F2分离比例。
用遍及全部26条染色体、总连锁距离跨4755.2cM的4062个SNP和5个SSR标志物构建遗传连锁图。平均SNP标志物密度约是每条染色体156个标志物,相邻标志物之间的平均距离是1个标志物/1.17cM。表1。
表1.P06x.4433xGB713遗传图的SNP标志物覆盖和连锁距离信息
染色体 #标志物 cM 平均标志物密度/染色体
1 93 170.003 1.827989
2 135 155.215 1.149741
3 194 175.523 0.904758
4 131 135.209 1.03213
5 215 277.216 1.289377
6 164 183.425 1.118445
7 157 186.453 1.187599
8 156 168.155 1.077917
染色体 #标志物 cM 平均标志物密度/染色体
9 166 213.766 1.287747
10 203 241.071 1.187542
11 174 210.237 1.208259
12 199 197.157 0.990739
13 186 237.979 1.279457
14 162 168.496 1.040099
15 134 142.294 1.061896
16 146 171.051 1.171582
17 133 148.258 1.114722
18 155 155.718 1.004632
19 143 211.273 1.477434
20 145 190.851 1.316214
21 182 194.822 1.070451
22 131 168.822 1.288718
23 124 193.05 1.556855
24 137 138.835 1.013394
25 159 153.686 0.966579
26 143 166.651 1.165392
总连锁距离 4067 4755.216 1.16922
实施例3:QTL定位
根据区间定位结果,将RN抗性定位到染色体21的一个主QTL。
染色体21具有总共182个标志物,跨越194.8cM,平均标志物覆盖率为1.07cM。上述主QTL区集中在该染色体远端的0至32.62cM之间,最大LOD得分为13.93,在DASCTP_28910_164和DASCTP_1656_527之间观察到。这个主QTL解释了抗性表型中29.8%的变异。尽管在染色体21上检测到了两个额外的QTLLOD峰:(i)一个QTLLOD峰在染色体21上DASCTP_39375_356(19.33cM)和DCTE1_208529_965(20.74cM)之间;(ii)一个QTLLOD峰区域在染色体21上DCTE1_214869_124(27.49cM)和DASCTP_8602_418(28.33cM)之间,它们被看作是一个主QTL区的不同部分。染色体21上该QTL区的细节在表2-4和图3-4中提供。
表2.与染色体21上RN抗性相关的QTL区中的标志物、LOD得分和%解释。斜体的QTL基因座解释最大的RN抗性变异
染色体 cM 标志物名 LOD %解释
Chr 21 0.00 DASCTP_4812_64 4.18 10.1
Chr 21 0.00 DASCTP_60046_46 4.18 10.1
Chr 21 0.00 DASCTP_60046_472 4.18 10.1
Chr 21 0.00 DCTE1_261396_78 4.18 10.1
Chr 21 1.00 4.60 11.1
Chr 21 2.00 5.04 12.0
Chr 21 3.00 5.48 13.0
Chr 21 4.00 5.92 14.0
Chr 21 5.00 6.35 14.9
Chr 21 6.00 6.75 15.8
Chr 21 7.00 7.13 16.6
Chr 21 8.00 7.46 17.3
Chr 21 9.00 7.74 17.9
Chr 21 10.00 7.98 18.4
Chr 21 10.56 DCTE1_278814_262 8.09 18.6
Chr 21 11.42 DCTE1_214911_694 8.56 19.6
Chr 21 11.69 DCTE1_233925_865 8.49 19.4
Chr 21 12.69 8.88 20.2
Chr 21 13.69 9.09 20.6
Chr 21 14.69 9.04 20.5
Chr 21 14.97 DCTE1_232591_126 8.97 20.4
Chr 21 15.97 9.48 21.4
Chr 21 16.97 9.84 22.1
Chr 21 17.89 DCTE1_365870_69 10.01 22.5
Chr 21 18.89 11.65 25.6
Chr 21 19.33 DASCTP_39375_356 12.04 26.4
Chr 21 19.90 DCTE1_240643_347 12.71 27.6
染色体 cM 标志物名 LOD %解释
Chr 21 20.75 DCTE1_208529_965 10.66 23.8
Chr 21 21.31 DCTE1_271930_223 12.01 27
Chr 21 21.87 DASCTP_59246_191 13.17 28.5
Chr 21 22.43 DASCTP_28910_164 13.82 29.7
Chr 21 23.43 13.93 29.8
Chr 21 23.55 BNL3279 13.84 29.7
Chr 21 23.55 DASCTP_1656_527 13.84 29.7
Chr 21 24.39 DASCTP_51689_504 13.75 29.5
Chr 21 25.39 12.23 26.7
Chr 21 25.96 BNL4011 11.01 24.4
Chr 21 26.96 11.29 25.0
Chr 21 27.50 DCTE1_214869_124 11.01 24.4
Chr 21 28.05 DASCTP_8602_496 11.82 26.0
Chr 21 28.33 DASCTP_8602_418 11.61 25.6
Chr 21 29.33 10.06 22.6
Chr 21 29.63 GH132 9.49 21.4
Chr 21 30.63 10.00 22.5
Chr 21 31.63 10.01 22.5
Chr 21 32.62 DASCTP_10515_556 9.56 21.6
表3.与染色体21上的主QTL连锁的SNP标志物及其抗性和易感基因型
表4.与染色体21上QTL连锁的标志物
标志物 染色体 引物 SEQ ID NO.
BNL3279 21 正向 SEQ ID NO:22
BNL3279 21 反向 SEQ ID NO:23
BNL4011 21 正向 SEQ ID NO:24
BNL4011 21 反向 SEQ ID NO:25
GH132 21 正向 SEQ ID NO:26
GH132 21 反向 SEQ ID NO:27
实施例4:用于多倍体物种的SNP检测管道
使用棉花作为模式物种测试并验证基于单倍型的SNP检测管道:HAPSNP管道。使用基因组复杂性降低途径,用454测序技术对两个棉花品种,一个陆地棉物种和一个海岛棉物种,进行了测序。如此生成的序列信息通过HAPSNP管道进行处理,该管道包括下述模块:(1)组装/定位;(2)SNP判读;(3)SNP过滤;(4)单倍型判读;和(5)SNP序列格式化。管道的图形表示总结为如图5的流程图。
来自棉花的测序数据可以被直接输入到HAPSNP管道的组装/作图模块中,如图5所示。在组装/定位(例如,见图5的模块1)后,可将“输出.ace”(或ACE)文件输入到SNP判读模块中(例如,图5的模块2所示)。SNP判读模块基于序列比较来确定全部可能的SNP,序列比较是在所有的输入序列以及任选地用于序列比较考虑的参考序列中进行的。重叠群序列和标识(identifier)可以作为SNP判读之后的输出包含在所有SNP中,如图5所示。然后,对这些SNP/重叠群进行SNP过滤(例如,见图5的模块3)。SNP过滤模块还可以确定SNP是否位于同聚物区(homopolymerregion)内。在SNP过滤之后,假阳性的SNP被除去并输入到SNP序列格式化模块中,如图5所示。
另一方面,将所有可能的SNP输入到单倍型判读模块(例如,见图5的模块4)。单倍型判读模块可任选地包括独立于SNP过滤模块的单倍型过滤单元。可以将单倍型信息输入到SNP序列格式化模块中,以便在与经过滤的SNP合并后考虑与基因型关联。
最后,SNP序列格式化模块(例如,见图5的模块5)使过滤后的SNP顺应(comply)侧翼序列以及单倍型信息(任选经过过滤),从而确定含有高质量SNP标志物的重叠群用于测试目的。
候选或真SNP是双等位基因的,在同源条件下每个基因型支持一个等位基因,最少有2个序列。半SNP(Hemi-SNP)是三等位基因的,其中单倍型集群中的一个基因型是双等位基因的或杂合的,另一个基因型是单等位基因的或处于纯合条件。旁系同源的SNP是在基因型内双等位基因的或者杂合的。真SNP和半SNP可用于遗传定位目的。旁系同源SNP在遗传定位中的用处较小。根据候选SNP基因座的位置,在SNP上游或下游100bp处获取侧翼序列信息,并用SNP基因座处的[等位基因1/等位基因2]信息格式化用于测定设计。
通过对陆地棉和海岛棉基因型的简化文库(PstI和EcoRI)的454测序,随后通过HAPSNP管道对数据进行分析,用所得的SNP标志物设计了两组iSelect(Illumina)测定。最终在第一和第二iSelect芯片上分别制造了总共5023和8040个测定。本研究使用这些芯片用于基因分型目的。
该HAPSNP管道有助于在多倍体物种如棉花中以高验证率鉴定高质量SNP。将同源SNP与旁系同源和部分同源SNP区分比常规方法更加容易且更加准确。这样的管道将提供精选的计算机SNP候选者,以供在多倍体物种中进行验证,同时减少假阳性SNP的出现。
实施例5:用于棉花分子育种的与肾状线虫抗性相关的SNP标志物的验证和应用
最先通过RN易感性陆地棉品种x印加棉(IncaCotton)GB713的杂交产生的F1植物与RN易感性品种杂交生成了回交群体(BC1F1),从而将RN抗性从GB713渗入到陆地棉品种中。使用这个群体验证标志物-RN抗性性状相关性。
在这个群体中进行肾状线虫抗性的表型筛选,收集从用~2,000条成体和幼体线虫/盆接种个体6周后的土壤中获得的线虫计数数据,该数据代表RN繁殖程度。表型数据含有每个盆中线虫的数目。
使用染色体21主QTL区的6个SNP标志物,即DASCTP_39375_356(19.33cM),DASCTP_59246_191(21.87cM),DASCTP_1656_527(23.55cM),DASCTP_51689_504(24.39cM),DASCTP_8602_496(28.05cM),DASCTP_8602_418(28.33cM)验证标志物-RN抗性性状相关性。
表5.用于测试标志物-性状关联的SNP标志物
染色体 标志物 位置(cM)
21 DASCTP_39375_356 19.33
21 DASCTP_59246_191 21.87
21 DASCTP_1656_527 23.55
21 DASCTP_51689_504 24.39
21 DASCTP_8602_496 28.05
21 DASCTP_8602_418 28.33
对SNP标志物进行KASPar测定,并用于对BC1F1群体进行基因分型。使用基因型信息与表型数据的组合实施“单标志物分析(SingleMarkerAnalysis)”,使用“WindowsQTLCartographer”程序进行。
单标志物分析将数据拟合到简单线性回归模型y=b0+b1x+e中。下面的结果为每个标志物给出了b0,b1的估值以及F统计。该分析经常用于验证标志物是否与QTL连锁。这样的检验是通过确定b1是否与0显著不同。F统计将假定的H0:b1=0与备选的H1:b1不等于0进行比较。pr(F)是H0有多大支持的度量。pr(F)越小表示对H0的支持越小,因此对H1的支持越大。在5%,1%,0.1%和0.01%水平下的显著性分别用*,**,***和****指示。注意,似然性比值测试统计是比较两个嵌套(nested)假设,并且是似然性比值负自然对数的两倍。例如,假定假设H0被嵌套在H1内,并且它们分别具有似然性L0和L1。那么,“似然性比值测试统计”是-2ln(L0/L1)。–t1是被分析性状的数目。
表6.用于标志物-RN抗性性状关联的单标志物分析
染色体 标志物 位置 b0 b1 -2ln(L0/L1) F(1,n-2) pr(F)
21 DASCTP_39375_356 19.33 2700.714 -1526.92 5.127 5.177 0.027*
21 DASCTP_59246_191 21.87 2643.992 -1058.82 2.486 2.452 0.123
21 DASCTP_1656_527 23.55 2676.744 -1342.34 4.074 4.075 0.048*
21 DASCTP_51689_504 24.39 2700.714 -1439.23 4.531 4.551 0.037*
21 DASCTP_8602_496 28.05 2700.714 -1439.23 4.531 4.551 0.037*
21 DASCTP_8602_418 28.33 2728.601 -1552.96 5.094 5.143 0.027*
标志物DASCTP_39375_356(19.33cM),DASCTP_1656_527(23.55cM),DASCTP_51689_504(24.39cM),DASCTP_8602_496(28.05cM),DASCTP_8602_418(28.33cM)被发现在5%水平上显著,并且在pr(F)列中用*标明。这确认了RN抗性性状与来自染色体21中主QTL区的SNP标志物相关,并且通过MAS选择RN抗性植物。
因为这些标志物通过统计学检验被确认与RN抗性相关,我们对来自两个杂交的育种推进世代的基因型信息进行了评估,以预测表型并在育种程序中进一步推进具有抗性基因座的品系。
使用RN抗性标志物信息,我们能够基于抗性标志物基因座提供用于推进的选择,从而帮助RN抗性棉花的育种。来自共有图的这些候选基因座之间的标志物信息可用于开发新的与RN抗性相关的SNP标志物。
尽管为了清楚和理解的目的对前述实施方案进行了详细描述,但是本领域的技术人员通过阅读本公开会清楚地认识到,可以在不背离本发明真实范围的前提下在形式和细节上进行各种改变。例如,上述的全部技术和装置可以按照各种组合加以使用。

Claims (30)

1.一种用于鉴定含有肾状线虫(RN)抗性的第一陆地棉(Gossypiumhirsutum)植物或种质的方法,该方法包括:
在第一陆地棉植物或种质中检测至少一个与RN抗性连锁的标志物,其中该至少一个标志物选自下组:DASCTP_4812_64;DASCTP_60046_472;DCTE1_261396_78;DASCTP_60046_46;DCTE1_278814_262;DCTE1_214911_694;DCTE1_233925_865;DCTE1_232591_126;DCTE1_365870_69;DASCTP_39375_356;DCTE1_240643_347;DCTE1_208529_965;DCTE1_271930_223;DASCTP_59246_191;DASCTP_28910_164;DASCTP_1656_527;DASCTP_51689_504;DCTE1_214869_124;DASCTP_8602_496;DASCTP_8602_418;DASCTP_10515_556;和与前述的至少一个连锁的其它标志物。
2.根据权利要求1的方法,其中该至少一个标志物与下述者中的至少一个紧密连锁:DASCTP_4812_64;DASCTP_60046_472;DCTE1_261396_78;DASCTP_60046_46;DCTE1_278814_262;DCTE1_214911_694;DCTE1_233925_865;DCTE1_232591_126;DCTE1_365870_69;DASCTP_39375_356;DCTE1_240643_347;DCTE1_208529_965;DCTE1_271930_223;DASCTP_59246_191;DASCTP_28910_164;DASCTP_1656_527;DASCTP_51689_504;DCTE1_214869_124;DASCTP_8602_496;DASCTP_8602_418;DASCTP_10515_556。
3.根据权利要求2的方法,其中被检测的标志物与下述者中的至少一个标志物显示小于约10%的遗传重组频率:DASCTP_4812_64;DASCTP_60046_472;DCTE1_261396_78;DASCTP_60046_46;DCTE1_278814_262;DCTE1_214911_694;DCTE1_233925_865;DCTE1_232591_126;DCTE1_365870_69;DASCTP_39375_356;DCTE1_240643_347;DCTE1_208529_965;DCTE1_271930_223;DASCTP_59246_191;DASCTP_28910_164;DASCTP_1656_527;DASCTP_51689_504;DCTE1_214869_124;DASCTP_8602_496;DASCTP_8602_418;DASCTP_10515_556。
4.根据权利要求1的方法,其中被检测的标志物选自下组:DCTE1_240643_347;DASCTP_8602_496;DASCTP_28910_164;DASCTP_1656_527;和与前述者中的至少一个连锁的其它标志物。
5.根据权利要求1的方法,其中该种质是陆地棉品系或品种。
6.根据权利要求1的方法,其中所述检测包括扩增所述标志物或标志物的一部分以产生扩增的标志物扩增子,并检测所得的扩增的标志物扩增子。
7.根据权利要求6的方法,其中所述扩增包括:
将扩增引物或扩增引物对与从第一陆地棉植物或种质分离的核酸掺混,其中该引物或引物对与标志物的至少一部分互补或部分互补,并且能够使用陆地棉核酸作为模板引发DNA聚合酶所致的DNA聚合;和
在包含DNA聚合酶和模板核酸的DNA聚合反应中延伸所述引物或引物对以产生至少一个扩增子。
8.根据权利要求7的方法,其中该核酸是DNA分子或RNA分子。
9.根据权利要求6的方法,其中该扩增包括利用聚合酶链式反应(PCR)或连接酶链式反应(LCR),在该PCR或LCR中使用从所述第一陆地棉植物或种质分离的核酸作为模板。
10.一种用于产生经基因渗入的陆地棉植物或种质的方法,该方法包括:
将至少一个来自第一棉属(Gossypium)植物或种质的与肾状线虫(RN)抗性正相关的标志物等位基因基因渗入到宿主陆地棉植物或种质中,以产生经基因渗入的陆地棉植物或种质,
其中所述至少一个标志物选自下组:DASCTP_4812_64;DASCTP_60046_472;DCTE1_261396_78;DASCTP_60046_46;DCTE1_278814_262;DCTE1_214911_694;DCTE1_233925_865;DCTE1_232591_126;DCTE1_365870_69;DASCTP_39375_356;DCTE1_240643_347;DCTE1_208529_965;DCTE1_271930_223;DASCTP_59246_191;DASCTP_28910_164;DASCTP_1656_527;DASCTP_51689_504;DCTE1_214869_124;DASCTP_8602_496;DASCTP_8602_418;DASCTP_10515_556;和与前述的至少一个连锁的其它标志物。
11.根据权利要求10的方法,其中所述宿主陆地棉植物或种质与所述第一棉属植物或种质相比对RN感染敏感,并且其中该经基因渗入的陆地棉植物或种质与所述宿主陆地棉植物或种质相比包含增加的RN抗性。
12.通过根据权利要求10的方法产生的经基因渗入的陆地棉植物或种质。
13.权利要求12的经基因渗入的陆地棉植物或种质,其中在用大约2,000条肾状线虫接种该植物或该种质的植株约6周后,该经基因渗入的陆地棉植物或种质包含138至24,806条线虫。
14.根据权利要求10的方法,其中该宿主陆地棉植物或种质是来自良种棉花品种或外来棉花品种的植物或种质。
15.根据权利要求10的方法,其中该宿主陆地棉植物或种质是陆地棉。
16.根据权利要求10的方法,其中该宿主陆地棉植物或种质包含根结线虫(RKN)抗性。
17.根据权利要求16的方法,其中该经基因渗入的陆地棉植物或种质与不包含RKN抗性的经基因渗入的陆地棉植物或种质相比,具有增加的RN抗性。
18.根据权利要求1的方法,其中该方法包括将代表被检测的标志物的数据电子传输或电子存储在计算机可读的介质中。
19.根据权利要求1的方法,其中该方法包括选择所述第一陆地棉植物或种质。
20.根据权利要求1的方法,其中该方法包括选择第一陆地棉植物或种质的后代。
21.根据权利要求19的方法,包括将所选的第一陆地棉植物或种质与第二棉花植物或种质杂交。
22.根据权利要求21的方法,其中该第二棉花植物或种质是来自良种棉花品种或外来棉花品种的植物或种质。
23.一种用于产生具有肾状线虫(RN)抗性表型的转基因植物的方法,该方法包括:
将一个或多个外源核酸引入到目标植物中以产生转基因植物,其中该一个或多个外源核酸中的至少一个包含来自棉花植物的内源核苷酸序列,所述内源核苷酸序列在该棉花植物中与至少一个选自下组的标志物连锁:DASCTP_4812_64,DASCTP_60046_472,DCTE1_261396_78,DASCTP_60046_46,DCTE1_278814_262,DCTE1_214911_694,DCTE1_233925_865,DCTE1_232591_126,DCTE1_365870_69,DASCTP_39375_356,DCTE1_240643_347,DCTE1_208529_965,DCTE1_271930_223,DASCTP_59246_191,DASCTP_28910_164,DASCTP_1656_527,DASCTP_51689_504,DCTE1_214869_124,DASCTP_8602_496,DASCTP_8602_418,DASCTP_10515_556,以及与前述者中的至少一个连锁的其它标志物;其中所得的转基因植物包含RN抗性。
24.根据权利要求23的方法,其中所述目标植物是棉花植物。
25.根据权利要求23的方法,其中来自所述棉花植物的所述内源核苷酸序列在该棉花植物中与所述至少一个标志物连锁,使得该内源核苷酸序列显示与该至少一个标志物的遗传重组频率不超过约10%。
26.根据权利要求23的方法,其中将一个或多个外源核酸引入到目标植物中包括将棉花植物与目标植物杂交。
27.一种用于鉴定被预测为具有肾状线虫(RN)抗性表型的棉花植物的系统,该系统包括:
一组标志物探针或引物,其被配置成检测至少一个与RN抗性连锁的标志物,其中该标志物选自下组:DASCTP_4812_64,DASCTP_60046_472,DCTE1_261396_78,DASCTP_60046_46,DCTE1_278814_262,DCTE1_214911_694,DCTE1_233925_865,DCTE1_232591_126,DCTE1_365870_69,DASCTP_39375_356,DCTE1_240643_347,DCTE1_208529_965,DCTE1_271930_223,DASCTP_59246_191,DASCTP_28910_164,DASCTP_1656_527,DASCTP_51689_504,DCTE1_214869_124,DASCTP_8602_496,DASCTP_8602_418,DASCTP_10515_556,和与前述者中的至少一个连锁的其它标志物;
检测器,其被配置成检测一个或多个来自该组标志物探针或引物或其扩增子的信号输出,藉此鉴定所述标志物的存在或不存在;以及
将标志物的存在或不存在与RN抗性表型相关联的系统指令。
28.权利要求27的系统,其中该检测器检测一个或多个光发射,其中该光发射指示标志物等位基因的存在或不存在。
29.权利要求27的系统,其中所述指令包括至少一个参考表,所述参考表包括至少一个被检测标志物的标志物等位基因的存在或不存在与低棕榈酸含量表型之间的关联。
30.权利要求27的系统,其中该系统包括来自植物或种质的核酸样品。
CN201480026791.3A 2013-03-15 2014-03-14 与肾状线虫抗性连锁的标志物 Pending CN105229174A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361799059P 2013-03-15 2013-03-15
US61/799,059 2013-03-15
PCT/US2014/027300 WO2014152399A1 (en) 2013-03-15 2014-03-14 Markers linked to reniform nematode resistance

Publications (1)

Publication Number Publication Date
CN105229174A true CN105229174A (zh) 2016-01-06

Family

ID=50942991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480026791.3A Pending CN105229174A (zh) 2013-03-15 2014-03-14 与肾状线虫抗性连锁的标志物

Country Status (9)

Country Link
US (3) US11136630B2 (zh)
EP (1) EP2971143A4 (zh)
CN (1) CN105229174A (zh)
AR (1) AR095305A1 (zh)
AU (1) AU2014239856A1 (zh)
BR (1) BR112015021478B8 (zh)
MX (1) MX2015013243A (zh)
UY (1) UY35436A (zh)
WO (1) WO2014152399A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106661610A (zh) * 2014-03-14 2017-05-10 美国陶氏益农公司 与肾状线虫抗性连锁的标志物

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11136630B2 (en) * 2013-03-15 2021-10-05 Dow Agrosciences Llc Markers linked to reniform nematode resistance
BR112019017705A2 (pt) * 2017-03-30 2020-03-31 Monsanto Technology Llc Sistemas e métodos para uso em identificação de múltiplas edições de genoma e prevenção dos efeitos agregados das edições do genoma identificado

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101501217A (zh) * 2006-05-25 2009-08-05 孟山都技术有限公司 大豆抗病性数量性状基因座及其组成的鉴定方法
CN102597263A (zh) * 2009-10-09 2012-07-18 孟山都技术公司 定量目标生物体和产生肾形线虫抗性棉花植物的方法
CN103442575A (zh) * 2010-09-22 2013-12-11 拜耳知识产权有限责任公司 生物或化学防治剂用于在抗性作物中防治昆虫和线虫的用途

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU1927599A (en) 1997-12-22 1999-07-12 Pioneer Hi-Bred International, Inc. Qtl mapping in plant breeding populations
CN102131386A (zh) 2008-08-28 2011-07-20 孟山都技术公司 选择棉花根结线虫抗性棉花植物的方法和组合物
CN102171732B (zh) 2008-10-02 2013-08-14 报知机株式会社 传输输入电路
US11136630B2 (en) * 2013-03-15 2021-10-05 Dow Agrosciences Llc Markers linked to reniform nematode resistance

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101501217A (zh) * 2006-05-25 2009-08-05 孟山都技术有限公司 大豆抗病性数量性状基因座及其组成的鉴定方法
CN102597263A (zh) * 2009-10-09 2012-07-18 孟山都技术公司 定量目标生物体和产生肾形线虫抗性棉花植物的方法
CN103442575A (zh) * 2010-09-22 2013-12-11 拜耳知识产权有限责任公司 生物或化学防治剂用于在抗性作物中防治昆虫和线虫的用途

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
OSMAN A ET AL: "Identification of QTL regions and SSR markers associated with resistance to reniform nematode in Gossypium barbadense L.accession GB713", 《THEOR APPL GENET》 *
OSMAN A ET L: "SSR markers closely associated with genes for resistance to root-knot nematode on chromosomes 11 and 14 of Upland cotton", 《THEOR APPL GENET》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106661610A (zh) * 2014-03-14 2017-05-10 美国陶氏益农公司 与肾状线虫抗性连锁的标志物

Also Published As

Publication number Publication date
US9840744B2 (en) 2017-12-12
EP2971143A1 (en) 2016-01-20
BR112015021478A2 (pt) 2017-10-10
UY35436A (es) 2014-05-30
US11136630B2 (en) 2021-10-05
MX2015013243A (es) 2015-12-11
US20140283212A1 (en) 2014-09-18
EP2971143A4 (en) 2016-08-24
AR095305A1 (es) 2015-10-07
AU2014239856A1 (en) 2015-09-10
WO2014152399A1 (en) 2014-09-25
BR112015021478B1 (pt) 2021-12-28
US20220025471A1 (en) 2022-01-27
BR112015021478B8 (pt) 2023-05-16
US20140283213A1 (en) 2014-09-18

Similar Documents

Publication Publication Date Title
US10577623B2 (en) Quantitative trait loci (QTL) associated with shatter resistant capsules in sesame and uses thereof
US20220025471A1 (en) Markers linked to reniform nematode resistance
US20180371483A1 (en) Molecular markers for low palmitic acid content in sunflower (helianthus annus), and methods of using the same
WO2020036950A1 (en) Molecular markers for blackleg resistance gene rlm1 in brassica napus, and methods of using the same
US10561084B2 (en) Molecular markers for blackleg resistance gene rlm2 in brassica napus and methods of using the same
US10793918B2 (en) Molecular markers for blackleg resistance in canola and methods of using the same
US20220195537A1 (en) Methods and compositions to select and/or predict cotton plants resistant to fusarium race-4 resistance in cotton
US20210315177A1 (en) Molecular markers for blackleg resistance gene rlm7 in brassica napus, and methods of using the same
AU2014386227B2 (en) Markers linked to reniform nematode resistance

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160106

RJ01 Rejection of invention patent application after publication