CN104838263A - 用于选择基因渗入标志组的方法 - Google Patents

用于选择基因渗入标志组的方法 Download PDF

Info

Publication number
CN104838263A
CN104838263A CN201380043360.3A CN201380043360A CN104838263A CN 104838263 A CN104838263 A CN 104838263A CN 201380043360 A CN201380043360 A CN 201380043360A CN 104838263 A CN104838263 A CN 104838263A
Authority
CN
China
Prior art keywords
plant
mark
proterties
interested
genetic marker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380043360.3A
Other languages
English (en)
Other versions
CN104838263B (zh
Inventor
K·R·罗宾斯
J·E·巴克伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agrigenetics Inc
Original Assignee
Agrigenetics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agrigenetics Inc filed Critical Agrigenetics Inc
Publication of CN104838263A publication Critical patent/CN104838263A/zh
Application granted granted Critical
Publication of CN104838263B publication Critical patent/CN104838263B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Botany (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Image Processing (AREA)
  • Cultivation Of Plants (AREA)

Abstract

本公开涉及标志辅助植物选择和育种。在具体的实施方案中,提供鉴定用于预测感兴趣的植物性状之存在的优化标志组的方法,以及/或由该方法鉴定的标志组。

Description

用于选择基因渗入标志组的方法
发明领域
本公开涉及植物育种。更具体地,本公开涉及应用一种改进的系统来鉴定和选择对感兴趣的性状基因渗入非常有用的植物遗传标志的集合。
发明背景
杂交植物育种的发展已经使得显著提高作物生产的质量和数量成为可能。产量和理想性状(如对疾病和昆虫的抗性、对炎热和干旱的耐性)组合的改善,以及植物组成的变化,都至少部分地是由于植物杂交过程才成为可能的。杂交过程依赖来自雄性亲代植物的花粉贡献于雌性亲代植物,由此产生杂种。
玉米杂种的开发需要纯合近交系的开发、这些品系之间的杂交、以及对杂交的评估。谱系育种和轮回选择是用于从种群中发展近交系的两种育种方法。育种程序将来自两种或多种近交系、或广泛基础的不同来源的理想性状组合成育种池,从育种池通过自交和对理想表型的选择来开发新的近交系。杂交玉米品种由两种这样的近交系杂交获得,每一种近交系可能具有一种或多种在另一近交系中不存在的理想性状,或对另一近交系补全的性状。使新的近交植物与其他近交系杂交,且对来自这些杂交的杂种进行评估以确定哪些是理想的。第一代的杂交后代被称为F1。所述F1杂种通常与其近交亲本相比更加有活力。这种杂种活力称为杂交优势,通常导致,例如植物生长增强和产量增加。因此,在杂种开发中通常只寻求F1杂种。
为促进标志辅助的基因渗入,高信息量的标志(例如,在轮回亲本和供体亲本之间呈多态性的SNP标志)在性状渗入的各目标群体中都是理想的。鉴定有信息量的标志的子集可以看作一个组合性问题。解答在理论上很容易实现,需要对每一个可能的组合进行评估,但在计算上是不可行的。举例来说,现有的利用256个标志的标志集合性状的基因渗入应用需要从业者评估1.2x10279个标志组合方可穷尽式地寻找所有的可能组合,且随者标志集合中包含的标志增多,该数字会呈指数增长。
蚁群算法(ACA)是一种群体智能算法,其模拟真实蚁群在寻找通向食物源的最佳路径中的交流。参见,例如Dorigio et al.(1999)Artificial Life5(2):137-72。在自然界,蚂蚁在地面上放置化学信息素来形成路线,供其他蚂蚁追踪。最初,蚂蚁从巢穴随机分散以寻找食物,并在找到食物后返回。找到通向食物源的最快路径的蚂蚁穿越巢穴与找到的食物源之间距离的速度更快,在该过程中放置信息素的更多。随所述信息素水平的积累,更多蚂蚁优先地选择较短路径而非具有较少信息素的较长路径,由此在该过程中放置进一步更多的信息素。如前所述,蚁群的自然生物学行为描述了正反馈系统的基本要素,由此蚁群中的所有蚂蚁最终均将选择从巢穴至食物源的最佳路径。
具有大样本空间的蚁群优化算法(ACO)技术方案已被证明是通信网络路径(Dorigio et al.(1999),同上、疾病鉴定(Ressom et al.(2007)Bioinformatics23(5):619-26)、疾病分类(Robbins et al.(2007)Math.Med.Biol.24:413-26)以及家畜基因分型(Spangler et al.(2009)Anim.Genet.40:308-14)的有效技术。
发明概述
本文描述的是用于确定植物育种用的遗传标志集合的系统和方法,该方法包括多个向量,每一个向量储存一种可能的方案或“路径”。该方法利用一种称为“信息素函数”的自适应概率密度函数(PDF)将这些向量(称为“蚂蚁”)间的通信模型化。在实施方案中,蚂蚁利用该函数从感兴趣的植物物种的基因组中选择遗传标志的子集。随后可利用从多个感兴趣的植物提供的遗传信息评估该遗传标志的子集。基于该选出的子集的性能,可以更新信息素函数,使得能产生理想方案的特征更有可能在未来的迭代中被蚂蚁选出。
在特定的实施方案中,适用ACA来鉴定能产生最佳基因组分析覆盖率的标志组。在特定的实施方案中,适用ACA来鉴定能产生最佳连锁不平衡覆盖率的标志组。
在一些实施方案中,使用SNP基因分型系统(例如,基因分型系统)提供来自感兴趣的植物的基因信息。
前文和其他特征随下文多个实施方案的详述变得更加清楚,随后是附图的参考。
附图简述
图1a-y包括可在计算机上执行以实现特定实施方案的蚁群优化的程序代码。
图2-3包括从数种优化方法获得的标志组的性能的比较:对于“ACA”,抽样是基于适应性的信息素函数;对于“PS”,抽样是基于标志在所有亲本组合中有信息量(在供体和轮回亲本之间有多态性)的次数的比例,而对于“RS”,抽样是完全随机的。性能(图1中的GA;图2中的LD)以选定的标志组所实现的覆盖率与使用所有标志时实现的覆盖率(在该实施例中,共有1371个标志)之比来表示。对于每一种方法,评估了24000个标志子集,而仅呈现了性能最好的子集。
图2包括对于ACA、PS和RS的GA覆盖率的作图。GA覆盖率以在选定的组中保留的覆盖率与利用全部可用标志时获得的覆盖率相比的比例表示。
图3包括对于ACA、PS和RS的LD覆盖率的制图。LD覆盖率以在选择的组中保留的覆盖率与当利用全部可用标志时获得的覆盖率相比的比例表示。
图4包括对于通过ACA选择的(ACA标志)256个标志以及全部可用标志(全部标志)的信息化标志位置的作图。图4a包括D020083/SLB01标志位置的作图。图4b包括SLD25BM/SLB01标志位置的作图。
发明详述
I.多个实施方案的概要
随着用于主要作物品种的数以千记的遗传标志(例如,SNP标志)的开发,目前在理论上已存在可有效用于多个作物种系中的标志辅助感兴趣的性状(例如,农艺学重要的性状)基因渗入的标志组。这些有效标志组的鉴定将使得基因渗入过程进一步自动化并增加其有效性。然而,鉴于植物育种项目相关的标志组选择可用的标志的数量过于庞大且不断增长,对所有可能的标志组的穷尽性的评估是在计算上是不可行的。因此,本文提供系统和方法,用于高效率地搜索庞大的标志样本空间,以找到以优化的标志组形式呈现的最优解。在一些实施方案中,提供了系统和方法,它们在搜索巨大样本标志空间的一小部分时能够鉴定有信息量的标志子集。
蚁群优化系统(ACO)利用正反馈通信系统,模拟真实蚁群用来寻找食物源最佳途径的信息素路径,以图在极大的样本空间中高效率地搜索优化解。在本发明的实施方案中,可适用ACO系统鉴定已知和/或可凭经验确定的、可以产生最佳的基因组分析(GA)和/或连锁累赘(LD)覆盖率用于标志辅助的植物育种(例如标志辅助的性状基因渗入)的遗传标志组。采用根据本发明一些实施方案中的方法,ACO系统在执行鉴定优化的标志组用于标志辅助的植物育种的任务时惊人地有效,使得ACO系统的性能一贯地优于其他优化方法。根据特定实施方案的方法的惊人优势可随着标志样本空间的增加而增加。
在一些实例中,应用ACO从1371个可用的SNP标志的集合中确定用于植物育种程序开发的高信息量的256个标志的组。当应用到72个有潜力的基因渗入项目时,采用ACO的方法的性能一贯地优于所有其他测试的方法。当利用该确定的256个标志的集合时,该标志子集可保持利用全部1371种可用标志时所获得的基因组(GA)和LD覆盖率的80%,其进一步在数量上证明了采用ACO的方法的有效性。
II.   缩写
ACA   蚁群算法
ACO   蚁群优化
AFLP  扩增片段长度多态性
DAF   DNA扩增指纹印迹
GA    基因组分析
LD    连锁累赘
PCR   聚合酶链式反应
PDF   概率密度函数
PS    基于先前信息的取样
QTL   数量性状座位
RAPD  多态性DNA的随机扩增
RFLP  限制性片段长度多态性
RS    随机取样
SCAR  序列特征性扩增区域
SNP   单核苷酸多态性
III.  术语
蚂蚁:本文所用“蚂蚁”或“人工蚂蚁”指从点到点运动的媒介。“蚁群优化”(ACO)系统指一种元启发式算法,在一些实施方案中用于离散的组合优化。在ACO系统中,蚂蚁可利用边缘上累计的踪迹(trail accumulated on edges)和启发式因子(heuristic value)二者(它们可以是边缘长度的函数)的概率函数来选择下一个要运动到的点。根据信息素函数,蚂蚁优选具有高联合概率(jointprobabilities)的离散状态。
回交:回交方法可用于将核酸序列引入植物中。回交技术数十年来已被广泛用于新性状向植物中的导入。Jensen,N.,Ed.Plant Breeding Methodology,John Wiley&Sons,Inc.,1988。在典型的回交方案中,感兴趣的最初品种(轮回亲本)与携带要转移的感兴趣基因的另一品种(非轮回亲本)杂交。随后将该杂交所得的子代与轮回亲本再一次杂交,且重复该流程,直至在被转换的植物中除了从非轮回亲本转移而来的基因之外,轮回亲本的基本上所有期望的形态学和生理学特征均得以恢复。
基因组分析:“基因组分析”一般指判定和比较基因序列的技术。其包括DNA测序、DNA微阵列技术用于在mRNA水平分析基因表达谱的常规应用、以及来整理和分析这些数据的改进的信息工具。
“分离的”:“分离的”生物组分(例如核酸或蛋白质)已实质上与该组分天然出现的生物体细胞中的其他生物组分(即,其他染色体和染色体外DNA和RNA,以及蛋白质)分离、与所述其他生物组分分开产生,或自所述其他生物组分纯化开来,同时引起该组分中的化学和功能上的变化(例如,核酸可通过破坏将该核酸与染色体中的其余DNA连接的化学键来从染色体分离)。已经被“分离”的核酸分子和蛋白质包括通过标准纯化方法纯化的核酸分子和蛋白质。该术语还涵盖通过在宿主细胞中重组表达制备的核酸和蛋白质,以及化学合成的核酸分子、蛋白质和肽。
连锁累赘:“连锁累赘”指在渗入的基因周围的一段供体基因组节段。连锁累赘节段是重要的,因为它会纳入其他不利的等位基因并把它们带入商品化种群中,而且这种情况的风险与其长度相关。分子标志提供了一种工具,可在每个回交代的全程中监控野生和外源DNA的量。
核酸分子:本文所用术语“核酸分子”可指聚合形式的核苷酸,其可包括RNA、cDNA、基因组DNA和上述的合成形式和混合多聚物的有义和反义链。核苷酸可指核糖核苷酸、脱氧核糖核苷酸或任一种核苷酸的修饰形式。本文所用的核酸分子与“核酸”和“多核苷酸”具有相同含义。术语“核酸分子”包括单链和双链形式的DNA。核酸分子可包括天然存在的核苷酸和/或修饰的核苷酸,这些核苷酸通过天然存在的核苷酸联接和非天然存在的核苷酸联接而连接在一起。本领域的技术人员容易理解,核酸分子可以通过化学或生化修饰,或可包含非自然或衍生化的核苷酸碱基。术语“核酸分子”还包括任何拓扑构象,其包括单链、双链、部分双链体、三链体、发夹、环状和挂锁状构象。
基因座(座位):本文所用术语“基因座”(或“座位”)指与可测量特征(例如,性状)相对应的基因组上的位置。SNP基因座通过与基因座内包含的DNA杂交的探针来界定。
标志(marker):本文所用术语“标志”指可用于鉴定可能具有特定等位基因和/或展示特定性状或表型的植物的基因或核苷酸序列。标志可以描述为给定基因座上的变化。遗传标志可以为短DNA序列,如围绕单碱基对改变(单核苷酸多态性,或“SNP”)的序列,或长序列,举例来说,微卫星/简单重复序列(“SSR”)。“标志等位基因”指在特定植物中存在的标志的版本。本文所用术语“标志”可指植物染色体DNA的克隆节段,还可以指或另外可以指与植物染色体DNA的克隆节段互补的DNA分子。
在一些实施方案中,植物中标志的存在可以通过使用核酸探针来检测。探针可以是DNA分子或RNA分子。RNA探针可以通过本领域已知的手段合成,例如利用DNA分子模板。探针可包含标志的全部或部分序列,以及来自植物基因组的额外的邻接核苷酸序列。这在本文被称为“邻接探针”。额外的邻接核苷酸序列称为原始标志的“上游”或“下游”,根据来自植物基因组的邻接核苷酸序列位于原始标志的5’还是3’端(按照常规理解)而定。如本领域技术人员认可的,获得额外的邻接核苷酸序列加入标志中的流程可以接近无限地循环(仅被染色体长度限制),由此沿着染色体鉴定额外的标志。任何上述的标志的变化均可用于本发明的实施方案。
核苷酸探针序列可通过合成或克隆制备。合适的克隆载体是本领域的技术人员熟知的。核苷酸探针可是标记的或无标记的。已有用于标记核酸分子的多项技术,包括例如但不限于:缺口平移放射性标记;随机引物法;利用终端脱氧转移酶加尾等,其中使用例如放射性的32P来标记核苷酸。也可使用其他标记物,包括,例如但不限于:荧光团;酶;酶底物;酶辅因子;酶抑制剂等。或者,作为使用提供检测信号(其自身提供或与其他活性剂共同提供)的标记物的替代,可以使用被受体结合的配体,其中受体被标记(例如,用上述的标记物),通过其自身或与其他作用剂联合来提供检测信号。见,例如,Leary et al.(1983)Proc.Natl.Acad.Sci.USA 80:4045-9。
探针可包括不与原标志的核苷酸序列邻接的核苷酸序列;该探针在本文称为“非邻接探针”。非邻接探针序列在染色体上的位置与原始标志序列足够接近,使得该非邻接探针与作为原始标志的同一基因或标志遗传连锁。例如,在一些实施方案中,非邻接探针可位于染色体上的原始标志的500kb;450kb;400kb;350kb;300kb;250kb;200kb;150kb;125kb;120kb;100kb;0.9kb;0.8kb;0.7kb;0.6kb;0.5kb;0.4kb;0.3kb;0.2kb或0.1kb之内。
探针可以是待检测的标志的确切拷贝。探针还可以是这样的核酸分子,其包括,或由与包含待检测的标志的染色体DNA克隆节段基本相同的核苷酸序列组成(例如,由在表2中的SNP ID(玉米)所界定)。
探针还可以是与待检测的标志(“DNA靶”)的确切拷贝“可特异性杂交”或“特异互补”的核酸分子。术语“可特异性杂交”或“特异互补”表明充分的互补度使得在核酸分子和DNA靶之间发生稳定和特异的结合。核酸分子与其可特异性杂交的靶序列不需要100%互补。核酸分子可特异性杂交指存在充分的互补性来避免当期望特异结合,例如,在严格杂交条件下的结合时核酸分子与非靶序列非特异结合。
取决于选择的杂交方法的性质以及杂交核酸序列的长度,导致特定严格程度的杂交条件可发生变化。虽然清洗时间也影响严格度,但一般而言,杂交缓冲液的杂交的温度和离子强度(尤其是Na+和/或Mg++浓度)将决定杂交的严格度。关于用于获得特定严格程度所需的杂交条件的计算为本领域的技术人员已知,且在例如,Sambrook et al.(ed.)Molecular Cloning:A LaboratoryManual,2nd ed.,vol.1-3,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,1989,chapters 9 and 11;and Hames and Higgins(eds.)Nucleic AcidHybridization,IRL Press,Oxford,1985中有讨论。关于核酸杂交的进一步详细的说明和指导可见于,例如,Tijssen,“Overview of principles of hybridizationand the strategy of nucleic acid probe assays,”in Laboratory Techniques inBiochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,Part I,Chapter 2,Elsevier,NY,1993;and Ausubel et al.,Eds.,Current Protocolsin Molecular Biology,Chapter 2,Greene Publishing and Wiley-Interscience,NY,1995。
本文所用的“严格条件”涵盖了杂交仅在当杂交分子和DNA靶之间存在少于25%的错配时发生的情况。“严格条件”包括进一步的特定的严格性水平。因此,“适度严格”的情况是那些具有多于25%的序列错配的分子将不会杂交的情况;“中度严格”的情况是那些分子具有多于15%错配将不会杂交的情况;而“高度严格”的情况是那些序列具体多于10%错配将不会杂交的情况。“非常高度严格”的情况是那些序列具有多于6%错配将不会杂交的情况。
在具体的实施方案中,严格条件是在65℃于6×柠檬酸钠(SSC)缓冲液、5×Denhardt’s溶液、0.5%SDS和100μg剪切的鲑鱼精DNA中的杂交,接下来在65℃下2×SSC缓冲液和0.5%SDS中连续洗涤15-30分钟,随后由1×SSC缓冲液和0.5%SDS,最后0.2×SSC缓冲液和0.5%SDS中洗涤。
对于如上讨论的所有探针,所述探针可包括额外的核酸序列,例如,启动子;转录信号和/或载体序列。
本文所用的基因或标志之间的“连锁”指染色体上的基因或标志表现出可被共同传递至下一代的个体的可测量的概率的现象。两个基因或标志越接近彼此,这种概率变得越接近(1)。因此,术语“连锁的”可以指一个或多个基因或标志与另一基因或标志以高于0.5的概率(这是依据各标志/基因位于不同染色体时的自由组合预期的)共同传递。由于在染色体上的两个基因或标志的接近度直接与基因或标志将共同传递至下一代中的个体的概率相关,术语“连锁的”在本文中也可以指相同染色体上彼此相距2.0Mb之内的一种或多种基因或标志。因此,两种“连锁的”基因或标志可相隔约2.1Mb;2.00Mb;约1.95Mb;约1.90Mb;约1.85Mb;约1.80Mb;约1.75Mb;约1.70Mb;约1.65Mb;约1.60Mb;约1.55Mb;约1.50Mb;约1.45Mb;约1.40Mb;约1.35Mb;约1.30Mb;约1.25Mb;约1.20Mb;约1.15Mb;约1.10Mb;约1.05Mb;约1.00Mb;约0.95Mb;约0.90Mb;约0.85Mb;约0.80Mb;约0.75Mb;约0.70Mb;约0.65Mb;约0.60Mb;约0.55Mb;约0.50Mb;约0.45Mb;约0.40Mb;约0.35Mb;约0.30Mb;约0.25Mb;约0.20Mb;约0.15Mb;约0.10Mb;约0.05Mb;约0.025Mb;约0.012Mb;以及约0.01Mb。本文所有术语“紧密连锁的”可指在相同玉米染色体上彼此相距0.5Mb以内的一种或多种基因或标志。本文所用术语“非常紧密连锁的”可指在相同玉米染色体上彼此相距100kb以内的一种或多种基因或标志。
如本文所用的,感兴趣的标志和性状或表型之间的连锁可指一种或多种标志,它们各自与某性状或表型以大于从随机因素预期的机率共同传递。虽然在某些实例中标志可被包含于决定特定性状和表型的基因之内,应该理解的是大多数情况下标志可在同一染色体上与这样的基因相隔一段较短的距离(例如,少于约2Mb)。此外,应该理解的是,大多数的性状和表型是多基因的,因此与性状或表型连锁的标志在一些实例中可能位于多基因性状所基于的QTL之间,或与之连锁。
连锁、紧密连锁以及非常紧密连锁的遗传标志可以用于标志辅助的育种计划,例如但不限于,感兴趣性状或表型至植物品种的基因渗入;并产生包括感兴趣的性状或表型的新的植物变种。
标志辅助育种:本文所用术语“标志辅助育种”可指直接针对一种或多种性状(例如,多基因性状)的育种方式。在目前的实践中,植物育种者试图鉴定与农艺学理想性状连锁的易于检测的性状,如花的颜色、种皮外观或同工酶变体。随后,植物育种者通过追踪该易于检测的性状,在发生分离的育种群体中追踪该农艺性状。但是,感兴趣的性状与易于检测的性状的连锁关系可用于植物育种的很少。在本发明的一些实施方案中,标志辅助的育种包括鉴定与感兴趣的性状相连锁的一个或多个遗传标志(例如,SNP标志),并通过追踪一种或多种遗传标志的分离来在发生分离的育种群体中追踪感兴趣的性状。在一些实例中,可以利用针对一种或多种遗传标志的探针,通过测试来自子代植物的遗传样品来测定一种或多种遗传标志的存在,来确定一种或多种遗传标志的分离。
标志辅助育种提供了用于植物品种改进的时间和成本高效的方法。多个标志辅助育种应用的实例包括同工酶标志的使用。见,例如,Tanksley andOrton,eds.(1983)Isozymes in Plant Breeding and Genetics,Amsterdam:Elsevier。一个实例是与对番茄害虫线虫的抗性相关的同工酶标志。该抗性由称为Mi的基因控制,位于番茄的染色体6上且与一种酸性磷酸酶同工酶Aps1紧密连锁。利用Aps1同工酶标志来间接选择Mi基因提供了能够利用标准电泳技术清楚地判断种群中的分离的优势;同工酶标志可在幼苗组织中评估,避免了保持植物至成熟的需要;且同工酶等位基因的共显性使得在纯合子和杂合子之间区分成为可能。见Rick(1983)in Tanksley and Orton,supra。
优化的:如在遗传标志的组的语境中使用的,术语“优化的”指与包含相同数目的非同一标志的参照组相比,在预测感兴趣的性状的存在或不存在时表现更佳(例如,提供更佳的GA或LD覆盖率)的标志组。因此,在一些实施方案中,“优化的”标志组是植物物种中某一大群遗传标志的子集,与由来自该一大群遗传标志的标志组成的、同样大小的另一不同子集相比,在预测感兴趣的性状或供体DNA存在或不存在时表现更佳。在一些实施例中,“优化的”标志组是在植物品种中某个遗传标志集合的子集,与由来自整个遗传标志集合的标志组成的、同样大小的子集相比,其更多地保持整个遗传标志集合的预测价值(对感兴趣的性状存在或不存在而言)。
术语“优化的”可指其提供的性能优于其他所有子集的子集,但并非一定是这样。优化的标志物集合可进一步被优化以提供更好的性能,例如,通过执行ACO系统的进一步迭代,或通过在附加的分离数据存在时执行对ACO系统的迭代。
序列同一性:术语“序列同一性”或“同一性”,如在两条核酸序列的语境中使用的,可指在比对这两条序列使它们在规定的比较窗口中一致性最大时,这两条序列中相同的核碱基。
本文所用术语“序列同一性的百分比”可指通过在比较窗口中比较两个最佳对齐的核酸序列所确定的值,其中为得到两序列的最佳对齐,在比较窗口中的序列部分相比于参考序列(其不包含添加或缺失)可包含添加或缺失(即,缺口)。该百分比如下计算:确定在两序列中出现相同核碱基的位点的数目从而获得匹配的位点数目,用匹配的位点数目除以比较窗口中位点的总数,并将结果乘以100以获得序列同一性的百分数。
用于比对序列以供比较的方法为本领域公知。不同的程序和比对算法描述于,例如,Smith and Waterman(1981)Adv.Appl.Math.2:482;Needleman andWunsch(1970)J.Mol.Biol.48:443;Pearson and Lipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444;Higgins and Sharp(1988)Gene 73:237-44;Higgins andSharp(1989)CABIOS 5:151-3;Corpet et al.(1988)Nucleic Acids Res.16:10881-90;Huang et al.(1992)Comp.Appl.Biosci.8:155-65;Pearson et al.(1994)Methods Mol.Biol.24:307-31;Tatiana et al.(1999)FEMS Microbiol.Lett.174:247-50。序列比对方法和同源性计算的详细描述可见于,例如,Altschulet al.(1990)J.Mol.Biol.215:403-10。
美国国立生物技术信息中心(NCBI)基础局部比对搜索工具(BLASTTM;Altschul et al.(1990))可从多个来源访问,包括美国国立生物技术信息中心(Bethesda,MD)以及在互联网上,可供与多个序列分析程序关联使用。如何利用该程序确定序列同一性的描述可从互联网上BLASTTM的“帮助”版块获得。核酸序列的比较可采用BLASTTM(Blastn)程序的“Blast 2序列”功能,使用默认参数。与参考序列具有更大相似性的核酸序列当利用该方法评估时将展示出增加的百分数。
本文所用术语“基本上相同”可指超过85%相同的核苷酸序列。例如,基本上相同的核苷酸序列可以与参照序列至少85.5%、至少86%、至少87、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。
单核苷酸多态性(SNP):本文所用术语“单核苷酸多态性”可指当基因组(或其他共有的序列)中的单个核苷酸在某一物种的成员之间,或者在某一个体的配对染色体之间发生差异时,DNA序列发生的变化。
在某一群体中,可对SNP指配最小等位基因频率,即在特定群体中观察到的某个基因座上的最低等位基因频率。这对于单核苷酸多态性说即为两个等位基因频率的较小者。植物群体之间有所不同,因此在一个群体中常见的SNP等位基因在另一群体中可能是较为罕见的。
单核苷酸多态性可落入基因的编码序列、基因的非编码区域、或基因之间的基因间区域内。由于遗传密码的简并性,编码序列内的SNP不一定会改变其产生的蛋白质的氨基酸序列。两种形式的SNP导致相同多肽序列被称为“同义”(有时也被称为沉默突变),如果产生不同多肽序列,则称为“非同义”。非同义变化可以为错义或无义,其中错义变化导致不同的氨基酸,而无义变化导致提前出现的终止密码子。不在蛋白质编码区的SNP对基因剪接、转录因子结合或非编码RNA的序列仍然可以有影响。SNP通常为双等位的,因此在植物和动物中很容易检验。Sachidanandam(2001)Nature 409:928-33。
共识主动性(stigmergy):本文所用术语“共识主动性”或“共识主动通信”指的是媒介之间通过环境状态变量的物理改变介导的间接通信,其值仅可由所述通信媒介(即,蚂蚁)由本地访问。
性状或表型:本文术语“性状”和“表型”可互换使用。为本公开的目的,特别感兴趣的性状包括农艺学上重要的性状,此类性状可表达于,例如,植物作物中。
IV.用于植物育种的标志
本发明的实施方案包括植物中可能与感兴趣的性状连锁的遗传标志。一些实施方案包括植物基因组中的标志集合,通过ACO系统的实施,可从该集合鉴定出标志的子集,该子集用于预测提供遗传样品的植物中感兴趣的性状的存在或不存在。遗传标志集合,以及从其中鉴定的优化的子集,可包含一个或多个与感兴趣的性状各自连锁的标志。
可被用于特定实施方案的一些标志是本领域已知的。例如,在多种植物物种中已通过基因测序、基因分型以及QTL定位研究获得了遗传标志。其他可用于特定实施方案的标志可利用任何本领域的技术人员已知的技术鉴定,包括例如但不限于:分子技术如RAPD、RFLP的鉴定、AFLP-PCR、DAF、SCAR的鉴定和/或微卫星的鉴定;以及来自多个群体的比对的基因组核酸序列之间的直接比较。
在一些实例中,标志集合包括SNP标志。对于植物的一种或多种SNP标志的基因分型可容易地实施,例如,通过利用多种基于PCR的分析技术中的一种。在特定实例中,植物对SNP集合的基因分型可通过利用SNP基因分型系统(Applied BioSystems)实施。SNP基因分型系统利用包含SNP组的“芯片”通过测定遗传样品中核酸对该SNP组的杂交来判断提供遗传样品的生物体的基因分型。
V.蚁群优化
ACO是参考蚂蚁使用信息素来鉴定从感兴趣的空间位点至巢穴的最短路径的自然过程所设计的优化方法。Dorigo and Gambardella(1997)BioSystems 43:73-81;Dorigo et al.(1999)Artificial Life 5:137-72。在自然界,每只蚂蚁在行走中放置一定量的信息素,且每只蚂蚁在概率上偏好沿着富有信息素的方向前进。如果沿感兴趣的空间位点(例如,食物源)和巢穴间的路径上出现障碍物,那些接近障碍物的蚂蚁必须选择向右或向左转来避免该障碍物。如果没有以这样或那样的方式提供方向线索的信息素,一半的蚂蚁将选择向右转而另一半将选择向左转。那些随机选择较短路径绕开障碍物的蚂蚁相比那些选择较长路径的蚂蚁将更快速地重建一条连续的信息素踪迹。这种行为建立了一个自催化过程,使较短的路径在每单位时间接收的信息素量较多,且更多数的蚂蚁随后将选择该较短路径。如果允许该过程达到其自然终点,所有蚂蚁均将快速选择所述较短的路径。
绕开障碍物的最短路径可以视为障碍物形状和蚂蚁分布行为之间的相互作用的涌现性质(emergent property)。虽然所有的蚂蚁以大致相同的速度移动并以大致相同的速度放置信息素踪迹,沿较长的边绕过障碍物相比沿较短的边需要更长的时间。因此,在较短的边上信息素踪迹积累更快。蚂蚁对具有高水平信息素的踪迹的偏好使得在较短路径上的该积累进一步更快。根据前文,当每只蚂蚁可找到解(即两点之间的路径)时,只有m只蚂蚁的集合的行为导致优化。
在ACO系统的一个实例中,将m只蚂蚁放置在要解决的问题的合适表示中包含的随机选择的空间位点上。在每一个时间步骤,蚂蚁移动至新位点,并可改变其使用的边(即,点与点之间的路径)上的信息素踪迹,该过程称为“局部路径更新”。当所有蚂蚁已完成运动,进行了最短移动的蚂蚁可通过加入与移动长度成反比的量的信息素来改变属于其移动的边(全局途径更新)。在一些实施方案中,蚂蚁可能能够确定点与点之间的距离,和/或具有用于记忆已访问的点的工作记忆(Mk)(该工作记忆可在每次新移动开始时被清空,且可在每个时间步骤后被更新)。
蚂蚁被给予找出连接最初问题状况至目标状况的最短路径的任务。蚂蚁必须一步步移动通过近邻的问题状态。蚂蚁通过应用概率决策策略(probabilistic decision policy)来移动通过过近邻状态以建立解,在大多数实施方案中仅利用局部信息而非预测未来状态。因此,决策策略在空间和时间上可以完全是局部性的。决策策略是下述两者的函数:由问题说明(problemspecifications)所代表的事先信息,以及问题环境(信息素踪迹)中由过去的蚂蚁所诱导的局部改变。一旦个体蚂蚁建立了问题的解且放置了信息素信息,可将该蚂蚁从ACO系统删除。虽然每只蚂蚁的复杂度能够建立可行的解(因为真正的蚂蚁总能以某种方法找到巢穴和食物之间的路径),但高质量的解是整个群落的个体之间合作的结果。
在一些实施方案中,本发明的ACO系统的特征可包括,例如但不限于:多个合作的个体媒介(蚂蚁群落);为了局部共识主动性通信而改变问题的局部状态的人工“信息素”踪迹(即,考虑进行放置的蚂蚁(depositing ant)的现有历史或性能、且能够被任何访问该状态的蚂蚁所读/写的数字信息);为寻找最短路径的一系列局部移动;且利用局部信息而不预测未来状态的随机决策策略。在一些实施方案中,本发明的ACO系统的特征还可包括,例如但不限于:包含离散近邻状态的离散问题环境,其中蚂蚁运动由在离散的近邻状态之间的转换构成;每只蚂蚁的内部状态,包含蚂蚁过去行为的记忆;以及信息素的放置,放置的量是所发现的解的质量的函数
在一些实施方案中,由局部信息素踪迹所提供的共识主动性通信可以是蚂蚁与蚂蚁之间仅有的通信渠道。然而在一些实施方案中,可采用一些对未来状态的预测。Michel and Middendorf(1998)“An island model based AntSystem with lookahead for the shortest supersequence problem.”In Proceedingsof PPSN-V,Fifth International Conference on Parallel Problem Solving fromNature,Eiben et al.(Eds.),Springer-Verlag,Berlin.
在一些实施方案中,蚂蚁决策策略的随机成分和/或“蒸发机制”可以防止蚂蚁被过去的决策限制而向先前访问过的相同的搜索空间部分快速迁移。挥发机制随时间改变局部信息素踪迹中的信息,使得蚁群能够忘记或部分地忘记其过去的历史。蚂蚁决策策略的随机成分决定下述各者之间的平衡:对状态空间内的新点的探索,与利用根据策略中随机性的水平积累的知识、以及在局部信息素踪迹中更新的强度。信息素踪迹中更新的强度和/或随机性的特定水平,以及蒸发机制的强度,可在实施方案中根据从业者的裁量加以确定。
在一些实例中,蚂蚁放置信息素的时机是依赖于问题的。例如,蚂蚁可仅在已经产生解后更新信息素途径。还有一些实例中,ACO系统可加以强化能力,能力包括,例如但不限于,局部优化(见,例如,Dorigo and Gambardella(1997)IEEE Transactions on Evolutionary Computation 1(1):53-66);由原路返回(backtracking)/恢复步骤(见Di Caro and Dorigo(1998)J.Art.Intel.Res.(JAIR)9:317-65);以及这样的蚂蚁外(extra-ant)成分:其可观察蚂蚁行为来收集有用的全局信息,并放置额外的生物素信息,该信息从非局部的角度偏差化蚂蚁搜索过程(Dorigo et al.(1999)。这些和其他改变可改进,例如,ACO系统的有效性和/或性能。在ACO系统中,蚂蚁世代和活动、信息素蒸发、以及蚂蚁外行为可在系统的实施过程中同步化。在一些实施例中,使用系统活动的顺序调度。
在本发明的实施方案中,通过实施ACO系统鉴定来自植物的优化的遗传标志组。在一些实施方案中,问题空间内的空间位点可与来自更大的离散标志集合的离散标志子集对应。在一些实施方案中,蚂蚁之间的共识主动性通信可由一个PDF来代表,该PDF被如下所述的信息素水平所更新:信息素水平是由选定的标志为感兴趣的性状所提供的基因组(GA)和连锁累赘(LD)覆盖率所决定的。根据这些实施方案通过多重时间步骤实施的ACO系统可鉴定一组遗传标志,它们为感兴趣的性状的鉴定和/或基因渗入而被优化。在特定的实例中,较大的离散标志集合可包括至少约500个标志、至少约600个标志、至少约700个标志、至少约800个标志、至少约900个标志、至少约1000个标志、至少约1100个标志、至少约1200个标志、至少约1300个标志、至少约1400个标志、至少约1500个标志、至少约1600个标志、至少约1700个标志、至少约1800个标志、至少约1900个标志、至少约2000个标志;或更多。
为测试ACO系统在鉴定来自植物的优化的遗传标志组的有效性,可将ACO系统应用于以感兴趣性状的基因渗入为目标的多个靶植物群体。在特定的实例中,可将ACO应用于多于约100个群体、少于约100个群体、少于约90个群体、少于约80个群体、少于约75个群体、少于约70个群体、少于约60个群体、少于约50个群体、或更少。ACO系统的有效性可通过比较下述二者来评估:使用已鉴定的优化标志子集获得的GA和LD覆盖率,和使用更大的集合(前述优化标志子集是从该集合中鉴定出来的)中的所有标志获得的覆盖率。可以将如此评估后的ACO系统的有效性与备选的组选择方法进行比较。在多个性状基因渗入项目中,这种优化的标志子集相比于备选方法可提供更佳的GA和/或LD覆盖率。
关于ACO系统及其实施的基本信息可见于,例如,Dorigo et al.(1999),(同上)。
VI.优化的标志组的用途
一些实施方案包括利用优化的分子标志组来鉴定可能包括感兴趣的性状的植物的方法,优化的分子标志组是通过采用ACO系统的过程鉴定的。在特定的实施方案中,可从植物中提取核酸分子(例如,基因组DNA或mRNA)。提取的核酸分子可随后与一种或多种探针接触,所述探针与优化的标志组中的标志是可特异性杂交的。所述一种或多种探针与所述提取的核酸分子的特异性杂交指示植物中感兴趣性状的存在。由于使用这种方法消除了为开发过程中生成的个体植物确定表型(例如,通过将具有感兴趣性状的植物与缺少感兴趣性状的植物品种杂交)的需要,因此这种方法可令植物开发者节省成本。
在一些实施方案中,已通过利用ACO系统的方法鉴定为能指示感兴趣性状的优化标志组可用于转移含有决定或贡献于感兴趣性状的一个或多个基因或QTL(即,性状基因渗入)的DNA节段。在特定的实施方案中,使用这些优化的标志组的方法可包括,例如但不限于,提供包含优化标志组中的标志的第一亲本植物;提供第二亲本植物;利用与优化标志组中的标志可特异性杂交的探针分析该第一和第二植物的基因组DNA;将两个亲本植物基因型进行杂交来获得子代群体,并对这些子代分析所述优化标志组中的标志的存在;将包含优化标志组中的标志的所述子代与第二亲本基因型回交来产生第一回交群体,随后持续回交程序直至获得包含由第二亲本基因型展示的任何理想性状以及所述优化标志组中的标志的最终子代,由此转移包含决定或贡献于感兴趣性状的一个或多个基因或QTL的DNA节段。在特定的实施方案中,第一杂交的子代,或任何后续的回交的子代,可与另一品系或基因型的第三植物而非第一或第二植物杂交。包含由第二亲本基因型展示的任何理想性状和优化标志组中的标志的最终子代很可能包含感兴趣的性状。
在一些实例中,在每一世代通过标志组分析选择在每一次杂交和回交步骤中获得的个体子代。在一些实例中,利用与优化的标志组中的标志可特异性地杂交的探针对两个亲本植物的基因组DNA的分析可揭示亲本植物之一包含较少的可与探针特异性杂交的标志,或没有与探针特异性杂交的标志。在一些实例中,第一亲本植物可包括感兴趣的性状,或可缺乏感兴趣的性状但包含对感兴趣性状有预测作用的基因型。
根据前文,在一些实例中子代植物可经受基因型,和/或接合性判断。一旦子代植物已得到基因分型,和/或接合性已得到确定,本领域的技术人员可选择那些具有理想的遗传组成的子代植物(例如,包含优化的标志组的标志的子代植物)。这些选择的子代可用于进一步杂交、自交或培养。如果性状渗入方法使用由利用ACO系统的过程鉴定出的对性状有预测作用的优化标志组,可减少或省略不具有理想的基因组合的植物的培养和/或繁殖,由此可在选择性植物育种或开发项目中提供理想的可靠性和可预测性。
提供下列实施例用来演示说明某些具体特征和/或实施方案。实施例不应被理解为将本公开限制于例示的特定特征或实施方案。
实施例
实施例1:材料和方法
数据。数据集由关于下述玉米品系的基因型信息组成:作为性状基因渗入目标的72个轮回近交玉米系,以及作为供体的五个近交玉米系。对每个品系采用SNP基因分型系统就可用的1371标志进行基因分型。对每个轮回与供体亲本组合,基于两亲本植物间的多态性将标志评定为有信息量或无信息量。
SNP组选择。采用三种抽样方法来选择标志的子集(sk):随机抽样(RS)、基因先前信息的抽样(PS)(先前信息作为SNP的多态率进行计算)、以及ACA。RS对标志子集随机抽样,而标志被PS选择的概率是基于对72个轮回与供体亲本组合而言标志具有信息量的次数的比例。ACO抽样方法使用蚁群抽样方法。标志的每个集合基于由下式计算的GA和LD覆盖率进行评估,
以及
其中nm是sk中有信息量的标志的数目;nmi是在插入位点侧翼的有信息量的标志的数目;ni是带有性状插入的染色体的数目;而MWGAi和MWLDi分别是GA和LD的标志权重,受到如下限制:
对于MWLDi,若标志i距离插入位点多于30cM,
若不然
标志权重以感兴趣的标志与sk中最近的有信息量的上游和下游标志的一半距离(以cM计)的和来计算。
蚁群优化。人工蚂蚁定义为多个平行的单位,它们之间通过概率密度函数(PDF)通信,该函数被权重或“信息素水平”更新,权重或“信息素水平”在这里由选定的标志提供的GA和LD确定。见Dorigo et al.(1999)同上,另外参见Ressom et al.(2007)同上,另外Robbins et al.(2007)Math.Med.Biol.24:413-26。抽样标志m在时间t的概率定义为:
P m ( t ) = ( τ m ( t ) ) α η m β Σ m = 1 nf ( τ m ( t ) ) α η m β
其中τm(t)是标志m(总共nf个标志中)在时间t的信息素的量,ηm是PS对于标志m使用的先前信息;α和β是参数,它们分别确定对蚂蚁放置的信息素给予的权重和对关于特征的事先信息给予的权重。对本研究而言,α和β均被设置成1。
初始化ACA,使所有标志具有相等的信息素基线水平,用于计算所有标志的Pm(0)。利用公式3中定义的PDF,j只蚂蚁中的每一个将从包含全部1371个标志的S空间选择具有n个标志的子集(sk)。随后如下所述根据(Sk)的性能更新sk中的每个标志m的信息素水平:
τm(t+1)=(1-ρ)*τm(t)+Δτm(t)
其中ρ是0和1之间的常量,代表信息素踪迹蒸发的速率;Δτm(t)是标志m的信息素水平基于(sk)的性能的变化,如果特征则其被设置为0。对于所有的(sk)重复该过程。
采用的过程可总结为如下步骤:第一,每只蚂蚁选择预先确定的标志数目;随后,采用选定的标志,如下计算性能:
性能=0.5*覆盖率GA+0.5*覆盖率LD
第三,如下计算信息素的变化:
Δτm(t)=性能(1-性能)
根据公式4更新信息素水平之后,根据公式3更新PDF,且重复该过程直至达到收敛条件,收敛条件在本实施例中是预先确定的迭代数。随着PDF被更新,选出的性能更好的条件被后续的人工蚂蚁采样的可能性更高,这些蚂蚁进而放置更多“信息素”,因此导致自催化的正反馈系统。图1阐述了在本实施例中使用的用于实施上述蚁群优化过程的程序代码。
实施例2:蚁群优化系统的改进的性能
确定了利用ACO、PS和RS选择的标志的GA和LD覆盖率、。图2-3。对于测试的所有标志组大小,ACO的性能均超过PS和RS,这清楚地表明ACO的适应性抽样方法导致优异的组选择。在256个标志的条件下,针对GA和LD性状通过ACO选择的组恢复了使用所有可用标志时的覆盖率的80%。仅利用19%的标志就实现了该覆盖率水平(1371个标志中的256个)是非常令人惊讶且引人注目的,尤其是考虑到样本空间的巨大。此外,ACO在不到5分钟就收敛到了稳定的解,表明该系统可容纳更大的样本空间。
实施例3优化的SNP组
采用ACO来选择256个SNP组,用于SNP基因分型系统。考虑到好的LD覆盖的重要性和大的间隙在GA覆盖中的代价,对用于测试ACO性能的标准进行了修改,以在LD覆盖率上放置更多权重,并对GA覆盖中大的间隙加以更高的处罚。新的评估准则仅利用插入片段的上游和下游25cM的标志计算LD覆盖。对于GA覆盖,覆盖多于40cM的标志的权重被设置为0,而不是之前描述的20cM。
利用新的准则,ACA分别恢复了利用所有可用标志获得的75%和87%的GA和LD覆盖率。对于两个选用群体的提供信息的标志的位置的绘图可见图4。由于在覆盖率中存在一些较大间隙,可以看到ACA组中的间隙与当使用所有提供信息的标志时出现的间隙相对应。总的来说,即使当利用所有可用标志获得相对覆盖率的覆盖率时,ACA组的收获引人注目。

Claims (22)

1.一种确定用于鉴定可能包含感兴趣性状的植物的生物标志集合的方法,所述方法包括:
利用蚁群优化系统来鉴定可预测所述感兴趣性状的具有多个遗传标志的优化子集,其中所述具有多个遗传标志的优化子集是用于鉴定可能包含感兴趣性状的植物的生物标志集合。
2.根据权利要求1所述的方法,其进一步包括:
提供不包含所述感兴趣性状的近交植物,其中所述近交植物包含关于所述多个遗传标志的基因型;
将包含关于所述多个遗传标志的基因型的第一供体植物与所述近交植物杂交来产生子代植物,其中子代植物包含关于所述多个遗传标志的基因型,并确定该子代植物是否包含所述感兴趣的性状;以及
提供包含关于所述多个遗传标志的多种基因型的数据库,其中每一种基因型是通过将所述近交植物与另一不同的供体植物杂交产生的子代植物的基因型。
3.根据权利要求2所述的方法,其进一步包括:
提供来自所述第一供体植物的遗传样品,以及
对所述第一供体植物进行关于所述多个遗传标志的基因分型。
4.根据权利要求1所述的方法,其中利用蚁群优化系统包括:
定义问题空间,其包含所述多个遗传标志的离散的邻接子集,以及多个媒介,其中所述媒介在连续的时间步骤中根据概率密度函数在各离散邻接子集之间进行选择,在所述连续的时间步骤过程中用由被选取的离散邻接子集所提供的感兴趣性状的基因组(GA)和连锁累赘(LD)覆盖率确定的值来更新所述概率密度函数;以及
容许所述媒介在预定数目的连续时间步骤过程中选择所述多个遗传标志的离散邻接子集。
5.根据权利要求4所述的方法,其中在所述预定数目的连续时间步骤的最后一步中被选取的离散邻接子集是用于鉴定可能包含感兴趣性状的植物的生物标志集合。
6.根据权利要求1所述的方法,其中通过基因分型确定所述近交植物关于所述多个遗传标志的基因型。
7.根据权利要求1所述的方法,其中通过基因分型确定所述子代植物关于所述多个遗传标志的基因型。
8.根据权利要求1所述的方法,其中通过基因分型确定另外的不同供体植物的基因型。
9.根据权利要求1所述的方法,其中所述多个遗传标志包括SNP标志。
10.根据权利要求9所述的方法,其中所述多个遗传标志由SNP标志组成。
11.根据权利要求1所述的方法,其中所述植物选自下组:玉米、大豆、烟草、胡萝卜、芸苔、油菜、棉花、棕榈、花生、稻属、拟南芥属、蓖麻属和甘蔗。
12.根据权利要求1所述的的方法,其中所述多个遗传标志包括至少约1000个标志。
13.根据权利要求1所述的方法确定的标志集合。
14.权利要求13所述的标志集合,其中所述集合包括少于约300个标志。
15.一种鉴定可能包含感兴趣性状的植物的方法,所述方法包括:
提供权利要求13所述的标志集合;
提供包含来自植物的核酸的遗传样品;以及
使所述核酸接触能与所述标志集合中的标志特异性杂交的探针,其中该探针对所述核酸的特异性杂交指示该植物中感兴趣性状的存在。
16.根据权利要求15所述的方法,其中所述标志包括SNP标志。
17.根据权利要求15所述的方法,其中所述植物选自下组:玉米、大豆、烟草、胡萝卜、芸苔、油菜、棉花、棕榈、花生、稻属、拟南芥属、蓖麻属和甘蔗。
18.一种转移感兴趣的植物性状的方法,所述方法包括:
提供权利要求13所述的标志集合;
提供包含所述感兴趣性状的第一亲代植物;
提供缺少所述感兴趣性状的第二亲代植物;
利用能与所述标志集合中的标志特异性杂交的探针分析所述第一和第二亲代植物的基因组DNA,由此确定第一和第二亲代植物关于该标志子集中的所述标志的基因型;
将这两个亲代植物基因型杂交来获得子代群体;
用能与所述标志集合中的标志特异性杂交的探针分析所述子代群体的植物,由此确定子代植物关于所述标志集合中的所述标志的基因型;
将包含与所述第一亲代植物相同的关于所述标志子集中的所述标志的基因型的子代植物与所述第二亲代基因型回交来产生第一回交群体;以及
继续进行回交程序直至获得如下所述的最终子代植物,由此转移所述感兴趣的性状:所述最终子代植物包含由所述第二亲代基因型展示的任何理想性状、以及与所述第一亲代植物相同的关于所述标志子集中的所述标志的基因型。
19.根据权利要求18所述的方法,其中将所述第一杂交或所述回交程序中的任何后续回交的子代和第三亲代植物杂交,所述第三亲代植物包含与所述第一亲代植物或第二亲代植物均不同的基因型。
20.根据权利要求18所述的方法,其中对每一个杂交和回交步骤中获得的子代个体进行关于所述标志集合中的所述标志的基因分型。
21.根据权利要求18所述的方法,其中所述标志包括SNP标志。
22.根据权利要求18所述的方法,其中所述植物选自下组:玉米、大豆、烟草、胡萝卜、芸苔、油菜、棉花、棕榈、花生、稻属、拟南芥属、蓖麻属和甘蔗。
CN201380043360.3A 2012-06-15 2013-06-13 用于选择基因渗入标志组的方法 Expired - Fee Related CN104838263B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261660055P 2012-06-15 2012-06-15
US61/660,055 2012-06-15
PCT/US2013/045538 WO2013188606A2 (en) 2012-06-15 2013-06-13 Methods for selection of introgression marker panels

Publications (2)

Publication Number Publication Date
CN104838263A true CN104838263A (zh) 2015-08-12
CN104838263B CN104838263B (zh) 2017-12-05

Family

ID=49757280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380043360.3A Expired - Fee Related CN104838263B (zh) 2012-06-15 2013-06-13 用于选择基因渗入标志组的方法

Country Status (10)

Country Link
US (1) US20130340110A1 (zh)
CN (1) CN104838263B (zh)
AR (1) AR091443A1 (zh)
AU (1) AU2013274214A1 (zh)
BR (1) BR112014031216A2 (zh)
CA (1) CA2875652A1 (zh)
IN (1) IN2014DN10614A (zh)
MX (1) MX2014015429A (zh)
PH (1) PH12014502791A1 (zh)
WO (1) WO2013188606A2 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103749286B (zh) * 2014-01-09 2016-04-13 福建省农业科学院水稻研究所 一种覆盖野生稻全基因组杂合片段导入系的构建方法
CN105205344A (zh) * 2015-05-18 2015-12-30 上海交通大学 基于多目标蚁群优化算法的基因位点挖掘方法
CA3026265A1 (en) 2016-06-08 2017-12-14 Monsanto Technology Llc Methods for identifying crosses for use in plant breeding
AU2018380430A1 (en) * 2017-12-10 2020-06-18 Monsanto Technology Llc Methods and systems for identifying hybrids for use in plant breeding
BR112020011321A2 (pt) 2017-12-10 2020-11-17 Monsanto Technology Llc métodos e sistemas para identificação de progênies para uso na criação de plantas
CN111123324B (zh) * 2019-12-31 2022-03-29 杭州电子科技大学 一种基于改进蚁群算法的dgps整周模糊度搜索方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110281765A1 (en) * 2000-03-29 2011-11-17 Bush David F Plant polymorphic markers and uses thereof
CN101437958B (zh) * 2003-08-01 2012-02-08 先锋高级育种国际公司 具有优越农业性能的大豆植物及其生产方法
US20100037342A1 (en) * 2008-08-01 2010-02-11 Monsanto Technology Llc Methods and compositions for breeding plants with enhanced yield
US8692064B2 (en) * 2009-10-02 2014-04-08 The Curators Of The University Of Missouri Quantitative trait loci associated with soybean cyst nematode resistance and methods of their use
US8921647B2 (en) * 2010-09-03 2014-12-30 Monsanto Technology Llc Molecular markers associated with yellow flash in glyphosate tolerant soybeans

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
FENG LI ET AL: "A Brassica rapa Linkage Map of EST-based SNP Markers for Identification of Candidate Genes Controlling Flowering Time and Leaf Morphological Traits", <DNA RESEARCH> *
HIROYOSHI IWATA: "AntMap: Constructin gGenetic Linkage Maps Using an Ant Colony Optimization Algorithm", <BREEDING SCIENCE> *
K. M. IFTEKHARUDDAULA ET AL: "Rapid and high-precision marker assisted backcrossing to introgress the SUB1 QTL into BR11,the rainfed lowland rice mega variety of Bangladesh", <EUPHYTICA> *
ROBBINS K ET AL: "THE USE OF THE ANT COLONY ALGORITHM FOR THE DETECTION OF MARKER ASSOCIATIONS IN THE PRESENCE OF GENE INTERACTIONS", <INTERNATIONAL JOURNAL OF BIOINFORMATICS RESEARCH> *
S. D. TANKSLEY ET AL: "Advanced backcross QTL analysis: a method for the simultaneous discovery and transfer of valuable QTLs from unadapted germplasm into elite beeding lines", <THEOR APPL GENET> *
S.D.TANKSLEY ET AL: "Rflp mapping in plant breeding:new tools for an old science", <BIO/TECHNOLOGY> *

Also Published As

Publication number Publication date
AU2013274214A1 (en) 2015-01-15
US20130340110A1 (en) 2013-12-19
WO2013188606A2 (en) 2013-12-19
BR112014031216A2 (pt) 2017-06-27
IN2014DN10614A (zh) 2015-09-11
CA2875652A1 (en) 2013-12-19
WO2013188606A3 (en) 2015-06-18
AR091443A1 (es) 2015-02-04
MX2014015429A (es) 2015-07-14
CN104838263B (zh) 2017-12-05
PH12014502791A1 (en) 2015-02-09

Similar Documents

Publication Publication Date Title
Pang et al. Identification and mapping of the clubroot resistance gene CRd in Chinese cabbage (Brassica rapa ssp. pekinensis)
Anderson et al. Ecological genetics and genomics of plant defences: evidence and approaches
Khan et al. Association mapping in forest trees and fruit crops
Yu et al. EST derived SSR markers for comparative mapping in wheat and rice
Prasanna et al. Molecular marker-assisted breeding options for maize improvement in Asia
Hufford et al. Teosinte as a model system for population and ecological genomics
Guimarães Marker-assisted selection: current status and future perspectives in crops, livestock, forestry and fish
Pourkheirandish et al. On the origin of the non-brittle rachis trait of domesticated einkorn wheat
Xiao et al. Genetic structure and linkage disequilibrium pattern of a rapeseed (Brassica napus L.) association mapping panel revealed by microsatellites
CN104838263A (zh) 用于选择基因渗入标志组的方法
Stewart Jr et al. Evolution of weediness and invasiveness: charting the course for weed genomics
Medina et al. Population genetic structure of a specialist leafhopper on Zea: likely anthropogenic and ecological determinants of gene flow
Fletcher et al. Development of a next-generation NIL library in Arabidopsis thaliana for dissecting complex traits
US20220025471A1 (en) Markers linked to reniform nematode resistance
CN109234431B (zh) 玉米抗茎腐病qtl的分子标记及其应用
Singh et al. QTL-seq for the identification of candidate genes for days to flowering and leaf shape in pigeonpea
RU2670517C2 (ru) Молекулярные маркеры низкого содержания пальмитиновой кислоты в подсолнечнике (helianthus annus) и способы их применения
US10561084B2 (en) Molecular markers for blackleg resistance gene rlm2 in brassica napus and methods of using the same
Singh et al. Exome sequencing and advances in crop improvement
Zhang et al. Fine mapping of a novel QTL DM9. 1 conferring downy mildew resistance in melon
CN105624154A (zh) 玉米抗大斑病qtl的分子标记及其应用
CN110468226B (zh) 杨树抗叶锈病的分子标记及其应用
CN105506147B (zh) 玉米发芽势基因ZmGLP的功能分子标记及其应用
Perera et al. Characterization of Genetic Diversity Using Molecular Markers
Rafalski Genomic tools for the analysis of genetic diversity

Legal Events

Date Code Title Description
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171205

Termination date: 20190613

CF01 Termination of patent right due to non-payment of annual fee