CN111489790B

CN111489790B - 一种快速、高通量定位和克隆植物QTL基因的RapMap方法

Info

Publication number: CN111489790B
Application number: CN202010256016.4A
Authority: CN
Inventors: 李一博; 张俊成; 张德建; 李翠翠; 许鹏坤; 樊亚伟; 李威; 苏小敏; 孙琪; 李星星; 宋盈盈
Original assignee: Huazhong Agricultural University
Current assignee: Huazhong Agricultural University
Priority date: 2020-04-02
Filing date: 2020-04-02
Publication date: 2023-03-17
Anticipated expiration: 2040-04-02
Also published as: CN111489790A; WO2021196255A1

Abstract

本发明公开了一种快速、高通量定位和克隆植物QTL基因的RapMap方法，从核心种质中选取性状差异较小的品系作为梯度亲本，构建尽可能多的F2梯度遗传群体，通过对每个群体分离的两个极端表型DNA池进行芯片检测或二代测序初步定位QTL，根据本发明提出的“共分离标准”在每个梯度群体的单株水平验证QTL，再用QTL杂合家系作为近等基因系进行精细定位来克隆目标基因。梯度遗传群体的概念和“共分离标准”的思想是本发明的核心。本发明应用该RapMap方法成功克隆六个水稻粒长和粒宽基因，表明RapMap是一个集QTL定位、验证及其近等基因系筛选“三位一体”的快速、高通量基因克隆RapMap方法。

Description

一种快速、高通量定位和克隆植物QTL基因的RapMap方法

技术领域

本发明属于植物功能基因组和基因工程领域，特别是涉及快速、高通量的QTL基因的定位、克隆及其应用领域。

背景技术

作物或家畜在自然和人类选择过程中产生的大量自然遗传变异是其驯化和改良的基础和驱动力，对其在环境适应性和保持遗传多样性、满足人类对能量和健康需求以及对其产量、品质、抗性和分子性状改良策略的制定等方面起到重要作用(Ellegren&Galtier,2016；Rheenen et al.,2019；Mitchell-Olds,2007)。多基因调控和环境影响造成多数生物学、生物医学和农业重要的经济性状都表现为连续变异的复杂数量性状(Mauricio,2001；Goddard&Hayes,2009；Bazakos et al.,2017)。全面理解数量变异需要鉴定全部调控基因及其功能性自然变异，然而从QTL定位到基因克隆再到弄清性状背后潜在调控机制的整体模式是一个漫长而艰难的过程(Glazier et al.,2002；Salvi&Tuberosa,2005；Lehner,2013；Boyle et al.,2017)。不仅如此，控制自然变异的功能基因经常以很微妙的方式对自然性状的遗传多样性起重要贡献，这种微妙的方式是无法通过敲除或插入突变体分析发现的，对这种微妙调控方式的揭示是生物学基础研究与应用研究如何协同发展的重要目标。基于这些原因，充分破译自然界中自然变异性状的分子基础是一项长期的挑战和生物学研究的主要目标之一(Mackay et al.,2009；Thorisson,2009；Costanzo etal.,2019)，也是理解多样性、进化和基因功能以及加速分子育种的必要条件(Goddard&Hayes,2009；Alonso-Blanco&Mendez-Vigo,2014；Wallace et al.,2018)。

过去20年，利用丰富的种质资源、遗传群体、参考基因组、连锁和关联分析、图位克隆RapMap方法和遗传转化技术，人们得以解析复杂性状到基因或核苷酸水平，在许多植物中分离和描述数量性状基因和核苷酸(QTGs和QTNs)的报道逐渐增加(Miura et al.,2011；Alonso-Blanco&Mendez-Vigo,2014；Huang&Han,2014；Salvi&Tuberosa,2015；Wallace etal.,2018；Torkamaneh et al.,2018)。图位克隆已经被证明是分离作物QTL基因的一种最成功、最可靠的策略(Jander et al.,2002；Peters et al.,2003；Miura et al.,2011)。但是，鉴定主效QTL需要构建高世代群体和开发大量DNA分子标记，将一个QTL分解成一个孟德尔遗传因子依赖多代回交、自交和构建近等基因系等，需要花费多年时间，对于完整地描述和系统地理解一个自然性状的大量自然变异的分子基础是非常具有挑战性的，QTL鉴定和近等基因系构建成为QTL基因克隆的两个决定性限速步骤(Jander et al.,2002；Benfey&Mitchell-Olds,2008；Bazakos et al.,2017)。此外，来自特定双亲的一个特定遗传群体只能克隆少数(通常一个)具有较大效应的、控制同一性状的QTL基因(Kover et al.,2009)；另外,目前报道的一个特定QTG只能解释有限双亲组合的表型变异，而非所有其他用微核心种质随机构建的双亲组合的表型变异，因此，使用特定的遗传连锁群体无法捕获自然界中复杂性状的全部遗传和分子基础，这样基于有限的遗传材料得出的结论较为局限或片面(Holland,2007；Benfey&Mitchell-Olds,2008；Rockman,2008；Kover et al.,2009；Yamamoto,2009)。

全基因组关联分析(GWAS)能充分利用自然发生的历史重组事件以相对较高的分辨率同时对多个性状进行基因鉴定，是对经典的双亲连锁作图的有益补充(Huang&Han,2014；Wallace et al.,2018)。但是GWAS研究有三个关键问题需要解决(Wallace et al.,2018；Huang&Han,2014；Kover et al.,2009)：一是由于较大群体结构的存在，需要研究者权衡取舍降低假阳性和提高假阴性的比例，二是在自然群体里检测稀有等位基因的功效较低，三是局部连锁不平衡衰减的缓慢造成一个GWAS位点有多个基因，需要进行额外的实验和大量后续分析来确定真正的目的基因。

为解决上述种种挑战，我们迫切需要一种快速、强大、全面的方法仅通过几个简单易行的步骤就能够同时发现和克隆控制自然界单一性状的足够多的QTL。

发明内容

本发明的目的是提出一种快速、高通量定位和克隆植物QTL基因的方法，命名为“RapMap”，它是由核心种质中性状相近亲本配制一系列梯度遗传群体来定位QTL、以“共分离标准”验证QTL及其近等基因系、精细定位并克隆基因组成的一个“三位一体”的基本框架，可以完全克服现有技术中克隆QTL的两个限速步骤。应用RapMap技术，我们在3年内成功地定位和克隆了6个控制水稻粒长和粒宽自然变异的基因。RapMap快速、大规模地对自然界中同一性状的多个基因进行系统鉴定的特点，可以加速人们对重要农艺和经济性状的分子基础的理解和作物育种进程。

本发明是这样实现的：

本发明的目的在于提供一种快速、高通量定位和克隆植物QTL基因的RapMap方法，所述RapMap方法包括：

步骤1、构建梯度遗传群体以快速初步定位QTL：

S1、把遗传多样性高的自然变异核心种质材料根据目标表型从小到大排序，找出表型差异较小的代表性纯系作为梯度亲本，将所述梯度亲本进行杂交，得到一系列梯度子代分离群体；针对所述梯度子代分离群体，挑选表型分布前后各15％内的个体经混合得到两个极端表型DNA池；

S2、对所述的两个极端表型DNA池进行SNP芯片或二代测序分析得到QTL座位信息；

步骤2、利用共分离标准验证QTL并筛选其近等基因系：

所述QTL座位信息为每个群体的一个或多个QTL区间，设计能覆盖所述QTL区间的分子标记并检测每个群体中每个个体在所述QTL区间的基因型，进行目标表型与基因型之间的共分离检测，按共分离标准得到验证的QTL基因型，所述验证的QTL基因型杂合的家系作为QTL基因型的近等基因系；所述共分离标准为：任意分离群体后代中目标QTL区间两种纯合基因型的个体能够明显区分目标表型；

步骤3、QTL精细定位和基因克隆：对所述QTL基因型的近等基因系进行目标区间重组单株的筛选及常规的精细定位和克隆，并结合候选基因法得到每个梯度群体QTL基因的克隆。

本发明有如下六个创新性优点：

(1)本发明集成了连锁分析的高可靠性和全基因组关联分析的高通量性两大优势，具有亲本和目标性状选择的灵活性和广泛性、遗传群体构建(F₂即可)的简单性和快速性等优点。本发明利用表型相近的亲本配制分离群体、以“共分离标准”验证真正的QTL并同时筛选相应的近等基因系是区分于传统遗传群体连锁分析的显著特征，RapMap方法的优点在于：传统遗传群体都是利用目标性状差异很大的双亲构建的，导致控制目标性状位点的复杂性、遗传分析的困难性和遗传群体构建的复杂性和长期性，而本发明利用的是表型差异较小的双亲构建的F₂梯度遗传群体，使得绝大多数梯度遗传群体中控制目标性状分离的位点为一个位点，同时更加直接容易获得可靠的单个位点的近等基因系，解决了传统连锁分析中的复杂性、长期性、困难性等难题，加上图位克隆本身的可靠性就可加快基因克隆的速度；由于本发明是同时构建很多个控制同一性状的梯度遗传群体，进而实现了多个遗传群体多个基因的同时克隆，具有GWAS分析的高通量性，又克服了相关分析的缺点和局限；本发明具有亲本选择的灵活性和广泛性、目标性状选择的灵活性和广泛性、群体构建(F₂即可)的简单性和快速性等优点，克服了NAM、MAGIC等多亲本群体在这些方面上的很多缺点和局限。

(2)本发明提出了“任意分离群体后代中目标QTL区间两种纯合基因型的个体能够明显区分出两种目标表型”的“共分离标准”，把它作为八个单位点遗传模式的共同原则和充要条件，是同时验证任意一个真实QTL及其近等基因系的黄金标准；该“共分离标准”的思想与概念是本发明的核心和灵魂，对于大幅度简化QTL克隆过程和理解QTL基因的本质具有重要意义；该“共分离标准”是单位点遗传的充要条件，对遗传学中单位点遗传分离的传统判断标准(如双峰分布、3：1或1：3的分离比等)起更正和澄清的作用，这一思想和概念对普通遗传学和数量遗传学的发展做出了重要贡献。

(3)本发明的RapMap是一个QTL定位、QTL效应验证和QTL近等基因系筛选“三位一体”的快速、高通量基因定位和克隆RapMap方法，该“三位一体”攻克了传统基因克隆中的两个关键步骤的限速难题，共同构成了本RapMap方法的基本框架，该“三位一体”的基本框架和原理是由上述的“共分离标准”来整合和确保无误的，该“三位一体”和“共分离标准”也保证了RapMap定位和克隆基因的快速性、准确性和高通量性。

(4)本发明具有快速、高通量同时定位和克隆控制目标性状的多个QTL基因及获得其近等基因系的优势。同时利用一系列从核心种质中选择性状相邻亲本构建的梯度遗传群体定位QTL、验证其效应及筛选其近等基因系，克服了其他RapMap方法中通常遇到的克隆QTL所面临的两个限速步骤难题。配制的尽可能多的一系列梯度遗传群体和“共分离标准”保证了其RapMap的快速性和全面性，为更全面了解某一性状自然变异的分子基础和精确的分子设计改良提供了快速和高通量的研究RapMap方法和原理。

(5)实践证明本发明在快速大规模鉴定作物QTL基因方面具有可靠性和强大的能力。本发明已经成功地应用于8个水稻粒长和7个水稻粒宽梯度群体QTL基因的系统鉴定，结果表明6个已知基因GS3、GL7、GS2、GW5、GW8和GW7在3年内被同时克隆，而用传统RapMap方法需要6-10年。这6个已知基因对水稻核心种质中的粒长、粒宽、粒形、千粒重具有较大遗传贡献。

(6)根据配制一系列梯度遗传分离群体的具体原理和“共分离标准”，RapMap方法不仅适合水稻粒形性状的快速、高通量基因定位和克隆，也适合于其他任何易于杂交和繁衍更多杂交后代的植物和动物的任意性状基因的快速、高通量定位和克隆。本发明作为一种高通量定位基因的RapMap方法，对全面了解作物甚至动物的重要农艺和经济性状的遗传和分子基础有着巨大的应用前景，可加深我们对性状遗传多样性的全面认识。

附图说明

图1为本发明的RapMap方法和原理示意图。图1a：梯度亲本的选择和梯度遗传群体的构建；图1b：QTL定位；图1c：“共分离标准”是八种单基因遗传模型的共同原则和同时验证QTL及其近等基因系的黄金标准；图1d：利用杂合后代发展的重组单株进行QTL精细定位和图位克隆；图1e：不符合“共分离标准”的群体可用当前群体目标性状分离良好的F₃或F₄家系替代对应的梯度群体并重复上述步骤。

图2为本发明在克隆水稻粒长基因中的应用。图2a：水稻粒长梯度亲本的表型及其梯度遗传群体的构建方式；图2b：各梯度遗传群体F₂代的粒长表型分布；图2c：粒长QTL定位结果(Cross1-3、5、7、8为使用芯片定位结果，Cross4为使用二代测序技术定位结果)；图2d：利用“共分离标准”验证真正的QTL；图2e：粒长QTL的精细定位和克隆；图2f：粒长基因两近等基因系粒长的表型比较。

图3为本发明在克隆水稻粒宽基因中的应用。图3a：水稻粒宽梯度亲本的表型及其梯度遗传群体的构建方式；图3b：各梯度遗传群体F₂代的粒宽表型分布；图3c：粒宽QTL定位结果(Cross1、2、3、4、6为使用芯片定位结果，Cross7位使用二代测序技术定位结果)；图3d：利用“共分离标准”验证真正的QTL；图3e：粒宽QTL的精细定位和克隆；图3f：粒宽基因两近等基因系的粒宽表型比较。

图4为本发明克隆的六个基因对水稻世界微核心种质中籽粒大小和粒形的遗传贡献。(图4a,4c,4e,g,i,k)：本发明克隆的粒长和粒宽基因在粒长、粒宽、长宽比、千粒重、粒数和单株产量6个性状中贡献的大小；(图4b,4d,4f,4h,4j,4l)：预测模型预测粒长、粒宽、长宽比、千粒重、粒数和单株产量6个性状的能力。

具体实施方式

以水稻为例阐述本发明的原理和应用，三个实施例用于说明本发明的具体应用效果，但不用来限制本发明的使用范围。

本发明的基本原理和步骤：

步骤S1：构建一系列梯度遗传群体来快速定位QTL。首先收集来自世界各地由541个品种组成的具有较大遗传多样性的世界微核心种质，根据表型将其从小到大排序，分成表型类似的几个群，每个群挑选出一个有代表性表型的品系作为随后构建梯度遗传群体的梯度亲本(P₁到Pn，图1a左)。任意两个具有较小表型差异的相邻亲本杂交(如P₁与P₂、P₂与P₃、P₃与P₄等)，每个杂交后代的F₁自交产生的F₂代但不限于F₂代(约200个个体)分单株种在田间，以评估其目标表型(图1a右)。由于这些F₂后代是由相邻性状双亲间的杂交而来，在大多数情况下，使得控制每个群体表型变异的QTL数量是最少的(一般是一个)，即使亲本间的表型差异范围较小，也可以明确观察到表型分离。本发明的目的是定位任意梯度亲本间导致目标性状变异的每个主效QTL，因此F₂群体是最简单和最好的选择。这样我们就能构建一系列的梯度遗传群体来系统地揭示目标性状的分子基础，其中多数群体很可能具有单位点分离特征。

针对每个梯度群体，根据表型分布特征选取最前和最后15％的极端表型个体配制混合池(一般多于25个个体)，并将混合池的种子进行集体萌发并抽提出高质量基因组DNA备用。在这两个DNA池中，所有染色体上的大多数SNP或InDel的两种基因型将以1：1的比例随机分离，并且是杂合的。然而，导致目标表型自然变异的SNP或InDel基因在至少一个极端群体中是纯合的(图1b右)。通过对每个群体的两个DNA池进行基于SNP芯片(如RICE6K)或二代测序分析(>6.0×测序深度)的BSA分析，得到每条染色体上QTL可能存在的位置，即QTL初步定位结果(图1b)。

步骤S2：利用“共分离标准”同时验证QTL并筛选其近等基因系。对于步骤S1中的QTL定位结果，需要验证哪个QTL是真正的主效QTL，在进行图位克隆或遗传改良前将其分解为单个孟德尔因子。本发明提出了八种单位点遗传模型(图1c)：一个等位基因可以是一个低值或高值的完全显性基因，在表型分布上具有离散(无环境影响)或部分重叠(受环境或其它因素影响)的边界，且表型比率为3：1或1：3(图1c上)；一个等位基因也可以是一个加性基因，在表型分布上具有两个离散(无环境影响)或部分重叠(受环境或其它因素影响)的边界，且表型比为1：2：1(图1c下)。从图1c中可看出，八个单位点遗传模式的共同原则和充要条件是“共分离标准”：即两个纯合基因型(AA和aa)可区分出两种表型(图1c)，而不考虑杂合子基因型、也与表型的双峰还是正态分布无关。“共分离标准”是验证一个真正的QTL及其近等基因系(NIL)的黄金标准：任何随机分离群体的后代中一个QTL的两种纯合基因型可以明显地区分两种表型，则该性状的QTL效应就得以证实，并且该QTL基因型杂合的家系即可作为相应QTL的NILs(图1c)，可立即用于筛选重组单株，以便进一步进行精确定位和典型的QTL克隆程序(图1d)。因此为了确定一个QTL区间、验证QTL效应、选择适合于图位克隆的NILs，我们首先在上述鉴定的一个大约2Mb的区域中设计2-4个InDel标记，覆盖上述识别的SNPs或InDels(图1b)，然后对用于连锁分析的同一群体中的约200个个体进行基因型鉴定，对每个梯度群体检查上述共分离标准(图1c)，并根据梯度群体中的重组单株确定QTL的左右边界。如果检测区域非常大，则需要更多的标记并利用重组单株进一步缩小区间。不符合单位点遗传模式标准的群体，可以用相似梯度水平的双亲构建新的梯度群体，或者用当前群体目标性状分离良好的F₃或F₄家系替代对应的梯度群体并重复上述步骤，这些F₃或F₄家系可从随机选择的低、中、高值性状的F₂或F₃单个家系衍生出来(图1e)，通过自交纯化和基于表型分离的后代选择，分别最大可能的使小效应位点纯合和一个大效应位点杂合。任意分离群体只要最终符合QTL定位、验证和近等基因系筛选的上述“共分离标准”均适用于本发明。因此，RapMap是一个QTL定位、QTL效应验证和QTL近等基因系筛选“三位一体”的快速、高通量基因定位和克隆RapMap方法，该“三位一体”攻克了传统基因克隆中的该两个关键步骤的限速难题，共同构成了本RapMap方法的基本框架，该“三位一体”的基本框架和原理是由上述的“共分离标准”来整合和确保无误的，该“三位一体”特征和“共分离标准”也保证了RapMap定位和克隆基因的快速性、准确性和高通量性。

步骤S3：QTL精细定位和基因克隆。对于每一个验证好QTL的梯度遗传群体，将杂合个体4000至10000左右种子萌发并分单株提取DNA，用QTL两侧分子标记和KASP技术筛选两端基因型不同的足够多的重组单株，并根据后代测验的分离情况确定基因的基因型，根据QTL区间内新设计的分子标记基因型和重组单株后代测验推断的目的基因基因型进行精细定位，结合各种候选基因法确定最终可靠的基因(图1d)。一旦控制某一性状的尽可能多的梯度遗传群体被构建且其每一个QTL基因被RapMap定位和克隆，就会丰富人们对自然界该性状分子基础的全面认识和可能的定量遗传改良。

实施例一：本发明应用于水稻粒长自然变异QTL基因的克隆。

我们在上述541个水稻品种组成的种质资源(粒长变异范围为5.58mm到13.76mm)中选取12个粒长表型有代表性的亲本材料(图2a)，2016年在海南我们用粒长相近的亲本配制了8个杂交组合，每个组合的F₁种子于2016年在武汉进行繁殖，2017年在海南每个梯度群体获得约200个后代及其基因组DNA。收获F₂种子后，2017年武汉进行粒长表型的考种，并构建了高值(后15％)和低值(前15％)的混合池(图2b)。6个梯度群体(群体1、2、3、5、7、8)的混合池使用RICE6K商业芯片(中国种子集团公司)进行基因分型和QTL定位，该芯片是根据上述微核心种质设计的，包含了四百万个SNP位点(Yu et al.,2014)，芯片检测到的SNP很有可能就是紧密连锁粒长性状的QTL基因(Zou et al.,2016；Yu et al.,2014)(图2c)；我们利用QTL-seq的估计SNP指数的RapMap方法(Takagi et al.,2013)分析了杂交组合4，发现在第三染色体的一个SNP簇的SNP指数接近1而其他位置接近0.5(图2c)，SNP指数的峰最可能位于QTL基因附近。为了验证真正的QTL并选择其对应的近等基因系用于图位克隆，我们首先在覆盖上述SNP簇的2-4Mb范围内设计2-4个InDel分子标记(表1)，设计分子标记使用RiceVarMap(Zhao et al.,2015)。使用该标记对每个群体200个个体进行基因型鉴定和连锁分析，最终于2017年武汉进行“共分离标准”验证，如果每个验证的QTL两侧的分子标记两种纯合基因型能将个体的粒长表型明显区分开，该QTL即被验证为真正的粒长QTL(图2d)，共分离标准不考虑QTL杂合基因型的个体，但杂合个体作为真正QTL相应的NILs用以筛选重组单株。若检测的区间较大，应当均匀设计更多的分子标记，利用随机群体的重组事件可以将QTL区间缩小至2Mb以内并确定左右两端可靠的分子标记边界。最终，我们验证了每个组合/群体的每个QTL，明确了7个组合各自决定粒长性状自然变异的主效QTL在染色体3、3、3、3、7、7、2的较小区间。

为了对这些QTL进行精细定位，2017年我们用较小区间两侧的分子标记和KASP高通量基因分型技术(Semagn et al.,2014)对杂合的NILs进行扫描以筛选到足够多的重组单株。重组单株的粒长基因型主要由两个方面决定：一是2017年10月武汉收获的种子的当代表型；二是2018年4月海南收获的后代测验的表型，后代测验是当代测验表型不明确的材料再种一代的表型。2017年11月至2018年5月间，根据重组单株后代测验推断的基因型和表型信息，我们将组合1、2、3、4、5、7、8的粒长QTL区间各自缩小至20kb、18kb、14kb、54kb、24kb、56kb和3.7kb区间，每个区间只有很少几个开放阅读框(ORFs；图2e)。由于已知粒长基因GS3、GL7、GS2分别位于检测到的QTL区间，为了验证是否上述已知基因造成粒长变异，通过双亲的比较测序发现了已知基因的功能性变异，并且功能性分子标记与表型共分离(图2f)，进一步证明了梯度群体发现的控制粒长的目的基因就是QTL区间的已知基因。这个结果足以证明本实验克隆到的水稻粒长基因就是上述已知基因，因此没有必要再进行遗传转化实验。

实施例二：本发明应用于水稻粒宽自然变异QTL基因的克隆。

克隆粒长基因的同时，我们从上述水稻微核心种质(粒宽变异范围1.99mm-3.43mm)选择了10个粒宽表型有代表性的亲本材料(图3a)，于2016年3月份在海南用粒宽相近的亲本做了7个杂交组合。此处需要注意，只要配制杂交组合的两亲本粒宽差异不是太大，都是适用于RapMap的，即可以最大可能获得单一位点控制的分离群体和筛选到合适的近等基因系。F₁种子于2016年武汉繁殖并于2017年在海南加代种植，每个群体收获200个F₂单株的种子，于2017武汉进行粒宽表型的考种，选取极端表型单株种子构建了高值(后15％)和低值(前15％)的混合池(图3b)。利用水稻SNP芯片RICE6K(组合1、2、3、4、6)和QTL-seq的估计SNP指数(组合7)的RapMap方法对混合池进行BSA分析，将QTL进行了相应的染色体定位(图3c)。为了验证真正的QTL，我们2017年在武汉设计了覆盖QTL的InDel分子标记对每个群体约200个个体进行基因型鉴定(分子标记见表1)和进行“共分离标准”验证，即验证两个纯合基因型(AA和aa)能否明确区分宽粒和窄粒，最终，我们验证出了每个组合/群体的一个真实QTL(图3d)，明确了6个组合(组合1、2、3、4、6、7)各自控制粒长性状自然变异的QTL于染色体8、8、8、7、5、5的最小区间。

2017年6月份我们将随机群体中杂合个体的种子种植于培养间，种子萌发10天后抽提DNA并用KASP高通量基因分型技术将QTL两端基因型不同的个体筛选出来即为重组单株，重组单株幼苗种植于武汉大田，2017年10月武汉收获种子后考察当代表型，最终根据重组单株后代测验表型信息推断的目标基因的基因型，我们将组合1、2、3、4、6、7的QTL区间各自缩小至168kb、36kb，168kb，24kb,18kb和18kb，各区间只有很少几个ORFs(图3e)。由于已知粒宽基因GW5、GW7、GW8分别位于检测到的QTL区间，为了验证粒宽变异是否由上述已知基因造成，通过双亲的比较测序发现了该已知基因的功能性变异，并且功能性分子标记与表型共分离(图3f)，进一步证明了梯度群体发现的粒宽目的基因就是该三个已知基因，没有必要再进行遗传转化实验去验证。

表1-RapMap克隆粒长和粒宽基因使用的引物

实施例三

本发明克隆的六个基因对水稻世界微核心种质中粒长和粒形的遗传贡献很大。

利用实施例一、实施例二克隆的6个控制粒长和粒宽基因的功能变异在微核心种质的基因型和微核心种质的粒长、粒宽、长宽比、千粒重、粒数和单株产量6个性状的表型进行多元线性回归分析，以评价这些基因对6个性状的遗传贡献，发现三个粒长基因可以解释49％的粒长变异(图4a)，三个粒宽基因可以解释53％的粒宽变异(图4c)，6个基因可以分别解释长宽比、千粒重、粒数和单株产量64％、17％、15％、13％的表型变异(图4e,4g,4i,4k)；模型对粒长、粒宽和长宽比具有较高的预测能力(图4b,4d,4f)，对产量相关性状的直接预测能力不如前者，但仍具有比较高的预测效果(图4h,4j,4l)。

总之，仅经过一轮RapMap程序(本发明配制15个杂交组合)即可发现直接影响目标表型(粒长、粒宽、长宽比)至少一半表型变异，剩余表型变异包含部分遗传变异、遗传互作和环境因子影响等，可能需要新一轮的程序方能解决，该结果表明本发明在快速、高通量发现影响目标表型的变异基础上可以达到全面解析目标表型遗传基础的效果。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

序列表

<110> 华中农业大学

<120> 一种快速、高通量定位和克隆植物QTL基因的RapMap方法

<160> 132

<170> SIPOSequenceListing 1.0

<210> 1

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

gcatatggat cggatatgga c 21

<210> 2

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

cgtttccaca ggctttctag a 21

<210> 3

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gcatatggat cggatatgga c 21

<210> 4

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

cgtttccaca ggctttctct t 21

<210> 5

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

agctcggcct cttgaggttg aag 23

<210> 6

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

agctacctct cctggatctg ctg 23

<210> 7

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

tccctcagac atcacctgaa 20

<210> 8

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

aggacatgca tgcattgaaa 20

<210> 9

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

tctacagctt tcccatatgt atc 23

<210> 10

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ttggcttcca gagacctact cg 22

<210> 11

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

gctctctttc ctcagacatg g 21

<210> 12

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

cctacgacgt agccagatat g 21

<210> 13

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

gatcgaagaa aagtacagac 20

<210> 14

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

tccctccatt tctgagtatt c 21

<210> 15

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

atacacgcac caaatgaggc 20

<210> 16

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

ggtggacagg acgaaggaat 20

<210> 17

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

gacagcaaag ggagatgtgg 20

<210> 18

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

gcagacattc acggaccttc 20

<210> 19

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

tctctccgag aaactagcct 20

<210> 20

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

agcgatggca ctgtttcaaa 20

<210> 21

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

actgatgtga ggcccttctt 20

<210> 22

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

gctagctggc taggtttaaa ca 22

<210> 23

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

ggggatgcag ttttggttca 20

<210> 24

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

ggagagaaaa aagacagaca gga 23

<210> 25

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

attacctctc cccgaccatc 20

<210> 26

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

tagtggcgtc aaggggttag 20

<210> 27

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

gcatgctgat cacttcttct gt 22

<210> 28

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

tgcgtacgtg ttagatgcat c 21

<210> 29

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

tgaccacgtc gatcatcaag 20

<210> 30

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

ccacctgcag atttcttcca 20

<210> 31

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

tgagttttga gctttccgag a 21

<210> 32

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

ctagctagtg ccacgacagt 20

<210> 33

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

agaggagcag tttttgggga 20

<210> 34

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

cccagcttaa aaccactcct 20

<210> 35

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

tagagatgcg cgtagtcgtt 20

<210> 36

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

tgccttgata ggttgtgcat g 21

<210> 37

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

ccaacgacga ggagagatga 20

<210> 38

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

ctcgcttccc ccacatgtat 20

<210> 39

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

atgtgccact gtcagtctga 20

<210> 40

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

ctccatttct tgcaacagca 20

<210> 41

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

tcgcgggaat ggagagatc 19

<210> 42

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

aacgaagccc agcgtaattg 20

<210> 43

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

catttggtcc tatgtgtcac 20

<210> 44

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

ttcaagtgga aatggaggcg 20

<210> 45

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

tctacgctgg atcatggcaa 20

<210> 46

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

acgtgctcgt tgaccaggta 20

<210> 47

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

gcgagaggct attctccctt 20

<210> 48

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

gcagcagttt ggagaggttt 20

<210> 49

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

agtctcggct gctataacca 20

<210> 50

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

tgcgagtagg gcattctcat 20

<210> 51

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

acgtcaccga tgtcaacgc 19

<210> 52

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

aaggcaccgc tgccacttg 19

<210> 53

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

gctagagctt cccctatgga 20

<210> 54

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

ccctcaaaga tctaagagcc g 21

<210> 55

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

gcaaggccag atgagagttg 20

<210> 56

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

ggtggtgcac ttgcttcaaa 20

<210> 57

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

cgggcaacgt cagattcata 20

<210> 58

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

ttccgtccca tttccgatga 20

<210> 59

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

cggcaaacca atagcgattg 20

<210> 60

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

atgccttggt tgtgagagga 20

<210> 61

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

gatctaccct gagtgcacgt 20

<210> 62

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

gatagcctcc ctcctagctg 20

<210> 63

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

gctcacgagg gaagaatggt 20

<210> 64

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

accatagcta ttgcacccga 20

<210> 65

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

gttgtcctag gagggatcac 20

<210> 66

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 66

ccacccacta acctgctaca 20

<210> 67

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 67

ttctctcgcc gtcgttacaa 20

<210> 68

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 68

gagccaagtt ggttcttcgg 20

<210> 69

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 69

cgcacgtaaa tcttatgggc t 21

<210> 70

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 70

gctgcagagc aaaggaataa c 21

<210> 71

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 71

actactgcta cagtacagct 20

<210> 72

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 72

tcgatctagc tagctagcca 20

<210> 73

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 73

gtcgcattct ctcatctcag 20

<210> 74

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 74

ttctgacatg aacagttgaa 20

<210> 75

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 75

gataaccatc ggtaattgct 20

<210> 76

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 76

acgtacgaac gtattctgtg 20

<210> 77

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 77

gataaccatc ggtaattgct 20

<210> 78

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 78

tagcaccacg tctactccta g 21

<210> 79

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 79

tgttggagtt ggatggttcg 20

<210> 80

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 80

tgatgatgat aggtggtact 20

<210> 81

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 81

ggcagctaac ttctgttcac c 21

<210> 82

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 82

tggcctgatt aacgggttct 20

<210> 83

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 83

aagagcttct tgacgaggta ggc 23

<210> 84

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 84

ggaatggatg gatatgaaca gtgc 24

<210> 85

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 85

cagctatgtg tagcttcg 18

<210> 86

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 86

ctgctcattg ggcggttt 18

<210> 87

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 87

caccctcacc tttcttcgta 20

<210> 88

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 88

ggtgtaatca agaaggactt ttga 24

<210> 89

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 89

ccgtccattc tcatgcccta 20

<210> 90

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 90

ccaaatggca actattgagt g 21

<210> 91

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 91

ccaaattgct tcctcggata tagg 24

<210> 92

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 92

cggatttagg gagttcgtgt tcg 23

<210> 93

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 93

acagtatcca aggccctgg 19

<210> 94

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 94

cacgtgagac aaagacggag 20

<210> 95

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 95

ctatccgcta gcacccgatc 20

<210> 96

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 96

agcacgacgt ctggaagtaa 20

<210> 97

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 97

tgccaagtca aaggttagag g 21

<210> 98

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 98

ttgcattgct gatccatgca 20

<210> 99

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 99

gctgtgatca ctgtgctagc 20

<210> 100

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 100

cgctgtcgta gtagccga 18

<210> 101

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 101

acactggtgc taagctctgg 20

<210> 102

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 102

gcgcctaaga atctttatgt gc 22

<210> 103

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 103

tgacacgcca cagtccaaga cgagcagt 28

<210> 104

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 104

aagggagttg agagtagaaa aaa 23

<210> 105

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 105

atggcattcg cacgccattg 20

<210> 106

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 106

gaaagccaag gagcaagcag 20

<210> 107

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 107

gacatgatct tgggtgtgtg 20

<210> 108

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 108

gaggaaccta atcgaaacca 20

<210> 109

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 109

aggacttgac tgaattggca 20

<210> 110

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 110

caacgttacg tactgcactg 20

<210> 111

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 111

tctgacattg cactacagct t 21

<210> 112

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 112

gggctctctc caggatttca 20

<210> 113

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 113

ggcaagtctg ggcacaaca 19

<210> 114

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 114

caccattccc ccaacgaga 19

<210> 115

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 115

cagataccat gcacaactgc 20

<210> 116

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 116

ggaaaacaga tttcttagga c 21

<210> 117

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 117

ggcctttgtg gactactagt 20

<210> 118

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 118

gatgaagtag atttcgtcgt g 21

<210> 119

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 119

gggggaacgt gtgtcactga 20

<210> 120

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 120

ccagaagctg gaatggatgg 20

<210> 121

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 121

agcgccaaat ttttcacgaa 20

<210> 122

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 122

gatccatagc actatcatct 20

<210> 123

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 123

taagagcggc tactatgtgc 20

<210> 124

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 124

cagtcactga catgtcactg 20

<210> 125

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 125

gcaaaacagc aaaagtacat tg 22

<210> 126

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 126

tgaatattga tacccttaag tca 23

<210> 127

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 127

tagcttgttg attgagctgc 20

<210> 128

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 128

ttaagtccaa gcgagacagc 20

<210> 129

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 129

tgttctccga tggtgggttg 20

<210> 130

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 130

tcgatggccg tggagttcg 19

<210> 131

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 131

aagcgacacc agtgtgtg 18

<210> 132

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 132

tctccagctc gtcggcta 18

Claims

1.一种快速、高通量定位和克隆植物QTL基因的RapMap方法，其特征在于，所述RapMap方法包括：

步骤1、构建梯度遗传群体以快速初步定位QTL：

步骤2、利用共分离标准验证QTL并筛选其近等基因系：

2.如权利要求1所述的RapMap方法，其特征在于，所述步骤1中配制的梯度遗传群体，每个遗传群体的梯度双亲为在该物种核心种质中目标表型相近的代表性品系。

3.如权利要求1所述的RapMap方法，其特征在于，所述步骤1利用表型相近的亲本产生的分离群体包含简单的F2遗传群体但不限于F2群体，根据RapMap的原理，任意分离群体只要最终符合步骤S2所述的“共分离标准”都适用于本RapMap方法。

4.如权利要求1所述的RapMap方法，其特征在于，所述步骤2中“共分离标准”为验证QTL及其真正近等基因系的标准。

5.如权利要求1所述的RapMap方法，其特征在于，所述步骤2中不符合所述“共分离标准”的群体，用表型水平相似的双亲构建新的梯度群体，或者用当前群体目标性状分离良好的F3或F4家系替代对应的梯度群体并重复上述步骤2，这些F3或F4家系分别从随机选择的低、中、高值性状的F2或F3单个家系衍生出来。

6.如权利要求1所述的RapMap方法，其特征在于，所述RapMap方法是一个QTL定位、效应验证和近等基因系筛选“三位一体”的快速、高通量基因定位和克隆的方法。

7.如权利要求1-6任一项所述的RapMap方法，其特征在于，所述植物QTL基因包括：水稻粒长的3个QTL基因GS3、GL7、GS2；以及水稻粒宽的3个QTL基因GW5、GW7、GW8。