CN110993027B

CN110993027B - 一种高效克隆植物性状相关突变基因的方法

Info

Publication number: CN110993027B
Application number: CN201911311922.3A
Authority: CN
Inventors: 赵洁; 余礼; 聂延伸; 焦进霞
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2019-12-18
Filing date: 2019-12-18
Publication date: 2022-10-11
Anticipated expiration: 2039-12-18
Also published as: CN110993027A

Abstract

本发明属于植物基因克隆技术领域，具体涉及一种高效克隆植物性状相关突变基因的方法。本发明充分结合了图位克隆技术与基因组重测序技术的优点开发了一种新的策略，可以更好更快的克隆突变位点；本发明通过图位克隆技术可以将突变位点定位到一条染色体的一个较大的区域内，再通过重测序结果分析SNP或者In‑Del标记在这个大区域内的频率分布，并通过标记的连锁分析，便可以将突变位点定位到更小的区域，如果突变类型为碱基替换、插入或者缺失，那么可以直接找到突变位点，对其进行功能验证，如果是表观修饰引起的，需要对区间内基因的表达进行验证，并对表达发生改变的基因进行功能验证。

Description

一种高效克隆植物性状相关突变基因的方法

技术领域

本发明属于植物基因克隆技术领域，具体涉及一种高效克隆植物性状相关突变基因的方法。

背景技术

在研究植物基因功能过程中，突变体是一个非常重要而有效的工具，因为突变体是基因功能缺失的直接体现，是基因功能研究最有说服力的证据。自然界中存在大量的自然突变，产生了多种表型，形成了多个亚种或品种，但是需要花大量的时间去寻找。除此之外，研究人员经常人为的突变基因，构建突变库来研究基因的功能。构建突变体库的方法很多，分为三大类：生物方法、物理方法和化学方法。

生物方法主要包括T-DNA插入、转座子插入和基因编辑。物理方法主要包括激光、离子注射和辐射突变，常用的是辐射突变。这些方法会导致基因组出现修饰、缺失、碱基替换或小段重排的现象，从而对基因的转录或编码产生影响。由于大部分突变是一个或数个碱基的替换或缺失，因此对基因的表达与结构的影响较小，经常会产生一些弱突变的表型，这对研究一些管家基因或者发育过程中的重要基因具有重要意义。但是由于序列改变较小，且无已知的序列信息，对突变位点的克隆比较困难，常用的方法有Tilling（Targetinginduced local lesions in genome）技术和图位克隆技术，最近随着测序技术的发展，基因组重测序技术逐渐成为人们的新宠。化学方法主要是采用各种化学试剂的处理，包括烷化剂、平阳霉素、秋水仙素、5-溴尿嘧啶和2-氨基嘌呤等，最常用的是烷化剂甲基磺酸乙酯（EMS）。EMS诱变后常常会导致胞嘧啶（C）替换为胸腺嘧啶（T），因此，经常会产生较弱表型的突变体，这与物理方法诱变的结果类似。其突变位点的鉴定方法也是Tilling（Targetinginduced local lesions in genome）技术、图位克隆技术和基因组重测序技术。

在这三种突变位点鉴定方法中，Tilling技术的原理是利用核酸内切酶CELI酶剪切未配对上的异源DNA链，从而确定点突变位点，因此该技术非常适合鉴定EMS诱变产生的突变位点。

图位克隆技术是由Coulson等人在1986年建立的，其原理是根据连锁与交换定律，通过对多个标记的连锁分析，确定突变基因。在图位克隆中，构建群体所用品种的基因组信息越详细越好，亲缘关系越远越利于定位基因，这样可以获得更多的标记，但是又由于亲缘关系越远越容易出现F₁代种子不育，难以获得足够大的作图群体，从而无法确定突变位点。特别是水稻雌配子体败育突变体，这些突变体的败育率一般为50%左右，而水稻许多品种间的杂交F₁代会产生很高的败育率，从而干扰杂交F₂代中雌配子体败育突变体与野生型的分离。因此，这些雌配子体败育突变体只能与亲缘关系很近的品种进行杂交，但在这种方法构建的群体中，很难筛选到足够数量的分子标记，从而难以克隆目的基因。另外，由于许多实验室缺乏足够的种植空间，因此构建的杂交群体较小，或者需要通过更多的时间来收集足量的材料，这极大的限制了基因的功能研究。

最近几年，随着高通量测序技术的出现，其低成本、易操作和高效率的优点使人们可以轻松获得杂交亲本的基因组信息。运用该技术，人们开发了利用基因组重测序技术直接寻找突变位点的方法，如MutMap和ShoreMap，该类技术可以对自交后代或者近亲本杂交后代进行分析，但是由于突变体中存在太多的点突变，这极大的干扰了后续的数据分析，因此，实际效果并不理想，假阳性结果太多，难以确定突变位点。

发明内容

本发明针对现有技术的不足，目的在于提供一种高效克隆植物性状相关突变基因的方法。

为实现上述发明目的，本发明所采用的技术方案为：

一种高效克隆植物性状相关突变基因的方法，其特征在于，包括如下步骤：

（1）近亲杂交父母本的选择及作图群体的构建；

（2）对作图群体进行表型遗传分析并统计遗传分离比，确定性状由单基因遗传控制；

（3）构建父本DNA Pool、母本DNA Pool和作图群体DNA Pool，根据已有的分子标记信息，以父本DNA Pool、母本DNA Pool、作图群体DNA Pool为对象，分析分子标记的有效性与分离情况；计算作图群体中分子标记的配子频率，分析分子标记与突变基因的连锁情况，确定突变基因在染色体上存在的位置，进一步对该位置附近的其他分子标记进行PCR扩增和分析，确定突变位点的大致区域；

（4）选取父本DNA Pool、母本DNA Pool和作图群体DNA Pools中的三个或两个DNAPools进行重测序，分析不同DNA Pool之间的SNP和In-Del标记，检测同一个标记在不同DNAPool之间的频率差值和分布，结合步骤（3）所得突变位点的大致区域结果以及SNP和In-Del标记在该区域的频率差值分布和连锁情况，进一步缩小突变位点所在区间；所述选取两个DNA Pools重测序时，其中一个DNA Pools为作图群体DNA Pools，另一个DNA Pool为父本DNA Pool或母本DNA Pool；

（5）根据重测序结果对区间内的SNP和In-Del标记进行PCR验证，利用位点特异性PCR、酶切多态性PCR和测序技术确定这些位点在群体中的连锁情况，确定最终在突变位点两端的标记，分析这两个标记中间的序列，定位突变位点并克隆。

上述方案中，步骤（1）中所述近亲杂交为亚种内杂交。

上述方案中，步骤（1）中所述作图群体选用F2群体、近等基因系群体、或重组自交系群体。

上述方案中，步骤（2）中所述父本DNA Pool的构建过程：父本取不低于十株植株的基因组等量混合形成父本DNA Pool；所述母本DNA Pool的构建过程：母本取不低于十株植株的基因组等量混合形成母本DNA Pool。

上述方案中，步骤（2）所述作图群体DNA Pool的构建过程：取作图群体所有植株的基因组等量混合形成群体DNA Pool。

上述方案中，步骤（4）所述重测序分析不同DNA Pool之间的SNP和In-Del标记的频率和分布，限定每个位点标记的支持reads数不低于10，以确保克隆效率。

本发明的有益效果：

（1）本发明充分结合了图位克隆技术与基因组重测序技术的优点开发了一种新的策略，可以更好更快的克隆突变位点；本发明通过图位克隆技术可以将突变位点定位到一条染色体的一个较大的区域内，再通过重测序结果分析SNP或者In-Del标记在这个大区域内的频率分布，再通过附近的标记进行交换植株的分析，便可以将突变位点定位到更小的区域，如果突变类型为碱基替换、插入或者缺失，那么可以直接找到突变位点，对其进行功能验证，如果是表观修饰引起的，需要对区间内基因的表达进行验证，并对表达发生改变的基因进行功能验证。

（2）本发明通过优化杂交组合、采用近亲品种杂交、减少群体数目、结合标记连锁分析和重测序数据分析，建立了一种高效的克隆突变基因的方法，该方法普遍适用于植物基因的克隆，特别适用于一些数目较少的杂交群体和水稻雌配子体发育缺陷的相关群体中，成本低，快速且高效，具有良好的开发和应用前景。

（3）本发明采用所述方法成功的克隆了3个水稻基因（均已验证其功能）和2个拟南芥基因（均已验证其功能），另有2个拟南芥突变体定位到一段区间内，区间内均未发生碱基突变，推测是基因组修饰导致的表型，证明所述方法的有效性。

附图说明

图1为水稻突变体dst的PCR鉴定，利用T-DNA上的两对引物Hph（上排）和2707（下排）鉴定突变体dst，PCR结果显示3株无T-DNA插入（用下划线斜体显示）。

图2水稻SSR标记的筛选图谱。

图3为第一批2号染色体SSR标记的PCR结果，其中Z：杂交母本ZH11；P：F2 Pool，由F2代中55株突变体等量混合的DNA池；下划线斜体代表标记发生交换的植株。

图4为第二批2号染色体SSR标记的PCR结果，Z：杂交母本ZH11；P：F2 Pool，由F2代中55株突变体等量混合的DNA池；RM13511位于Chr02：22394908-22395018之间，RM3515位于Chr02：24016552-24016748之间，RM207位于Chr02：35369336-35369671之间，下划线斜体代表发生交换的植株。

图5为第三批2号染色体SSR标记的PCR结果，H：杂交父本水稻突变体dst；Z：杂交母本ZH11；P：F2 Pool，由F2代中55株突变体等量混合的DNA池；RM13511、RM13517、RM13565、RM13574、RM13581和RM13589分别位于Chr02：22487906- 22488095、Chr02：22572094-22572314、Chr02：23498366-23498713、Chr02：23574090-23574326、Chr02：23644462-23644683、Chr02：23842361-23842524和Chr02：23959026-23959198之间，下划线斜体代表发生交换的植株。

图6为基于SNP信息绘制的F2群体Scarity值曲线图，纵坐标为物理位置，横坐标为Scarity值；Winstep：window step，每两次计算Scarity值的间隔区间，本研究中为10Kb；winsize：window size，计算Scarity值的区域（滑窗）大小，本研究中为100Kb。

图7为在重测序的F2群体中RM3688的PCR结果，Z：杂交母本ZH11；P：F2 Pool，由F2代中180株突变体等量混合的DNA池，下划线斜体代表发生交换的植株。

图8为在重测序的F2群体中RM13511的PCR结果，Z：杂交母本ZH11；P：F2 Pool，由F2代中180株突变体等量混合的DNA池，下划线斜体代表发生交换的植株。

图9为在重测序的F2群体中RM13565的PCR结果，Z：杂交母本ZH11；P：F2 Pool，由F2代中180株突变体等量混合的DNA池，下划线斜体代表发生交换的植株。

图10为在重测序的F2群体中RM13570的PCR结果，Z：杂交母本ZH11；P：F2 Pool，由F2代中180株突变体等量混合的DNA池。下划线斜体代表发生交换的植株。

图11为第2号染色体上标记的Hwayoung型配子频率分布，纵坐标为2号染色体上的物理位置，横坐标为标记Hwayoung型配子的频率。图中黑色的点代表SNP标记。

图12为在重测序的F2群体中SNP标记的PCR结果，Z：杂交母本ZH11；P：F2 Pool，由F2代中180株突变体等量混合的DNA池；SNP1、SNP3、SNP4、SNP11和SNP22分别位于Chr02：23073145、Chr02：3075946、Chr02：23077096、Chr02：23174646和Chr02：22891832；下划线斜体代表发生交换的植株。

图13为SNP21的测序结果，方框内为SNP21（Chr02：22911787），结果显示上排为T，下排为T/C。

图14为水稻突变体dst的图位克隆。

图15为突变体275-3的2号染色体部分SSLP分子标记的PCR电泳检测结果，图中所列SSLP标记分别为：T23K3、T12H3、F3P11、F27L4、T28I24、F27A10、T22F11、T19L8、F12C20、T20P8、T16B24（T23K3起始于Chr02：388035；T12H3起始于Chr02：2584861；F3P11起始于Chr02：8410147；F27L4起始于Chr02：10068751；T28I24起始于Chr02：10382120；F27A10起始于Chr02：10516283；T22F11起始于Chr02：10779026；T19L18起始于Chr02：11061880；F12C20起始于Chr02：11462271；T20P8起始于Chr02：11595846；T16B24起始于Chr02：16339214）；C：拟南芥野生型Columbia（Col-0）；L：拟南芥野生型Landsberg erecta（Ler）；加圆圈的数字代表发生了交换的植株编号。

图16为突变体275-3精细定位部分SSLP标记PCR凝胶电泳电泳检测图谱，图中所列SSLP标记分别为：T28I24、F27A10、T22F11、T19L8、T9J22、F12C20，各分子标记均位于2号染色体；加圆圈的数字代表发生了交换的植株编号。

图17为拟南芥突变体275-3初步定位及精细定位。

图18为突变体275-3基因组重测序及PCR产物测序验证突变位点，A：基因组重测序结果；B和C分别为突变位点前后区段PCR扩增产物测序结果；Allele 1：未发生突变的单链；Allele 2：发生了突变的单链。红色方框示意发生突变的位置，方框内为突变链上插入的碱基。

具体实施方式

为了更好地理解本发明，下面结合实施例进一步阐明本发明的内容，但本发明的内容不仅仅局限于下面的实施例。

实施例1 水稻DST基因的克隆

1. 材料

水稻（Oryza sativa L.）品种为粳稻Hwayoung、中花11（Zhonghua11）、日本晴和籼稻9311，突变体dst的野生型背景为粳稻Hwayoung，购买于韩国的RISD DB突变体库（RiceT-DNA Insertion Sequence Database）。

2. 引物

实施例1所用引物序列见表1，均在南京金斯瑞生物科技有限公司合成。

表1实施例1所用引物的序列

名称	正向引物	反向引物
			Hph	tgtcgtccatcacagtttgcc	aatctcgtgctttcagcttcg
2707	gaggcttccttcgtgt	acaaattgacgcttagac
			RM8145	ggcatgagagtctgtgatgttgg	tagtactgctccatctgccttgg
RM562	ggaaaggaagaatcagacacagagc	gtaccgttcctttcgtcacttcc
			RM488	aacaaccagcgtatgcgttctcg	cccacggctttgtaggaagaagc
RM561	gagctgttttggactacggc	gagtagctttctcccacccc
			RM3688	gttgaatcaagctgtgcagc	agctaggcaaagcatgcatg
RM13511	ggtgacaaattcagctgttgacc	caagctgcaccaattcaaatgc
			RM13517	caatagaacttcgcaccgtctcg	gtcatcagtgtgtggcttgtgc
RM13565	aaatagatgcacaacggagacg	gccgattgatgtttctttcc
			RM13570	catgctgatgcgattaagactgc	ctaacctgtgccttgtttgatgg
RM13574	tgcatgtttgccacagttaggg	cgagccaaatttgtgcactcc
			RM13581	taatcaaacatcggcacagtgg	gcgttgcgacactaaacaatgc
RM13589	ACTCCCGATAGTAGCAAATAGG	ATGGACTTTAGTCTCCTCTTCC
			RM3515	CATGCTAGTAAGCAAAGGGCAACG	TTGCACGTCCAACTGTCCAAGC
RM6318	AAGTGCCTCGAATTACACATCTCC	GCTGCTTCTGTCCAGTGAGACC
			RM530	TTCTTTATTCCCTCGCACTGACC	CAATGATGCCACAAACCGTAACC
RM208	AGTACCACCACCATTCTCTGCAAGC	TCGATTGGCCATGAGTTCTCG
			RM207	ATCCTAGTGGATAAGGCACAGACTGG	CCCTTGCTCTTCCACCTCATCC
RM535	CGGAGTGAATGAGTTTGCTCTGC	GTCATAACCCTACCTCCCGTAATCC
			RM218	TCAAACCAAGGTCCTTCAACTGC	TTTCTTCCACCGTCCATGTATCC
RM6929	TTCTTTCGAGGGTACGTAGAGG	CTAGCTAGCCAGTAGCTGATCG
			RM335	GTACACACCCACATCGAGAAGC	TCCATGGATATACGAGGAGATGC
RM518	AAGACACAAGCAAACAGCTCAACC	AAGCTTGCTTGGTTCAAGAGAGG
			RM255	GAGGAGGAGGAGGAGAGATCAGG	AACGAAACCGCTCAGTTCAACC
RM5709	TTTGGGATAAATGGGAGAGG	TCAGCTGGTTATTATGGAGAGG
			RM413	CCAATCTTGTCTTCCGGATCTTGC	AGATAGCCATGGGCGATTCTTGG
RM5700	TTTCAGTGCATGTCTTCG	GATTGTATGCATGGTTCAAAG
			RM4691	CCATCAAGAGATAGTGCTCCAACC	ACACAGCCTATGTTTAGGGTTTCC
RM204	CTAGCTAGCCATGCTCTCGTACC	CTGTGACTGACTTGGTCATAGGG
			RM4128	AGTAACTCGATCAAACTAAC	AGAGTCCATATAGAATTTCA
RM3183	GTGGTGCTAGTATGGACGAGAGG	CGGTTGGTAGACTGTAAACAAAGTGC
			RM3187	GCGGCTCTACGAGCTCCTCTACTGG	GAGCTTTGTCAGCGGATTTGTTCG
RM3509	CATCCTCAAGGATCGTAGAATTGC	GAGTAGGTGCACGGGTTGAGG
			RM5499	GGACGAAAGGGTATTTGATTGG	CCTCAAGGTGGTCTCCTTCTCC
RM8011	CCTATTGCTGCATGGTTTAGGG	TACACCTGGGCGTATGAAAGAGC
			RM6394	CACCAGCTGTTGCTTCCATAAGTACC	GTCGACGTCCACGATGACTACC
RM336	GTATCTTACAGAGAAACGGCATCG	GGTTTGTTTCAGGTTCGTCTATCC
			RM3395	CTTGGGAAACTTCACCTCATGG	CTGAGAGAAGCCACAGGATTAATGG
RM331	ATGTTGCACTCCTTCAATGTCC	CATGAGACAATGCCAGAAAGC
			RM105	GTCGTCGACCCATCGGAGCCAC	TGGTCGAGGTGGGGATCGGGTC
RM5122	ATATCACTGGGCAGACGGAGAGC	ACAGCCCACAGATCACAACAGC
			RM333	GATGTACTTGCCAACATGCTCTCC	AGCACACGCGAGTGATGTAACG
RM5590	GAGGGAGGGAGTACATATCTGATCG	AGCAACTGGATAAGCGATTGAGG
			RM5857	TGGTATGTGGCAATTGGATGG	AAGAGTCCTTGTGAGAGTCCTGTACC
RM6091	GCGGACACACCAGAGAATAAGC	GTGCTGTCCTGTCCTTGAATCC
			RM229	CACTCACACGAACGACTGAC	CGCAGGTTCTTGTGAAATGT
RM5997	CCTCGGTTGAGCAAATCAATCC	AGCTAACTAAACCGCCGTTCTCC
			RM224	ATCGATCGATCTTCACGAGG	TGCTATAAAAGGCATTCGGG
RM1880	TCACCAGGGTCGTTAAAGTACTGC	GCAATACCACATCTGATCCACACC
			RM519	AATTTCCGCGAAATCAGCATCC	TCATCTGGACAGTCGAGGTACGC
SNP1	CTTTCTAAAGCACCTT	GACACAATTTTGACAT
			SNP3	ACTCGAAACAATCAGA	CTTAATTTGGGCTCTA
SNP4	AGTCAACTGGTTAGGG	TGTCATTAATACTGCC
			SNP11	AGGGAAAGTGGACAAG	ATCTGAATCTGGCTGA
SNP22	GTCTGCTTCTGTCCTC	CTTCCATGGCTAGTGC

3. 实验方法

（1）突变体dst与籼稻9311或中花11（ZH11）的杂交

当籼稻9311和ZH11植株的花穗从剑叶中抽出后，除去剑叶，剪掉已开花的小穗。将余下的小穗从侧面和顶端剪开，用镊子或剥针将花药挑出，同时注意保护雌蕊，防止其被弄伤。等到突变体dst开花后，将突变体花粉分别授到除去雄蕊的野生型小花上，然后罩上牛皮纸，防止其他花粉落到柱头上。授粉过程中，为确保有过量的花粉落到柱头上，每一个花穗去雄后均连续授粉3天。授粉30天后除去牛皮纸，将杂交种子收获。

（2）基因组提取

（a）将高温灭菌的CTAB（含2% CTAB，100 mM Tris-HCl，20mM EDTA，1.4 M NaCl，2%的PVP-40）置于65℃水浴锅中加热。

（b）取100mg左右的水稻叶片，置于液氮中冷冻，然后用研磨棒将其研磨成粉末状。

（c）在研磨的样品中加入700微升的CTAB溶液，震荡混匀后置于65℃水浴锅中水浴30分钟，水浴时每隔5分钟将样品颠倒混匀一次，防止样品沉积而导致样品裂解不充分。

（d）水浴后，往样品中加入570微升氯仿：异戊醇（体积比24:1），震荡混匀，随后在12000rpm条件下离心10分钟；重复一次，质量更好。

（e）离心后溶液分层，上部分为透明或微黄色的水相层，下面为有机层。吸取上部水相层400~600微升，加入420微升异丙醇，颠倒混匀，-20℃静置20分钟。

（f）12000rpm条件下离心10分钟，使基因组沉淀。

（g）离心后去掉上清液，仅保留管底的基因组沉淀，加入500微升70%乙醇，颠倒混匀，洗涤沉淀。

（h）12000rpm条件下离心1分钟，去掉上清液，晾干沉淀。

（i）加入30~50微升含RNase的超纯水溶解DNA，随后用NanoDrop2000超微量分光光度计测量样品的DNA浓度。

（3）SSR分子标记的筛选与分析

本研究所使用的SSR分子标记均是来自Gramene数据库（http://www.gramene.org/），从中下载水稻的SSR分子标记的引物序列（International RiceGenome Sequencing Project，2005）。为了筛选合适的SSR标记，避免个体差异的干扰，构建了3个DNA混合池：父本突变体dst、母本ZH11和F₂混合池（Pool）。父母本各取十株植株的基因组等量混合形成父本突变体dst和母本ZH11两个亲本池，F₂群体所有植株均等量混合形成F₂ Pool。为了确保所有的基因组质量较好，方便后续的等量混合，所有基因组提取后均用NanoDrop 2000超微量分光光度计测定其质量与浓度，去掉质量较差的，并将其稀释成浓度为100 ng/ml的工作液，用于后续的PCR分析。

在筛选SSR标记时，样品为父本突变体dst、母本ZH11和F₂ Pool，或者为母本ZH11和F₂ Pool。PCR体系如下：

2×Taq MasterMix	正向引物	反向引物	模板	H2O
					7.5μl	1μl	1μl	1μl	4.5μl

PCR程序为

Step1	94℃	3min
			Step2	94℃	30s
Step3	55℃	30s
			Step4	72℃	30s
Step5	Go to step 2	39 cycles
			Step6	72℃	10min
Step7	16℃	5min

PCR产物在150V的条件下利用4%琼脂糖凝胶进行电泳，观察标记是否出现分离。

筛选标记后，分析标记的位置并选取合适的标记进行遗传连锁分析。首先通过PCR扩增目的产物，琼脂糖凝胶电泳使标记分离，然后对标记的交换率（crossoverate）进行计算，计算公式为：交换率（%）=中花11型配子数/（植株数*2）*100。不连锁标记的交换率约为50%，连锁的交换率趋近于0，交换率越低，标记与突变位点越近。初步确定突变位点可能的位置，然后对可疑区域的分子标记进行加密分析，缩小突变位点所在的区域。

（4）位点特异性PCR（Allele-Specific PCR，AS-PCR）

为了区分F2群体中的SNP标记，采用位点特异性PCR（Allele-Specific PCR，AS-PCR）。位点特异性PCR又称等位基因特异PCR，其原理是利用引物3’端碱基的不配对严重影响PCR的扩增效率。方法是设计两条正向引物与一条反向引物，两条正向引物3’端的最后一个碱基分别与SNP的两个碱基相同。这样一条正向引物可以与父本完全匹配，能与反向引物一起扩增出父本条带，但很难扩增出母本条带；而另一条正向引物恰好相反，能与反向引物一起扩增出母本条带，却难以扩增出父本条带，因此，可以将SNP差异区分开。PCR条件基本同上，退火温度因引物而不同。

（5）基因组重测序和数据分析

利用CTAB法提取基因组，并用NanoDrop 2000超微量分光光度计测定其质量，确保OD260/280≥1.8；同时，通过凝胶电泳确定基因组条带清晰无降解。随后利用超声波随机打断至平均长度500bp左右，回收500bp左右的DNA片段并进行末端补齐。然后，利用试剂盒将Solexa测序接头连到DNA片段上，纯化并用Solexa引物扩增12~18个循环。随后，将产物进行电泳，切胶回收500bp左右的DNA片段，纯化后定量。最后，利用测序仪（型号为Illumina2000）进行测序。这些过程均由上海欧易生物医学科技有限公司完成。

基因组重测序后产生了大量的reads（125bp），由于其中存在部分低质量的reads，这会干扰数据分析，因此去掉所有长度低于50bp的reads和碱基模糊的reads。利用BWA软件将余下的高质量reads组装到水稻基因组IRGSP-1.0（http://rapdb.dna.affrc.go.jp/download/irgsp1.html）上，分析其reads的全基因组覆盖度和平均深度。随后运用SHOREMAP软件寻找SNP（Single Nucleotide Polymorphism）和In-Del（Insertion-Deletion）标记，每个标记的支持reads数要大于或等于4，同时计算全基因组SNP分布的特征和Scarcity值，每次计算Scarcity值的区域大小（window size）为100kb，每两次计算Scarity值的区域间隔区间为10kb（Schneeberger等，2009）。

另外，将基因组测序结果与图位克隆结果结合起来，分析目标染色体上SNP的频率，观察SNP的频率趋势，并选取部分SNP进行验证。

4. 突变类型的确认与分离比统计

由于水稻突变体dst从韩国的RISD DB突变体库中购买的，为了确定表型是否因为T-DNA插入导致的，我们根据T-DNA插入序列设计了两对引物Hph和2707。同时，提取突变体dst的基因组作为PCR模板，检测结果显示在12株突变体中，3株未扩增出目的条带，说明突变体dst的表型与T-DNA插入无关，推测是转基因或者生长过程中的自然突变导致的（图1）。

为了进一步确定突变体dst的表型是否由单基因控制，我们对自交后代的表型分离比进行了统计，结果显示无表型:有表型=82:27，符合3:1分离比。同时，以粳稻中花11（ZH11）为母本，以突变体dst为父本进行杂交，获得杂交F₁代，观察其后代的表型分离比，结果显示F₂代的分离比为3.13:1，也接近3:1分离比，表明突变体dst是一个单基因控制的隐性性状（表2）。

表2 水稻杂合体后代遗传分离比情况

杂交组合	无表型	有表型	实际比值	理论比值	P值（卡方检验）
						DST/dst♀×DST/dst♂	82	27	3.04	3:1	0.95
ZH11♀×dst♂	172	55	3.13	3:1	0.79

5. 作图群体构建与SSR标记的筛选

为了克隆突变基因，我们分别选用粳稻中花11（japonicacv. Zhonghua11）和籼稻9311（indicacv. 9311）作为母本，水稻突变体dst作为父本进行杂交，分别获得100多粒杂交种子。结果发现，9311♀×DST/dst♂杂交种子F₁代几乎不结实，无法获得足够多的种子，因此无法将9311♀×DST/dst♂的F₂代群体作为图位克隆的作图群体；而中花11与突变体dst虽然同属于粳稻，其杂交F₁代依然有一定的败育，但是可以获得足够多的种子。因此，我们选用中花11♀×dst♂的水稻杂交F₂代作为图位克隆的作图群体。

遗传作图群体构建完成后，将55株F₂代植株、10株杂交父本（Hwayoung）和10株杂交母本（ZH11）分别提取基因组，测定基因组质量，并稀释成100ng/ml左右的工作液，用于突变位点的初步定位。然后，将杂交F₂代植株、杂交父本和杂交母本分别等量混合成3个DNA池，即F₂ Pool、突变体dst和ZH11。以这3个或其中的两个（F₂ Pool和ZH11）DNA池为模板，借用本院其他实验室已有的SSR标记引物，进行PCR扩增片段并利用4%的琼脂糖凝胶电泳区分其多态性。最终，从775对标记引物中筛选获得了78个可能有效的标记，重新验证和分析标记的位置后，选取43对引物进行下一步的实验。如图2所示，这43对标记在F₂ Pool和ZH11中均存在多态性，特别是标记RM561、RM3688、RM3515和RM530，它们在F₂ Pool中不能扩增出或只能扩增出很弱的杂交母本ZH11型条带，且这些标记均在2号染色体上，推测这些标记可能与突变位点连锁。另外11号染色体上的RM5590、RM5857、RM6091、RM229和RM5997也有类似的趋势，其在F₂ Pool中只能扩增出较弱的杂交母本型条带（图2）。

6. SSR标记分析结果显示突变位点位于第2号染色体

SSR标记筛选完成后，要确定突变位点在哪条染色体上，需要计算各个标记的交换率，分析标记与突变位点的连锁性。由于部分SSR标记间距离较短，因此在第一批分子标记扩增与分析时，我们从43个标记中选取了40个（不包括RM3688、RM3515和RM207）。通过PCR和4%琼脂糖凝胶电泳技术，发现2号染色体和11号染色体的一些标记交换率较低，其余染色体标记的交换率在50%左右波动（表3）。11号染色体中的5个marker（RM5590、RM5857、RM6091、RM229和RM5997）均在40%左右，并不存在显著的递增或递减趋势，推测与突变位点不相关。2号染色体SSR标记的交换率存在明显的先递减再递增的趋势，特别是标记RM6318和RM530，前者均有Hwayoung型条带，不存在ZH11型条带纯合的植株；而后者的交换率仅有16.36%，远低于50%，说明突变位点很可能就在该位点附近（表3）。

表3 第一批SSR标记结果的分析

标记	染色体	位置	交换率（%）
				RM8145	1	4885944-4885983	53.63
RM562	1	14626324-14626568	46.30
				RM488	1	24807508-24807684	45.92
RM561	2	19549103-19548504	35.45
				RM6318	2	24420594-24420792	-
RM530	2	30532198-30532386	16.36
				RM208	2	35135783-35136068	40.00
RM535	2	35778242-35778527	42.73
				RM218	3	8405368-8405516	53.92
RM6929	3	12928253-12928444	57.28
				RM335	4	688353-688466	42.73
RM518	4	2030135-2030305	41.82
				RM255	4	30772388-30772538	48.18
RM5709	4	31875481-31875663	46.36
				RM413	5	2212736-2212814	48.18
RM5700	5	4378151-4378362	52.78
				RM4691	5	7026152-7026313	38.89
RM204	6	3168314-3168547	51.82
				RM4128	6	6644518-6644658	48.15
RM3183	6	12446983-12447263	50.00
				RM3187	6	20925676-20926044	50.91
RM3509	6	30970997-30971169	48.15
				RM5499	7	9987145-9987338	47.17
RM8011	7	14316333-14316473	45.00
				RM6394	7	18392792-18392970	50.00
RM336	7	21871205-21871356	51.82
				RM3395	8	10293664-10293949	61.82
RM331	8	12294124-12294755	60.19
				RM105	9	13150789-13150492	60.91
RM5122	9	15247895-15248365	56.48
				RM333	10	22372009-22372491	39.29
RM5590	11	11682981-11683174	37.50
				RM5857	11	11854647-11854802	40.91
RM6091	11	13405326-13405451	37.27
				RM229	11	18407879-18408009	42.73
RM5997	11	22710429-22710614	39.09
				RM224	11	29515992-29516287	50.00
RM1880	12	746745-747262	54.55
				RM519	12	19903791-19903912	50.91
RM313	12	21005262-21005562	-

-：代表无法计算交换率，因为这两个标记仅能扩增出Hwayoung型条带，其中RM3618在所有植株中均有条带，与突变位点连锁，而RM313在42株（76.36%）中能扩增出条带，与突变位点不连锁。

进一步分析2号染色体SSR标记交换的植株，如图3所示，在标记RM530处发生交换的植株基本在标记RM208和RM535处也发生了交换，但在标记RM561处不一定交换，因此我们推测突变位点在标记RM530和RM561之间（图3）。为了验证我们的推测，我们选用另外3个SSR标记RM3688、RM3515和RM207，电泳结果显示这三者的交换率分别为2.73%、4.55%和41.35%。其中RM3688和RM3515位于RM561和RM6318之间，两者发生交换的植株完全不同，RM207位于RM208和RM535之间，交换率也在这两者之间。对交换植株进行分析，标记RM3688发生交换的植株是第9、13和31号植株，这些植株均在RM561处发生交换；而RM3515处发生交换的植株是第23、25、34、52和54号植株，这些植株均在RM530处发生交换，因此推测突变区域在RM3688和RM3515之间（图4）。

随后，我们从Gramene数据库（http://www.gramene.org/）中将所有位于RM3688和RM3515之间的SSR标记引物下载并合成，筛选后发现7个标记在Hwayoung和ZH11之间存在多态性。对RM3688和RM3515发生交换的植株进行分析，结果显示标记RM13511和RM13517发生交换的植株均是第9和13号植株，RM13565和RM13570发生交换的植株均是第23、25和54号植株，RM13574、RM13581和RM13589发生交换的植株均是第23、25、34、52和54号植株，这表明标记RM13511和RM13517位于突变位点的同一侧，其余的标记位于突变位点的另一侧（图5）。综合所有的SSR标记结果，我们发现RM3688、RM13511和RM13517发生交换的植株与标记RM13565、RM13570、 RM13574、RM13581、RM13589和RM3515发生交换的植株完全不同，因此我们推测突变位点位于标记RM13517和RM13565之间（表4）。由于这两个标记间的所有能查到的标记已经筛选完了，无法找到新的标记，因此无法继续通过图位克隆的方法来继续定位基因了。

表4 F₂代中SSR标记发生交换的植株

F2代植株

9

13

23

25

31

34

52

54

RM3688

√

RM13511

√

RM13517

√

RM13565

√

RM13570

√

RM13574

√

RM13581

√

RM13589

√

RM3515

√

√：标记发生了交换的植株。

7. 基因组重测序确认初定位结果

由于作图群体是通过粳稻品种水稻突变体dst和粳稻品种中花11（ZH11）杂交后获得的，品种间的多态性较小，因此为了克隆到目的基因，我们种植了更多的F₂群体，等量混合189株F2群体基因组，与ZH11一起进行基因组重测序。测序完成后，将重测序数据组装到染色体上，结果显示ZH11与F₂ pool均获得了超过116M的reads，分别有96.43%和96.01%的reads组装到水稻参考基因组上IRGSP-1.0（http://rapdb.dna.affrc.go.jp/download/irgsp1.html），其中83.82%和82.07%的reads仅能组装到基因组上的一个位置（表5）。随后将F₂ pool与杂交母本ZH11的测序结果进行比较分析，根据ShoreMap的方法来分析，利用SHOREMAP软件计算全基因组SNP分布的特征和Scarcity值，Scarcity值越接近1说明该区域越可能是突变基因所在区域。结果显示Scarcity值最大区域位于3号染色体和11号染色体，其次是2号染色体的前端和6号染色体的末端，这与我们的初定位结果是不一致的（图6）。

表5 基因组重测序数据的组装结果

Samples	Total reads	Total mapped	Uniquely mapped	Multiple mapped
					ZH11	129346635	124727429（96.43%）	108419707（83.82%）	16307722（12.61%）
F2 pool	116980645	112310020（96.01%）	96004555（82.07%）	16305465（13.94%）

两种克隆突变位点方法得到的结果出现了矛盾，其可能的原因是测序的群体有问题，或者ShoreMap的方法存在一些缺陷，而已完成的测序结果显示这种方法成功率不到50%。为了确定测序的F₂群体是没问题的，我们对测序的189株突变体单独进行基因组的提取，检测浓度与质量后去掉9个质量差的样品，选取了一部分SSR标记进行连锁交换分析。如图7~图10所示，SSR标记RM3688、RM13511、RM13565和RM13570发生交换的植株都很少，交换率分别为12.78%、10.00%、2.78%和4.44%，均与突变位点较连锁（图7~图10）。分析标记发生交换的植株后，发现RM3688和RM13511发生交换的植株与RM13565和RM13570发生交换的植株完全不同，因此突变位点应该位于标记RM13511和RM13565之间（表6）。这与初定位的结果一致，同时也证明测序群体是可靠的。

表6 重测序的F₂群体中SSR标记发生交换的植株

F2代植株	RM3688	RM13511	RM13565	RM13570
					13			√	√
15			√	√
					20	√	√
33	√	√
					41	√	√
46				√
					60			√	√
67				√
					88				√
89	√
					90	√	√
96	√	√
					101	√	√
102	√	√
					105	√	√
109	√	√
					113	√	√
120			√	√
					128	√	√
129	√	√
					132	√	√
133			√	√
					142	√	√
145	√
					148	√	√
150	√
					156	√	√
162	√
					166	√
169	√	√
					170	√	√

√：标记发生了交换的植株。

我们重新分析2号染色体上的SNP标记的Hwayoung型配子频率，设定reads数不小于10，发现在18Mb之后SNP标记的Hwayoung型配子频率基本高于0.5，并且呈先递增后递减的趋势，频率最高的区域位于23Mb附近（图11）。同时分析了部分SSR标记的Hwayoung型配子频率，它们离23Mb越近，频率越高（图11）。这些与PCR的结果基本一致，验证了前面的初定位结果。

8. 通过SNP标记精确定位突变位点

从测序结果中，我们发现许多SNP位于标记RM13511和RM13565之间。为了进一步缩小突变位点所在的位置，我们选取了部分SNP标记，设计ZH11特异性引物进行位点特异性PCR。PCR模板选用的是在标记RM13511和RM13565处发生交换的植株，结果有5个标记获得较好的结果。如图12所示，SNP1、SNP3和SNP4发生交换的植株均为第13、15和60株，SNP11发生交换的植株为第13、15 、60和133株，而SNP22发生交换的植株是第90、101、128、129、148和149株，与SNP1、SNP3、SNP4和SNP11完全不同（图12）。另外在SNP22和SNP1之间存在一个SNP标记SNP21，但是由于SNP21处序列存在poly结构，无论是位点特异性PCR技术还是dCAPS（derived cleaved amplified polymorphic sequences）技术，均未能获得理想的结果。因此，我们对部分SNP22和SNP1发生交换的植株进行了测序，结果显示第13和15株的序列与突变体dst（背景Hwayoung）一样，并未发生交换，而第90、101、128和148株是杂合体，发生了交换（图13）。

将所有的SNP标记发生交换的植株列表，发现标记SNP21和SNP22发生交换的植株，在标记SNP1、SNP3、SNP4和SNP11处不会发生交换，反之亦然（表7）。由此，我们推测突变位点位于标记SNP21和SNP1之间的161Kb范围内。

表7 重测序的F2群体中SNP标记发生交换的植株

F2代植株

SNP22

SNP21

SNP1

SNP3

SNP4

SNP11

13

√

15

√

60

ND

√

90

√

101

√

128

√

129

√

ND

133

ND

√

148

√

156

√

ND

√：标记发生了交换的植株；ND：未检测。

9. 突变体位点的确认与验证

通过分析SNP1和SNP21之间的序列（重测序结果），我们发现在突变体dst植株中，2号染色体上的一个转录因子发生了碱基替换，该基因的第752位的胸腺嘧啶（T）突变成了鸟嘌呤（G），对自交后代的648株植株和与ZH11杂交后代的189株纯合体进行鉴定与表型观察，表型均与该位点共分离（图14）。在粳稻品种日本晴植株中敲除DST基因（敲除位点位于突变体dst的突变位点后面），观察发现T₀代植株的表型与突变体dst基本一致，大部分绝育，仅有缺失一个碱基C的植株和DST CR3-15（杂合体）可以结实，而T₁代表型也与突变体dst相似。

综上所述，本案例先用传统的图位克隆方法来克隆突变基因DST，要么因为杂交较远而拿不到足够数目的群体（突变体dst与9311杂交），要么由于标记过少而无法定位目的基因；随后采用ShoreMap的方法，但由于方法本身的缺陷，也未能确定突变位点的位置；最后，我们利用本发明的方法，成功克隆到目的基因。

实施例2 拟南芥突变体275-3的图位克隆

1. 实验材料

拟南芥野生型为Columbia（Col-0）和Landsberg erecta（Ler）两种生态型，拟南芥突变体275-3购于拟南芥生物资源中心（ABRC）。材料种植于武汉大学生命科学学院温室，在室温为22℃的条件下进行光照16h、黑暗8h的培养。

2. 本实施例用到的引物如表8所示。

表8 拟南芥突变体275-3克隆所用的标记引物

Maker	FP	RP
			T23J18	GATATTTGTTTTGCTAACAC	TAATAAAGTTCCAGCTTTGA
T22J18	CACTGCAACAAAGTGGAAAT	ATCCGTTTCAATATCCACAA
			F28H19	TGCGGGAGTGTGATAGAATA	TCCTCGAAAGATTCATTGAT
F19K23	GAATTCTGTAACATCCCATTTCC	GGTCTAATTGCCGTTGTTGC
			T17F3	GGACCGACGGTTACGAGAGT	TAACGGGCCGTTGCAAGA
T23K3	CGTGTTTACCGGGTCGGA	AAAACCCTTGAAGAATACG
			T12H3	TAGTCTGAGCTTACCAATA	TTACCCTCGACTCGTAAC
F3P11	ATGTATTTGTTGCAAAATAA	TGCACAGAAGAAAAAACTA
			T20P8	TCCGATTCGATTAAACTC	TTATTTCCTATTTCAAGACT
T16B24	ATGAACGGAGTAGCTATC	CGCGTAGAACATAATCTGTA
			F20H23	CAATGGGAAGAAGGTGTGAG	CGCATTTCCATAAGTTTGTT
MGL6	ACCTGTTCAGTCTATGTTAC	GGGAATTATTAACATTATCA
			K1G2	ATGAGCTTTAGGAGTGTGTA	AATTTTGTCCCAAAAGAATA
T32N15	CAAAAGAAATGCAACGAGAC	TTTGATCATGAATGGTAGTG
			T26I12	GAGCAACATTAAGGATAGAA	ATCTCATACTCATAATATGTAG
T4I9	TTATAGCAAACGTACAAGTC	CTGCATACACGTCGTCTC
			F17A8	CTGGACCCTAGTGGATGT	GACGGTTCTCCATTAATTAT
FCA8	TTCGGAGAAAGAAACGACAT	ATGGAACTATTCAGGCATTA
			T15N24	GCAACCGCTGCTGCTTTA	AATATTTGGCTTTGCGTAGA
T4L20	ACCCTAAAACAATGTCTCTT	TGCTAACATGGAAATTTGTC
			F13G24	TTATGCCCATTTGAAACC	TGAAACTTTGGGCCTCAG
MYJ24	TTCATGAGAGCGGCATTC	GCAAAATGTTTGGACAATTA
			T26D22	CACAGGCCATTGGATGTA	TGTTAGAACCCACCATTTG
K6M13	CCTGTTCCAATGAATATG	TGTAGCTGCTGAGTTGTC
			MQB2	AAAAGGCGACTACTAGCA	GCCATTTATTTGGTCAAC
F25P22	TGCCACAATCCTAGCTTGTC	TATATGCTTTTCTTCTCTTA
			F2P24	GATTAATTCGGCAGGAAA	TCATGAACCATAAAACTAAA
F27L4	TTATGTTGTGTTGGAGTTGG	TTGGTATGAATACGTTCTAA
			T28I24	ATAGGCATTATAGTTATGAG	TTTCGACATTGGCTTGAA
F27A10	GGGTCTGAATGGAAGAAC	GTAGGACAAAACCAAGTACA
			T22F11	CGTGGATTAGAGATCACT	TTTGAATTTCTTCTAAGAG
T19L18	AGTTTGGACATTGGAATA	ACTCTAAACCAAAAATTAAG
			T9J22	GCGACAATGGCACTACAC	CTTCCATCGCTCTGTCAC
F12C20	TCCTTTGTCGTCTTGTTG	ATTTTAACGAAAAATATTAC

3. 实验方法

（1）拟南芥杂交技术

于杂交前天的下午至晚上，选取Ler野生型拟南芥的露白期花苞，用尖头镊子去雄（除去萼片、花瓣及雄蕊，仅留雌蕊）；次日上午（11：00至12：00为佳）取突变体275-3平展期的花，将花药上的花粉授到Ler野生型已去雄的柱头上，此步骤应轻柔，使授粉充分，同时注意避免损伤柱头，影响杂交效果。

（2）突变体胚珠败育率的统计

突变体杂交及自交后代中有表型的植株即杂合体，通过确定植株角果中有无白化胚珠和未膨大的胚珠及其比例来确定。在解剖镜下用剖针轻轻划开角果腹缝线两侧并剥开，统计其中白化胚珠及未膨大的胚珠数目及总胚珠数目，计算其比值，即为败育率。

（3）突变体表型分离比的统计

杂交或自交后代群体中有表型植株（角果中有白化及未膨大的胚珠）与无表型植株（角果中胚珠均发育正常）的比值即为分离比。本实验统计的均为杂合体自交后代的分离比，理论值应为2：1。

（4）位点特异性PCR

位点特异性PCR（Allele-Specific PCR，AS-PCR）是一种基于SNP的PCR技术，利用一种基因型的引物3’端碱基与另一基因型同一位置处不匹配从而严重影响PCR的扩增效率。因为特异性引物在一种基因型中有扩增产物，而在另一种基因型中没有，通过普通浓度的琼脂糖凝胶电泳即可判断目的条带的有无，从而确定基因型，方便且直观。实验难点在于摸索合适的PCR条件，避免出现两种基因型都能扩增出大小正确的条带的情况，且摸索的条件进行PCR检测效果也可能会不稳定。

（5）PCR的反应程序与扩增体系

（a）本研究所用PCR的反应体系如下：

试剂	体积（μl）
		ddH2O	4.5
2×Taq MasterMix	7.5
		FP	1
RP	1
		模板（DNA）	1
总体积	15

根据样品数目计算各组分（除模版外）所需量，混合吹打均匀后分装入PCR管，分装后再分别按顺序加入模版DNA。

（b）PCR扩增程序设置如下：

步骤	名称	条件	时间
				Step 1	预变性	94℃	3min
Step 2	变性	94℃	30s
				Step 3	退火	55℃	30s
Step 4	延伸	72℃	20s
				Step 5	Go to step 2	--	39 cycles
Step 6	补充延伸	72℃	5min
				Step 7	保温	12℃	5min

其中退火温度和循环数根据引物质量和电泳检测的效果进行调整。

（6）CTAB的配制（1000mL）

在电子天平上称取20g CTAB、81.85g NaCl、20g PVP40入容积为1L的烧杯中，量取100mL 10mM的Tris-HCl（PH=8.0），40mL 20mM的EDTA，加入800mL ddH2O，置于磁力搅拌器上搅拌加热，至各组分溶解，溶液澄清。然后定容至1L，121℃ 15min液体模式灭菌，常温保存备用。

（7）拟南芥基因组的提取

（a）取适量生长良好的拟南芥新鲜叶片加入EP管；

（b）提前将CTAB提取液置于65℃水浴锅中预热，至溶液澄清方可使用；

（c）在收集的叶片的EP管中加入液氮并迅速用研磨棒研磨，用移液枪加入700mLCTAB提取液，盖上EP管（或者每管加入100mL CTAB提取液和一颗钢珠，于组织破碎仪上震荡破碎2min，倒出钢珠，每管补充600mL CTAB提取液）；

（d）将EP管置于65℃水浴锅中加热30min，同时间隔5min剧烈摇晃一次，使叶片破碎组织与提取液充分混合；

（e）12000 rpm离心5min；

（f）吸取上清液700ml转移至新的EP管，并加入570ml氯仿：异戊醇（体积比24：1），剧烈摇晃，充分混匀；

（g）12000rpm离心10min；

（h）吸取上清液600ml转移至新的EP管，再加入570ml氯仿：异戊醇，剧烈摇晃使之充分混匀；

（i）重复步骤（g）一次；

（j）吸取上清液400ml转移至新的EP管，并加入等体积的异丙醇，于-20℃放置30min；

（k）12000rpm离心5min；

（l）弃上清后加入500mL的75%酒精洗脱，轻柔摇晃，然后倒掉酒精；

（m）吸取残余酒精，并将EP管打开置于37℃烘箱，烘干酒精及水分；

（n）加入50mL含RNA酶的ddH₂O，离心1min使之沉降到EP管底；

（o）提取的基因组用NanoDrop2000超微量分光光度计测量样品的DNA浓度，可直接使用或置于-20℃保存备用。

（8）基因组重测序和数据分析

利用CTAB法提取基因组，并用超微量分光光度计NanoDrop 2000测定样品质量，确保OD260/280≥1.8和OD260/230≥2.0。同时，我们通过普通琼脂糖凝胶电泳检测，确定基因组条带清晰，没有发生降解。基于第二代测序技术，利用Illumina测序平台进行测序，由武汉康测科技有限公司完成。通过Illumina Hiseq测序得到原始数据（raw data）后，先对原始数据进行过滤筛选，获得高质量的测序数据（Clean data），将clean data比对到项目物种（Arabidopsis thaliana）的参考基因组（https://www.arabidopsis.org/）上，获得实验样本的SNP和In-Del。然后鉴定不同混池间的SNP和In-Del，检测同一个位点在不同混池间的变异等位频率和分布。

4. 突变体275-3的遗传稳定性和遗传群体的构建

突变体275-3均为胚胎在球形期发育停滞而胚乳游离核数目减少。通过对突变体与Ler野生型杂交后代进行T-DNA插入鉴定，证明该突变体胚胎及胚乳败育的表型确实不是由T-DNA插入所引起。由于该突变体纯合致死，我们无法获得突变基因型纯合的植株，因此不能构建F₂群体，所以选择构建近等基因系；同时由于该突变体的生态型背景为Col-0，我们选择Ler生态型作为杂交母本，通过杂交与回交清除突变体的Col-0遗传背景。将筛选得到的突变体275-3（父本）与Ler生态型（母本）杂交获得F₁代，之后与Ler回交三次得到BC₃F₁代，从而构建近等基因系，即遗传作图群体。在杂交与回交的过程中，我们可以排除T-DNA插入可能对定位产生的干扰，同时在BC₂F₁代对基因进行初步定位。

5. 突变体275-3的败育率分析和表型分离比统计

取突变体275-3的F₀代、BC₁F₁代、BC₂F₁代有表型植株的角果，统计并记录其败育率，分别为26.49%、20.66%、22.73%，均接近25%（表9）。

表9 拟南芥突变体275-3与野生型Ler杂交及回交后代的败育率统计

类型	胚珠败育数目	正常胚珠数目	胚珠总数	败育率（%）
					275-3	209	580	789	26.49
BC1F1	275	1331	1173	20.66
					BC2F1	235	799	1034	22.73
Col-0	8	1199	1207	0.66
					Ler	2	1116	1118	0.18

对BC₁F₂群体的表型分离比进行统计，1号株系共统计170株，其中有表型植株127株，无表型植株43株，比例为2.95:1，不符合2：1的遗传分离比；6号株系共统计62株，其中有表型植株43株，无表型植株19株，比例为2.26:1，较接近2：1的理论值（表10）。

综上，突变体275-3在杂交和回交过程中其胚珠败育的表型均能稳定遗传；同时由于每代败育率均较接近25%，自交后代分离比接近2:1，由此推测突变体275-3可能是由单基因控制的隐性突变且纯合致死。

表10 拟南芥突变体275-3与野生型Ler杂交后代的分离比分析

275-3	植株总数	突变体	野生型	分离比
					BC1F2代 1#	170	127	43	2.95：1
BC1F2代 6#	62	43	19	2.26：1

6. 突变体275-3初步定位

突变体275-3与Ler经过一次杂交和两次回交得到的BC₂F₁代，作为遗传作图群体。取该群体中有胚珠败育表型的植株作为实验材料，同时以Col-0野生型和Ler野生型为对照，从拟南芥图位克隆网站选取的25对分子标记进行PCR并用4%琼脂糖凝胶电泳检测其多态性，条带电泳检测结果如图15所示（图15）。统计Col-0型配子频率，结果如表11所示：1号染色体5个分子标记的Col-0型配子频率均明显低于50%，3号染色体5个分子标记的Col-0型配子频率均为0，4号、5号染色体的分子标记Col-0型配子频率均很低；而第2号染色体上的5个分子标记T23K3、T12H3、F3P11、T20P8、T16B24对应的Col-0型配子频率均较高，分别为32.05%、35.90%、48.72%、48.72%、43.59%（表11）。其中分子标记F3P11和T20P8的Col-0型配子频率最高，且都低于50%，因此推测突变体275-3的突变位点定位于第2号染色体上，并且位于分子标记F3P11与T20P8之间。

表11 拟南芥突变体275-3第一次分子标记结果分析

Makers	Chromosome	Start position	Col-0型配子频率(%)
				T23J18	1	3830616	0
T22J18	1	8070981	0
				F28H19	1	16533461	0
F19K23	1	22939031	37.18
				T17F3	1	26305380	39.74
T23K3	2	388035	32.05
				T12H3	2	2584861	35.9
F3P11	2	8410147	48.72
				T20P8	2	11595846	48.72
T16B24	2	16339214	43.59
				F20H23	3	989952	0
MGL6	3	5634662	0
				K1G2	3	10162396	0
T32N15	3	16344066	0
				T26I12	3	20475817	0
T4I9	4	1313034	32.05
				F17A8	4	6139784	28.21
FCA8	4	9791410	0
				T15N24	4	13413430	0
T4L20	4	16563643	25.64
				F13G24	5	2501873	26.92
MYJ24	5	7720794	26.92
				T26D22	5	13588072	0
K6M13	5	20078535	0
				MQB2	5	25191644	33.33

根据第一次分子标记的结果，进一步在2号分子标记F3P11与T20P8之间选取7个分子标记，同样经过PCR及电泳检测（图15），统计每个分子标记的Col-0型配子频率。结果显示，分子标记F27L4的Col-0型配子频率为48.72%，其余6个分子标记频率均为50%（表12）。对以上两次分子标记结果发生交换的植株进行统计，如表13所示，实验植株在这12个分子标记发生的交换符合交换规律，且位于分子标记F27L4与分子标记T20P8之间的6个分子标记均不发生交换，由此推定，突变体275-3的突变位点可能位于分子标记F27L4与分子标记T20P8之间，其间的物理距离为1527095bp，约1.53Mbp（表13）。

表12 拟南芥突变体275-3初定位第二次分子标记结果分析

Makers	Chromosome	Start position	Col-0型配子频率(%)
				F27L4	2	10068751	48.72
T28I24	2	10382120	50
				F27A10	2	10516283	50
T22F11	2	10779026	50
				T19L18	2	11061880	50
T9J22	2	11328569	50
				F12C20	2	11462271	50

表13 拟南芥突变体275-3杂交后代在SSLP分子标记中发生交换的植株

BC2F1代植株

1

2

4

9

11

13

14

15

16

18

19

25

28

29

30

33

34

T23K3

√

T12H3

√

F3P11

√

F27L4

√

T28I24

F27A10

T22F11

T19L18

T9J22

F12C20

T20P8

√

T16B24

√

“√”代表植株在该分子标记结果中发生了交换

7. 突变体275-3的精细定位

为了进一步缩小定位范围，快速获得目标突变基因，取Ler野生型（♀）与BC₂F₁代的杂合体（♂）杂交得到的BC₃F₁代中有表型的植株进行精细定位分析。实验以BC₃F₁代为材料，共取有表型的杂合体植株136株，利用确定初定位范围的两个分子标记F27L4与T20P8进行PCR，然后通过凝胶电泳检测扩增条带。我们从这136株中筛选到有交换的植株21株。PCR扩增条带电泳检测结果如16所示。对分子标记F27L4、T28I24、F27A10、T22F11、T19L18、T9J22、F12C20和T20P8的Col-0型配子频率进行统计，发现在T19L18出现了50%的交换频率，说明突变位点在此分子标记附近（表14）。对植株在这些SSLP标记中发生交换的情况列表统计，发现从分子标记T28I24、F27A10、T22F11到T19L18呈递减规律，从分子标记F12C20、T9J22到T19L18呈递减规律（表15）。分子标记T22F11发生交换的植株，在分子标记T28I24与F27A10也必定发生交换；分子标记T9J22发生交换的植株，在分子标记F12C20也全部发生交换，表明这些SSLP分子标记在突变体275-3中紧密连锁。

结果表明，突变体275-3的突变位点可能位于分子标记T22F11与分子标记T9J22之间，即Chr02：10779026~11328569，其间的物理距离为549543bp，约0.55Mbp（表15，图17）。

表14 突变体275-3精细定位分子标记结果

Makers	Chromosome	Start position	Col-0型配子频率(%)
				T28I24	2	10382120	42.86
F27A10	2	10516283	42.86
				T22F11	2	10779026	47.62
T19L18	2	11061880	50
				T9J22	2	11328569	42.86
F12C20	2	11462271	42.86

表15 拟南芥突变体275-3回交后代BC₃F₁群体在SSLP分子标记中发生交换的植株

BC3F1代植株

15

26

34

58

63

65

T28I24

√

F27A10

√

T22F11

√

T19L18

T9J22

√

F12C20

√

“√”代表植株在该分子标记结果中发生了交换

8. 突变体275-3基因组重测序结果分析

为了筛选到与突变体表型对应的候选基因，在做精细定位的同时，我们以精细定位用植株的基因组为实验组，同时取Ler野生型作为对照组，委托武汉康测科技有限公司对两组样品样品进行基因组重测序，并将测序数据组装在基因组上，分析SNP和In-Del标记，结果显示这区间标记与突变位点连锁，基因上仅有一个移码突变。用IGV软件打开测序原始数据，包括突变体275-3和野生型Ler，然后导入拟南芥Col-0的序列信息（https://www.arabidopsis.org/），在精细定位区间内（Chr02：10779026~11328569）比对突变体275- 3与两个野生型亲本的序列差异。排除了生态型不同引起的DNA序列差异后，我们发现在Chr02：11104201后插入一个碱基C，该位点对应的基因为At2g26060，除此之外在定位区间内未找到其他可疑位点（图18A）。因此将At2g26060列为候选基因。

为了印证基因组重测序结果，在该位点前后分别设计了一条正向引物和一条反向引物，扩增片段大小为570bp，然后进行片段测序（由北京擎科新业生物有限公司完成）。测序结果如图18B、18C所示，在Chr02：11104201后插入一个碱基C（Insertion），导致其后序列移码。

在NCBI（https://www.ncbi.nlm.nih.gov/pubmed/）上搜索该基因，发现已有发表相关文章，该基因突变后的表型与突变体275-3基本一致，证明该基因就是目的基因。

序列表

<110> 武汉大学

<120> 一种高效克隆植物性状相关突变基因的方法

<160> 180

<170> PatentIn version 3.5

<210> 1

<211> 21bp

<212> DNA

<213> 人工序列

<400> 1

tgtcgtccat cacagtttgc c 21

<210> 2

<211> 21bp

<212> DNA

<213>人工序列

<400> 2

aatctcgtgc tttcagcttc g 21

<210> 3

<211> 16bp

<212> DNA

<213>人工序列

<400> 3

gaggcttcct tcgtgt 16

<210>4

<211> 18bp

<212> DNA

<213>人工序列

<400> 4

acaaattgac gcttagac 18

<210>5

<211> 23bp

<212> DNA

<213>人工序列

<400> 5

ggcatgagag tctgtgatgt tgg 23

<210>6

<211>23bp

<212> DNA

<213>人工序列

<400>6

tagtactgct ccatctgcct tgg 23

<210>7

<211>25bp

<212> DNA

<213>人工序列

<400>7

ggaaaggaag aatcagacac agagc 25

<210>8

<211>23bp

<212> DNA

<213>人工序列

<400>8

gtaccgttcc tttcgtcact tcc 23

<210>9

<211>23bp

<212> DNA

<213>人工序列

<400>9

aacaaccagc gtatgcgttc tcg 23

<210>10

<211>23bp

<212> DNA

<213>人工序列

<400>10

cccacggctt tgtaggaaga agc 23

<210>11

<211>20bp

<212> DNA

<213>人工序列

<400>11

gagctgtttt ggactacggc 20

<210>12

<211>20bp

<212> DNA

<213>人工序列

<400>12

gagtagcttt ctcccacccc 20

<210>13

<211>20bp

<212> DNA

<213>人工序列

<400>13

gttgaatcaa gctgtgcagc 20

<210>14

<211>20bp

<212> DNA

<213>人工序列

<400>14

agctaggcaa agcatgcatg 20

<210>15

<211>23bp

<212> DNA

<213>人工序列

<400>15

ggtgacaaat tcagctgttg acc 23

<210>16

<211>22bp

<212> DNA

<213>人工序列

<400>16

caagctgcac caattcaaat gc 22

<210>17

<211>23bp

<212> DNA

<213>人工序列

<400>17

caatagaact tcgcaccgtc tcg 23

<210>18

<211>22bp

<212> DNA

<213>人工序列

<400>18

gtcatcagtg tgtggcttgt gc 22

<210>19

<211>22bp

<212> DNA

<213>人工序列

<400>19

aaatagatgc acaacggaga cg 22

<210>20

<211>20bp

<212> DNA

<213>人工序列

<400>20

gccgattgat gtttctttcc 20

<210>21

<211>23bp

<212> DNA

<213>人工序列

<400>21

catgctgatg cgattaagac tgc 23

<210>22

<211>23bp

<212> DNA

<213>人工序列

<400>22

ctaacctgtg ccttgtttga tgg 23

<210>23

<211>22bp

<212> DNA

<213>人工序列

<400>23

tgcatgtttg ccacagttag gg 22

<210>24

<211>21bp

<212> DNA

<213>人工序列

<400>24

cgagccaaat ttgtgcactc c 21

<210>25

<211>22bp

<212> DNA

<213>人工序列

<400>25

taatcaaaca tcggcacagt gg 22

<210>26

<211>22bp

<212> DNA

<213>人工序列

<400>26

gcgttgcgac actaaacaat gc 22

<210>27

<211>22bp

<212> DNA

<213>人工序列

<400>27

actcccgata gtagcaaata gg 22

<210>28

<211>22bp

<212> DNA

<213>人工序列

<400>28

atggacttta gtctcctctt cc 22

<210>29

<211>24bp

<212> DNA

<213>人工序列

<400>29

catgctagta agcaaagggc aacg 24

<210>30

<211>22bp

<212> DNA

<213>人工序列

<400>30

ttgcacgtcc aactgtccaa gc 22

<210>31

<211>24bp

<212> DNA

<213>人工序列

<400>31

aagtgcctcg aattacacat ctcc 24

<210>32

<211>22bp

<212> DNA

<213>人工序列

<400>32

gctgcttctg tccagtgaga cc 22

<210>33

<211>23bp

<212> DNA

<213>人工序列

<400>33

ttctttattc cctcgcactg acc 23

<210>34

<211>23bp

<212> DNA

<213>人工序列

<400>34

caatgatgcc acaaaccgta acc 23

<210>35

<211>25bp

<212> DNA

<213>人工序列

<400>35

agtaccacca ccattctctg caagc 25

<210>36

<211>21bp

<212> DNA

<213>人工序列

<400>36

tcgattggcc atgagttctc g 21

<210>37

<211>26bp

<212> DNA

<213>人工序列

<400>37

atcctagtgg ataaggcaca gactgg 26

<210>38

<211>22bp

<212> DNA

<213>人工序列

<400>38

cccttgctct tccacctcat cc 22

<210>39

<211>23bp

<212> DNA

<213>人工序列

<400>39

cggagtgaat gagtttgctc tgc 23

<210>40

<211>25bp

<212> DNA

<213>人工序列

<400>40

gtcataaccc tacctcccgt aatcc 25

<210>41

<211>23bp

<212> DNA

<213>人工序列

<400>41

tcaaaccaag gtccttcaac tgc 23

<210>42

<211>23bp

<212> DNA

<213>人工序列

<400>42

tttcttccac cgtccatgta tcc 23

<210>43

<211>22bp

<212> DNA

<213>人工序列

<400>43

ttctttcgag ggtacgtaga gg 22

<210>44

<211>22bp

<212> DNA

<213>人工序列

<400>44

ctagctagcc agtagctgat cg 22

<210>45

<211>22bp

<212> DNA

<213>人工序列

<400>45

gtacacaccc acatcgagaa gc 22

<210>46

<211>23bp

<212> DNA

<213>人工序列

<400>46

tccatggata tacgaggaga tgc 23

<210>47

<211>24bp

<212> DNA

<213>人工序列

<400>47

aagacacaag caaacagctc aacc 24

<210>48

<211>23bp

<212> DNA

<213>人工序列

<400>48

aagcttgctt ggttcaagag agg 23

<210>49

<211>23bp

<212> DNA

<213>人工序列

<400>49

gaggaggagg aggagagatc agg 23

<210>50

<211>22bp

<212> DNA

<213>人工序列

<400>50

aacgaaaccg ctcagttcaa cc 22

<210>51

<211>20bp

<212> DNA

<213>人工序列

<400>51

tttgggataa atgggagagg 20

<210>52

<211>22bp

<212> DNA

<213>人工序列

<400>52

tcagctggtt attatggaga gg 22

<210>53

<211>24bp

<212> DNA

<213>人工序列

<400>53

ccaatcttgt cttccggatc ttgc 24

<210>54

<211>23bp

<212> DNA

<213>人工序列

<400>54

agatagccat gggcgattct tgg 23

<210>55

<211>19bp

<212> DNA

<213>人工序列

<400>55

tttcagtgc atgtcttcg 19

<210>56

<211>22bp

<212> DNA

<213>人工序列

<400>56

gattgtatg catggttcaa ag 22

<210>57

<211>24bp

<212> DNA

<213>人工序列

<400>57

ccatcaagag atagtgctcc aacc 24

<210>58

<211>24bp

<212> DNA

<213>人工序列

<400>58

acacagccta tgtttagggt ttcc 24

<210>59

<211>23bp

<212> DNA

<213>人工序列

<400>59

ctagctagcc atgctctcgt acc 23

<210>60

<211>23bp

<212> DNA

<213>人工序列

<400>60

ctgtgactga cttggtcata ggg 23

<210>61

<211>21bp

<212> DNA

<213>人工序列

<400>61

agtaactc gatcaaactaa c 21

<210>62

<211>20bp

<212> DNA

<213>人工序列

<400>62

agagtccata tagaatttca 20

<210>63

<211>23bp

<212> DNA

<213>人工序列

<400>63

gtggtgctag tatggacgag agg 23

<210>64

<211>26bp

<212> DNA

<213>人工序列

<400>64

cggttggtag actgtaaaca aagtgc 26

<210>65

<211>25bp

<212> DNA

<213>人工序列

<400>65

gcggctctac gagctcctct actgg 25

<210>66

<211>24bp

<212> DNA

<213>人工序列

<400>66

gagctttgtc agcggatttg ttcg 24

<210>67

<211>24bp

<212> DNA

<213>人工序列

<400>67

catcctcaag gatcgtagaa ttgc 24

<210>68

<211>21bp

<212> DNA

<213>人工序列

<400>68

gagtaggtgc acgggttgag g 21

<210>69

<211>22bp

<212> DNA

<213>人工序列

<400>69

ggacgaaagg gtatttgatt gg 22

<210>70

<211>22bp

<212> DNA

<213>人工序列

<400>70

cctcaaggtg gtctccttct cc 22

<210>71

<211>22bp

<212> DNA

<213>人工序列

<400>71

cctattgctg catggtttag gg 22

<210>72

<211>23bp

<212> DNA

<213>人工序列

<400>72

tacacctggg cgtatgaaag agc 23

<210>73

<211>26bp

<212> DNA

<213>人工序列

<400>73

caccagctgt tgcttccata agtacc 26

<210>74

<211>22bp

<212> DNA

<213>人工序列

<400>74

gtcgacgtcc acgatgacta cc 22

<210>75

<211>24bp

<212> DNA

<213>人工序列

<400>75

gtatcttaca gagaaacggc atcg 24

<210>76

<211>24bp

<212> DNA

<213>人工序列

<400>76

ggtttgtttc aggttcgtct atcc 24

<210>77

<211>22bp

<212> DNA

<213>人工序列

<400>77

cttgggaaac ttcacctcat gg 22

<210>78

<211>25bp

<212> DNA

<213>人工序列

<400>78

ctgagagaag ccacaggatt aatgg 25

<210>79

<211>22bp

<212> DNA

<213>人工序列

<400>79

atgttgcact ccttcaatgt cc 22

<210>80

<211>21bp

<212> DNA

<213>人工序列

<400>80

catgagacaa tgccagaaag c 21

<210>81

<211>22bp

<212> DNA

<213>人工序列

<400>81

gtcgtcgacc catcggagcc ac 22

<210>82

<211>22bp

<212> DNA

<213>人工序列

<400>82

tggtcgaggt ggggatcggg tc 22

<210>83

<211>23bp

<212> DNA

<213>人工序列

<400>83

atatcactgg gcagacggag agc 23

<210>84

<211>22bp

<212> DNA

<213>人工序列

<400>84

acagcccaca gatcacaaca gc 22

<210>85

<211>24bp

<212> DNA

<213>人工序列

<400>85

gatgtacttg ccaacatgct ctcc 24

<210>86

<211>22bp

<212> DNA

<213>人工序列

<400>86

agcacacgcg agtgatgtaa cg 22

<210>87

<211>25bp

<212> DNA

<213>人工序列

<400>87

gagggaggga gtacatatct gatcg 25

<210>88

<211>23bp

<212> DNA

<213>人工序列

<400>88

agcaactgga taagcgattg agg 23

<210>89

<211>21bp

<212> DNA

<213>人工序列

<400>89

tggtatgtgg caattggatg g 21

<210>90

<211>26bp

<212> DNA

<213>人工序列

<400>90

aagagtcctt gtgagagtcc tgtacc 26

<210>91

<211>22bp

<212> DNA

<213>人工序列

<400>91

gcggacacac cagagaataa gc 22

<210>92

<211>22bp

<212> DNA

<213>人工序列

<400>92

gtgctgtcct gtccttgaat cc 22

<210>93

<211>20bp

<212> DNA

<213>人工序列

<400>93

cactcacacg aacgactgac 20

<210>94

<211>20bp

<212> DNA

<213>人工序列

<400>94

cgcaggttct tgtgaaatgt 20

<210>95

<211>22bp

<212> DNA

<213>人工序列

<400>95

cctcggttga gcaaatcaat cc 22

<210>96

<211>23bp

<212> DNA

<213>人工序列

<400>96

agctaactaa accgccgttc tcc 23

<210>97

<211>20bp

<212> DNA

<213>人工序列

<400>97

atcgatcgat cttcacgagg 20

<210>98

<211>20bp

<212> DNA

<213>人工序列

<400>98

tgctataaaa ggcattcggg 20

<210>99

<211>24bp

<212> DNA

<213>人工序列

<400>99

tcaccagggt cgttaaagta ctgc 24

<210>100

<211>24bp

<212> DNA

<213>人工序列

<400>100

gcaataccac atctgatcca cacc 24

<210>101

<211>22bp

<212> DNA

<213>人工序列

<400>101

aatttccgcg aaatcagcat cc 22

<210>102

<211>23bp

<212> DNA

<213>人工序列

<400>102

tcatctggac agtcgaggta cgc 23

<210>103

<211>16bp

<212> DNA

<213>人工序列

<400>103

ctttctaaag cacctt 16

<210>104

<211>16bp

<212> DNA

<213>人工序列

<400>104

gacacaattt tgacat 16

<210>105

<211>16bp

<212> DNA

<213>人工序列

<400>105

actcgaaaca atcaga 16

<210>106

<211>16bp

<212> DNA

<213>人工序列

<400>106

cttaatttgg gctcta 16

<210>107

<211>16bp

<212> DNA

<213>人工序列

<400>107

agtcaactgg ttaggg 16

<210>108

<211>16bp

<212> DNA

<213>人工序列

<400>108

tgtcattaat actgcc 16

<210>109

<211>16bp

<212> DNA

<213>人工序列

<400>109

agggaaagtg gacaag 16

<210>110

<211>16bp

<212> DNA

<213>人工序列

<400>110

atctgaatct ggctga 16

<210>111

<211>16bp

<212> DNA

<213>人工序列

<400>111

gtctgcttct gtcctc 16

<210>112

<211>16bp

<212> DNA

<213>人工序列

<400>112

cttccatggc tagtgc 16

<210>113

<211>20bp

<212> DNA

<213>人工序列

<400>113

gatatttgtt ttgctaacac 20

<210>114

<211>20bp

<212> DNA

<213>人工序列

<400>114

taataaagtt ccagctttga 20

<210>115

<211>20bp

<212> DNA

<213>人工序列

<400>115

cactgcaaca aagtggaaat 20

<210>116

<211>20bp

<212> DNA

<213>人工序列

<400>116

atccgtttca atatccacaa 20

<210>117

<211>20bp

<212> DNA

<213>人工序列

<400>117

tgcgggagtg tgatagaata 20

<210>118

<211>20bp

<212> DNA

<213>人工序列

<400>118

tcctcgaaag attcattgat 20

<210>119

<211>23bp

<212> DNA

<213>人工序列

<400>119

gaattctgta acatcccatt tcc 23

<210>120

<211>20bp

<212> DNA

<213>人工序列

<400>120

ggtctaattg ccgttgttgc 20

<210>121

<211>20bp

<212> DNA

<213>人工序列

<400>121

ggaccgacgg ttacgagagt 20

<210>122

<211>18bp

<212> DNA

<213>人工序列

<400>122

taacgggccg ttgcaaga 18

<210>123

<211>18bp

<212> DNA

<213>人工序列

<400>123

cgtgtttacc gggtcgga 18

<210>124

<211>19bp

<212> DNA

<213>人工序列

<400>124

aaaacccttg aagaatacg 19

<210>125

<211>19bp

<212> DNA

<213>人工序列

<400>125

tagtctgagc ttaccaata 19

<210>126

<211>18bp

<212> DNA

<213>人工序列

<400>126

ttaccctcga ctcgtaac 18

<210>127

<211>20bp

<212> DNA

<213>人工序列

<400>127

atgtatttgt tgcaaaataa 20

<210>128

<211>19bp

<212> DNA

<213>人工序列

<400>128

tgcacagaag aaaaaacta 19

<210>129

<211>18bp

<212> DNA

<213>人工序列

<400>129

tccgattcga ttaaactc 18

<210>130

<211>20bp

<212> DNA

<213>人工序列

<400>130

ttatttccta tttcaagact 20

<210>131

<211>18bp

<212> DNA

<213>人工序列

<400>131

atgaacggag tagctatc 18

<210>132

<211>20bp

<212> DNA

<213>人工序列

<400>132

cgcgtagaac ataatctgta 20

<210>133

<211>20bp

<212> DNA

<213>人工序列

<400>133

caatgggaag aaggtgtgag 20

<210>134

<211>20bp

<212> DNA

<213>人工序列

<400>134

cgcatttcca taagtttgtt 20

<210>135

<211>20bp

<212> DNA

<213>人工序列

<400>135

acctgttcag tctatgttac 20

<210>136

<211>20bp

<212> DNA

<213>人工序列

<400>136

gggaattatt aacattatca 20

<210>137

<211>20bp

<212> DNA

<213>人工序列

<400>137

atgagcttta ggagtgtgta 20

<210>138

<211>20bp

<212> DNA

<213>人工序列

<400>138

aattttgtcc caaaagaata 20

<210>139

<211>20bp

<212> DNA

<213>人工序列

<400>139

caaaagaaat gcaacgagac 20

<210>140

<211>20bp

<212> DNA

<213>人工序列

<400>140

tttgatcatg aatggtagtg 20

<210>141

<211>20bp

<212> DNA

<213>人工序列

<400>141

gagcaacatt aaggatagaa 20

<210>142

<211>22bp

<212> DNA

<213>人工序列

<400>142

atctcatact cataatatgt ag 22

<210>143

<211>20bp

<212> DNA

<213>人工序列

<400>143

ttatagcaaa cgtacaagtc 20

<210>144

<211>18bp

<212> DNA

<213>人工序列

<400>144

ctgcatacac gtcgtctc 18

<210>145

<211>18bp

<212> DNA

<213>人工序列

<400>145

ctggacccta gtggatgt 18

<210>146

<211>20bp

<212> DNA

<213>人工序列

<400>146

gacggttctc cattaattat 20

<210>147

<211>20bp

<212> DNA

<213>人工序列

<400>147

ttcggagaaa gaaacgacat 20

<210>148

<211>20bp

<212> DNA

<213>人工序列

<400>148

atggaactat tcaggcatta 20

<210>149

<211>18bp

<212> DNA

<213>人工序列

<400>149

gcaaccgctg ctgcttta 18

<210>150

<211>20bp

<212> DNA

<213>人工序列

<400>150

aatatttggc tttgcgtaga 20

<210>151

<211>20bp

<212> DNA

<213>人工序列

<400>151

accctaaaac aatgtctctt 20

<210>152

<211>20bp

<212> DNA

<213>人工序列

<400>152

tgctaacatg gaaatttgtc 20

<210>153

<211>18bp

<212> DNA

<213>人工序列

<400>153

ttatgcccat ttgaaacc 18

<210>154

<211>18bp

<212> DNA

<213>人工序列

<400>154

tgaaactttg ggcctcag 18

<210>155

<211>18bp

<212> DNA

<213>人工序列

<400>155

ttcatgagag cggcattc 18

<210>156

<211>20bp

<212> DNA

<213>人工序列

<400>156

gcaaaatgtt tggacaatta 20

<210>157

<211>18bp

<212> DNA

<213>人工序列

<400>157

cacaggccat tggatgta 18

<210>158

<211>19bp

<212> DNA

<213>人工序列

<400>158

tgttagaacc caccatttg 19

<210>159

<211>18bp

<212> DNA

<213>人工序列

<400>159

cctgttccaa tgaatatg 18

<210>160

<211>18bp

<212> DNA

<213>人工序列

<400>160

tgtagctgct gagttgtc 18

<210>161

<211>18bp

<212> DNA

<213>人工序列

<400>161

aaaaggcgac tactagca 18

<210>162

<211>18bp

<212> DNA

<213>人工序列

<400>162

gccatttatt tggtcaac 18

<210>163

<211>20bp

<212> DNA

<213>人工序列

<400>163

tgccacaatc ctagcttgtc 20

<210>164

<211>20bp

<212> DNA

<213>人工序列

<400>164

tatatgcttt tcttctctta 20

<210>165

<211>18bp

<212> DNA

<213>人工序列

<400>165

gattaattcg gcaggaaa 18

<210>166

<211>20bp

<212> DNA

<213>人工序列

<400>166

tcatgaacca taaaactaaa 20

<210>167

<211>20bp

<212> DNA

<213>人工序列

<400>167

ttatgttgtg ttggagttgg 20

<210>168

<211>20bp

<212> DNA

<213>人工序列

<400>168

ttggtatgaa tacgttctaa 20

<210>169

<211>20bp

<212> DNA

<213>人工序列

<400>169

ataggcatta tagttatgag 20

<210>170

<211>18bp

<212> DNA

<213>人工序列

<400>170

tttcgacatt ggcttgaa 18

<210>171

<211>18bp

<212> DNA

<213>人工序列

<400>171

gggtctgaat ggaagaac 18

<210>172

<211>20bp

<212> DNA

<213>人工序列

<400>172

gtaggacaaa accaagtaca 20

<210>173

<211>18bp

<212> DNA

<213>人工序列

<400>173

cgtggattag agatcact 18

<210>174

<211>19bp

<212> DNA

<213>人工序列

<400>174

tttgaatttc ttctaagag 19

<210>175

<211>18bp

<212> DNA

<213>人工序列

<400>175

agtttggaca ttggaata 18

<210>176

<211>20bp

<212> DNA

<213>人工序列

<400>176

actctaaacc aaaaattaag 20

<210>177

<211>18bp

<212> DNA

<213>人工序列

<400>177

gcgacaatgg cactacac 18

<210>178

<211>18bp

<212> DNA

<213>人工序列

<400>178

cttccatcgc tctgtcac 18

<210>179

<211>18bp

<212> DNA

<213>人工序列

<400>179

tcctttgtcg tcttgttg 18

<210>180

<211>20bp

<212> DNA

<213>人工序列

<400>180

attttaacga aaaatattac 20

Claims

1.一种高效克隆植物性状相关突变基因的方法，其特征在于，包括如下步骤：

(1)近亲杂交父母本的选择及作图群体的构建；

(2)对作图群体进行表型遗传分析并统计遗传分离比，确定性状由单基因遗传控制；

(3)构建父本DNA Pool、母本DNA Pool和作图群体DNA Pool，根据已有的分子标记信息，以父本DNA Pool、母本DNA Pool、作图群体DNA Pool为对象，分析分子标记的有效性与分离情况；计算作图群体中分子标记的配子频率，分析分子标记与突变基因的连锁情况，确定突变基因在染色体上存在的位置，进一步对该位置附近的其他分子标记进行PCR扩增和分析，确定突变位点的大致区域；

(4)选取父本DNA Pool、母本DNA Pool和作图群体DNA Pools中的三个或两个DNAPools进行重测序，分析不同DNA Pool之间的SNP和In-Del标记，检测同一个标记在不同DNAPool之间的频率差值和分布，结合步骤(3)所得突变位点的大致区域结果以及SNP和In-Del标记在该区域的频率差值分布和连锁情况，进一步缩小突变位点所在区间；所述选取两个DNA Pools重测序时，其中一个DNA Pools为作图群体DNA Pools，另一个DNA Pool为父本DNA Pool或母本DNA Pool；

(5)根据重测序结果对区间内的SNP和In-Del标记进行PCR验证，利用位点特异性PCR、酶切多态性PCR和测序技术确定这些位点在群体中的连锁情况，确定最终在突变位点两端的标记，分析这两个标记中间的序列，定位突变位点并克隆。

2.根据权利要求1所述的高效克隆植物性状相关突变基因的方法，其特征在于，步骤(1)中所述近亲杂交为亚种内杂交。

3.根据权利要求1所述的高效克隆植物性状相关突变基因的方法，其特征在于，所述作图群体选用F2群体、近等基因系群体、或重组自交系群体。

4.根据权利要求1所述的高效克隆植物性状相关突变基因的方法，其特征在于，步骤(2)中所述父本DNA Pool的构建过程：父本取不低于十株植株的基因组等量混合形成父本DNA Pool；所述母本DNA Pool的构建过程：母本取不低于十株植株的基因组等量混合形成母本DNA Pool。

5.根据权利要求1所述的高效克隆植物性状相关突变基因的方法，其特征在于，步骤(2)所述作图群体DNA Pool的构建过程：取作图群体所有植株的基因组等量混合形成群体DNA Pool。

6.根据权利要求1所述的高效克隆植物性状相关突变基因的方法，其特征在于，步骤(4)所述重测序分析不同DNA Pool之间的SNP和In-Del标记的频率和分布，限定每个位点标记的支持reads数不低于10，以确保克隆效率。