CN106995845B - 利用三代测序平台(PacBio RS II)进行多倍体中基因等位变异挖掘的方法 - Google Patents

利用三代测序平台(PacBio RS II)进行多倍体中基因等位变异挖掘的方法 Download PDF

Info

Publication number
CN106995845B
CN106995845B CN201710214678.3A CN201710214678A CN106995845B CN 106995845 B CN106995845 B CN 106995845B CN 201710214678 A CN201710214678 A CN 201710214678A CN 106995845 B CN106995845 B CN 106995845B
Authority
CN
China
Prior art keywords
genes
gene
allelic variation
sus1
wheat
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710214678.3A
Other languages
English (en)
Other versions
CN106995845A (zh
Inventor
刘冬成
张爱民
马晓玲
穆罕默德·萨贾德
余慷
阳文龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Genetics and Developmental Biology of CAS
Original Assignee
Institute of Genetics and Developmental Biology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Genetics and Developmental Biology of CAS filed Critical Institute of Genetics and Developmental Biology of CAS
Priority to CN201710214678.3A priority Critical patent/CN106995845B/zh
Publication of CN106995845A publication Critical patent/CN106995845A/zh
Application granted granted Critical
Publication of CN106995845B publication Critical patent/CN106995845B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种使用第三代测序平台(PacBio RS II)高效进行多倍体中基因等位变异挖掘的方法。本发明使用的材料为六倍体小麦,以多个材料中多个淀粉合成相关基因为研究对象,进行这些基因等位变异筛选。首先设计这些基因的小麦A、B和D基因组的保守引物,同时在这些引物前端分别加上识别不同材料的Barcode序列,然后选择不同材料的基因组DNA和相应的引物进行PCR扩增,进行三代测序,从而得到不同材料、多个基因中同时含有三个拷贝的序列信息,可方便有效地实现多倍体中高相似性基因的等位变异检测,也可实现基因家族成员的克隆和等位变异的挖掘。本发明同时可批量检测几十份材料中几十个基因的等位变异,并且数据可靠,具有高通量、低成本等优势。

Description

利用三代测序平台(PacBio RS II)进行多倍体中基因等位变 异挖掘的方法
技术领域
本发明属于基因工程领域,具体是通过三代测序平台(PacBio RS II)检测多倍体材料中基因等位变异的方法。
背景技术
小麦作为三大粮食作物之一,在世界范围内广泛种植。小麦基因组庞大且复杂(2n=6x=42),是由A、B和D三个同源性极高的基因组组成的异源六倍体。分子标记辅助选择(MAS)的应用加速了小麦育种的进程,MAS的研究思路:克隆目标性状相关基因,鉴定更多等位变异,通过关联分析推测基因功能并开发相应的标记辅助育种。在过去几十年间,育种家通过在小麦中利用传统的分子标记如:SSR、RFLP、AFLP、RAPD和DArT等,鉴定出许多控制重要农艺性状的QTL。QTL mapping的缺点是不仅耗时而且价格昂贵,同时由于小麦基因组的特点,在小麦中进行图位克隆的研究相对比较困难(Barrero等)。许多研究表明水稻、小麦、大麦和玉米等不同植物基因组间遗传标记和基因的线性顺序是非常保守的(Choi等;Fulton等;Gale 和 Devos;Gupta等),这为通过比较基因组学方法在小麦中进行基因挖掘提供了强有力的工具。
目前鉴定到的控制大多数农艺性状的基因均为不同的等位变异,如:在水稻中SSIIIa的一种等位变异与抗性淀粉含量呈负相关(Zhou等);在小麦中Pinb-D1b作为Pinb的一种等位变异与优质磨粉品质呈正相关(Chen等);Hap-6A-A作为TaGW2-6A的一种优异等位变异表现为与粒宽和千粒重呈显著正相关。这些结果都显示了等位基因的重要性,因此,当前研究的热点是通过基因间多态性的鉴定,筛选出更多有利等位变异,从而为作物育种提供参考。
由于多倍体物种中基因的特点是同一基因的不同基因组序列相似性非常高,目前关于多倍体中基因等位变异检测的方法,主要包括传统的Sanger测序和Illumina等二代测序,但是他们都存在一些缺点,主要表现为:传统的Sanger测序方法不仅耗时耗力,而且通量太低;Illumina等二代测序平台虽然通量高,但是读长太短,这严重影响了多倍体中同一基因不同基因组序列的有效组装。而第三代测序(PacBio RS II)作为一种新的测序平台可直接用于多倍体中基因等位变异的挖掘,其优点表现为通量高(平均每个SMRT cell中有70,000个ZMWs产生序列)和读长长(平均读长可达到约10 kb),PacBio RS II是一种单分子实时DNA测序系统(SMRT),不需要任何PCR的过程。每个SMRT cell中含有150,000零模波导孔(ZMWs),每个ZMW同时包含一个DNA聚合酶和一条DNA样品链进行单分子测序,可以实时检测插入碱基的荧光信号。同时PacBio RS II测序系统在细菌基因组的de-novo组装(Rasko等;Mou等)、叶绿体基因组组装(Chen等)、补齐基因组缺口(Zhang等)、全长转录本的获得及转录本突变体的筛选(Ocwieja等)等方面得到了很好的应用。最近该技术也被用于小麦谷蛋白基因的克隆中,研究者利用从一个SMRT Cell测序数据中得到10个品种的424个小麦储藏蛋白基因(Zhang等),该技术单分子及平均读长相对长的特性有效地保证对A、B和D三个高度相似基因组序列的识别,在小麦家族基因克隆及等位变异挖掘方面具有很强的优势。
淀粉占小麦籽粒干重的70 %左右,其组成和比例直接影响小麦面粉品质,而淀粉的合成是由一系列酶基因控制。前人对六倍体小麦中淀粉合成途径相关基因优良等位变异筛选开展了一些研究,如TaSuSy1TaSuSy2,但是在小麦中开展整个淀粉合成途径相关基因等位变异筛选的研究相对较少。因此,通过PacBio RS II三代测序平台对中国现有种质材料中淀粉合成途径相关基因的等位变异进行鉴定显得尤为重要。
发明内容
本发明的目的是为了解决多倍体物种(小麦、大豆等)中基因等位变异检测的技术问题,提出一种高效检测六倍体小麦中高相似性基因等位变异的方法。
本发明提供的检测多倍体中基因等位变异的方法,包括如下步骤:
1)根据待测多倍体基因的参考序列设计其保守引物;所述引物对扩增的PCR产物的长度为4-5 kb,且此区段包含多个外显子和内含子;在正反向引物的5'前端都加上不同的Barcode,所述的Barcode序列长度为8-12 bp的Barcode序列,不同Barcode组合的正反向引物来识别不同的材料;
2)选择不同材料的基因组DNA和相应的引物进行PCR扩增,得到PCR扩增产物;
3)对步骤2)得到的PCR产物进行定量,对来自不同材料不同基因的PCR产物进行等量混合;
4)对步骤3)的混合物进行纯化后,得到的混合产物文库可直接用于测序;
5)对步骤4)得到的文库进行三代测序,从而得到不同材料、多个基因中同时含有相似性较高的不同拷贝的序列信息;
6)对步骤5)得到的所有序列信息进行多重比对从而达到等位变异筛选的目的。
所述的方法,其中第3)步所述的定量采用琼脂糖凝胶电泳仪或Fragmentanalyzer仪进行;所述不同材料为六倍体小麦中36个自然群体小麦材料。
所述的方法,其中第4)步所述的纯化是磁珠法。
所述的方法,其中所述三代测序是采用PacBio RS II测序平台,可以方便有效地实现多倍体中相似性高的基因的等位变异的检测。
所述的方法,其中所述多倍体为小麦。
所述的方法,其中所述待测多倍体基因为六倍体小麦中A、B和D基因组序列。
所述的方法,其中所述基因为29个淀粉合成相关基因,因而所述保守引物为分别扩增29个淀粉合成相关基因的A、B和D基因组的保守引物。
上述方法中,所述根据第三代测序平台批量进行不同材料不同基因等位变异筛选的的方法为:将所述PCR扩增产物经定量和等量混合后,再经纯化后,通过三代测序平台获得待测材料中待测基因的所有序列信息,经多重序列比对从而达到等位变异筛选的目的。
本发明还提供所述的引物,或所述的方法在多倍体小麦中进行基因等位变异筛选的应用:进行重要基因等位变异的筛选,从而为培育优质小麦品种提供参考。
所述的应用是在筛选多倍体中高相似性基因等位变异的应用。
本发明所述的方法可用于序列相似性较高的基因家族基因序列的多态性分析。
本发明具有以下有益效果:本发明为解决多倍体基因等位变异检测的技术问题,提供一种检测方法,有助于快速有效地进行不同小麦材料中同一基因或多个基因等位变异的筛选。该方法基于普通小麦品种中基因的多拷贝及长读长的特点:在基因的保守区段设计A、B和D基因组序列通用的PCR引物,同时在正反向引物的5'前端分别加上区别不同材料的8-12 bp的Barcode序列,通过普通PCR扩增的方法得到不同材料的同一基因的DNA片段,扩增长度为4-6 kb,然后对不同材料不同基因的PCR产物进行等量混合并建库,再经PacBioRS II测序得到含有不同Barcode的DNA片段序列信息,经比对分析得到这些基因序列的多态性,从而实现高通量的对不同小麦品种中同一基因或多个基因等位变异的挖掘。应用该策略可以对多倍体中同一材料的不同基因组序列进行比对分析;可以对不同材料的同一基因进行等位变异的分离鉴定;也可以对不同材料的多个基因进行快速有效的等位基因的分离鉴定。
本发明方法中,根据实验室前期研究的结果以及在小麦中国春中通过Sanger测序法对29个淀粉合成相关基因进行的测序分析,同时用第三代测序平台进行淀粉合成相关基因的分离鉴定验证了该第三代测序平台的有效性,也表明了该等位变异筛选系统的准确性和可靠性。
本发明方法无需昂贵的仪器和试剂,通过常规的PCR仪、琼脂糖凝胶电泳仪和Fragment analyzer仪就可以完成样品的准备,制备好的样品送测序公司测序,易于操作。本发明方法基于用于PCR扩增的正反向引物5'前端不同的Barcode序列组成用于区分来自不同材料的同一基因序列,可以有效分离并准确鉴定来自不同材料的同一基因的序列信息,从而进行此基因新等位变异的筛选和鉴定。在本发明方法中,通过一次PCR反应、定量、混合和纯化过程就可以获得多个小麦品种中一个或多个基因的序列信息,而且PCR仪、琼脂糖凝胶电泳仪和Fragment analyzer仪都是自动化和高通量的仪器。本发明方法极大地提高了基因鉴定的效率和准确性。
本发明方法基于第三代测序平台进行基因多态性的鉴定,由于PacBio RS II平均读长可达到约10 kb,可使小麦中相似性高的A、B和D基因组序列进行准确组装,同时通过单次测序可得到含有目的片段全长的序列信息,不仅方便快捷而且价格便宜,表现为可单次对批量基因进行操作。
本发明方法不仅适用于多倍体中基因等位变异的筛选,同样适用于序列相似性较高的基因家族基因序列的多态性分析。该发明将直接促进基因等位变异的筛选以及在作物育种中对优异等位基因的应用。
附图说明
图1 中国春蔗糖合酶(TaSus1)基因的结构,其中:CDSf,第一个外显子;CDSi,内部的外显子;CDSI,最后的外显子。
图2 不同材料中TaSus1基因的多序列比对结果。
图3 TaSus1基因在部分小麦材料中的等位变异。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、小麦中国春中蔗糖合酶(TaSus1)基因的A、B和D基因组序列分析
一、引物设计
参考国际上已公布的小麦基因组数据库信息(包括中国春、乌拉尔图小麦和粗山羊草基因组框架图序列),对中国春中蔗糖合酶(TaSus1)基因进行了预测,结果表明:TaSus1基因不同基因组序列的共同特点是序列较长,参考预测结果,设计该基因A、B和D基因组序列的保守引物SEQ ID NO :1和SEQ ID NO :2(表2),此引物对扩增的PCR产物的长度约为4.2 kb,这样通过一次PCR扩增可得到TaSus1基因全长基因组序列。
二、中国春中TaSus1基因的A、B和D基因组序列分析
小麦品种中国春来自中国科学院遗传与发育生物学研究所植物细胞与染色体工程国家重点实验室,最初购于河南舞阳县种子公司。
利用CTAB法从中国春的叶片中提取基因组DNA。
根据表2中的引物SEQ ID NO :1和SEQ ID NO :2,以中国春叶片的基因组DNA为模板进行PCR扩增,反应体系如下:
LA Taq (5 U/μL)(Takara公司) 0.2 μL
2 × buffer I 10 μL
dNTP (10 mM) 0.8 μL
上游引物(10 μM) 0.5 μL
下游引物(10 μM) 0.5 μL
ddH<sub>2</sub>O 7 μL
模板DNA(100 ng/μL) 1 μL
反应总体积 20 μL
PCR扩增产物通过Fragment analyzer仪定量和磁珠法(AMPure PB Beads)纯化后,送公司进行PacBio RS II平台测序,通过单次测序反应可得到TaSus1基因的三类序列信息,初步命名为TaSus1-1、TaSus1-2和TaSus1-3,这三类序列再经过与已知参考序列进行比对后,分别将其归类为TaSus1-ATaSus1-BTaSus1-D;通过DNAMAN软件进行多重比对分析发现三个基因组的序列相似性非常高,仅有个别SNP的差异;经softberry(www.softberry.com)对基因结构进行预测表明:TaSus1-ATaSus1-BTaSus1-D都是由15个外显子和13个内含子组成,其基因组序列长度分别为4037 bp、4011 bp和3999 bp(图1)。
三、对中国春中TaSus1基因的Sanger测序验证
已知六倍体小麦中TaSus1的三个基因组序列相似性非常高,通过设计此基因的保守引物,经单次PCR扩增得到PCR产物,再经PacBio RS II测序后可直接得到包含编码区序列全长的TaSus1-ATaSus1-BTaSus1-D三类序列,为了验证PacBio RS II测序的准确性,将由同一保守引物扩增得到的中国春中TaSus1基因进行克隆,再通过Sanger测序法获得TaSus1的A、B和D基因组序列信息,将得到的序列与PacBio RS II测序的序列进行多序列比对,发现两次测序得到的TaSus1基因的三个拷贝序列完全一致,相似性达到了100 %。结果表明:PacBio RS II可直接用于多倍体中单个或多个基因等位变异的筛选,同样适用于序列相似性较高的基因家族基因序列的多态性分析,并且数据可靠,具有高通量、低成本等优势。同时,Sanger测序的缺点也显示出来:(1)由于Sanger测序系统的平均每个反应读长为800bp,而我们目标片段长度为4-5 kb,因此要得到含有目的片段的每个单克隆需要测5-7个反应,这增加了准确组装的难度;(2)若要获得每个基因的A、B和D三个基因组的序列信息,需要进行大量的单克隆测序,不仅耗时,而且价格昂贵;(3)很难单次对批量基因进行操作。因此,通过PacBio RS II测序平台可以高效的辅助检测多倍体中基因等位变异。
实施例2、36份小麦品种中29个淀粉合成相关基因A、B和D基因组序列的差异
通过对中国春29个淀粉合成相关基因的A、B和D基因组序列分析,发现这些基因的序列存在如下特点:(1)基因序列较长,如TaAGPS基因的A、B和D基因组序列长度较长,分别为7528 bp、6245 bp和6071 bp,TaSus1基因的A、B和D基因组序列长度较长,分别为4037bp、4011 bp和3999 bp;(2)A、B和D基因组序列相似性较高。根据这两个特点,提出了一种通过三代测序手段(PacBio RS II)批量检测多倍体中基因等位变异的策略:参考基因间保守区段设计A、B和D基因组序列通用的PCR引物,同时在正反向引物的5'前端都加上区别不同材料的8-12 bp的Barcode序列,通过普通PCR扩增的方法得到不同材料的同一基因的DNA片段,扩增长度为4-6 kb,然后对不同材料不同基因的PCR产物进行等量混合并建库,再经PacBio RS II测序得到含有不同Barcode的DNA片段序列信息,经比对分析得到这些基因序列的多态性,从而实现高通量的对不同小麦品种中同一基因或多个基因等位变异的挖掘。
一、引物设计
设计了29个淀粉合成相关基因的特异引物(表1),这些引物都为A、B和D基因组的保守引物,且扩增的目的片段的长度为4-6 kb,同时此区段包含了多个外显子和内含子。
由于三代测序中每个SMRT cell中可以包含多个材料中多个基因的扩增产物,若此SMRT cell中包含36份材料的29个淀粉合成相关基因,为了区别SMRT cell中来自36份材料中同一基因的序列信息,在正反向引物的5'前端都加上不同的Barcode。以TaSus1基因为例,设计的此基因的特异引物为SEQ ID NO :1和SEQ ID NO :2(表2),在Barcode的选择上,为了保证PCR反应的扩增效率,我们挑选了长度为8-12 bp的一系列Barcode序列,同时为了节约成本我们设计了包含不同Barcode的6条正向引物和6条反向引物共12条序列(表2),采用正反向引物的不同组合方式来识别这36份材料(表3)。
表1、29个淀粉合成相关基因的保守引物序列
基因编号 正向引物序列(5'-3') 反向引物序列(5'-3')
1 CGCCGTGAGTTGTCACTCC ACCGGATGTGGAAGCCTTCT
2 GGCTCAAGTCCTGAAGACTGTA TGCCAAAACATCCAGATTCC
3 ATGTCATCGATGCAGTTCAGC GGCGGTGCTCTACACGAC
4-1 GTGTCAAGGAACCAAGCAACC GCTGTTCAGACAATTACTGACAGG
4-2 GTTCTCGGAATTATTCTTGGAG CTGTATTGCTGCATTTGCATC
5 GATGGCGGCTCTGGTCACGTC CTCTCTTCAGGGAGCGGCGA
6 GATR(A/G)TGCACATTGGGAACAGA TGGAGATTTCAGGGAGTGGC
7 CTGCAAGTGAGCAGGATTCT TGCAGTTCACCAAGCCAATT
8 GCACTCCTGCCTGTCTATCTG GGACGTCCTCGTAGAGCTTG
9 CGTTCCTCTTGCTCGTGG ATGTGCAGTTAAAGATTGAGGTG
10-1 GCATCATTCAGATCCTCCTAATAG CATCCCCTGATTTCACCATCT
10-2 CGAAGGTTTCTGCTTTCCC CGGCTCCGTCGAAACTGAA
11-1 TAGCACCCAAGGACAGGACC GACGGCAATGTAAATCCTTCAC
11-2 GTGAAGGATTTACATTGCCGTC GACGTCTGCGTGTCACATGC
12 CACAGCAAACCAAGTAGAGCAT GCTGAAATCGATCGTCATGTC
13 TCTGCGCCAAGAGACTACAC TGTCCACCAAACATCAGAGC
14-1 CTGCTCCTCAGGAAGAAGGAC CGAGAATCCCACATCCAA
14-2 GATTCTTACTGTCAAACGCGAG TTACTCTGTAAGGGCATACACGA
15 CATCCCAGGAAACAACAACAG GTTCATTGGAGCATAGACAACAC
16 GCTTCCTTGGGAGGCTCTC GCAACGAATCGGCTATTCTC
17 GCATTTGGATGGATTCGG CGCATCCCGAGAAGTTCAG
18 CTTCTTTGATGGTCCAGCG CTGAGGTCTAATGGTGCACAAC
19 GCTTTCAGCCGTGCTAACTTC CAGTGTTCAGAATCCAGTCATC
20 GGAAGGTGCACCTATGGCC CAGGCTTCGTACGTTGCTTC
21 CGCTCTGGCAGGTGATTAC GCTTCTTCGAGGCTAAGGC
22 GATCGCAGATGGTTCTTTCT GGGCTATCGTTACTTTCCAG
23-1 AGTGTTGATATCCTAGTGGCTGT CACGACCAGACCAAATGAAA
23-2 CCTCCTAGATTCCCCGCCT CGACCAGACCAAATGAAAACTAC
24 GGAY(C/A)AGCAATGGGGGAGAC GAATCAAGAACGGTAAAGCGG
25 GTAATAATGCGAATCTGCCCC CCAGCAGAATGCACACGAA
26 GATCAACGGGTACCTGGAGG CGAGGCGGTAGATGTGAGG
27 AGATGGACGTGGAGAAGGTGA CGAGGATGGCGTTGAAGAAG
28 ACGTCCAGGTATACCACACGTA CAGTTAGTTACCCGTCAACACC
29 ATCGCCTTCTCCGTGCTCA GACCATGTTTCACACCGACAA
表2、扩增36份材料中TaSus1基因的引物信息
引物名称 引物序列(5'-3')
Sus1-F AGTGTTGATATCCTAGTGGCTGT SEQ ID NO :1
Sus1-R CACGACCAGACCAAATGAAA SEQ ID NO :2
Sus1-1F GAGGCTTGAGTGTTGATATCCTAGTGGCTGT SEQ ID NO :3
Sus1-2F CCTCCAGGAGTGTTGATATCCTAGTGGCTGT SEQ ID NO :4
Sus1-3F CCTACTAGAGTGTTGATATCCTAGTGGCTGT SEQ ID NO :5
Sus1-4F GGCTGAGGAGTGTTGATATCCTAGTGGCTGT SEQ ID NO :6
Sus1-5F GGAACCTGAGTGTTGATATCCTAGTGGCTGT SEQ ID NO :7
Sus1-6F CTTCGCCAAGTGTTGATATCCTAGTGGCTGT SEQ ID NO :8
Sus1-1R CCACCTGCACACGACCAGACCAAATGAAA SEQ ID NO :9
Sus1-2R GGTGGACCACACGACCAGACCAAATGAAA SEQ ID NO :10
Sus1-3R GAACACTCACACGACCAGACCAAATGAAA SEQ ID NO :11
Sus1-4R GAGAATCCACACGACCAGACCAAATGAAA SEQ ID NO :12
Sus1-5R CGTGGTCGACACGACCAGACCAAATGAAA SEQ ID NO :13
Sus1-6R GGTAGGTCACACGACCAGACCAAATGAAA SEQ ID NO :14
表3、扩增36份材料的引物组合信息
材料编号 材料名称 引物组合
1 莱州3279 Sus1-1F/Sus1-1R
2 泰山9818 Sus1-1F/Sus1-2R
3 红须麦 Sus1-1F/Sus1-3R
4 陕354 Sus1-1F/Sus1-4R
5 中麦533 Sus1-1F/Sus1-5R
6 石优17号 Sus1-1F/Sus1-6R
7 潍麦7号 Sus1-2F/Sus1-1R
8 轮选361 Sus1-2F/Sus1-2R
9 小三月黄 Sus1-2F/Sus1-3R
10 石麦21 Sus1-2F/Sus1-4R
11 耐盐101 Sus1-2F/Sus1-5R
12 京花7号 Sus1-2F/Sus1-6R
13 洲元9369 Sus1-3F/Sus1-1R
14 济麦2号 Sus1-3F/Sus1-2R
15 平原50 Sus1-3F/Sus1-3R
16 沧5412 Sus1-3F/Sus1-4R
17 新冬26 Sus1-3F/Sus1-5R
18 洛旱6号 Sus1-3F/Sus1-6R
19 石新539 Sus1-4F/Sus1-1R
20 97-3222 Sus1-4F/Sus1-2R
21 Atlas 66 Sus1-4F/Sus1-3R
22 科遗6014 Sus1-4F/Sus1-4R
23 京冬8号 Sus1-4F/Sus1-5R
24 冀麦31 Sus1-4F/Sus1-6R
25 烟农5286 Sus1-5F/Sus1-1R
26 农大3159R Sus1-5F/Sus1-2R
27 冀麦2号 Sus1-5F/Sus1-3R
28 河北野麦子1 Sus1-5F/Sus1-4R
29 沧麦119 Sus1-5F/Sus1-5R
30 济麦19 Sus1-5F/Sus1-6R
31 信B891 Sus1-6F/Sus1-1R
32 内麦11 Sus1-6F/Sus1-2R
33 白芒麦 Sus1-6F/Sus1-3R
34 黑小麦76 Sus1-6F/Sus1-4R
35 农大多系1号 Sus1-6F/Sus1-5R
36 山融3号 Sus1-6F/Sus1-6R
二、不同小麦材料中淀粉合成相关基因的PCR扩增、检测、定量和混合
36份小麦材料来自中国科学院遗传与发育生物学研究所植物细胞与染色体工程国家重点实验室。
利用CTAB法从小麦材料的叶片中提取基因组DNA。以36份小麦材料的基因组DNA为模板,然后利用每份材料相应的引物组合(如表3)进行PCR扩增,反应体系如下:
LA Taq (5 U/μL)(Takara公司) 0.1 μL
2 × buffer I 5 μL
dNTP (10 mM) 0.4 μL
上游引物(10 μM) 0.25 μL
下游引物(10 μM) 0.25 μL
ddH<sub>2</sub>O 1.5 μL
模板DNA(20 ng/μL) 2.5 μL
反应总体积 10 μL
为了保证每个基因都能产生A、B和D三个基因组的序列信息,PCR反应过程中的循环数应尽量降低,一般为30-32,首先参考琼脂糖凝胶电泳的相对定量结果(前提是明确琼脂糖凝胶电泳结果中不同亮度的条带与浓度之间的倍数关系),把同一基因不同材料的PCR产物进行等量混合,从而得到29管不同基因的混合产物。然后采用Fragment analyzer仪对不同基因的混合产物进行精确定量,参考定量的结果,对不同基因的PCR混合物进行等量混合。最终形成的单管混合产物为构建好的用于PacBio RS II测序的文库,为了满足测序要求,此文库的原始浓度为10 µg左右。
三、库样品的纯化
为了保证测序样品的特异性,通过磁珠法(AMPure PB beads)对文库样品进行纯化,纯化后样品浓度为4-5 µg,纯化过程如下:
(1)实验前上下颠倒AMPure PB beads,加1×Beads于PCR反应液中(即500 µl PCR产物+500 µl Beads),上下颠倒混匀;
(2)室温放置5 min,用于磁珠和核酸结合;
(3)然后把EP管置于磁力架上至溶液澄清,弃上清;
(4)现配80 %乙醇,加入相对于PCR产物2倍体积量的80 %乙醇,混匀,再置于磁力架上,室温30s,弃上清;
(5)重复4;
(6)掀开盖在磁力架上干燥10 min;
(7)加100 µl水洗脱DNA,混匀,上下颠倒后置于磁力架上;
(8)转移100 µl上清置于新离心管中。
此样品直接送千年基因或华大基因等测序公司测序。
四、PCR产物测序结果的分析
通过对单个SMRT cell的测序结果分析表明,经测序后产生78,280条subreads(52.19 %ZMWs利用率),且此SMRT cell产生的CCS(circular consensus sequence)原始数据为36,311条reads,其中有31,230条CCS reads(86.01 %)通过序列同源性比对能够匹配到基因上,然后根据识别不同材料的Barcode序列将25,343条CCS reads(69.79 %)拆分到不同材料中。也就是说,这25,343条reads含有扩增基因的全长序列,即为有效数据。由于我们构建的文库中包含有36份材料中29个基因的A、B和D三个拷贝,同时经过PacBio RS II测序后产生25343条有效reads,那么理论上每份材料的每个基因的单个拷贝可产生约8条reads。实际上通过对每份PCR产物的精确定量也可保证后续测序产生的每份材料中每个基因序列的一致性。因此,我们可通过PacBio RS II测序平台可以批量获得几十份材料中几十个基因的序列信息。
为了进一步分析测序得到的这些基因序列中是否能够满足找等位变异的目的,选择36份材料的TaSus1基因序列进行分析,每份材料中TaSus1的reads数目的分布虽然存在差异(1-132 reads),但是大多数材料都能得到TaSus1基因的2-3个拷贝的序列信息,通过对部分材料中TaSus1基因进行多序列比对发现,这些序列中确实含有TaSus1基因的三个拷贝(TaSus1-ATaSus1-BTaSus1-D)(图2);比较不同材料的TaSus1基因的同一拷贝的序列信息,在TaSus1的B基因组的Exon 10上找到一种新等位变异(图3)。综上所述,通过PacBioRS II测序平台可以批量检测几十份材料中几十个基因的等位变异,并且数据可靠,具有高通量、低成本等优势。
核苷酸序列表
<110>中国科学院遗传与发育生物学研究所
<120>利用三代测序平台(PacBio RS II)进行多倍体基因等位变异挖掘的方法
<160> 14
<210> 1
<211> 23
<212> DNA
<400> 1
AGTGTTGATATCCTAGTGGCTGT
<210> 2
<211> 20
<212> DNA
<400> 2
CACGACCAGACCAAATGAAA
<210> 3
<211> 31
<212> DNA
<400> 3
GAGGCTTGAGTGTTGATATCCTAGTGGCTGT
<210> 4
<211> 31
<212> DNA
<400> 4
CCTCCAGGAGTGTTGATATCCTAGTGGCTGT
<210> 5
<211> 31
<212> DNA
<400> 5
CCTACTAGAGTGTTGATATCCTAGTGGCTGT
<210> 6
<211> 31
<212> DNA
<400> 6
GGCTGAGGAGTGTTGATATCCTAGTGGCTGT
<210> 7
<211> 31
<212> DNA
<400> 7
GGAACCTGAGTGTTGATATCCTAGTGGCTGT
<210> 8
<211> 31
<212> DNA
<400> 8
CTTCGCCAAGTGTTGATATCCTAGTGGCTGT
<210> 9
<211> 29
<212> DNA
<400> 9
CCACCTGCACACGACCAGACCAAATGAAA
<210> 10
<211> 29
<212> DNA
<400> 10
GGTGGACCACACGACCAGACCAAATGAAA
<210> 11
<211> 29
<212> DNA
<400> 11
GAACACTCACACGACCAGACCAAATGAAA
<210> 12
<211> 29
<212> DNA
<400> 12
GAGAATCCACACGACCAGACCAAATGAAA
<210> 13
<211> 29
<212> DNA
<400> 13
CGTGGTCGACACGACCAGACCAAATGAAA
<210> 14
<211> 29
<212> DNA
<400> 14
GGTAGGTCACACGACCAGACCAAATGAAA

Claims (8)

1.一种检测多倍体中基因等位变异的方法,包括如下步骤:
1)根据待测多倍体基因的参考序列设计其保守引物;所述引物对扩增的PCR产物的长度为4-6 kb,且此区段包含多个外显子和内含子;在正反向引物的5'前端都加上不同的Barcode,所述的Barcode序列长度为8-12 bp的Barcode序列,不同Barcode组合的正反向引物来识别不同的材料;
2)选择不同材料的基因组DNA和相应的引物进行PCR扩增,得到PCR扩增产物;
3)对步骤2)得到的PCR产物进行定量,对来自不同材料不同基因的PCR产物进行等量混合;
4)对步骤3)的混合物进行纯化后,得到的混合产物文库可直接用于测序;
5)对步骤4)得到的文库进行三代测序,从而得到不同材料、多个基因中同时含有相似性较高的不同拷贝的序列信息;
6)对步骤5)得到的所有序列信息进行多重比对从而达到等位变异筛选的目的;
其中,所述待测多倍体基因为六倍体小麦中A、B和D基因组序列。
2.如权利要求1所述的方法,其特征在于:第3)步所述的定量采用琼脂糖凝胶电泳仪或Fragment analyzer仪进行。
3.如权利要求1所述的方法,其特征在于:第4)步所述的纯化是磁珠法。
4.如权利要求1所述的方法,其特征在于:所述三代测序是采用PacBio RS II测序平台。
5.如权利要求1所述的方法,其特征在于:所述多倍体为小麦。
6.如权利要求5所述的方法,其特征在于:所述基因为29个淀粉合成相关基因,因而所述保守引物为分别扩增29个淀粉合成相关基因的A、B和D基因组的保守引物。
7.如权利要求1至6任一项所述的方法在筛选多倍体中高相似性基因等位变异的应用。
8.如权利要求1至6任一项所述的方法在序列相似性较高的基因家族基因序列的多态性分析中的应用。
CN201710214678.3A 2017-04-01 2017-04-01 利用三代测序平台(PacBio RS II)进行多倍体中基因等位变异挖掘的方法 Expired - Fee Related CN106995845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710214678.3A CN106995845B (zh) 2017-04-01 2017-04-01 利用三代测序平台(PacBio RS II)进行多倍体中基因等位变异挖掘的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710214678.3A CN106995845B (zh) 2017-04-01 2017-04-01 利用三代测序平台(PacBio RS II)进行多倍体中基因等位变异挖掘的方法

Publications (2)

Publication Number Publication Date
CN106995845A CN106995845A (zh) 2017-08-01
CN106995845B true CN106995845B (zh) 2020-05-05

Family

ID=59434704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710214678.3A Expired - Fee Related CN106995845B (zh) 2017-04-01 2017-04-01 利用三代测序平台(PacBio RS II)进行多倍体中基因等位变异挖掘的方法

Country Status (1)

Country Link
CN (1) CN106995845B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110055317B (zh) * 2019-04-29 2022-04-26 中国农业科学院作物科学研究所 小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法
CN110511988A (zh) * 2019-07-20 2019-11-29 河南科技学院 基于PacBio测序的麦类植物基因组中LMW-GS基因拷贝数的鉴定方法
CN111621599A (zh) * 2020-06-12 2020-09-04 武汉菲沙基因信息有限公司 一种基于新冠病毒的全基因组全长扩增的三代建库测序方法
CN117344032A (zh) * 2023-12-04 2024-01-05 允思拓(天津)生物科技有限公司 一种β-酪蛋白基因型检测方法及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102952854A (zh) * 2011-08-25 2013-03-06 深圳华大基因科技有限公司 单细胞分类和筛选方法及其装置
CN104695027A (zh) * 2013-12-06 2015-06-10 中国科学院北京基因组研究所 测序文库及其制备和应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102952854A (zh) * 2011-08-25 2013-03-06 深圳华大基因科技有限公司 单细胞分类和筛选方法及其装置
CN104695027A (zh) * 2013-12-06 2015-06-10 中国科学院北京基因组研究所 测序文库及其制备和应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Next-generation polyploid phylogenetics: rapid resolution of hybrid polyploidy complexes using PacBio single-molecule sequencing;Carl J. Rothfels等;《New Phytologist》;20160727;第213卷(第1期);第413-429页,参见Materials and Methods,第424页左栏第2段 *

Also Published As

Publication number Publication date
CN106995845A (zh) 2017-08-01

Similar Documents

Publication Publication Date Title
Nadeem et al. DNA molecular markers in plant breeding: current status and recent advancements in genomic selection and genome editing
CN106995845B (zh) 利用三代测序平台(PacBio RS II)进行多倍体中基因等位变异挖掘的方法
CN107090504B (zh) 用于玉米基因分型的snp分子标记组合及其应用
US20060281082A1 (en) Genome partitioning
CN107142324B (zh) 桑树est-ssr分子标记及其核心引物组和应用
CN110622920A (zh) 一种纯黑毛色猪种的选育方法
CN109371146A (zh) 绵羊多胸椎数性状的snp分子标记、引物对、检测试剂盒及其应用
CN107090450B (zh) 与谷子穗长性状相关的分子标记及其检测引物和应用
Shirasawa et al. Conversion of AFLP markers to sequence-specific markers for closely related lines in rice by use of the rice genome sequence
CN115109843A (zh) 一种多个水稻性状控制基因变异检测功能标记方法
CN108642209B (zh) 一种小麦植株千粒重判断标记及其应用
CN108707685B (zh) 与谷子分蘖数性状相关的snp标记及其检测引物和应用
Jordan et al. Transcript profiling of the hypomethylated hog1 mutant of Arabidopsis
CN113046465B (zh) 一组与小麦抗寒性显著关联的snp位点及其在遗传育种中的应用
CN113637790B (zh) 抗条锈病基因YrAS2388R的KASP分子标记及引物、试剂盒和应用
CN107267503B (zh) 核酸和检测转基因水稻b1c893及其衍生系的方法以及试剂盒及其用途
CN112226433B (zh) 一种鉴定白皮松种质资源的snp位点引物组合及应用
CN114606337A (zh) 水稻粒型基因glw7的kasp标记开发及其应用
CN108315396B (zh) 一种简单便捷检测snp的新方法
CN108642203B (zh) 与谷子茎粗性状相关的snp标记及其检测引物和应用
CN108707684B (zh) 一种与谷子旗叶长性状相关的snp标记及其检测引物和应用
CN112501345A (zh) 一组与小麦白粉病抗性显著关联的snp位点及其在遗传育种中的应用
Ballichatla et al. Impairment in a member of AP2/ERF and F-box family protein enhances complete panicle exsertion, an economically important trait in rice
KR101144990B1 (ko) Sts 프라이머를 이용한 pcr 기반 인삼 품종 판별 방법
Zhao et al. Validating a Major Quantitative Trait Locus and Predicting Candidate Genes Associated With Kernel Width Through QTL Mapping and RNA-Sequencing Technology Using Near-Isogenic Lines in Maize

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200505

Termination date: 20210401