CN110218811B - 一种筛选水稻突变体的方法 - Google Patents

一种筛选水稻突变体的方法 Download PDF

Info

Publication number
CN110218811B
CN110218811B CN201910379866.0A CN201910379866A CN110218811B CN 110218811 B CN110218811 B CN 110218811B CN 201910379866 A CN201910379866 A CN 201910379866A CN 110218811 B CN110218811 B CN 110218811B
Authority
CN
China
Prior art keywords
pcr
primer
primers
oscyp
target dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910379866.0A
Other languages
English (en)
Other versions
CN110218811A (zh
Inventor
漆小泉
张英春
冯来宝
池旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Botany of CAS
Original Assignee
Institute of Botany of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Botany of CAS filed Critical Institute of Botany of CAS
Priority to CN201910379866.0A priority Critical patent/CN110218811B/zh
Publication of CN110218811A publication Critical patent/CN110218811A/zh
Application granted granted Critical
Publication of CN110218811B publication Critical patent/CN110218811B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种筛选水稻突变体的方法。本发明公开的筛选水稻突变体的方法包括:利用多重PCR富集待测水稻中的目标DNA片段,得到富集的目标DNA片段;对富集的目标DNA片段测序,得到待测水稻目标DNA片段序列;比较待测水稻目标DNA片段序列与野生型水稻目标DNA片段的序列,确定待测水稻目标DNA片段是否发生突变,以确定待测水稻是否为突变体。实验证明,利用本发明的方法可成功检测目标DNA片段是否发生突变,进一步可用于筛选突变体。

Description

一种筛选水稻突变体的方法
技术领域
本发明涉及生物技术领域中,一种筛选水稻突变体的方法。
背景技术
高通量测序技术(High-throughput sequencing)又称下一代测序技术(NextGeneration Sequencing,NGS)是2004年后新兴的一系列测序技术,能一次平行对大量(几十万到几百万)DNA分子进行序列测定。已经在基因组从头测序、基因组重测序、转录组测序、表观遗传学、单核苷酸多态性(Single Nucleotide Polymorphism,SNP)开发等等方面,将使基因组学成为研究生物学问题的常规方法,成为人们研究分子生物学、分子遗传学等等的有力工具。
在多种新一代测序技术中,Illumina公司开发的基因组分析仪(GenomeAnalyzer,GA) 是由隶属英国剑桥大学的Solexa公司建立,是基于边合成边测序(Sequencing by Synthesis) 原理,由于具有成本相对较低、通量大、前处理较为简单等等优势,是目前使用最广泛的二代测序技术平台。Illumina不断升级GA,特别是HiSeq、NextSeq、MiSeq、MiniSeq系列测序仪研发完成。
Illumina GA和HiSeq测序平台都需要严格的样品前处理过程,并且不具有选择性,因此,如果对基因组(或转录组)中某一特定的区域感兴趣,则需要在Illumina样品前处理之前对目标区域进行选择性的富集。目前通用的选择性富集的方法包括PCR、MIP(Molecular Inversion Probe)和DNA芯片(Microarray)。其中,MIP和DNA芯片技术较为复杂,适合大量群体中目标片段的富集,成本费用高,需要的起始基因组DNA的用量大。并且这些方法都需要建立质量较高的样品文库,从而增加了实验的成本费用。PCR技术是一种具有良好的选择性并且技术要求较低的方法,虽然扩增中会产生核苷酸的突变会在Illumina的样品前处理中放大,造成过多的假阳性结果;但是随着二代测序技术的不断发展(例如Illumina GA在 2006-2012年间更新了6代,Illumina Hiseq在2010-2015年之间更新了7代),测序的成本费用在不断的降低,测序长度在不断的增加,那么增加测序深度足以能解决由于PCR选择性富集的缺陷。
PCR(聚合酶链式反应)是在基因组上设计特异性的引物序列对目标片段进行特异性的扩增。1985年,美国Karray等学者首创了PCR技术,并由美国Cetus公司开发研制。随着PCR 技术的不断发展,在常规PCR技术的基础上又衍生出了许多技术,如多重PCR技术、实时荧光定量PCR(real-time fluorescent quatitative PCR,FQ-PCR)技术、单分子PCR技术和微滴PCR技术。
发明内容
本发明所要解决的技术问题是如何鉴定生物目标DNA片段是否发生突变以及如何筛选突变体。
为解决上述技术问题,本发明首先提供了鉴定生物目标DNA片段突变的方法,所述方法包括:
1)利用多重PCR富集待测生物中的目标DNA片段,得到富集的目标DNA片段;所述利用多重PCR富集待测生物中的目标DNA片段包括利用多重PCR方法扩增得到目标DNA片段,实现目标DNA片段的富集;所述多重PCR方法,包括:利用成套引物对目标DNA片段进行PCR 扩增,得到PCR产物,将该PCR产物记为PCR产物1;所述成套引物满足如下a1)、a2)和 a3):
a1)所述成套引物由n个引物对组成,n为大于等于2的自然数;
a2)所述成套引物中的每个引物对的因素J小于50%,所述因素J为引物对的反向引物与所述成套引物的其它引物形成引物二聚体的个数占所述成套引物中引物个数的百分比;
a3)所述成套引物中的每个引物对的9个因素中至多一个因素不在标准范围内;所述9 个因素为因素A、B、C、D、E、F、G、H和I;
所述因素A为引物对的反向引物的GC含量;
所述因素B为引物对的反向引物的TM值,
所述因素C为目标片段的GC含量;
所述因素D为从目标片段上游400bp处至该目标片段下游400bp处间的DNA片段的GC含量;
所述因素E为目标片段的结构自由能;
所述因素F为目标片段及目标片段下游150bp的连续DNA片段的结构自由能;
所述因素G为目标片段及目标片段上游150bp的连续DNA片段的结构自由能;
所述因素H为引物对的正向引物3’末端5个核苷酸的结构自由能;
所述因素I为引物对的反向引物与所述成套引物的其它引物中部连续大于等于5个核苷酸所形成的多个双链DNA的TM值总和;
所述9个因素的标准范围如下:
35%≤所述因素A≤60%;68℃≤所述因素B≤79℃;30%≤所述因素C≤70%;30%≤所述因素D≤70%;15kcal/mol≤所述因素E的绝对值≤70kcal/mol;所述因素F的绝对值<100 kcal/mol;所述因素G的绝对值<100kcal/mol;4kcal/mol≤所述因素H的绝对值≤10 kcal/mol;所述因素I<100℃;
2)对所述富集的目标DNA片段测序,得到待测生物目标DNA片段序列;
3)比较所述待测生物目标DNA片段序列与野生型生物所述目标DNA片段的序列,确定所述待测生物目标DNA片段是否发生突变:所述待测生物目标DNA片段序列与野生型生物所述目标DNA片段的序列相同,所述待测生物目标DNA片段未发生或候选未发生突变;所述待测生物目标DNA片段序列与野生型生物所述目标DNA片段的序列不同,所述待测生物目标DNA 片段发生或候选发生突变。
所述成套引物中引物对数与所述目标DNA片段的个数相等。
引物对由两条单链DNA组成,一条单链DNA为正向引物,一条为反向引物。所述反向引物是指在进行PCR扩增时沿着正链进行延长的单链DNA或结合序列位于所扩增目的片段下游的单链DNA,所述正向引物是指在进行PCR扩增时沿着负链进行延长的单链DNA或结合序列位于所扩增目的片段上游的单链DNA。
所述因素B中,所述引物对的反向引物的TM值,具体为所述反向引物与其识别的单链 DNA片段所形成的双链DNA片段的TM值。
所述因素J和所述引物I中所述成套引物的其它引物为除所述引物对的反向引物外的所有引物(即除所述引物对的反向引物外的所有单链DNA)。
所述目标片段为在利用引物对进行PCR扩增所得的PCR产物。
上述方法中,所述成套引物中各引物对的正向引物可含有相同的序列,记为正向引物共同序列;各引物对的反向引物可含有相同的序列,记为反向引物共同序列。
上述方法中,所述正向引物共同序列的长度可为h1)或h2):
h1)15-25nt;
h2)21nt。
所述反向引物共同序列的长度可为i1)或i2):
i1)15-25nt;
i2)16nt。
上述方法中,所述利用多重PCR富集目标DNA片段的方法还包括利用第二轮PCR引物对所述PCR产物1进行PCR产物进行扩增实现目标DNA片段的富集,将得到的PCR产物记为PCR 产物2;所述第二轮PCR引物的两条引物分别含有所述正向引物共同序列和所述反向引物共同序列。
所述正向引物共同序列可为5’-TACACGACGCTCTTCCGATCT-3’。
所述反向引物共同序列可为5’-ATGCCATATTCGCTAG-3’。
所述第二轮PCR引物的两条引物还均可含有利用Illumina测序平台测序所用测序引物,将所述第二轮PCR引物的正反向引物中的利用Illumina测序平台测序所用测序引物分别记为引物1和引物2,所述引物1和所述引物2的序列不同。
所述第二轮PCR引物的反向引物或正向序列还可含有标签序列,以用于区分不同待测生物。
在本发明的一个实施例中,所述第二轮PCR引物的正向引物由所述正向引物共同序列与所述引物1连接得到。所述第二轮PCR引物的反向引物由所述反向引物共同序列、标签序列和所述引物2连接得到。
上述方法中,所述第二轮PCR引物的两条引物还均可含有利用Illumina测序平台测序所用测序引物,将所述第二轮PCR引物的正反向引物中的利用Illumina测序平台测序所用测序引物分别记为引物1和引物2,所述引物1和所述引物2的序列不同。
所述第二轮PCR引物的反向引物还可含有标签序列。
在本发明的一个实施例中,所述第二轮PCR引物的正向引物由所述正向引物共同序列与所述引物1连接得到。所述第二轮PCR引物的反向引物由所述反向引物共同序列、标签序列和所述引物2连接得到。
上述方法中,所述利用多重PCR富集目标DNA片段的方法还可包括利用分别含有所述引物1和所述引物2的两条引物组成的引物对进行PCR扩增,得到能利用Illumina测序平台测序的PCR产物,该PCR产物即为富集的目标DNA片段。
所述引物对还可含有标签序列(即Index序列),以用于区分不同的待测样本。
上述方法中,n小于等于100。
具体的,n满足如下b1)-b17)中任一条件:b1)2≤n≤60;b2)2≤n≤57;b3)2≤n ≤50;b4)2≤n≤48;b5)2≤n≤40;b6)2≤n≤38;b7)2≤n≤30;b8)2≤n≤28;b9)2 ≤n≤25;b10)2≤n≤24;b11)2≤n≤20;b12)2≤n≤18;b13)2≤n≤15;b14)2≤n ≤12;b15)2≤n≤10;b16)2≤n≤6;b17)2≤n≤3。
在本发明的实施例中,n的取值为20。
上述方法中,所述PCR扩增所用DNA聚合酶可为Q5DNA聚合酶、KOD FX聚合酶、KAPA高保真热启动DNA聚合酶或Taq聚合酶。所述Q5DNA聚合酶可为Q5High-Fidelity 2X MasterMix中的DNA聚合酶。所述Q5High-Fidelity 2X Master Mix可为NEB产品,货号:M0492S。所述KOD FX聚合酶可为TOYOBO产品,货号:KFX-101。所述KAPA高保真热启动DNA聚合酶可为KAPABIOSYSTEMS产品,货号:KK5532。所述Taq聚合酶可为TaKaRa Ex Taq。所述TaKaRa ExTaq可为TaKaRa产品,货号:RR001B。
上述方法中,所述成套引物的每条引物在所述PCR扩增的体系中的浓度均可相等。
所述成套引物的每条引物在所述PCR扩增的体系中的浓度可为d1)或d2)或d3):
d1)0.04-0.2pmol/μL;d2)0.044-0.176pmol/μL;d3)0.088pmol/μL。
所述PCR扩增的体系具体可包括也可由如下物质组成:DNA模板,所述DNA聚合酶和所述成套引物。
所述PCR扩增的体系具体可包括也可由如下物质组成:DNA模板,所述DNA聚合酶,所述成套引物和PCR缓冲液。
所述PCR扩增的体系具体可包括也可由如下物质组成:DNA模板,所述DNA聚合酶,所述成套引物,所述PCR缓冲液和水。
所述PCR缓冲液可根据PCR反应体系具体确定。
利用Q5High-Fidelity 2X Master Mix中的DNA聚合酶进行PCR扩增的反应体系(10μl) 可为:DNA模板(5ng/μl)2μl,所述成套引物,所述Q5High-Fidelity 2×Master Mix5μl,余量为水和/或1×TE缓冲液(PH=8.0)。所述1×TE缓冲液的PH为8.0,每500ml 1×TE缓冲液含0.6055g Tris和0.186g EDTA,利用HCl调PH至8.0,余量为水。
利用所述KOD FX聚合酶进行PCR扩增的反应体系(10μl)可为:DNA模板(5ng/μl) 2μl;dNTPs(2.5mM)0.8μl;所述成套引物;所述KOD FX聚合酶(1U/μl)0.16μl;2×KOD buffer5μl;余量为水和/或所述1×TE缓冲液(PH=8.0)。所述2×KOD buffer可为TOYOBO 产品,货号:KFX-101。。
利用所述KAPA高保真热启动DNA聚合酶进行PCR扩增的反应体系(10μl)可为:DNA模板(5ng/μl)2μl;dNTPs(2.5mM)0.8μl;5×Buffer A 2μl;所述成套引物;所述 KAPA高保真热启动DNA聚合酶(5U/μl)0.1μl;余量为水和/或所述1×TE缓冲液(PH=8.0)。所述5×Buffer A可为KAPABIOSYSTEMS产品,货号:KK5532。
利用所述Taq聚合酶进行PCR扩增的反应体系(10μl)可为:DNA模板(5ng/μl)2μl;dNTPs(2.5mM)0.8μl;Ex Taq buffer 1μl;所述成套引物;所述TaKaRa Ex Taq(5U/μl) 0.1μl;余量为水和/或所述1×TE缓冲液(PH=8.0)。所述Ex Taq buffer可为TaKaRa产品,货号:RR001B。
上述方法中,所述PCR扩增的退火温度可为e1)或e2):e1)58-65℃;e2)60℃。
所述PCR扩增的退火时间可根据所扩增DNA片段的长度确定,如1分钟。
上述方法中,所述PCR扩增的循环数可为c1)或c2):c1)20-35;c2)28。
利用Q5High-Fidelity 2X Master Mix中的DNA聚合酶进行PCR扩增的反应条件可为 98℃30sec;28个循环(98℃10s,60℃1min,72℃1.5min);72℃2min;12℃保温。利用Q5High-Fidelity 2X Master Mix中的DNA聚合酶进行PCR扩增的反应条件也可为:98℃30sec;35个循环(98℃10s,60℃1min,72℃1.5min);72℃2min;12℃保温。利用Q5 High-Fidelity 2X Master Mix中的DNA聚合酶进行PCR扩增的反应条件还可为:98℃30sec; 20个循环(98℃10s,58℃30s,72℃30s);72℃2min;12℃保温。
利用所述KOD FX聚合酶进行PCR扩增的反应条件可为:94℃2min;20个循环(98℃10s,58℃40s,68℃1min);68℃5min;12℃保温。
利用所述KAPA高保真热启动DNA聚合酶进行PCR扩增的反应条件可为:95℃3min;20 个循环(95℃20s,58℃40s,72℃1min);72℃2min;12℃保温。
利用所述Taq聚合酶进行PCR扩增的反应条件可为:95℃2min;20个循环(98℃10s,58℃40s,72℃1min);72℃5min;12℃保温。
本发明还提供了鉴定生物突变体的方法,所述方法包括:利用所述鉴定生物目标DNA片段突变的方法鉴定待测生物目标DNA片段是否发生突变,目标DNA片段发生突变的待测生物即为生物突变体。
本发明中,所述生物可为m1)、m2)或m3):
m1)植物、动物或微生物;
m2)单子叶植物或双子叶植物;
m3)水稻。
在本发明的一个实施例中,所述成套引物由如下引物对组成:序列248和268所示的两条单链DNA组成的引物对;序列249和269所示的两条单链DNA组成的引物对;序列250和270所示的两条单链DNA组成的引物对;序列251和271所示的两条单链DNA组成的引物对;序列252和272所示的两条单链DNA组成的引物对;序列253和273所示的两条单链DNA组成的引物对;序列254和274所示的两条单链DNA组成的引物对;序列255和275所示的两条单链DNA组成的引物对;序列256和276所示的两条单链DNA组成的引物对;序列257和 277所示的两条单链DNA组成的引物对;序列258和278所示的两条单链DNA组成的引物对;序列259和279所示的两条单链DNA组成的引物对;序列260和280所示的两条单链DNA组成的引物对;序列261和281所示的两条单链DNA组成的引物对;序列262和282所示的两条单链DNA组成的引物对;序列263和283所示的两条单链DNA组成的引物对;序列264和 284所示的两条单链DNA组成的引物对;序列265和285所示的两条单链DNA组成的引物对;序列266和286所示的两条单链DNA组成的引物对;序列267和287所示的两条单链DNA组成的引物对。所述目标DNA片段为以水稻基因组DNA为模板利用所述成套引物中各引物对进行PCR扩增得到的DNA片段。
实验证明,利用本发明的鉴定生物目标DNA片段突变的方法可成功检测目标DNA片段是否发生突变,进一步可用于筛选突变体。
附图说明
图1为两轮PCR的扩增流程。
图2为两种DNA聚合酶多重PCR扩增的第一轮PCR产物的电泳结果。
A为Q5High-Fidelity 2×Master Mix的结果。M:100bp DNA ladder;泳道1-6:28个循环扩增结果;泳道1:不加DNA模板的阴性对照;泳道2-6分别为Q5PM3,Q5PM6,Q5PM12,Q5PM18,Q5PM24的结果;泳道7-12:35个循环扩增结果;泳道7:不加DNA模板的阴性对照;泳道8-12分别为Q5PM3,Q5PM6,Q5PM12,Q5PM18,Q5PM24的结果。
B为KOD FX聚合酶扩增第一轮PCR产物结果。M:100bp DNA ladder;泳道1-5:35个循环扩增结果;泳道1-5分别为KODPM3,KODPM6,KODPM12,KODPM18,KODPM24的结果;泳道6-10:28个循环扩增结果;泳道6-10分别为KODPM3,KODPM6,KODPM12,KODPM18,KODPM24 的结果。
图3为两轮PCR产物的胶回收纯化检测结果。
(A)1.5%琼脂糖胶检测第一轮PCR切胶纯化后的结果。M:100bp DNA ladder;泳道1: Q5High-Fidelity 2×Master Mix的第一轮PCR产物的胶回收纯化产物的检测结果;泳道2: KOD FX聚合酶的第一轮PCR产物的胶回收纯化产物的检测结果。
(B)1.5%琼脂糖胶检测第二轮PCR富集结果。M:100bp DNA ladder;泳道1:Q5High-Fidelity 2×Master Mix扩增的第二轮PCR产物;2:KOD FX聚合酶扩增的第二轮PCR产物。
(C)1.5%琼脂糖胶检测第二轮PCR产物切胶纯化后的结果。M:100bp DNA ladder;泳道 1:Q5High-Fidelity 2×Master Mix扩增的第二轮PCR产物胶纯化后的结果;2:KODFX聚合酶扩增的第二轮PCR产物胶纯化后的结果。
图4为数据根据标签序列分开后数据的分配情况。A为MFR-Q5数据根据标签序列分开后数据的分配情况;B为MFR-KOD数据根据标签序列分开后数据的分配情况。
图5为不同PCR体系得到目标片段的引物对数。Q5表示Q5High-Fidelity 2×Master Mix,KOD表示KOD FX聚合酶。
图6为不同PCR体系的数据利用率。Q5表示Q5High-Fidelity 2×Master Mix,KOD表示KOD FX聚合酶。
图7为不同PCR体系的平均测序深度。Q5表示Q5High-Fidelity 2×Master Mix,KOD 表示KOD FX聚合酶。
图8为Q5High-Fidelity 2×Master Mix的不同PCR体系的数据利用率(柱状图)、得到目标片段的引物对数(折线图)以及不同体系中不同引物对得到的目标片段的数据量在该体系中所有引物对得到的目标片段的总数据量的百分比(饼图),饼图各上方的数字表示各体系得到的总的reads数,饼图反映了各个目标片段扩增的均匀程度。
图9为每个体系中扩增目标片段的比率(即得到目标片段的引物对个数占该体系中总引物对个数的百分比)。
图10为实施例2中三轮PCR的反应示意图。
图11为部分实验数据量的分配图。
图12为不同体系富集到的片段个数(即能得到目标片段的引物对的个数)。
图13为5种DNA聚合酶在6个不同引物组合中得到到目标片段的比率(即得到目的片段的引物对数的个数占相应引物组合中总的引物对数的个数的比率)。
图14为5种DNA聚合酶在6个不同引物组合中的数据利用率。
图15为能比对到参考序列上的目标片段数据量所占的比率。纵坐标为能比对到参考序列上的目标片段数据量所占的比率。
图16为不同引物组合富集的目标片段的个数。
图17为Sanger测序验证突变位点的结果。其中,核苷酸序列中灰色底纹的核苷酸为突变后的核苷酸。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。下述实施例中,如无特殊说明,各核苷酸序列的第1位均为相应DNA的5′末端核苷酸,末位均为相应DNA的3′末端核苷酸。
下述实施例中的中花11(Chi X,Zhang YC,Xue ZY,Feng LB,Liu HQ,Wang F andQi XQ.2014.Discovery of rare mutations in extensively pooled DNA samplesusing multiple target enrichment.Plant Biotechnology Journal,12:709-717)公众可从申请人处获得该生物材料,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
PCR扩增的DNA聚合酶均从北京友谊中联生物技术有限公司和北京华博德亿生物技术有限公司,纯化试剂盒从德国QIAgen公司购买,富集所用的引物均从上海生工合成。
Q5High-Fidelity 2X Master Mix:NEB,货号:M0492S,该产品中的DNA聚合酶为Q5DNA 聚合酶。
KOD FX聚合酶:TOYOBO,货号:KFX-101。
2×KOD buffer:TOYOBO,货号:KFX-101。
QIAquick Gel Extraction Kit:Qiagen,SDW-28704。
TaKaRa Ex Taq:TaKaRa,货号:RR001B。
Ex Taq buffer:TaKaRa,货号:RR001B。
KAPA高保真热启动DNA聚合酶:KAPABIOSYSTEMS,货号:KK5532。
5×Buffer A:KAPABIOSYSTEMS,货号:KK5532。
SD聚合酶(SD DNA聚合酶):海南博善都生物科技有限公司,货号:108702;SDbuffer:海南博善都生物科技有限公司,货号:108702。
下述实施例中的1×TE缓冲液,PH为8.0,500ml 1×TE缓冲液含0.6055g Tris,0.186g EDTA,利用HCl调PH至8.0,余量为水。
下述实施例中的dNTPs(2.5mM)含有dATP、dTTP、dCTP和dGTP,每种dNTP的浓度均为2.5mM。
实施例1、利用多重PCR富集水稻基因组DNA的目标片段
1.1实验材料
中花11(ZH11)基因组DNA。基因组DNA的提取使用标准CTAB法进行提取,浓度最终稀释并定量至50ng/μL。
1.2多重PCR引物的制备
设计两轮PCR引物,并合成各引物。
第一轮PCR引物(1st PCR)的设计:针对水稻的24个已知SNP位点设计引物,每个位点的引物所扩增的基因组的大小为200-250bp。每个位点的正向引物的5’端均含有21bp的公共序列(该序列为Illumina测序引物中的一段重叠序列(overlap),TACACGACGCTCTTCCGATCT),其余部分用于识别水稻基因组DNA;反向引物的5’端均含有21bp的公共序列(该序列为Illumina测序引物中的一段重叠序列(overlap),AGACGTGTGCTCTTCCGATCT)和5bp的标签序列(Tag,该序列用于区分样品)。引物序列中识别水稻基因组DNA特异性引物的设计原则:GC%为35%-65%,长度为19-20个核苷酸,TM值为55℃左右。这24个位点的引物对名称分别为OsCYP51H8-2、OsOSC8(5)-5、OsCYP51H5-5、Os07g11440-1、OsCAP1-1、OsCYP51H7-3、OsCYP51H6-3、OsG3-5、OsCYP51H9-3、OsOSC3-7、OsOSC11-8、OsOSC7-3、OsOSC10-1、OsZM-4、OsCYP51H5-1、Os07g11440-3、OsOSC8(18)-18、OsCYP51H5-2、Os07g11440-2、OsOSC3-2、OsCAP1-4、OsCAP1-3和OsOSC8(9)-9。每个位点的正向引物和反向引物的名称分别在引物对名称的末尾添加F(正向引物)和R(反向引物)用于区分两条引物。
为了比较的多重PCR的均匀度,设计了3对、6对、12对、18对和24对引物的多重PCR体系,将这几种体系分别记为PM3、PM6、PM12、PM18和PM24。不同体系中所用的正向引物的序列均相同,部分位点的反向引物设计多条,同一位点反向引物的区别在于标签序列的不同。各引物的序列以及所适用的体系如表1.1所示。
表1.1第一轮PCR引物
Figure BDA0002053006610000081
Figure BDA0002053006610000091
注:表1.1中,加粗字体表示标签序列,“—”表示正向引物适用于各体系。
第二轮PCR引物(2nd PCR)的设计:第二轮PCR引物为Illumina通用引物,其作用是在第一轮PCR产物的两端添加测序平台所需的序列,具体序列如表1.2所示。为了对比两种DNA聚合酶(Q5High-Fidelity 2X Master Mix和KOD FX聚合酶)的扩增效果,设计两条Index1.0(反向引物)用于区分不同PCR体系的产物,正向引物(Primer1.0)相同。
表1.2第二轮PCR引物(Illumina测序平台通用引物)
Figure BDA0002053006610000092
Figure BDA0002053006610000101
注:表1.2中,下划线序列分别为表1.1中各正向引物和反向引物的公共序列,加阴影字体为index序列,“—”表示正向引物适用于各体系。
1.3二步PCR方法富集多个目标DNA片段(制备二代测序的DNA模板)
两轮PCR反应过程示意图如图1所示。
将Q5High-Fidelity 2X Master Mix的含有3对、6对、12对、18对和24对引物的多重PCR体系分别记为Q5PM3、Q5PM6、Q5PM12、Q5PM18和Q5PM24,将KOD FX聚合酶的含有3 对、6对、12对、18对和24对引物的多重PCR体系分别记为KODPM3、KODPM6、KODPM12、KODPM18 和KODPM24,各体系所加标签序列信息见表1.3。
表1.3不同体系PCR产物所添加标签
Figure BDA0002053006610000102
1)稀释引物及引物混合
将表1.1中第一轮PCR的各引物利用1×TE缓冲液均稀释至100pmol/μL的储存液后进行引物的混合,制备10×引物混合液,各10×引物混合液中每条引物的浓度均为2pmol/μL,具体混合方法如下:
PM3体系:将OsCYP51G1-3F(1st PCR)、OsCYP51H8-2F(1st PCR)和OsOSC8(5)-5F(1st PCR)的储存液各取1μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮PM3体系的正向引物的10×引物混合液,将其称为1stPM3F(10×);将用于PM3体系的OsCYP51G1-3R (1st PCR)、OsCYP51H8-2R(1st PCR)和OsOSC8(5)-5R(1st PCR)的储存液各取1μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮PM3体系的反向引物的10×引物混合液,将其称为1stPM3R(10×)。
PM6体系:将OsCYP51G1-3F(1st PCR)、OsCYP51H8-2F(1st PCR)、OsOSC8(5)-5F(1st PCR)、OsCYP51H5-5F(1st PCR)、Os07g11440-1F(1st PCR)和OsCAP1-1F(1st PCR)的储存液各取1μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮PM6体系的正向引物的10×引物混合液,将其称为1stPM6F(10×);将用于PM6体系的OsCYP51G1-3R(1stPCR)、 OsCYP51H8-2R(1st PCR)、OsOSC8(5)-5R(1st PCR)、OsCYP51H5-5R(1st PCR)、Os07g11440-1R (1st PCR)和OsCAP1-1R(1st PCR)的储存液各取1μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮PM6体系的反向引物的10×引物混合液,将其称为1stPM6R(10×)。
PM12体系:将OsCYP51G1-3F(1st PCR)、OsCYP51H8-2F(1st PCR)、OsOSC8(5)-5F(1st PCR)、OsCYP51H5-5F(1st PCR)、Os07g11440-1F(1st PCR)、OsCAP1-1F(1st PCR)、OsCYP51H7-3F(1st PCR)、OsCYP51H6-3F(1st PCR)、OsG3-5F(1st PCR)、OsCYP51H9-3F(1stPCR)、OsOSC3-7F(1st PCR)和OsOSC11-8F(1st PCR)的储存液各取1μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮PM12体系的正向引物的10×引物混合液,将其称为1stPM12F(10×);将用于PM12体系的OsCYP51G1-3R(1st PCR)、OsCYP51H8-2R(1st PCR) 和OsOSC8(5)-5R(1st PCR)、OsCYP51H5-5R(1st PCR)、Os07g11440-1R(1st PCR)和 OsCAP1-1R(1st PCR)、OsCYP51H7-3R(1st PCR)、OsCYP51H6-3R(1st PCR)、OsG3-5R(1st PCR)、OsCYP51H9-3R(1st PCR)、OsOSC3-7R(1st PCR)和OsOSC11-8R(1st PCR)的储存液各取1μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮PM12体系的反向引物的10×引物混合液,将其称为1stPM12R(10×)。
PM18体系:将OsCYP51G1-3F(1st PCR)、OsCYP51H8-2F(1st PCR)、OsOSC8(5)-5F(1st PCR)、OsCYP51H5-5F(1st PCR)、Os07g11440-1F(1st PCR)、OsCAP1-1F(1st PCR)、OsCYP51H7-3F(1st PCR)、OsCYP51H6-3F(1st PCR)、OsG3-5F(1st PCR)、OsCYP51H9-3F(1stPCR)、OsOSC3-7F(1st PCR)、OsOSC11-8F(1st PCR)、OsOSC7-3F(1st PCR)、OsOSC10-1F(1st PCR)、OsZM-4F(1st PCR)、OsCYP51H5-1F(1st PCR)、Os07g11440-3F(1st PCR)和OsOSC8(18)-18F(1st PCR)的储存液各取1μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮PM18体系的正向引物的10×引物混合液,将其称为1stPM18F(10×);将用于PM18体系的OsCYP51G1-3R(1st PCR)、OsCYP51H8-2R(1st PCR)和OsOSC8(5)-5R(1st PCR)、OsCYP51H5-5R(1st PCR)、Os07g11440-1R(1st PCR)和OsCAP1-1R(1st PCR)、OsCYP51H7-3R(1st PCR)、OsCYP51H6-3R(1st PCR)、OsG3-5R(1st PCR)、OsCYP51H9-3R(1st PCR)、OsOSC3-7R (1st PCR)、OsOSC11-8R(1st PCR)、OsOSC7-3F(1st PCR)、OsOSC10-1F(1stPCR)、OsZM-4F (1st PCR)、OsCYP51H5-1F(1st PCR)、Os07g11440-3F(1st PCR)和OsOSC8(18)-18F(1st PCR)的储存液各取1μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮PM18 体系的反向引物的10×引物混合液,将其称为1stPM18R(10×)。
PM24体系:将OsCYP51G1-3F(1st PCR)、OsCYP51H8-2F(1st PCR)、OsOSC8(5)-5F(1st PCR)、OsCYP51H5-5F(1st PCR)、Os07g11440-1F(1st PCR)、OsCAP1-1F(1st PCR)、OsCYP51H7-3F(1st PCR)、OsCYP51H6-3F(1st PCR)、OsG3-5F(1st PCR)、OsCYP51H9-3F(1stPCR)、OsOSC3-7F(1st PCR)、OsOSC11-8F(1st PCR)、OsOSC7-3F(1st PCR)、OsOSC10-1F(1st PCR)、OsZM-4F(1st PCR)、OsCYP51H5-1F(1st PCR)、Os07g11440-3F(1st PCR)、OsOSC8(18)-18F(1st PCR)、OsCYP51H5-2F(1st PCR)、Os07g11440-2F(1st PCR)、OsOSC3-2F (1st PCR)、OsCAP1-4F(1st PCR)、OsCAP1-3F(1st PCR)和OsOSC8(9)-9F(1st PCR)的储存液各取1μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮PM24体系的正向引物的10×引物混合液,将其称为1stPM24F(10×);将用于PM24体系的OsCYP51G1-3R(1stPCR)、OsCYP51H8-2R(1st PCR)、OsOSC8(5)-5R(1st PCR)、OsCYP51H5-5R(1st PCR)、Os07g11440-1R(1st PCR)、OsCAP1-1R(1st PCR)、OsCYP51H7-3R(1st PCR)、OsCYP51H6-3R(1st PCR)、OsG3-5R(1st PCR)、OsCYP51H9-3R(1st PCR)、OsOSC3-7R(1st PCR)、OsOSC11-8R (1st PCR)、OsOSC7-3F(1st PCR)、OsOSC10-1F(1st PCR)、OsZM-4F(1st PCR)、OsCYP51H5-1F (1st PCR)、Os07g11440-3F(1st PCR)、OsOSC8(18)-18F(1st PCR)、OsCYP51H5-2R(1st PCR)、 Os07g11440-2R(1st PCR)、OsOSC3-2R(1st PCR)、OsCAP1-4R(1st PCR)、OsCAP1-3R(1st PCR) 和OsOSC8(9)-9R(1st PCR)的储存液各取1μl混在一起,然后加入1×TE缓冲液补齐到 50μl,得到第一轮PM24体系的反向引物的10×引物混合液,将其称为1stPM24R(10×)。
第二轮引物为Primer1.0和Index1.0(具体序列见表1.2)。各引物均利用1×TE缓冲液稀释至2.5pmol/μl。
2)第一轮PCR反应
取上述中花11(ZH11)基因组DNA稀释至5ng/μl作为PCR的DNA模板。
不同Q5体系均包括(10μl):DNA模板(5ng/μl)2μl;1stPM3F(10×)或1stPM6F(10×) 或1stPM12F(10×)或1stPM18F(10×)或1stPM24F(10×)0.44μl;1stPM3R(10×)或1stPM6R(10×)或1stPM12R(10×)或1stPM18R(10×)或1stPM24R(10×)0.44μl;Q5 High-Fidelity 2×Master Mix 5μl;ddH2O 2.12μl。Q5PM3体系中的两种引物混合液为 1stPM3F(10×)和1stPM3R(10×),Q5PM6体系中的两种引物混合液为1stPM6F(10×)和 1stPM6R(10×),Q5PM12体系中的两种引物混合液为1stPM12F(10×)和1stPM12R(10×), Q5PM18体系中的两种引物混合液为1stPM18F(10×)和1stPM18R(10×),Q5PM24体系中的两种引物混合液为1stPM24F(10×)和1stPM24R(10×)。利用不加DNA模板的体系作为阴性对照。
不同KOD FX体系均包括:DNA模板(5ng/μl)2μl;dNTPs(2.5mM)0.8μl;1stPM3F(10×) 或1stPM6F(10×)或1stPM12F(10×)或1stPM18F(10×)或1stPM24F(10×)0.44μl;1stPM3R (10×)或1stPM6R(10×)或1stPM12R(10×)或1stPM18R(10×)或1stPM24R(10×)0.44μl; KOD FX聚合酶(1U/μl)0.16μl;2×KOD buffer 5μl;最后用ddH2O补齐到10μl。KODPM3 体系中的两种引物混合液为1stPM3F(10×)和1stPM3R(10×),KODPM6体系中的两种引物混合液为1stPM6F(10×)和1stPM6R(10×),KODPM12体系中的两种引物混合液为1stPM12F (10×)和1stPM12R(10×),KODPM18体系中的两种引物混合液为1stPM18F(10×)和1stPM18R (10×),KODPM24体系中的两种引物混合液为1stPM24F(10×)和1stPM24R(10×)。利用不加DNA模板的体系作为阴性对照。
不同Q5体系的反应程序均有两个不同循环数的PCR扩增程序,一个为:98℃30sec;28 个循环(98℃10s,60℃1min,72℃1.5min);72℃2min;12℃保温。另一个为:98℃30sec;35个循环(98℃10s,60℃1min,72℃1.5min);72℃2min;12℃保温。
不同KOD FX体系的反应程序均有两个不同循环数的PCR扩增程序,一个为:94℃2min; 28个循环(98℃10s,60℃1min,68℃1.5min);68℃5min;12℃保温。另一个为:94℃2min;35个循环(98℃10s,60℃1min,68℃1.5min);68℃5min;12℃保温。
反应结束后,用1.5%的琼脂糖胶检测第一轮PCR产物,取1μl第一轮PCR产物在琼脂糖胶上检测。
结果如图2所示。结果显示,在两种酶扩增结果中,五个引物对的组合都能有效的富集目的DNA片段,但是引物对较多,需要经过切胶回收后除去目的片段以外的序列。用Q5High-Fidelity 2×Master Mix扩增时,发现35个PCR循环数的扩增效率要高于28个PCR 循环数(图2中A),为了减少PCR过程中引起的突变,所以用28个PCR循环数的结果进行后续的试验。同样,从图2中B中可以看出,用KOD FX聚合酶扩增时,发现35个循环的扩增效率要高于28个循环,为了减少PCR过程中引起的突变,将28个循环扩增的产物进行后续的试验。
分别将五个Q5体系的第一轮PCR产物(28个循环数)中的目的片段切胶回收后进行等摩尔的混合,将五个KOD FX体系的第一轮PCR产物(28个循环数)中的目的片段切胶回收后进行等摩尔的混合,所用试剂盒为QIAquick Gel Extraction Kit,最后每种DNA聚合酶均得到30μl洗脱液。
用1.5%琼脂糖检测胶回收纯化后的DNA,取1μl洗脱液用1.5%琼脂糖胶检测。图3中A 显示第一轮多重PCR富集效果图,从图中看出能看到PCR得到的目的条带的特异性较好。
第一轮洗脱液的DNA浓度检测:取1μl洗脱液用1.5%的琼脂糖胶检测洗脱液的浓度。将第一轮的洗脱液作为第二轮的PCR模板。
3)第二轮PCR
将上述步骤2)得到的洗脱液作为第二轮PCR的模板,利用每种聚合酶分别进行第二轮 PCR反应,第二轮PCR反应采用的聚合酶与第一轮PCR反应采用的聚合酶前后保持一致。
第二轮Q5体系(50μl):步骤2)得到的洗脱液(10ng/μl)3μl;Primer1.0(2.5μM) 5μl;Index1.0(2.5μM)5μl;Q5High-Fidelity 2×Master Mix 25μl;ddH2O补至 50μl。
第二轮KOD FX体系(50μl):步骤2)得到的洗脱液(10ng/μl)3μl;dNTPs(2.5mM)1μl; Primer1.0(2.5μM)5μl;Index1.0(2.5μM)5μl;KOD FX聚合酶(1U/μl)0.16μl; 2×KODbuffer 25μl;ddH2O补至50μl。
两种体系的PCR反应程序均为:98℃30s;18个循环(98℃10s,65℃30s,72℃30s);72℃2min;12℃保温。
第二轮PCR结束后,得到的PCR产物即为富集的目标片段。
PCR反应结束后,用1.5%的琼脂糖胶检测第二轮PCR产物,取1μl第二轮PCR产物在琼脂糖胶上检测。图3中B展示了第二轮PCR中加测序引物富集的结果,可以看出除了特异性片段外,还有非特异性的扩增,需要切胶回收第二轮PCR产物中的目的条带,图3中C为切胶纯化第二轮PCR产物中目的条带的结果。最后要经过检测产物的浓度和质量后再上Illumina平台测序。切胶回收所用试剂盒为QIAquick Gel Extraction Kit,回收得到30μl的DNA洗脱液。该DNA洗脱液即为用于Illumina Hiseq2500双端125bp标准测序测序上机所用的DNA测序模板。
1.4Illumina Hiseq平台测序及数据分析
将第二轮PCR的PCR产物的切胶回收得到的DNA洗脱液经由贝瑞和康测序公司使用Illumina Hiseq2500测序平台进行双端125bp的测序。数据过滤及分析方法利用池旭(Xuet al.2014,Plant Biotechnology Journal,pp.1-9)分布过滤方法。
(1)数据总量:MFR-Q5(用Q5High-Fidelity 2×Master Mix富集目标片段)得到2.8Gb;MFR-KOD(用KOD FX聚合酶富集目标片段)得到1.8Gb。
(2)去除低质量数据及标签部分没有测出的reads后,MFR-Q5剩余2.6Gb,MFR-KOD剩余1.7Gb。
(3)实验中共涉及的5个标签序列和2个index序列,其序列与标签对应的关系见表1.3。标签序列(Tag)添加在反向特异引物的上游,按照标签序列将数据分开,结果如图4。从该结果中发现,MFR-Q5和MFR-KOD能被分到5个标签中的reads数/clean reads数分别为5203591/5201548(98%)和3313101/3364314(98%)。
(4)使用bowtie将各个Tag的数据分别比对到参考序列上,而后用samtools2.0处理比对结果,生成pile up后的结果。分析比对结果如表1.4所示。数据量为各个标签得到的文件大小。
表1.4不同引物对组合中每个目标的片段获得reads数的对比
Figure BDA0002053006610000131
Figure BDA0002053006610000141
注:“得到目标片段的引物对数”为富集到目标片段的引物对个数。表格中的“0”代表无比对区域的序列,测序深度为0。reads利用率为含有各个标签的比对在参考序列上的数据量与含有相应标签的数据量之比 (含有每一个标签的数据只有一部分能够比对在基因组上,因此有数据利用率的问题。计算的方法是:含有标签的能比对到基因组上的数据量(bp)/该标签的总数据量×100%)。
分析以上结果,得到如下几点:
A)两种聚合酶获得的可用产物数量的比较:如图5所示,从图中可以看出,两种聚合酶进行多重PCR的实验中,Q5High-Fidelity 2×Master Mix获得的可用产物数量(即能得到目标片段的引物对数)要多于KOD FX聚合酶获得的可用产物数量(除了在使用3个引物对进行扩增时)。随着引物数量的增加,实际可用产物数量逐渐远离理论产物数量,但仍未达到平台期,引物对的数量仍然可以增加。
B)两种聚合酶不同引物对数所得数据的利用率比较:如图6所示,两种酶的数据利用率 (即表1.4中的reads利用率,也即比对到参考序列的比率)在77%-99%。虽然Q5High-Fidelity 2×Master Mix所得PCR产物的数据利用率要低于KOD FX聚合酶,但是在每个实验中得到的目标片段的引物对数Q5High-Fidelity 2×Master Mix要高于KOD FX聚合酶(见图5)。
C)两种聚合酶不同引物对数所得平均测序深度分析:如图7所示,测序深度随着引物对数的增加而逐渐减少;说明了在一个多重PCR中引物越多会降低每个目标片段的扩增效率,或者引物和引物之间会干扰目标片段的富集。
D)混合引物对数的优化:多重PCR中混合的引物对数对扩增效率以及所得样品的均匀度起到关键的作用。对Q5High-Fidelity 2×Master Mix扩增的结果进行了详细的分析,结果见图8。
1.5结论
综上所述:利用多重PCR可以富集DNA目标片段,并且得到的片段可以直接用于Illumina Hiseq测序平台进行测序。利用多重PCR可以富集DNA目标片段,与其他利用第二代测序技术多重富集目标片段的技术相比,省去了二代测序样品前处理的过程,大大降低实验操作繁琐程度,同时也降低了实验的成本费用。
①Q5High-Fidelity 2×Master Mix相对于KOD FX聚合酶比较适合用于多重PCR反应。
②由于本实验是直接靶向目标片段,除了Q5PM3试验,数据利用率不论在哪个体系中都比较高(达到90%以上),说明本实验能够特异性的富集目标片段。
③从图8中可以看出,得到目标片段的引物对数还没达到平台期,可以继续增加引物对的数量。
④多重PCR中的引物对数对扩增效率以及每个片段的扩增所得的产物的均匀度起关键作用。多重PCR扩增随着引物对数的增加,扩增出目标片段的引物对数也在增加(图8)。在不同体系中,数据中比对到参考序列上数据比例都在93%以上(除了Q5PM3),说明了数据的利用率较高(图8)。
⑤每个实验中得到的目标片段的引物对数比率在66-100%(图9)。
⑥图8的饼图明确地展示了目的片段扩增均匀程度,在引物对数为3的时候,扩增效率最高的片段数据量占65%,最低的片段占15%,相差4倍以上;在6对引物时,扩增效率最高的片段的数据量(62%)是最低的数据量(6%)的接近10倍;以及在其它引物组合中从饼图中也可以看出目的片段扩增的均匀程度差(图8)。
实施例2、多重PCR富集目标片段的方法的优化
从实施例1的结果中可以得出,引物数量增加的越多,富集的目标片段的效果越差,特别是富集得到的目标片段之间的均一性很差。为了解决富集得到目标片段的均一性问题,发明人检测了利用5种DNA聚合酶6种引物对数进行多重PCR扩增目标片段的效果。
2.1实验材料
中花11(ZH11)基因组DNA。基因组DNA的提取使用标准CTAB法进行提取,浓度最终稀释并定量至50ng/μL。
2.2多重PCR引物的制备
为减少引物用量,本实施例采用三轮PCR扩增,设计三轮PCR引物,并合成各引物。
第一轮PCR引物(1st PCR)的设计:针对水稻的57个位点设计引物,每个位点的引物所扩增的基因组大小为250bp左右。每个位点的正向引物的5’端均含有21bp的重叠序列(该重叠序列为TACACGACGCTCTTCCGATCT),其余部分用于识别水稻基因组DNA;反向引物的5’端均含有16bp连接序列(Linker sequence,该连接序列为ATGCCATATTCGCTAG),其余部分用于识别水稻基因组DNA。引物序列中识别水稻基因组DNA特异性引物的设计原则:GC%为35%-65%,长度为18-20个核苷酸,TM值为55℃左右。这24个位点的引物对名称分别为OsCYP51G1-3、OsCYP51H8-2、OsOSC8(5)-5、OsCYP51H5-5、Os07g11440-1、OsCYP51H7-3、OsCYP51H6-3、OsCYP51G3-5、OsCYP51H9-3、OsOSC3-7、OsCYP51H5-1、OsCYP51H5-2、OsOSC3-2、 OsCAP1-4、Os07g11440-2、OsCAP1-3、Os06g03610-1、Os06g03610-2、Os06g03610-3、Os06g03610-4、Os06g03610-5、OsCAP1-2、OsOSC11-1、OsOSC11-2、OsOSC11-3、OsOSC11-4、OsOSC11-5、OsOSC11-6、OsOSC11-7、OsOSC11-8、OsOSC11-9、OsOSC11-10、Os06g10350-1、Os07g11440-3、Os03g11350-1、Os03g11350-3、OsS5ORF4-1、OsS5ORF4-3、Os06g43304-1、Os06g43304-3、Os06g43304-4、Os06g33720-1、Os06g33720-3、Os06g33720-5、Os09g08990-1、 Os09g08990-3、Os09g08990-4、Os01g24420-1、Os01g24420-2、Os01g24420-6、Os01g24420-7、 Os01g24420-8、Os01g24420-10、Os01g24430-2、Os01g24340-1、Os01g24340-3和 Os01g24350-3。每个位点的正向引物和反向引物的名称分别在引物对名称的末尾添加F(正向引物)和R(反向引物)用于区分两条引物。引物序列具体如表2.1和表2.2所示。
表2.1第一轮PCR正向引物
Figure BDA0002053006610000161
Figure BDA0002053006610000171
表2.2第一轮PCR反向引物
Figure BDA0002053006610000172
Figure BDA0002053006610000181
第二轮PCR(2nd PCR)的设计:正向引物为通用引物,是Illumina部分测序引物序列,将该引物记为P2F,该引物中含有第一轮PCR正向引物的重叠序列(TACACGACGCTCTTCCGATCT) 和18bp序列(AGATCTACACTCTTTCCC);反向引物为标签引物,含有反向引物的重叠序列 (AGACGTGTGCTCTTCCGATCT)、标签序列和连接序列(ATGCCATATTCGCTAG)。所设计引物及引物的序列如表2.3所示。
为了比较多重PCR的均匀度及多重PCR反应中容纳的引物对数,设计了10对、20对、28对、38对、48对和57对引物的多重PCR体系,将这几种体系分别记为Mix10、Mix20、Mix28、Mix38、Mix48和Mix57,设计了带有不同标签的反向引物用于区分各体系与不同DNA聚合酶(Q5High-Fidelity 2×Master Mix、KOD FX聚合酶、TaKaRa Ex Taq、KAPA高保真热启动DNA聚合酶和SD聚合酶)的PCR产物。不同体系中所用的正向引物的序列均相同,均为 P2F,反向引物分别为P2R-Tag1~P2R-Tag24。不同DNA聚合酶和不同体系的标签如表2.4和表2.5所示,均设置两个重复。
表2.3第二轮PCR引物
Figure BDA0002053006610000182
Figure BDA0002053006610000191
注:加粗字体为标签序列,P2R-Tag1~P2R-Tag24的标签分别为Tag1~Tag24,各标签对应的序列如下: Tag1:CATGA;Tag2:CATCT;Tag3:CATAC;Tag4:CAGAG;Tag5:CAGTC;Tag6:CAGCT;Tag7:CACTA; Tag8:CACGT;Tag9:CACTG;Tag10:CAAGG;Tag11:CAACC;Tag12:CAAGT;Tag13:AGTGA;Tag14:AGTCT; Tag15:AGTAC;Tag16:AGGAT;Tag17:AGGTG;Tag18:AGGCT;Tag19:AGCAT;Tag20;AGCTA;Tag21: AGCGT;Tag22:AGAGC;Tag23:AGACA;Tag24:AGAGT。
表2.4 4种DNA聚合酶与引物组合方式及所加标签和index序列信息
Figure BDA0002053006610000192
注:Q5表示Q5High-Fidelity 2×Master Mix,KOD表示KOD FX聚合酶,TaKaRa表示TaKaRa Ex Taq, KAPA表示KAPA高保真热启动DNA聚合酶。
表2.5 SD聚合酶与引物组合方式及所加标签和index序列信息
Figure BDA0002053006610000193
Figure BDA0002053006610000201
第三轮PCR引物(3rd PCR)的设计:第三轮PCR引物为Illumina通用引物,用于各体系,其作用是添加测序平台所需的序列;设计三条反向引物(Index7.0、Index8.0和Index9.0) 用于区分不同重复与DNA聚合酶的PCR产物,正向引物均为Primer1.0。具体序列如表2.6 所示。重复和DNA聚合酶的Index序列如表2.4和2.5所示。
表2.6第三轮PCR引物(Illumina测序平台通用引物)
Figure BDA0002053006610000202
注:表2.6中,加阴影字体为index序列。
2.3三步PCR方法富集多个目标DNA片段(制备二代测序的DNA模板)
三轮PCR反应过程示意图如图10所示。
1)稀释引物及引物组合
将表2.1的正向引物、表2.2的反向引物的每条引物均稀释至200pmol/μL的储存液后进行引物的混合,制备10×引物混合液,各10×引物混合液中每条引物的浓度均为2pmol/μL,具体混合方法如下:
Mix10体系:将OsCYP51G1-3F、OsCYP51H8-2F、OsOSC8(5)-5F、OsCYP51H5-5F、Os07g11440-1F、OsCYP51H7-3F、OsCYP51H6-3F、OsCYP51G3-5F、OsCYP51H9-3F和OsOSC3-7F十个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮Mix10体系的正向引物的10×引物混合液,将其称为1stPM10F(10×);将OsCYP51G1-3R、OsCYP51H8-2R、OsOSC8(5)-5R、OsCYP51H5-5R、Os07g11440-1R、OsCYP51H7-3R、OsCYP51H6-3R、 OsCYP51G3-5R、OsCYP51H9-3R和OsOSC3-7R十个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮Mix10体系的反向引物的10×引物混合液,将其称为1stPM10R(10×)。
Mix20体系:将OsCYP51G1-3F、OsCYP51H8-2F、OsOSC8(5)-5F、OsCYP51H5-5F、Os07g11440-1F、OsCYP51H7-3F、OsCYP51H6-3F、OsCYP51G3-5F、OsCYP51H9-3F、OsOSC3-7F、OsCYP51H5-1F、OsCYP51H5-2F、OsOSC3-2F、OsCAP1-4F、Os07g11440-2F、OsCAP1-3F、Os06g03610-1F、Os06g03610-2F、Os06g03610-3F和Os06g03610-4F二十个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮Mix20体系的正向引物的10×引物混合液,将其称为1stPM20F(10×);将OsCYP51G1-3R、OsCYP51H8-2R、 OsOSC8(5)-5R、OsCYP51H5-5R、Os07g11440-1R、OsCYP51H7-3R、OsCYP51H6-3R、OsCYP51G3-5R、OsCYP51H9-3R、OsOSC3-7R、OsCYP51H5-1R、OsCYP51H5-2R、OsOSC3-2R、OsCAP1-4R、Os07g11440-2R、OsCAP1-3R、Os06g03610-1R、Os06g03610-2R、Os06g03610-3R和Os06g03610-4R二十个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到 50μl,得到第一轮Mix20体系的反向引物的10×引物混合液,将其称为1stPM20R(10×)。
Mix28体系:将OsCYP51G1-3F、OsCYP51H8-2F、OsOSC8(5)-5F、OsCYP51H5-5F、Os07g11440-1F、OsCYP51H7-3F、OsCYP51H6-3F、OsCYP51G3-5F、OsCYP51H9-3F、OsOSC3-7F、OsCYP51H5-1F、OsCYP51H5-2F、OsOSC3-2F、OsCAP1-4F、Os07g11440-2F、OsCAP1-3F、Os06g03610-1F、Os06g03610-2F、Os06g03610-3F、Os06g03610-4F、Os06g03610-5F、OsCAP1-2F、 OsOSC11-1F、OsOSC11-2F、OsOSC11-3F、OsOSC11-4F、OsOSC11-5F和OsOSC11-6F二十八个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮Mix28体系的正向引物的10×引物混合液,将其称为1stPM28F(10×);将OsCYP51G1-3R、OsCYP51H8-2R、OsOSC8(5)-5R、OsCYP51H5-5R、Os07g11440-1R、OsCYP51H7-3R、OsCYP51H6-3R、 OsCYP51G3-5R、OsCYP51H9-3R、OsOSC3-7R、OsCYP51H5-1R、OsCYP51H5-2R、OsOSC3-2R、OsCAP1-4R、Os07g11440-2R、OsCAP1-3R、Os06g03610-1R、Os06g03610-2R、Os06g03610-3R、Os06g03610-4R、Os06g03610-5R、OsCAP1-2R、OsOSC11-1R、OsOSC11-2R、OsOSC11-3R、OsOSC11-4R、OsOSC11-5R和OsOSC11-6R二十八个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮Mix28体系的反向引物的10×引物混合液,将其称为1stPM28R(10×)。
Mix38体系:将OsCYP51G1-3F、OsCYP51H8-2F、OsOSC8(5)-5F、OsCYP51H5-5F、Os07g11440-1F、OsCYP51H7-3F、OsCYP51H6-3F、OsCYP51G3-5F、OsCYP51H9-3F、OsOSC3-7F、OsCYP51H5-1F、OsCYP51H5-2F、OsOSC3-2F、OsCAP1-4F、Os07g11440-2F、OsCAP1-3F、Os06g03610-1F、Os06g03610-2F、Os06g03610-3F、Os06g03610-4F、Os06g03610-5F、OsCAP1-2F、 OsOSC11-1F、OsOSC11-2F、OsOSC11-3F、OsOSC11-4F、OsOSC11-5F、OsOSC11-6F、OsOSC11-7F、 OsOSC11-8F、OsOSC11-9F、OsOSC11-10F、Os06g10350-1F、Os07g11440-3F、Os03g11350-1F、 Os03g11350-3F、OsS5ORF4-1F和OsS5ORF4-3F三十八个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮Mix38体系的正向引物的10×引物混合液,将其称为1stPM38F(10×);将OsCYP51G1-3R、OsCYP51H8-2R、OsOSC8(5)-5R、OsCYP51H5-5R、 Os07g11440-1R、OsCYP51H7-3R、OsCYP51H6-3R、OsCYP51G3-5R、OsCYP51H9-3R、OsOSC3-7R、 OsCYP51H5-1R、OsCYP51H5-2R、OsOSC3-2R、OsCAP1-4R、Os07g11440-2R、OsCAP1-3R、 Os06g03610-1R、Os06g03610-2R、Os06g03610-3R、Os06g03610-4R、Os06g03610-5R、OsCAP1-2R、 OsOSC11-1R、OsOSC11-2R、OsOSC11-3R、OsOSC11-4R、OsOSC11-5R、OsOSC11-6R、OsOSC11-7R、 OsOSC11-8R、OsOSC11-9R、OsOSC11-10R、Os06g10350-1R、Os07g11440-3R、Os03g11350-1R、 Os03g11350-3R、OsS5ORF4-1R和OsS5ORF4-3R三十八个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮Mix38体系的反向引物的10×引物混合液,将其称为1stPM38R(10×)。
Mix48体系:将OsCYP51G1-3F、OsCYP51H8-2F、OsOSC8(5)-5F、OsCYP51H5-5F、Os07g11440-1F、OsCYP51H7-3F、OsCYP51H6-3F、OsCYP51G3-5F、OsCYP51H9-3F、OsOSC3-7F、OsCYP51H5-1F、OsCYP51H5-2F、OsOSC3-2F、OsCAP1-4F、Os07g11440-2F、OsCAP1-3F、Os06g03610-1F、Os06g03610-2F、Os06g03610-3F、Os06g03610-4F、Os06g03610-5F、OsCAP1-2F、 OsOSC11-1F、OsOSC11-2F、OsOSC11-3F、OsOSC11-4F、OsOSC11-5F、OsOSC11-6F、OsOSC11-7F、 OsOSC11-8F、OsOSC11-9F、OsOSC11-10F、Os06g10350-1F、Os07g11440-3F、Os03g11350-1F、 Os03g11350-3F、OsS5ORF4-1F、OsS5ORF4-3F、Os06g43304-1F、Os06g43304-3F、 Os06g43304-4F、Os06g33720-1F、Os06g33720-3F、Os06g33720-5F、Os09g08990-1F、 Os09g08990-3F、Os09g08990-4F和Os01g24420-1F四十八个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮Mix48体系的正向引物的10×引物混合液,将其称为1stPM48F(10×);将OsCYP51G1-3R、OsCYP51H8-2R、OsOSC8(5)-5R、 OsCYP51H5-5R、Os07g11440-1R、OsCYP51H7-3R、OsCYP51H6-3R、OsCYP51G3-5R、OsCYP51H9-3R、 OsOSC3-7R、OsCYP51H5-1R、OsCYP51H5-2R、OsOSC3-2R、OsCAP1-4R、Os07g11440-2R、OsCAP1-3R、 Os06g03610-1R、Os06g03610-2R、Os06g03610-3R、Os06g03610-4R、Os06g03610-5R、OsCAP1-2R、 OsOSC11-1R、OsOSC11-2R、OsOSC11-3R、OsOSC11-4R、OsOSC11-5R、OsOSC11-6R、OsOSC11-7R、 OsOSC11-8R、OsOSC11-9R、OsOSC11-10R、Os06g10350-1R、Os07g11440-3R、Os03g11350-1R、 Os03g11350-3R、OsS5ORF4-1R、OsS5ORF4-3R、Os06g43304-1R、Os06g43304-3R、 Os06g43304-4R、Os06g33720-1R、Os06g33720-3R、Os06g33720-5R、Os09g08990-1R、 Os09g08990-3R、Os09g08990-4R和Os01g24420-1R四十八个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮Mix48体系的反向引物的10×引物混合液,将其称为1stPM48R(10×)。
Mix57体系:将OsCYP51G1-3F、OsCYP51H8-2F、OsOSC8(5)-5F、OsCYP51H5-5F、Os07g11440-1F、OsCYP51H7-3F、OsCYP51H6-3F、OsCYP51G3-5F、OsCYP51H9-3F、OsOSC3-7F、OsCYP51H5-1F、OsCYP51H5-2F、OsOSC3-2F、OsCAP1-4F、Os07g11440-2F、OsCAP1-3F、Os06g03610-1F、Os06g03610-2F、Os06g03610-3F、Os06g03610-4F、Os06g03610-5F、OsCAP1-2F、 OsOSC11-1F、OsOSC11-2F、OsOSC11-3F、OsOSC11-4F、OsOSC11-5F、OsOSC11-6F、OsOSC11-7F、 OsOSC11-8F、OsOSC11-9F、OsOSC11-10F、Os06g10350-1F、Os07g11440-3F、Os03g11350-1F、 Os03g11350-3F、OsS5ORF4-1F、OsS5ORF4-3F、Os06g43304-1F、Os06g43304-3F、 Os06g43304-4F、Os06g33720-1F、Os06g33720-3F、Os06g33720-5F、Os09g08990-1F、 Os09g08990-3F、Os09g08990-4F和Os01g24420-1F五十七个引物的储存液各取0.5μl混在一起,然后加入1×TE缓冲液补齐到50μl,得到第一轮Mix57体系的正向引物的10×引物混合液,将其称为1stPM57F(10×);将OsCYP51G1-3R、OsCYP51H8-2R、OsOSC8(5)-5R、 OsCYP51H5-5R、Os07g11440-1R、OsCYP51H7-3R、OsCYP51H6-3R、OsCYP51G3-5R、OsCYP51H9-3R、 OsOSC3-7R、OsCYP51H5-1R、OsCYP51H5-2R、OsOSC3-2R、OsCAP1-4R、Os07g11440-2R、OsCAP1-3R、 Os06g03610-1R、Os06g03610-2R、Os06g03610-3R、Os06g03610-4R、Os06g03610-5R、OsCAP1-2R、 OsOSC11-1R、OsOSC11-2R、OsOSC11-3R、OsOSC11-4R、OsOSC11-5R、OsOSC11-6R、OsOSC11-7R、 OsOSC11-8R、OsOSC11-9R、OsOSC11-10R、Os06g10350-1R、Os07g11440-3R、Os03g11350-1R、 Os03g11350-3R、OsS5ORF4-1R、OsS5ORF4-3R、Os06g43304-1R、Os06g43304-3R、 Os06g43304-4R、Os06g33720-1R、Os06g33720-3R、Os06g33720-5R、Os09g08990-1R、Os09g08990-3R、Os09g08990-4R、Os01g24420-1R、Os01g24420-2R、Os01g24420-6R、 Os01g24420-7R、Os01g24420-8R、Os01g24420-10R、Os01g24430-2R、Os01g24340-1R、 Os01g24340-3R和Os01g24350-3R五十七个引物的储存液各取0.5μl混在一起,然后加入 1×TE缓冲液补齐到50μl,得到第一轮Mix57体系的反向引物的10×引物混合液,将其称为1stPM57R(10×)。
将第二轮各引物和第三轮各引物均稀释至2.5pmol/μl。
2)第一轮PCR反应
取上述中花11(ZH11)基因组DNA稀释至5ng/μl作为PCR的DNA模板。
不同Q5体系(即利用Q5High-Fidelity 2×Master Mix进行扩增的体系,10μl)均包括:DNA模板(5ng/μl)2μl;1stPM10F(10×)或1stPM20F(10×)或1stPM28F(10×)或1stPM38F(10×)或1stPM48F(10×)或1stPM57F(10×)0.44μl;1stPM10R(10×)或1stPM20R(10×)或1stPM28R(10×)或1stPM38R(10×)或1stPM48R(10×)或1stPM57R(10×) 0.44μl;Q5High-Fidelity 2×Master Mix 5μl;最后用ddH2O补到10μl。同一Q5的体系中含有下述引物组合中的任一种:1stPM10F(10×)与1stPM10R(10×),1stPM20F(10×)与1stPM20R(10×),1stPM28F(10×)与1stPM28R(10×),1stPM38F(10×)与1stPM38R(10×),1stPM48F(10×)与1stPM48R(10×),1stPM57F(10×)与1stPM57R(10×)。
不同KOD FX体系(即利用KOD FX聚合酶进行PCR扩增的反应体系,10μl)均包括:DNA 模板(5ng/μl)2μl;dNTPs(2.5mM)0.8μl;2×KOD buffer 5μl;1stPM10F(10×)或1stPM20F(10×)或1stPM28F(10×)或1stPM38F(10×)或1stPM48F(10×)或1stPM57F(10×) 0.44μl;1stPM10R(10×)或1stPM20R(10×)或1stPM28R(10×)或1stPM38R(10×)或1stPM48R(10×)或1stPM57R(10×)0.44μl;KOD FX聚合酶(1U/μl)0.16μl;最后用 ddH2O补齐到10μl。同一KOD的体系中含有下述引物组合中的任一种:1stPM10F(10×)与 1stPM10R(10×),1stPM20F(10×)与1stPM20R(10×),1stPM28F(10×)与1stPM28R(10×),1stPM38F(10×)与1stPM38R(10×),1stPM48F(10×)与1stPM48R(10×),1stPM57F(10×)与1stPM57R(10×)。
不同TaKaRa体系(即利用TaKaRa Ex Taq进行PCR扩增的反应体系,10μl)均包括:DNA模板(5ng/μl)2μl;dNTPs(2.5mM)0.8μl;Ex Taq buffer 1μl;1stPM10F(10×) 或1stPM20F(10×)或1stPM28F(10×)或1stPM38F(10×)或1stPM48F(10×)或1stPM57F (10×)0.44μl;1stPM10R(10×)或1stPM20R(10×)或1stPM28R(10×)或1stPM38R(10×) 或1stPM48R(10×)或1stPM57R(10×)0.44μl;TaKaRa Ex Taq(5U/μl)0.1μl;最后用 ddH2O补齐到10μl。同一TaKaRa的体系中含有下述引物组合中的任一种:1stPM10F(10×) 与1stPM10R(10×),1stPM20F(10×)与1stPM20R(10×),1stPM28F(10×)与1stPM28R(10×),1stPM38F(10×)与1stPM38R(10×),1stPM48F(10×)与1stPM48R(10×),1stPM57F(10×)与1stPM57R(10×)。
不同KAPA体系(即利用KAPA高保真热启动DNA聚合酶进行PCR扩增的反应体系,10μl) 均包括:DNA模板(5ng/μl)2μl;dNTPs(2.5mM)0.8μl;5×Buffer A 2μl;1stPM10F(10×)或1stPM20F(10×)或1stPM28F(10×)或1stPM38F(10×)或1stPM48F(10×)或1stPM57F(10×)0.44μl;1stPM10R(10×)或1stPM20R(10×)或1stPM28R(10×)或1stPM38R(10×)或1stPM48R(10×)或1stPM57R(10×)0.44μl;KAPA高保真热启动DNA聚合酶(5U/μl)0.1 μl;最后用ddH2O补齐到10μl。同一KAPA的体系中含有下述引物组合中的任一种:1stPM10F(10×)与1stPM10R(10×),1stPM20F(10×)与1stPM20R(10×),1stPM28F(10×)与1stPM28R(10×),1stPM38F(10×)与1stPM38R(10×),1stPM48F(10×)与1stPM48R(10×),1stPM57F(10×)与1stPM57R(10×)。
不同SD体系(即利用SD聚合酶进行PCR扩增的反应体系,10μl)均包括:DNA模板(5ng/μl)2μl;dNTPs(2.5mM)0.8μl;SD buffer 1μl;MgCl2(100mM)0.3μl; 1stPM10F(10×)或1stPM20F(10×)或1stPM28F(10×)或1stPM38F(10×)或1stPM48F(10×) 或1stPM57F(10×)0.44μl;1stPM10R(10×)或1stPM20R(10×)或1stPM28R(10×)或 1stPM38R(10×)或1stPM48R(10×)或1stPM57R(10×)0.44μl;SD聚合酶(10U/μl)0.2 μl;最后用ddH2O补齐到10μl。同一SD的体系中含有下述引物组合中的任一种: 1stPM10F(10×)与1stPM10R(10×),1stPM20F(10×)与1stPM20R(10×),1stPM28F(10×)与 1stPM28R(10×),1stPM38F(10×)与1stPM38R(10×),1stPM48F(10×)与1stPM48R(10×), 1stPM57F(10×)与1stPM57R(10×)。
各Q5体系的反应程序均为:98℃30sec;20个循环(98℃10s,58℃30s,72℃30s);72℃2min;12℃保温。
各KOD FX体系的反应程序均为:94℃2min;20个循环(98℃10s,58℃40s,68℃1min); 68℃5min;12℃保温。
各TaKaRa体系的反应程序均为:95℃2min;20个循环(98℃10s,58℃40s,72℃1min); 72℃5min;12℃保温。
各KAPA体系的反应程序均为:95℃3min;20个循环(95℃20s,58℃40s,72℃1min);72℃2min;12℃保温。
各SD体系的反应程序均为:92℃2min;20个循环(92℃10s,58℃40s,68℃30sec);68℃5min;12℃保温。
反应结束后,将第一轮PCR产物分别稀释25倍,得到稀释液,作为第二轮PCR反应的模板。
3)第二轮PCR反应
5种DNA聚合酶扩增6个不同试验所加标签序列信息见表2.4和表2.5。取上述的第一轮 PCR产物的3μl稀释液作为第二轮PCR的模板,第二轮PCR所用DNA聚合酶与第一轮保持一致,不同第一轮PCR产物分别进行第二轮扩增。
不同Q5第二轮体系(即利用Q5High-Fidelity 2×Master Mix进行扩增的体系)均包括(10μl):第一轮PCR产物的稀释液3μl;P2F 0.64μl;第二轮反向引物(P2R-Tag7、 P2R-Tag8、P2R-Tag9、P2R-Tag10、P2R-Tag11或P2R-Tag12,每个体系中一种反向引物) 0.64μl;Q5High-Fidelity 2×Master Mix 5μl;ddH2O 0.72μl。
各Q5第二轮体系的PCR反应程序均为:98℃30sec;18个循环(98℃10s,58℃40s,72℃1min);72℃2min;12℃保温。
不同KOD第二轮体系(即利用KOD FX聚合酶进行PCR扩增的反应体系)均包括(10μl):第一轮PCR产物的稀释液3μl;dNTPs(2.5mM)0.8μl;2×KOD buffer 5μl;P2F 0.8μl;第二轮反向引物(P2R-Tag19、P2R-Tag20、P2R-Tag21、P2R-Tag22、P2R-Tag23或P2R-Tag24,每个体系中一种反向引物)0.8μl;KOD FX聚合酶0.16μl,最后用ddH2O补齐到10μl。
各KOD第二轮体系的PCR反应程序均为:94℃2min;20个循环(98℃10s,58℃40s,68℃1min);68℃5min;12℃保温。
不同TaKaRa第二轮体系(即利用TaKaRa Ex Taq进行PCR扩增的反应体系)均包括(10μl):第一轮PCR产物的稀释液3μl;dNTPs(2.5mM)0.8μl;Ex Taq buffer 1μl; P2F 0.8μl;第二轮反向引物(P2R-Tag1、P2R-Tag2、P2R-Tag3、P2R-Tag4、P2R-Tag5或 P2R-Tag6,每个体系中一种反向引物)0.8μl;TaKaRa Ex Taq 0.1μl,最后用ddH2O补齐到10μl。
各TaKaRa第二轮体系的PCR反应程序均为:95℃2min;20个循环(98℃10s,58℃40s,72℃1min);72℃5min;12℃保温。
不同KAPA第二轮体系(即利用KAPA高保真热启动DNA聚合酶进行PCR扩增的反应体系) 均包括(10μl):第一轮PCR产物的稀释液3μl;dNTPs(2.5mM)0.8μl;5×Buffer A 2μl;P2F 0.8μl;第二轮反向引物(P2R-Tag13、P2R-Tag14、P2R-Tag15、P2R-Tag16、P2R-Tag17 或P2R-Tag18,每个体系中一种反向引物)0.8μl;KAPA高保真热启动DNA聚合酶(5U/μl) 0.1μl,最后用ddH2O补齐到10μl。
各KAPA第二轮体系的PCR反应程序均为:95℃3min;20个循环(95℃20s,58℃40s,72℃1min);72℃2min;12℃保温。
不同SD第二轮体系(即利用SD聚合酶进行PCR扩增的反应体系)均包括(10μl):第一轮PCR产物的稀释液3μl;dNTPs(2.5mM)0.8μl;SD buffer 1μl;MgCl2(100mM)0.3μl; P2F0.8μl;第二轮反向引物(P2R-Tag1、P2R-Tag2、P2R-Tag3、P2R-Tag4、P2R-Tag5、P2R-Tag6、P2R-Tag7、P2R-Tag8、P2R-Tag9、P2R-Tag10、P2R-Tag11或P2R-Tag12,每个体系中一种反向引物)0.8μl;SD聚合酶(10U/μl)0.2μl,最后用ddH2O补齐到10μl。
各SD第二轮体系的PCR反应程序均为:92℃2min;20个循环(92℃30s,60℃30s, 68℃30sec);68℃5min;12℃保温。
PCR反应结束后,用1.5%琼脂糖胶检测第二轮PCR的扩增情况。
然后用QIAquick Gel Extraction Kit分别纯化第二轮的PCR产物,按照试剂盒说明书对第二轮PCR产物进行纯化,纯化过程中除去目的片段以外的序列,将相同DNA聚合酶得到的纯化产物进行等摩尔的混合,各DNA聚合酶均得到30μl的DNA洗脱液。检测DNA洗脱液的浓度,并作为第三轮PCR的模板。
4)第三轮PCR反应
将步骤3)得到的各DNA洗脱液分别进行第三轮PCR扩增,第三轮PCR是在目标片段加上Illumina测序引物,第三轮PCR均采用Q5High-Fidelity 2×Master Mix进行扩增。
50μlPCR扩增体系为:步骤3)得到的洗脱液(10ng/μl)3μl;Primer1.0(2.5μM) 5μl;Index7.0或Index8.0或Index9.0(2.5μM)5μl;Q5High-Fidelity 2×Master Mix 25μl;ddH2O补至50μl。在第三轮PCR反应中,前两轮的TaKaRa Ex Taq、Q5High-Fidelity 2×Master Mix、KAPA高保真热启动DNA聚合酶、KOD FX聚合酶得到的PCR产物的重复1采用Primer1.0与Index7.0进行扩增,重复2采用Primer1.0与Index8.0进行扩增;前两轮 SD聚合酶得到的PCR产物的重复1和重复2均采用Primer1.0与Index9.0进行扩增。
PCR反应程序均为:98℃30s;18个循环(98℃10s,65℃30s,72℃30s);72℃2min;12℃保温。
应结束后,用1.5%的琼脂糖胶检测第三轮PCR产物,取1μl第三轮PCR产物在琼脂糖胶上检测。然后用QIAquick Gel Extraction Kit纯化第三轮PCR产物,按照试剂盒说明书对第三轮PCR产物进行纯化,得到30μl的DNA洗脱液,纯化过程中除去目的片段以外的序列。该DNA洗脱液即为用于Illumina Hiseq2500测序上机所用的DNA测序模板。
用1.5%琼脂糖检测胶纯化后的DNA,取1μl胶纯化后DNA洗脱液样品用1.5%琼脂糖胶检测。经过切胶回收后的第三轮PCR产物,浓度明显降低。要经过检测并定量后再上Illumina 平台测序。
2.4Illumina Hiseq平台测序及数据分析
将第三轮PCR的PCR产物的切胶回收得到的DNA洗脱液经由贝瑞和康测序公司使用Illumina Hiseq2500测序平台进行双端125bp的测序。数据过滤及分析方法利用池旭(Xuet al.2014,Plant Biotechnology Journal,pp.1-9)分布过滤方法。
重复1的Q5的体系、KOD的体系、TaKaRa的体系和KAPA的体系的产物的测序数据分配见图11。从该结果中看出,能够被分配24个标签中的reads数/clean reads数分别为8474186/8637669(98%)。
使用bowtie将各个Tag的数据分别比对到参考序列上,而后用samtools2.0处理比对结果,生成pile up后的结果。重复1的Taraka Ex Taq的分析比对结果如表2.7所示。
表2.7 Taraka Ex Taq扩增不同引物对数试验中每个目标的片段获得reads数的对比
Figure BDA0002053006610000261
Figure BDA0002053006610000271
用同样的方法对Q5High-Fidelity 2×Master Mix、KOD FX聚合酶、KAPA高保真热启动DNA聚合酶和SD聚合酶扩增的每个实验进行了reads数的统计。
分组后的数据经过与参考序列的比对,并进行堆积处理后统计,5种聚合酶酶获得的可用产物数量(即得到目的片段的引物对数)的比较,如图12所示,5种DNA聚合酶进行多重 PCR的实验中,5种DNA聚合酶扩增模式基本是相同的。Extaq(Taraka Ex Taq)、Q5(Q5High-Fidelity 2×Master Mix)、KAPA高保真热启动DNA聚合酶(KAPA2GTM RobustHotStart) 和KOD(KOD FX聚合酶)得到目标片段的引物对数要高于SD(SD聚合酶)。Extaq(Taraka Ex Taq)、Q5(Q5High-Fidelity 2×Master Mix)和KOD(KOD FX聚合酶)这4种DNA聚合酶得到目标片段的引物对数是基本相同的。但是,在KAPA(KAPA高保真热启动DNA聚合酶) 扩增的模式中可以看出,当引物对数增加到48对时,得到目标片段的引物对数要少于Extaq、 Q5和KOD三种酶。因为Extaq和KOD保真性要低于Q5,所以Q5用于下一步实验当中。从Q5 的富集目标片段的结果中可以看出,随着引物数量的增加,实际可用产物数量(即得到目的片段的引物对数)虽远离理论数,未达到平台期,引物对数仍然可以增加。
5种聚合酶不同引物组合得到目标片段比率(即得到目标片段的引物对数占相应引物组合体系中总引物对数的比率)的比较:如图13所示,5种酶在6个不同引物组合中得到到目标片段的比率均在75%-100%间(除SD聚合酶)。而且,Q5得到到目标片段的比率都接近90%或在90%以上。
重复2的结果与重复1的结果具有相同的趋势。
2.5结论
综上所述,通过比较不同的DNA聚合酶多重PCR富集DNA目标片段的效果,寻找一种更适合多重复DNA目标片段的DNA聚合酶,并且可以直接用于Illumina Hiseq测序平台。从实验数据分析结果可以作出以下结论:
①Taraka Ex Taq、Q5High-Fidelity 2×Master Mix、KAPA高保真热启动DNA聚合酶和KOD FX聚合酶更适合用于多重PCR反应,并且这4种DNA聚合酶多重PCR的扩增模式和效果是基本相同的。而SD聚合酶多重PCR扩增效果较差。
②从图12和13中可以看出,得到目标片段的引物对数(即引物组合中能扩增出目标片段的引物对数)还没达到平台期,下一步可以继续增加引物的混合数量。
③从图14中可以看出数据利用率在40%以上,说明这次整个实验中数据的利用率比较低。但是,从图13中可以看出,每个实验中得到目标片段的比率都在80%以上(除了KODFX 聚合酶(mix57)),说明了数据利用率不会影响目标片段富集的比率。其中,数据利用率为含有各个标签的比对在参考序列上的数据量与含有相应标签的数据量之比。
从图14中可以看出,数据利用率在不同引物组合实验中没有明显规律,多重PCR十个复杂的过程,在1个PCR反应加入过多的引物对,除了目标片段与引物特异结合问题以外,还存在引物与引物之间竞争的问题。
④综合考虑每种多重PCR扩增效果,Q5High-Fidelity 2×Master Mix各方面的表现要优于Taraka Ex Taq、KAPA高保真热启动DNA聚合酶和KOD FX聚合酶,所以用Q5 High-Fidelity 2×Master Mix更适合用于多重PCR。
实施例3、多重PCR的优化
一、影响多重PCR的因素的分析
为了实现在1个PCR反应体系中特异性的富集更多的目标片段,发明人利用不同DNA序列分析软件(DNAMAN软件和Oligo7软件)分析引物的特征,特异的对每条引物的3’端和5’端与同一PCR反应体系中其它引物的互补3个核苷酸或4个核苷酸的数量进行统计,利用PCR Primer Stats和Multiple Primer Analyzer网站再次对引物之间的互补情况进行了统计,分析对象为实施例2中表2.1和表2.2所组成的57对引物序列,各软件和网站所分析的指标具体如表3.1所示。
利用DNAMAN软件和Oligo7软件统计了的每对引物PCR扩增影响因素(表3.1)。
当在1个PCR反应体系中增加引物对时,要检测所有引物对之间的互补的情况是至关重要的。把引物之间出现互补情况分为3类:Homologies、Complementaries和Primer-dimer products。对57对引物中的每条引物的3’端和5’端的同源(互补)的引物个数情况进行了统计。
人工统计了每对引物的3’端的如下指标:3’homo-3-F(与正向引物3’端同源3个核苷酸的引物个数)、3’homo-3-R(与反向引物3’端同源3个核苷酸的引物个数)、3’homo-4-F(与正向引物3’端同源4个核苷酸的引物个数)、3’homo-4-R(与反向引物3’端同源4个核苷酸的引物个数)、3'homo-5-F(与正向引物3’端同源5个核苷酸的引物个数)、3’homo-5-R(与反向引物3’端同源5个核苷酸的引物个数)、3'comp-3-F(与正向引物3’端互补3个核苷酸的引物个数)、3'comp-3-R(与反向引物3’端互补3个核苷酸的引物个数)、3'comp-4-F(与正向引物3’端互补4个核苷酸的引物个数)、3'comp-4-R(与反向引物3’端互补4个核苷酸的引物个数)。
PCR Primer Stats统计引物设计的参数为:F-GC clamp、R-GC clamp、F-Self-annealing、 R-Self-annealing、F-Hairpin formation、R-Hairpin formation、F-3’-Self-dimers、 R-3’-Self-dimers、F-5’-Self-dimers、R-5’-Self-dimers、F-Self-dimerson the middle、R-Self-dimers on the middle。
还利用Multiple Primer Analyzer网站进行分析引物之间的互补情况。统计指标为:(1) 与引物序列3’端大于或等于5个核苷酸互补的其它引物的个数;(2)与引物序列5’端大于或等于5个核苷酸互补的其它引物的个数;(3)57对引物中所形成的cross primerdimer (交叉引物二聚体)的个数;(4)各个引物对的中部连续大于等于5个核苷酸与其它引物形成cross primer dimers TM值。利用Multiple Primer Analyzer对F-Cross primerdimers、 R-Cross primer dimers、F-Cross dimers on the middle和R-Cross dimers onthe middle 四种情况的数量进行统计。
分析的因素名称与所用工具具体含义见表3.1。
表3.1分析影响多重PCR因素的来源及名称的具体含义
Figure BDA0002053006610000291
Figure BDA0002053006610000301
上述不同分析方法发现,影响多重PCR扩增能力的候选因素及各因素需要满足的条件见 3.2,在多重PCR扩增体系中所有引物对的因素J(即R-Cross primer dimers)均小于50%时,体系中每个引物对的因素A-I中至多一个因素不在标准范围内的扩增体系的扩增效率高于至少一个引物对存在大于等于两个不符合标准范围的因素的扩增体系的扩增效率;所有引物对的因素J均小于50%的扩增体系的扩增效率大于至少一个引物对的因素J小于50%的扩增体系的扩增效率。
扩增效率是指在PCR扩增体系中引物对实际扩增到的目标片段的量占理论应得目标片段的量的百分比,上述扩增体系的扩增效率是指多重PCR扩增体系中所有引物对扩增效率的平均值。
表3.2候选因素满足条件
Figure BDA0002053006610000302
Figure BDA0002053006610000311
注:目标片段是指引物对进行PCR扩增所得到的DNA片段;引物中部是指引物序列自5’末端核苷酸始的第5个核苷酸与自3’末端核苷酸始的第5个核苷酸间的区域;一引物对的反向引物的GC含量(%) 为上文GC(reverse);一引物对的反向引物的TM值(℃)为上文TM(reverse);目标片段的GC含量(%) 为上文GC of target;从一目标片段上游400bp处至该目标片段下游400bp处间的DNA片段的GC含量(%) 为上文GC around target;一目标片段的结构自由能(kcal/mol)为Free energy of target;一目标片段及目标片段下游150bp的连续DNA片段的结构自由能(kcal/mol)为上文Structure of Forward target;一目标片段及目标片段上游150bp的连续DNA片段的结构自由能(kcal/mol)为上文Structure ofReverse target;一对引物的正向引物3’末端5个核苷酸的结构自由能(kcal/mol)为上文3'ΔG of Forward;同一PCR反应体系中一引物对的反向引物与其它各引物中部连续大于等于5个核苷酸所形成的多个双链DNA的TM值总和(℃)为上文R-Cross dimers on themiddle;同一PCR反应体系中一个引物对的反向引物与其它引物形成引物二聚体的个数占体系中总引物个数的百分比为上文R-Cross primer dimers。
二、影响多重PCR的因素的验证
选取实施例2中能扩增到目的片段且各引物特征均符合的表3.2的条件的位点(选取位点为OsOSC11-2、Os09g08990-4、Os01g24420-2、Os01g24350-3、OsOSC11-8、OsOSC11-4、Os01g24420-8、OsS5ORF4-3、OsOSC11-5、Os01g24420-10、OsOSC3-2、Os09g08990-3、OsOSC3-7、OsCYP51H5-2、OsOSC11-3、OsCYP51G3-5、Os09g08990-1、OsOSC11-9、Os01g24340-3、Os07g11440-1、Os06g03610-5、Os01g24420-7、OsCYP51H5-5)。另外选取七个位点(所选取位点为OsCYPH5-1、OsCYPH5-3、OsCYPH4-1、OsCYP51H4-4、OsCYP51H6-1、OsCYP51H6-3、OsCYP51H6-4)并设计满足表3.2的条件的第一轮PCR引物,进行多重PCR,所选取的七个位点的第一轮PCR引物的设计方法同实施例2,具体引物见表3.3,各引物的特征如表3.4所示。
表3.3七个位点的第一轮PCR引物序列
引物名称 引物序列(5’-3’) 序列编号
OsCYPH5-1F TACACGACGCTCTTCCGATCTATTGACACTTGTGTTAGCTAGG 234
OsCYPH5-1R ATGCCATattcgctagAGACCCTTGGCTATAAGTGTAGG 235
OsCYPH5-3F TACACGACGCTCTTCCGATCTTGATCCTAGCTAGATTGATTG 236
OsCYPH5-3R ATGCCATattcgctagCTGTGGGGTAGGGAGATATG 237
OsCYPH4-1F TACACGACGCTCTTCCGATCTTTGTGATCATGGATCACATATTC 238
OsCYPH4-1R ATGCCATattcgctagCAAGTGACCTGAGCGTAAACA 239
OsCYPH4-4F TACACGACGCTCTTCCGATCTCATCTCCGTAAACTAATCTTGTT 240
OsCYPH4-4R ATGCCATattcgctagTTGACGATCTGGGAGAATATCTC 241
OsCYPH6-1F TACACGACGCTCTTCCGATCTCGCATTTCCAGGCTACTTAATTG 242
OsCYPH6-1R ATGCCATattcgctagCTAGGAGAGCGATGCAATTCACA 243
OsCYPH6-3F TACACGACGCTCTTCCGATCTTGGCATCACCTACATGTTCTG 244
OsCYPH6-3R ATGCCATattcgctagATCTCACGATGTCGGAGAAGATG 245
OsCYPH6-4F TACACGACGCTCTTCCGATCTAGCTGTTTGAGAAACTAACTGC 246
OsCYPH6-4R ATGCCATattcgctagACGATTCTGCCATTGATGATG 247
Figure BDA0002053006610000321
第一轮PCR共涉及四种引物组合方式,这四种引物组合方式分别为15对引物、20对引物、25对引物和30对引物的组合。15对引物组合中涉及的15个位点为OsOSC11-2、Os09g08990-4、Os01g24420-2、Os01g24350-3、OsOSC11-8、OsOSC11-4、Os01g24420-8、OsS5ORF4-3、OsOSC11-5、Os01g24420-10、OsOSC3-2、Os09g08990-3、OsOSC3-7、 OsCYP51H5-2、OsOSC11-3,20对引物组合中涉及的20个位点在15对引物的基础上增加了 OsCYP51G3-5、Os09g08990-1、OsOSC11-9、Os01g24340-3、Os07g11440-1,25对引物组合中涉及的25个位点在20对引物的基础上增加了Os06g03610-5、Os01g24420-7、OsCYPH5-1、 OsCYPH5-3、OsCYPH4-1,30对引物组合中涉及的30个位点在25对引物的基础上增加了 OsCYP51H5-5、OsCYP51H4-4、OsCYP51H6-1、OsCYP51H6-3、OsCYP51H6-4。
第二轮PCR引物中的正向引物同表2.3,反向引物除标签序列外其余序列同表2.3,反向引物共4条,标签序列分别为Tag1:CATGA;Tag2:CATCT;Tag3:CATAC;Tag4:CAGAG。
第三轮PCR引物中的正向引物同表2.6,反向引物除index序列外其余序列同表2.6,反向引物共2条(分别在进行两个重复中),index序列分别为Index11(序列为GTAGCC)和 Index12(序列为TACAAG)。第三轮PCR共两个重复,重复1和重复2的反向引物中的index序列分别为Index11和Index12。
按照实施例2中Q5High-Fidelity 2×Master Mix的多重PCR的方法分别进行第一轮、第二轮和第三轮PCR扩增,并对得到的PCR产物进行测序。所用DNA聚合酶为Q5High-Fidelity 2×Master Mix,反应体系配置方法(包括引物的浓度、DNA聚合酶的用量、其余各组分及用量)、反应条件及测序方法均同实施例2。标签与Index的组合方式见3.5。
表3.5标签与Index的组合方式
Figure BDA0002053006610000331
注:表3.5中,Lmix15、Lmix20、Lmix25和Lmix30所用引物分别为15、20、25和30对引物组合。
测序数据分析:4个Imix实验数据共获得2.1Gb,根据标签序列对数据进行分组,各个实验所获得的数据量分别为Imix15占12%,Imix20占18%,Imix25占26%,Imix30占44%。 4个Lmix实验数据共获得1Gb,根据标签序列对数据进行分组,各个实验所获得的数据量分别为Lmix占4%,Lmix20占15%,Lmix25占28%,Lmix30占53%。
分组后的数据经过与参考序列比对,并进行堆积处理后进行统计,从扩增的特异性来看,两个重复实验高质量的比对到参考序列上。在Imix实验中,能比对到参考序列上的目标片段数据量所占的比率(即数据利用率)在95.84%-99.91%;在Lmix实验中,能比对到参考序列上的目标片段数据量所占的比率(即数据利用率)在93.17%-99.85%(图15)。
本实施例成功的完成了在一个PCR反应的体系中30个目标片段的富集,同时不论在哪个引物混合个数的实验中都能获得100%的扩增目标片段的比率(图16),即每种引物组合中的每个引物对均能扩增到目标片段,表明,利用本实施例优化后的PCR引物的设计方法得到的多个引物对可以进行多重PCR扩增,并可以富集目标片段。
实施例4、水稻基因突变体的筛选
本实施例利用实施例3中优化后的多重PCR方法对512株水稻组成的群体中20个目标片段进行多重PCR扩增,来富集目标片段,进而筛选群体中的突变位点。这512个水稻突变体群体为中花11的叠氮化钠突变体群体。
这20个目标片段的引物对名称分别为Os06g10350-1、Os07g11440-2、Os07g11440-3、OsOSC11-1、OsOSC11-2、OsOSC11-3、OsOSC11-4、OsOSC11-5、OsOSC11-6、OsOSC11-7、OsOSC11-8、 OsOSC11-9、OsOSC11-10、OsCAP1-2、OsCAP1-3、OsCAP1-4、Os06g03610-3、Os06g03610-4、 Os06g03610-3UTR1和Os06g03610-5。每个目标片段的正向引物和反向引物的名称分别在引物对名称的末尾添加F(正向引物)和R(反向引物)用于区分两条引物。
1、样品池的制备
提取512株水稻的基因组DNA,按照如下方法将得到的DNA样品混合成8×8×8三维池(Xu et al.2014,Plant Biotechnology Journal,pp.1-9):
三维池的样品混合:每512份DNA样品排列成一个8×8×8的正方体。设正方体的三个正交的维度分别为X,Y和Z,则在此正方体中的每一个样品都有一个唯一的坐标(Xi, Yj,Zk)(i,j,kΣ(1,2,3,…,8)。样品混合的方式是每一个平面上的样品混合成一个池,例如,所有坐标满足(X1,Yj,Zk)(j,kΣ(1,2,3,…,8))的样品在同一平面X1上,该平面上的样品共有8×8=64个,这64个样品被等摩尔量混合成一个混合池,将该样品池记为 X1。同样的,可以将平面X2,X3…X8的样品分别混合成混合池,分别记为X2,X3…X8。同理,所有坐标满足(Xi,Y1,Zk)(i,kΣ(1,2,3…8))的样品在同一个平面Y1上,这64 个样品被等摩尔量混合成一个混合池,并命名为Y1,同样可以混合出Y2,Y3…Y8共8个混合池,分别记为Y2,Y3…Y8。最后,Z方向用同样的方法,也可以混合出8个混合池,即 Z1,Z2…Z8。因此,对于一个8×8×8的三位池,共混合出8×3=24个样品池。此时,正方体中的每一个样本都出现在这24个样品池中,且在每一个方向上的8个样品池中仅出现一次。例如,样品(X3,Y5,Z6)在X3,Y5和Y6这三个混合池中。
2、引物的制备
第一轮引物的制备:按照实施例2和实施例3中第一轮PCR引物的设计方法设计并合成扩增各个目的片段的引物(表4.1),各对引物的表3.2的各因素见表4.2。
表4.1第一轮PCR引物
Figure BDA0002053006610000341
Figure BDA0002053006610000351
Figure BDA0002053006610000361
合成第二轮PCR引物,序列表4.3,P2F为正向引物,其余均为反向引物。该轮PCR 产物中引入的标签,即Tag1-Tag24用于区分24个混合池。
表4.3第二轮引物
引物名称 引物序列(5‘-3’) 序列编号
P2F AGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 288
P2R-Tag1 AGACGTGTGCTCTTCCGATCTCATGAATGCCATATTCGCTAG 289
P2R-Tag2 AGACGTGTGCTCTTCCGATCTCATCTATGCCATATTCGCTAG 290
P2R-Tag3 AGACGTGTGCTCTTCCGATCTCATACATGCCATATTCGCTAG 291
P2R-Tag4 AGACGTGTGCTCTTCCGATCTCAGAGATGCCATATTCGCTAG 292
P2R-Tag5 AGACGTGTGCTCTTCCGATCTCAGTCATGCCATATTCGCTAG 293
P2R-Tag6 AGACGTGTGCTCTTCCGATCTCAGCTATGCCATATTCGCTAG 294
P2R-Tag7 AGACGTGTGCTCTTCCGATCTCACTAATGCCATATTCGCTAG 295
P2R-Tag8 AGACGTGTGCTCTTCCGATCTCACGTATGCCATATTCGCTAG 296
P2R-Tag9 AGACGTGTGCTCTTCCGATCTCACTGATGCCATATTCGCTAG 297
P2R-Tag10 AGACGTGTGCTCTTCCGATCTCAAGGATGCCATATTCGCTAG 298
P2R-Tag11 AGACGTGTGCTCTTCCGATCTCAACCATGCCATATTCGCTAG 299
P2R-Tag12 AGACGTGTGCTCTTCCGATCTCAAGTATGCCATATTCGCTAG 300
P2R-Tag13 AGACGTGTGCTCTTCCGATCTAGTGAATGCCATATTCGCTAG 301
P2R-Tag14 AGACGTGTGCTCTTCCGATCTAGTCTATGCCATATTCGCTAG 302
P2R-Tag15 AGACGTGTGCTCTTCCGATCTAGTACATGCCATATTCGCTAG 303
P2R-Tag16 AGACGTGTGCTCTTCCGATCTAGGATATGCCATATTCGCTAG 304
P2R-Tag17 AGACGTGTGCTCTTCCGATCTAGGTGATGCCATATTCGCTAG 305
P2R-Tag18 AGACGTGTGCTCTTCCGATCTAGGCTATGCCATATTCGCTAG 306
P2R-Tag19 AGACGTGTGCTCTTCCGATCTAGCATATGCCATATTCGCTAG 307
P2R-Tag20 AGACGTGTGCTCTTCCGATCTAGCTAATGCCATATTCGCTAG 308
P2R-Tag21 AGACGTGTGCTCTTCCGATCTAGCGTATGCCATATTCGCTAG 309
P2R-Tag22 AGACGTGTGCTCTTCCGATCTAGAGCATGCCATATTCGCTAG 310
P2R-Tag23 AGACGTGTGCTCTTCCGATCTAGACAATGCCATATTCGCTAG 311
P2R-Tag24 AGACGTGTGCTCTTCCGATCTAGAGTATGCCATATTCGCTAG 312
合成第三轮PCR引物,序列如表4.4。
表4.4第三轮引物
引物名称 引物序列(5‘-3’) 序列编号
Primer1.0 AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 313
Index4.0 CAAGCAGAAGACGGCATACGAGATTGGTCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT 314
按照实施例2中Q5High-Fidelity 2×Master Mix的多重PCR的方法分别进行第一轮、第二轮和第三轮PCR扩增,并对得到的PCR产物进行测序。所用DNA聚合酶均为Q5 High-Fidelity 2×Master Mix,反应体系配置方法(包括引物的浓度、DNA聚合酶的用量、其余各组分及用量)、反应条件及测序方法均同实施例2。
第一轮PCR扩增的模板为上文得到的24个样品池,所用PCR引物为表4.1的引物,每个样品池单独进行多重PCR,所用体系为实施例2的Q5的Mix20体系。第二轮PCR扩增的模板为第一轮PCR扩增产物,每个样品池的产物采用一种反向引物,正向引物相同。第三轮 PCR扩增的模板为第二轮PCR产物的等量混合物。
测序数据经过过滤后,得到了84608660高质量的reads(2.1Gbp),各引物对得到的目标片段的数据量占总数据中的百分比如表4.5所示。分组并将数据比对到参考序列上后,比对到参考序列上的数据比例平均为90%,最大97.4%(见表4.6)。
表4.5目标片段的数据量占总数据中的百分比(%)
引物对 百分比(%)
Os06g10350-1 13.99
Os07g11440-2 9.80
Os07g11440-3 7.35
OsOSC11-1 1.51
OsOSC11-2 3.74
OsOSC11-3 0.64
OsOSC11-4 0.48
OsOSC11-5 0.34
OsOSC11-6 0.25
OsOSC11-7 0.19
OsOSC11-8 0.59
OsOSC11-9 5.28
OsOSC11-10 2.35
OsCAP1-2 15.59
OsCAP1-3 24.88
OsCAP1-4 1.06
Os06g03610-3 0.22
Os06g03610-4 11.54
Os06g03610-3UTR1 0.17
Os06g03610-5 0.03
表4.6比对到参考序列上的reads所占的比例
混合池 比例(%) 混合池 比例(%) 混合池 比例(%)
X1 95.22 Z1 95.82 Y1 97.4
X2 95.14 Z2 96.42 Y2 93.64
X3 88.49 Z3 91.91 Y3 94.9
X4 93.17 Z4 91.14 Y4 94.56
X5 91.23 Z5 95.35 Y5 95.45
X6 94.77 Z6 95.26 Y6 95.39
X7 94.29 Z7 95.62 Y7 94.99
X8 95.86 Z8 95.13 Y8 95.5
分析各序列发现利用上述方法共得到11个突变体位点(见表4.7),每个片段富集的长度在200bp左右,突变体频率为1突变/220kb。
表4.7获得突变位点的情况
序号 引物 坐标顺序 所在池 突变效果 CDS位置
1 Os07g11440-3 X4Y2Z7 71B4 GGC-GAC 1019
2 Os07g11440-3 X6Y6Z2 66F6 GTC-GTT 891
3 Os07g11440-3 X2Y6Z3 67F2 TCC-TCT 996
4 OsCAP1-3 X3Y6Z8 72F3 GCT-ACT 718
5 OsCAP1-3 X7Y6Z5 69F7 GCT-GTT 719
6 OsCAP1-2 X4Y7Z2 66G4 CCT-TCT 322
7 OsOSC11-9 X2Y3Z1 65C2 GTC-GTT 1836
8 OsOSC11-5 X6Y8Z8 72H6 CAC-CAT 1065
9 OsOSC11-3 X4Y6Z7 71F4 CGG-CGA 780
10 OsOSC11-8 X7Y8Z3 67H7 GGA-AGA 1510
11 Os06g03610-3 X8Y5Z8 72E8 AGC-AAC 1466
分别对突变位点上下游的位点进行PCR扩增,并进行Sanger测序,所用引物为表4.1 中的相应位点的引物,结果显示,上述方法的结果与Sanger测序的结果完全一致。其中,序列1-6和11的Sanger测序结果如图17所示。
<110> 中国科学院植物研究所
<120> 一种筛选水稻突变体的方法
<160> 4
<170> PatentIn version 3.5
<210> 1
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 1
tacacgacgc tcttccgatc ttaatcatgc tgctccgcca g 41
<210> 2
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 2
tacacgacgc tcttccgatc ttctcaggcc attgcctact c 41
<210> 3
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 3
tacacgacgc tcttccgatc tgtgcctcct tccagtcaat c 41
<210> 4
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 4
tacacgacgc tcttccgatc tagatgacca cactgactca c 41

Claims (9)

1.非疾病诊断目的的鉴定生物目标DNA片段突变的方法,包括:
1)利用多重PCR富集待测生物中的目标DNA片段,得到富集的目标DNA片段;所述利用多重PCR富集待测生物中的目标DNA片段包括利用多重PCR方法扩增得到目标DNA片段,实现目标DNA片段的富集;所述多重PCR方法,包括:利用成套引物对目标DNA片段进行PCR扩增,得到PCR产物,将该PCR产物记为PCR产物1;所述成套引物满足如下a1)、a2)和a3):
a1)所述成套引物由n个引物对组成,n为大于等于2的自然数,2≤n≤30;
a2)所述成套引物中的每个引物对的因素J小于50%,所述因素J为引物对的反向引物与所述成套引物的其它引物形成引物二聚体的个数占所述成套引物中引物个数的百分比;
a3)所述成套引物中的每个引物对的9个因素中的A、B、C、D、E、F、G、H均在标准范围内;所述9个因素为因素A、B、C、D、E、F、G、H和I;
所述因素A为引物对的反向引物的GC含量;
所述因素B为引物对的反向引物的TM值,
所述因素C为目标片段的GC含量;
所述因素D为从目标片段上游400bp处至该目标片段下游400bp处间的DNA片段的GC含量;
所述因素E为目标片段的结构自由能;
所述因素F为目标片段及目标片段下游150bp的连续DNA片段的结构自由能;
所述因素G为目标片段及目标片段上游150bp的连续DNA片段的结构自由能;
所述因素H为引物对的正向引物3’末端5个核苷酸的结构自由能;
所述因素I为引物对的反向引物与所述成套引物的其它引物中部连续大于等于5个核苷酸所形成的多个双链DNA的TM值总和;
所述9个因素的标准范围如下:
35%≤所述因素A≤60%;
68℃≤所述因素B≤79℃;
30%≤所述因素C≤70%;
30%≤所述因素D≤70%;
15 kcal/mol≤所述因素E的绝对值≤70 kcal/mol;
所述因素F的绝对值<100 kcal/mol;
所述因素G的绝对值<100 kcal/mol;
4 kcal/mol≤所述因素H的绝对值≤10 kcal/mol;
所述因素I<100℃;
所述PCR扩增所用DNA聚合酶为Q5 DNA聚合酶;
所述成套引物的每条引物在所述PCR扩增的体系中的浓度为0.088 pmol/μL;
所述PCR扩增的循环数为20;
2)对所述富集的目标DNA片段测序,得到待测生物目标DNA片段序列;
3)比较所述待测生物目标DNA片段序列与野生型生物所述目标DNA片段的序列,确定所述待测生物目标DNA片段是否发生突变:所述待测生物目标DNA片段序列与野生型生物所述目标DNA片段的序列相同,所述待测生物目标DNA片段未发生或候选未发生突变;所述待测生物目标DNA片段序列与野生型生物所述目标DNA片段的序列不同,所述待测生物目标DNA片段发生或候选发生突变。
2.根据权利要求1所述的方法,其特征在于:所述成套引物中各引物对的正向引物含有相同的序列,记为正向引物共同序列;各引物对的反向引物含有相同的序列,记为反向引物共同序列。
3.根据权利要求2所述的方法,其特征在于:所述正向引物共同序列的长度为h1)或h2):
h1)15-25nt;
h2)21nt;
和/或,所述反向引物共同序列的长度为i1)或i2):
i1)15-25nt;
i2)16nt。
4.根据权利要求2或3所述的方法,其特征在于:所述利用多重PCR富集目标DNA片段的方法还包括利用第二轮PCR引物对所述PCR产物1进行PCR产物进行扩增实现目标DNA片段的富集,将得到的PCR产物记为PCR产物2;所述第二轮PCR引物的两条引物分别含有所述正向引物共同序列和所述反向引物共同序列。
5.根据权利要求2或3所述的方法,其特征在于:所述第二轮PCR引物的两条引物还均含有利用Illumina测序平台测序所用测序引物,将所述第二轮PCR引物的正反向引物中的利用Illumina测序平台测序所用测序引物分别记为引物1和引物2,所述引物1和所述引物2的序列不同。
6.根据权利要求5所述的方法,其特征在于:所述利用多重PCR富集目标DNA片段的方法还包括利用分别含有所述引物1和所述引物2的两条引物组成的引物对进行PCR扩增,得到能利用Illumina测序平台测序的PCR产物,该PCR产物即为富集的目标DNA片段。
7.根据权利要求1所述的方法,其特征在于:所述生物为m1)、m2)或m3):
m1)植物、动物或微生物;
m2)单子叶植物或双子叶植物;
m3)水稻。
8.非疾病诊断目的的鉴定生物突变体的方法,包括:利用权利要求1-6中任一所述的方法鉴定待测生物目标DNA片段是否发生突变,目标DNA片段发生突变的待测生物即为生物突变体。
9.根据权利要求8所述的方法,其特征在于:所述生物为m1)、m2)或m3):
m1)植物、动物或微生物;
m2)单子叶植物或双子叶植物;
m3)水稻。
CN201910379866.0A 2019-05-08 2019-05-08 一种筛选水稻突变体的方法 Active CN110218811B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910379866.0A CN110218811B (zh) 2019-05-08 2019-05-08 一种筛选水稻突变体的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910379866.0A CN110218811B (zh) 2019-05-08 2019-05-08 一种筛选水稻突变体的方法

Publications (2)

Publication Number Publication Date
CN110218811A CN110218811A (zh) 2019-09-10
CN110218811B true CN110218811B (zh) 2020-12-08

Family

ID=67820797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910379866.0A Active CN110218811B (zh) 2019-05-08 2019-05-08 一种筛选水稻突变体的方法

Country Status (1)

Country Link
CN (1) CN110218811B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109957574B (zh) * 2017-12-14 2021-04-13 中国科学院植物研究所 一种与木栓酮合成相关的基因及其应用
CN111172255A (zh) * 2019-12-24 2020-05-19 中国烟草总公司郑州烟草研究院 CRISPR/Cas9基因编辑突变体的筛选鉴定方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9677118B2 (en) * 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
CN107254541B (zh) * 2017-08-03 2020-05-08 广州万德基因医学科技有限公司 用于扩增cfDNA样品中多个目标的NGS建库引物池及应用

Also Published As

Publication number Publication date
CN110218811A (zh) 2019-09-10

Similar Documents

Publication Publication Date Title
Kumar et al. SNP discovery through next-generation sequencing and its applications
JP2024059651A (ja) Dnaプロファイリングのための方法および組成物
EP1546345B1 (en) Genome partitioning
US20100035249A1 (en) Rna sequencing and analysis using solid support
US20220389416A1 (en) COMPOSITIONS AND METHODS FOR CONSTRUCTING STRAND SPECIFIC cDNA LIBRARIES
US9334532B2 (en) Complexity reduction method
JP2011500092A (ja) 非ランダムプライマーを用いたcDNA合成の方法
US11021702B2 (en) Method of producing a normalised nucleic acid library using solid state capture material
CN110607356B (zh) 一种基因组编辑检测方法、试剂盒及应用
Rani et al. Transcriptome profiling: methods and applications-A review
CN110218811B (zh) 一种筛选水稻突变体的方法
CN113789364A (zh) 一种超微量全长rna测序文库的构建方法
CN113227370B (zh) 一种单链dna合成方法
CN114555821A (zh) 检测与dna靶区域独特相关的序列
CN115715323A (zh) 一种高兼容性的PCR-free建库和测序方法
CN114207229A (zh) 靶基因组区域的灵活且高通量的测序
CN110144383B (zh) 利用多重pcr富集目标dna片段的方法
CN110144387B (zh) 一种多重pcr方法
Llaca Sequencing technologies and their use in plant biotechnology and breeding
Hayden Empirical analysis of RNA robustness and evolution using high-throughput sequencing of ribozyme reactions
Cheng et al. Dense sgRNA library construction using a Molecular Chipper approach
CN115896958A (zh) 基因文库构建方法、建库试剂盒、设备及可读存储介质
CN113774121A (zh) 一种基于RNA连接标签的低样本量m6A高通量测序方法
Fairchild Definition of the yeast transcriptome using next-generation RNA sequencing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant