CN104762406B - 一种两核苷酸不同步合成测序分析pcr产物单体型方法 - Google Patents
一种两核苷酸不同步合成测序分析pcr产物单体型方法 Download PDFInfo
- Publication number
- CN104762406B CN104762406B CN201510198271.7A CN201510198271A CN104762406B CN 104762406 B CN104762406 B CN 104762406B CN 201510198271 A CN201510198271 A CN 201510198271A CN 104762406 B CN104762406 B CN 104762406B
- Authority
- CN
- China
- Prior art keywords
- sequencing
- nucleotides
- pcr primer
- haplotype
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 102000054766 genetic haplotypes Human genes 0.000 title claims abstract description 73
- 239000002773 nucleotide Substances 0.000 title claims abstract description 48
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 48
- 238000004458 analytical method Methods 0.000 title claims abstract description 47
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 45
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 45
- 238000013459 approach Methods 0.000 title claims description 14
- 238000012163 sequencing technique Methods 0.000 claims abstract description 103
- 238000006243 chemical reaction Methods 0.000 claims abstract description 53
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000002156 mixing Methods 0.000 claims abstract description 6
- 108020004414 DNA Proteins 0.000 claims description 49
- 102000053602 DNA Human genes 0.000 claims description 13
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 13
- 238000012408 PCR amplification Methods 0.000 claims description 11
- 238000012098 association analyses Methods 0.000 claims description 10
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 9
- 239000011324 bead Substances 0.000 claims description 7
- 238000009396 hybridization Methods 0.000 claims description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 6
- 230000003321 amplification Effects 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 108090001008 Avidin Proteins 0.000 claims description 5
- 238000004925 denaturation Methods 0.000 claims description 5
- 230000036425 denaturation Effects 0.000 claims description 5
- 239000012634 fragment Substances 0.000 claims description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 4
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical group NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 claims description 4
- 102000007347 Apyrase Human genes 0.000 claims description 4
- 108010007730 Apyrase Proteins 0.000 claims description 4
- 108060001084 Luciferase Proteins 0.000 claims description 4
- 239000005089 Luciferase Substances 0.000 claims description 4
- 108091028664 Ribonucleotide Proteins 0.000 claims description 4
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 claims description 4
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 claims description 4
- 239000002336 ribonucleotide Substances 0.000 claims description 4
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 claims description 3
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 claims description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 3
- 229920001213 Polysorbate 20 Polymers 0.000 claims description 3
- 238000000137 annealing Methods 0.000 claims description 3
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 claims description 3
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 claims description 3
- 239000011780 sodium chloride Substances 0.000 claims description 3
- 229960002685 biotin Drugs 0.000 claims description 2
- 235000020958 biotin Nutrition 0.000 claims description 2
- 239000011616 biotin Substances 0.000 claims description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 claims description 2
- 235000011180 diphosphates Nutrition 0.000 claims description 2
- 238000000835 electrochemical detection Methods 0.000 claims description 2
- GPRLSGONYQIRFK-UHFFFAOYSA-N hydron Chemical compound [H+] GPRLSGONYQIRFK-UHFFFAOYSA-N 0.000 claims description 2
- 239000006210 lotion Substances 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 230000003287 optical effect Effects 0.000 claims description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 2
- 239000002994 raw material Substances 0.000 claims description 2
- 239000007790 solid phase Substances 0.000 claims description 2
- 238000005406 washing Methods 0.000 claims description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims 2
- 230000000295 complement effect Effects 0.000 claims 1
- 239000000203 mixture Substances 0.000 claims 1
- 150000007523 nucleic acids Chemical class 0.000 abstract description 3
- 239000003550 marker Substances 0.000 abstract description 2
- 108020004707 nucleic acids Proteins 0.000 abstract description 2
- 102000039446 nucleic acids Human genes 0.000 abstract description 2
- 238000002474 experimental method Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 101000990912 Homo sapiens Matrilysin Proteins 0.000 description 3
- 102100030417 Matrilysin Human genes 0.000 description 3
- 229940098773 bovine serum albumin Drugs 0.000 description 3
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 3
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 3
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 2
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 2
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- BEGBSFPALGFMJI-UHFFFAOYSA-N ethene;sodium Chemical group [Na].C=C BEGBSFPALGFMJI-UHFFFAOYSA-N 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 101710183568 Serine/threonine-protein kinase PknK Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000002038 chemiluminescence detection Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- PXQLVRUNWNTZOS-UHFFFAOYSA-N sulfanyl Chemical class [SH] PXQLVRUNWNTZOS-UHFFFAOYSA-N 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种两核苷酸不同步合成测序分析PCR产物单体型的方法。通过两核苷酸实时合成测序,每个测序反应同时代加入两个不同的核苷酸,且PCR产物中不同DNA模板的合成测序不同步,使得相邻两个SNP位点上不同碱基的信息是由不同测序反应所提供。根据这些不同步合成测序反应所得到的不同SNP位点上的测序信息进行关联分析,确定PCR产物单体型。本发明拓广了分析范围,操作简单、可以降低分析成本;适合多个混合样本的单体型分析,可以直接测定混合样本中各个单体型的比例,可以用于从大规模样本中寻找、筛选核酸标志物。
Description
技术领域
本发明属于生物技术领域,是一种PCR产物单体型分析方法,具体涉及一种两核苷酸不同步合成测序分析PCR产物单体型方法。
背景技术
人类基因组单体型图计划本身说明了单体型研究的重要性,也为个体样本的单体型分析提供了重要的数据库。位于一条染色体特定区域的一组相互关联并倾向于以整体遗传给后代的SNP的组合叫作单体型(haplotype)。早期的研究工作就表明,单体型的分析可以极大地减少疾病关联研究的工作量,且提供比SNP基因型分析更大的信息量,有利于发现更多的信息。理论上说,一个包含N个独立双等位基因的SNP区域中可能存在2n种单体型,但实际上,由于缺乏重组和(或)反复突变,SNP之间常常存在连锁不平衡的关系,因此,单体型的种类不会超过(N+1)。对于二倍体个体(如单个人)的DNA样本分析,一般情况下就是要从大样本所包含的可能单体型中找出具体属于哪一种或者二种单体型。如果两个相邻SNP位点间有一个SNP位点为纯合型,那么其单体型就很容易判断。因此,单体型分析就聚焦在两个相邻杂合型SNP间二种单体型的确定。目前对于单体型的分析,普遍采用间接方法是利用多个SNP分型结果,以统计方法推断,这种方法得到广泛的应用,且用于构建单体型的相关软件也非常之多。然而,软件分析的结果对于临床样本而言,如果得不到直接的实验证实终究是不踏实的,临床检测也很难接受这样的分析结果。通过实验方法得到自然状态下真实的单体型情况需要进行单分子测序(如克隆测序、高通量测序等),这些方法由于成本高,不适于大规模的个体样本分析。对于常规PCR产物中包含多个SNP位点的实验分析单体型方法,均采用一种等位基因特异引物-PCR(AS-PCR)的方法,以第一个SNP位点为扩增起始点,用两种特异引物将起始为两种的不同DNA模板分别进行扩增,然后分别进行测序,以确定其它SNP位点的碱基信息。然而,这种方法既无法知道单体型的含量(需要另外设计实验来确定),也不一定适合所有SNP位点的扩增,且操作繁琐、效率不高。我们知道利用测序引物在不同模板上发生不同步合成反应,焦测序技术不仅能够分型SNP位点,同时也能够对其模板含量进行定量分析。沿着这一思路,如果在一个包含N个SNP位点的PCR产物中,这种不同步合成测序继续对各个SNP位点的碱基信息进行读取,则除了在SNP位置提供不同DNA模板的信息外,其它位置由于SNP碱基的错位测序,也可以提供不同DNA模板的加和信息,并从这些加和信息中构建方程组实现对不同DNA模板的含量分析。
最近,我们实验室提出一种基于两核苷酸实时合成测序的方法,该方法通过每次反应同时加入未标记的两种dNTPs实时测序,得到两组编码,解码这两组编码便能确定测序片段的具体碱基信息(肖鹏峰等,中国发明专利:ZL 201210128597.6)。该方法具有大幅提高测序长度,且测序得到的测序信号强度比传单核苷酸合成测序的信号强等特点。然而,该发明专利对一个DNA模板样本需要两次测序既增加了操作的琐碎程度,也增加了分析的成本,且同步测序反应的信息不能满足对单体型的分析。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种两核苷酸不同步合成测序分析PCR产物单体型的方法,为PCR产物单体型方法提供一种快速、高效、灵敏的分析方法。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种两核苷酸不同步合成测序分析PCR产物单体型方法,步骤包括:1)DNA提取;2)PCR扩增;3)测序;4)关联分析;
所述步骤3)的测序方法为:同时加入两个不同的核苷酸,PCR扩增产物中不同DNA模板的合成测序不同步,得到相邻两个SNP位点上不同的测序信息。
进一步的,在本发明中,所述步骤3)的具体方法包括以下步骤:
3-1)制备单链DNA模板:将PCR扩增产物与亲和素修饰的磁珠反应,修饰生物素的DNA链固定到所述磁珠上,在0.2M NaOH溶液下变性;将未固定的另一条DNA链清除;然后用洗液洗涤,得到固定的单链DNA模板;
3-2)测序引物杂交:将测序引物与所述单链DNA模板,在杂交反应体系中,80℃下放置5min,自然冷却至室温,完成杂交;
3-3)焦测序:配备焦测序反应体系,与所述步骤3-2)得到的杂交产物混合,按照循环加入两核苷酸方式对DNA模板进行循环焦测序反应,得到由按照先后顺序排列的单个测序反应的碱基片段编码信息。
进一步的,在本发明中,步骤3-2)中,所述测序引物是一段与单链DNA模板完全互补的一段序列;所述测序引物为5′-SEQ ID NO:1-3′所示:5′-ctaaaacgag gaagtattacatc-3′;
所述杂交反应体系的条件为:10mM Tris–HCl,2M NaCl,1mM EDTA,0.1%Tween20,pH 7.6。
进一步的,在本发明中,步骤3-3)中,焦测序反应体系包括pH 7.7的0.1M Tris-Ac,2mM EDTA,10mM Mg(Ac)2,0.2%BSA,10mM DTT,10mM APS,0.4mg/mL PVP,4mM D-luciferin,2U/mL ATP sulfurylase,0.4mM luciferase,2U/mL apyrase VII,2U/mL DNA聚合酶I。
进一步的,在本发明中,所述循环加入两核苷酸方式包括(A+G)/(C+T),(A+C/(G+T),(A+T)/(C+G)三组中的一组或一组以上的循环测序方式;两核苷酸加入的顺序按照循环的方式;或按照以四种不同的两核苷酸为原料,每次加入一种两核苷酸来实施。
进一步的,在本发明中,所述步骤3)中,每个测序反应获得的测序信息包括两核苷酸种类信息和测序信号强度信息,所述测序信号强度与合成核苷酸数目成正比;
所述步骤4)中,根据不同步合成测序反应所得到的两个不同SNP位点上的测序信息进行关联分析,构建关联方程式,确定PCR产物单体型及含量;
所述关联方程式为:对于包含任意相邻两个SNP位点的PCR产物,不超过四种不同的DNA模板;设定这四种单体型1、…、i的含量分别为x1、…、xi,其中2≤i≤4,且x1+……+xi=1;则PCR产物中混合DNA模板单个测序反应测序信号强度fn、fn’与x1、…、xi存在下列关系:(fn-fn’)=a1 nx1+…+ai n xi;其中n表示第n次测序反应;fn、fn’分别表示第n次测序反应的测序信号强度与背景值;a1 n、…、ai n分别表示100%单体型DNA序列1、…、i在第n次测序反应中合成的核苷酸数目。
进一步的,在本发明中,所述SNP位点上的测序信息进行关联分析是指两个相邻SNP位点均是杂合型的单个样本的关联分析;
若PCR产物中包含若干个SNP位点的分析,将其分解成相邻两个SNP位点的单体型关联分析。
进一步的,在本发明中,所述步骤2)中,
扩增条件为:94℃起始变性5min;35个热循环为:94℃变性30s、61℃退火45s、72℃延伸45s;最后72℃延伸7min;
PCR扩增所用的PCR一条引物为5’端被生物素、氨基,或者丙烯酰胺等基团修饰,能够与表面修饰亲合素、羧基的固相载体反应,或者与丙烯酰胺单体聚合反应制备单链DNA模板,包括:
5’-SEQ ID NO:2-3′所示:5’-agtctacaga actttgaaag tatgtg-3’;
5’-biotin-SEQ ID NO:3-3’所示:5’-biotin-ctatgagagc agtcatttga ctttg-3’。
进一步的,在本发明中,所述核苷酸dNTPs合成实时合成释放的检测分子是相同的,所述检测分子为化学发光检测的焦磷酸盐、电化学检测的氢离子或者光学检测的荧光信号。
进一步的,在本发明中,所述PCR扩增产物的分析指包括单个样本PCR产物和混合样本PCR产物的分析。
有益效果:本发明提供的两核苷酸不同步合成测序分析PCR产物单体型的方法,应用两核苷酸同时加入到反应中的一次循环测序信息,根据PCR产物中不同DNA模板的合成测序不同步,使得相邻两个SNP位点上不同碱基的信息是由不同测序反应所提供。根据这些不同步合成测序反应所得到的不同SNP位点上的测序信息进行关联分析,确定PCR产物单体型。该发明与传统AS-PCR相比,具有如下有益效果:
1)本发明在测序长度能够保障的前提下,适合所有包括两个关联位点的PCR产物的单体型分析。相对于对传统AS-PCR对PCR引物设计的限制,本发明对PCR引物没有限制,任何包括相邻两位点序列的PCR产物均适合分析,拓广了分析范围。
2)本发明只需对PCR产物进行一次循环测序,相对于对传统AS-PCR方法需要两次扩增、两次测序,本发明操作简单、可以降低分析成本。
3)本发明能够对分析的各种单体型进行定量分析,相对于对传统AS-PCR对PCR产物进行的定性分析,本发明不但可以进行定性、同时可以进行定量分析,为样本的分析提供更多的参数。
4)本发明适合多个混合样本的单体型分析,可以直接测定混合样本中各个单体型的比例,可以用于从大规模样本中寻找、筛选核酸标志物。
5)本发明直接采用商品化、非标记的天然核苷酸进行合成测序,它可以在任何基于实时合成测序的测序平台进行。
附图说明
图1为本发明方法分析一个样本中包含MMP7(U25346)基因A/G(rs11568818)和C/T(rs11568819)核酸片段的PCR产物的单体型分析测序结果;图中纵坐标为信号强度(au),横坐标为加入两核苷酸试剂的顺序,其中A=(A+T),T=(C+G)。
具体实施方式
本发明利用两核苷酸不同步合成测序其测序长度的特点,“跟踪”不同步合成在不同DNA模板上的测序位置,并获取这些不同SNP位点的不同步测序信息就变得可能。同时利用这些不同测序信息提供不同DNA模板的加和信息,并从这些加和信息中构建方程组、并求解出不同DNA模板的含量,即实现不同单体型的实验分析。从而为单体型与疾病的相关性研究,以及实际样本的单体型临床检测提供一种新的分析方法。
下面结合附图对本发明作更进一步的说明。
一种两核苷酸不同步合成测序分析PCR产物单体型方法,步骤包括:1)DNA提取;2)PCR扩增;3)测序:每次测序反应同时加入两个不同的核苷酸,且PCR扩增产物中不同DNA模板的合成测序不同步,使得相邻两个SNP位点上不同的测序信息是由不同测序反应所提供;4)关联分析:根据这些不同步合成测序反应所得到的不同SNP位点上的测序信息进行关联分析,确定PCR产物单体型。
不同步合成是指PCR产物中包含的不同DNA模板在相邻两个SNP位点的测序信息是通过不同的合成测序反应获得的。单个测序反应获得的测序信息包括两核苷酸种类的信息和测序信号强度信息,所述测序信号强度与合成核苷酸数目成正比。根据不同步合成测序反应所得到的不同SNP位点上的测序信息进行关联分析,构建关联方程式,确定PCR产物单体型及含量;
关联方程式为:对于包含任意相邻两个SNP位点的PCR产物,不超过四种不同的DNA模板;设定这四种单体型1、…、i的含量分别为x1、…、xi,其中2≤i≤4,且x1+……+xi=1;则PCR产物中混合DNA模板单个测序反应测序信号强度fn、fn’与x1、…、xi存在下列关系:(fn-fn’)=a1 nx1+…+ai n xi;其中n表示第n次测序反应;fn、fn’分别表示第n次测序反应的测序信号强度与背景值;a1 n、…、ai n分别表示100%单体型DNA序列1、…、i在第n次测序反应中合成的核苷酸数目。
比如设定四种单体型1、2、3、4的含量分别为x1、x2、x3、x4,x1+x2+x3+x4=1;则PCR产物中混合DNA模板测序反应测序信号强度fn、fn’与x1、x2、x3、x4存在下列关系:(fn-fn’)=a1 nx1+a2 n x2+a3 n x3+a4 n x4。
实施例1:人样本包含MMP7(U25346)基因A/G(rs11568818)和C/T(rs11568819)核酸片段的PCR产物的单体型分析
以MMP7(U25346)基因包含A/G(rs11568818)和C/T(rs11568819)两个SNP位点的PCR产物制备的单链DNA模板为例,来说明不同步合成测序关联分析对单体型样本的检测。
A)从文献或者数据库中可以查出在下列四种理论存在的单体型中,“大样本”只存在单体型1、2、3,而不存在单体型4(下划线字母为SNP位点)。
单体型1如5’-SEQ ID NO:4所示:
5’-ACGAATACATTGTGTGCTTCCTGCCAATAAC
单体型2如5’-SEQ ID NO:5所示:
5’-ACGAATACATTGTGTGCTTCCTGCCAATAAT
单体型3如5’-SEQ ID NO:6所示:
5’-ACAAATACATTGTGTGCTTCCTGCCAATAAC
单体型4如5’-SEQ ID NO:7所示:
5’-ACAAATACATTGTGTGCTTCCTGCCAATAAT
B)按照(A+T)/(C+G)循环两核苷酸焦测序时,单体型1、2、3按照(A+T)/(C+G)循环两核苷酸合成测序分别得到的编码信息与每个测序反应的合成核苷酸数目am n(m=1~4)如表1所示。
C)假定单体型1、2、3的含量分别为x1、x2、x3,且x1+x2+x3=1;则PCR产物中混合DNA模板测序反应峰强度与x1、x2、x3有下列关系:(fn-fn’)=a1 nx1+a2 n x2+a3 n x3。从表1可以看出,能够构建独立方程的反应包括第1、2、14、15、16个测序反应,但应注意第2、14个测序反应不能同时使用,它们对于单体型1和3而言不是相对独立的。如选取:
(f2-f2’)=x1+3x2+x3;
(f16-f16’)=2x1+x2+x3;
且1=x1+x2+x3,
那么可以求出:
x1=(f16-f16’)-1;
x2=[(f2-f2’)-1]/2;
x3=5/2-(f16-f16’)-(f2-f2’)/2;
从而确定实际样本的单体型及其含量(需要考虑实验误差)。
表1.三种单体型按照(A+T)/(C+G)循环在每个测序反应中的系数
表中斜体下划线字母包含相应单体型的SNP位点。表明单体型1、2、3的两个SNP位点分别在第2、1、2(第一个SNP位点),第16、14、15(第二个SNP位点)个测序反应进行了测定。
一般地,任意相邻两个杂合型SNP位点的单体型的分析,在获得两核苷酸不同步合成测序信息后,即使没有文献资料、均可由候选四种单体型的不同步合成测序信息构建关联方程式,并假定其中任意两种单体型含量为0%,由实验中构建二个方程式,找出符合实验结果就可以实现单体型的分析。而关联分析方程式既可以是由(A+G)/(C+T),(A+C/(G+T),(A+T)/(C+G)三组循环测序中的一组测序信息构建,也可以由两组或者三组测序信息构建。
具体方法包括:
(1)将血样本采用传统的蛋白激酶K与苯酚/氯仿抽提法提取外周血中的基因组DNA;
(2)将PCR引物为:
5’-SEQ ID NO:2-3’所示:5’-agtctacaga actttgaaag tatgtg-3’;
5’-biotin-SEQ ID NO:3-3’所示:5’-biotin-ctatgagagc agtcatttga ctttg-3’;
与200mg基因组DNA,0.2mM dNTP,1U Taq DNA聚合酶,1×扩增缓冲液,1.8mMMgCl2的50μL PCR扩增体系进行扩增,扩增条件为:94℃起始变性5min;35个热循环为:94℃变性30s、61℃退火45s、72℃延伸45s;最后72℃延伸7min;
(3)将PCR扩增产物与亲和素修饰的磁珠反应,使修饰生物素的DNA链固定到磁珠上,在0.2M NaOH溶液下变性,将未固定的另一条DNA链清除;然后用洗液(10mM Tris–Acetate,pH 7.6)洗涤,得到固定的单链DNA模板,分成两份用于下列实验;
(4)将测序引物为5′-SEQ ID NO:1-3′所示:5′-ctaaaacgag gaagtattac atc-3′
与磁珠固定的其中一份单链DNA模板模板在反应体系((10mM Tris–HCl,2M NaCl,1mM EDTA(乙二胺四乙酸钠),0.1%Tween 20,pH 7.6)80℃下放置5分钟,然后自然冷却至室温,完成杂交;
(5)焦测序反应体系包括0.1M Tris-Ac(pH 7.7),2mM EDTA(乙二胺四乙酸钠),10mM Mg(Ac)2,0.2%BSA(小牛血清蛋白),10mM DTT(二巯苏糖醇),10mM APS(磷酰硫酸腺),0.4mg/mL PVP(聚乙烯吡咯烷酮),4mM D-luciferin(虫荧光素),2U/mL ATPsulfurylase(三磷酸腺苷硫酸化酶),0.4mM luciferase(荧光素酶),2U/mL apyrase VII(三磷酸腺苷双磷酸酶VII),2U/mL DNA聚合酶I(Klenow fragment,exo–);焦测序反应体系与上述(4)杂交产物混合用于测序反应;
(6)将上述(5)的反应体系置于焦测序仪(PSQ 96MA system(Biotage AB,Uppsala,Sweden))中,按照(A+T)/(C+G)循环加入方式对DNA模板进行合成测序(参见专利ZL201210128597.9);得到由按照先后顺序排列的单个测序反应的碱基片段编码信息;得到图1谱;
(7)根据图1谱测的峰值,转换成核苷酸合成的数目(合成一个核苷酸=10au信号强度),并按照表1构建三个独立的方程,求解三个方程得到x1、x2、x3的数值;
x1=(f16-f16’)-1=0.98-(-0.2)-1=0;
x2=[(f2-f2’)-1]/2=[((1.98-(-0.1))-1]/2=0.495≈0.5
x3=5/2-(f16-f16’)-(f2-f2’)/2=5/2-[0.98-(-0.2)]–[(1.98-(-0.1)]/2=0.505≈0.5
(8)根据(7)求出的x1、x2、x3确定PCR产物的单体型为单体型2和单体型3,且含量各为50%。
单体型2如5’-SEQ ID NO:5所示:5’-acgaatacat tgtgtgcttc ctgccaataat
单体型3如5’-SEQ ID NO:6所示:5’-acaaatacat tgtgtgcttc ctgccaataac
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种两核苷酸不同步合成测序分析PCR产物单体型方法,其特征在于:步骤包括:1)DNA提取;2)PCR扩增;3)测序;4)关联分析;
所述步骤3)的测序方法为:同时加入两个不同的核苷酸,PCR扩增产物中不同DNA模板的合成测序不同步,得到相邻两个SNP位点上不同步的测序信息;
所述步骤3)中,每个测序反应获得的测序信息包括两核苷酸种类信息和测序信号强度信息,所述测序信号强度与合成核苷酸数目成正比;
所述步骤4)中,根据不同步合成测序反应所得到的相邻两个SNP位点上的测序信息进行关联分析,构建关联方程式,确定PCR产物单体型及含量;
所述关联方程式为:对于包含任意相邻两个SNP位点的PCR产物,不超过四种不同的DNA模板;设定这四种单体型1、…、i的含量分别为x1、…、xi,其中2≤i≤4,且x1+……+xi=1;则PCR产物中混合DNA模板单个测序反应测序信号强度fn、fn’与x1、…、xi存在下列关系:(fn-fn’)=a1 nx1+…+ai nxi;其中n表示第n次测序反应;fn、fn’分别表示第n次测序反应的测序信号强度与背景值;a1 n、…、ai n分别表示100%单体型DNA序列1、…、i在第n次测序反应中合成的核苷酸数目;
所述SNP位点上的测序信息进行关联分析是指两个相邻SNP位点均是杂合型的单个样本的关联分析;若PCR产物中包含若干个SNP位点的分析,将其分解成相邻两个SNP位点的单体型关联分析。
2.根据权利要求1所述的两核苷酸不同步合成测序分析PCR产物单体型方法,其特征在于:所述步骤3)的具体方法包括以下步骤:
3-1)制备单链DNA模板:将PCR扩增产物与亲和素修饰的磁珠反应,修饰生物素的DNA链固定到所述磁珠上,在0.2M NaOH溶液下变性;将未固定的另一条DNA链清除;然后用洗液洗涤,得到固定的单链DNA模板;
3-2)测序引物杂交:将测序引物与所述单链DNA模板在杂交反应体系中,80℃下放置5min,自然冷却至室温,完成杂交;
3-3)焦测序:配备焦测序反应体系,与所述步骤3-2)得到的杂交产物混合,按照循环加入两核苷酸方式对DNA模板进行循环焦测序反应,得到由按照先后顺序排列的单个测序反应的碱基片段编码信息。
3.根据权利要求2所述的两核苷酸不同步合成测序分析PCR产物单体型方法,其特征在于:步骤3-2)中,所述测序引物是一段与单链DNA模板完全互补的一段序列;所述测序引物为5′-SEQ ID NO:1-3′所示:5′-ctaaaacgag gaagtattac atc-3′;
所述杂交反应体系的条件为:10mM Tris–HCl,2M NaCl,1mM EDTA,0.1%Tween 20,pH7.6。
4.根据权利要求2所述的两核苷酸不同步合成测序分析PCR产物单体型方法,其特征在于:步骤3-3)中,焦测序反应体系包括pH 7.7的0.1M Tris-Ac,2mM EDTA,10mM Mg(Ac)2,0.2%BSA,10mM DTT,10mM APS,0.4mg/mL PVP,4mM D-luciferin,2U/mL ATPsulfurylase,0.4mM luciferase,2U/mL apyrase VII,2U/mL DNA聚合酶I。
5.根据权利要求2所述的两核苷酸不同步合成测序分析PCR产物单体型方法,其特征在于:所述循环加入两核苷酸方式包括(A+G)/(C+T),(A+C/(G+T),(A+T)/(C+G)三组中的一组或一组以上的循环测序方式;两核苷酸加入的顺序按照循环的方式,或按照以四种不同的两核苷酸为原料,每次加入一种两核苷酸来实施。
6.根据权利要求1所述的两核苷酸不同步合成测序分析PCR产物单体型方法,其特征在于:所述步骤2)中,扩增条件为:94℃起始变性5min;35个热循环为:94℃变性30s、61℃退火45s、72℃延伸45s;最后72℃延伸7min;
PCR扩增所用的PCR一条引物为5’端被生物素、氨基或者丙烯酰胺基团修饰,与表面修饰亲合素、羧基的固相载体反应,或者与丙烯酰胺单体聚合反应制备单链DNA模板,包括:
5’-SEQ ID NO:2-3’所示:5’-agtctacaga actttgaaag tatgtg-3’;
5’-biotin-SEQ ID NO:3-3’所示:5’-biotin-ctatgagagc agtcatttga ctttg-3’。
7.根据权利要求1所述的两核苷酸不同步合成测序分析PCR产物单体型方法,其特征在于:所述核苷酸dNTPs合成实时合成释放的检测分子是相同的,所述检测分子为化学发光检测的焦磷酸盐、电化学检测的氢离子或者光学检测的荧光信号。
8.根据权利要求1所述的两核苷酸不同步合成测序分析PCR产物单体型方法,其特征在于:所述PCR扩增产物的分析指包括单个样本PCR产物和混合样本PCR产物的分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510198271.7A CN104762406B (zh) | 2015-04-23 | 2015-04-23 | 一种两核苷酸不同步合成测序分析pcr产物单体型方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510198271.7A CN104762406B (zh) | 2015-04-23 | 2015-04-23 | 一种两核苷酸不同步合成测序分析pcr产物单体型方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104762406A CN104762406A (zh) | 2015-07-08 |
CN104762406B true CN104762406B (zh) | 2017-08-25 |
Family
ID=53644496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510198271.7A Expired - Fee Related CN104762406B (zh) | 2015-04-23 | 2015-04-23 | 一种两核苷酸不同步合成测序分析pcr产物单体型方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104762406B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105648084B (zh) * | 2016-03-02 | 2019-07-12 | 东南大学 | 一种两核苷酸实时合成测序检测碱基连续突变序列的方法 |
CN110621785B (zh) * | 2017-06-20 | 2023-08-15 | 深圳华大生命科学研究院 | 基于三代捕获测序对二倍体基因组单倍体分型的方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102634586A (zh) * | 2012-04-27 | 2012-08-15 | 东南大学 | 一种两核苷酸实时合成dna解码测序方法 |
CN102634587A (zh) * | 2012-04-27 | 2012-08-15 | 东南大学 | Dna芯片组合延伸检测碱基连续突变的方法 |
CN103602740A (zh) * | 2013-11-06 | 2014-02-26 | 毅新兴业(北京)科技有限公司 | 质谱仪鉴定血清中游离dna的方法、试剂盒及其应用 |
CN104313168A (zh) * | 2014-10-30 | 2015-01-28 | 东南大学 | 一种引物选择合成测序分析pcr产物单体型的方法 |
-
2015
- 2015-04-23 CN CN201510198271.7A patent/CN104762406B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102634586A (zh) * | 2012-04-27 | 2012-08-15 | 东南大学 | 一种两核苷酸实时合成dna解码测序方法 |
CN102634587A (zh) * | 2012-04-27 | 2012-08-15 | 东南大学 | Dna芯片组合延伸检测碱基连续突变的方法 |
CN103602740A (zh) * | 2013-11-06 | 2014-02-26 | 毅新兴业(北京)科技有限公司 | 质谱仪鉴定血清中游离dna的方法、试剂盒及其应用 |
CN104313168A (zh) * | 2014-10-30 | 2015-01-28 | 东南大学 | 一种引物选择合成测序分析pcr产物单体型的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104762406A (zh) | 2015-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9670536B2 (en) | Increased confidence of allele calls with molecular counting | |
ES2873850T3 (es) | Bibliotecas de secuenciación de próxima generación | |
Pati et al. | A comparison between SNaPshot, pyrosequencing, and biplex invader SNP genotyping methods: accuracy, cost, and throughput | |
WO2008059578A1 (fr) | Procédé d'amplification pcr multiplex | |
JP4989493B2 (ja) | 分子内プローブによる核酸配列の検出方法 | |
CN104372093A (zh) | 一种基于高通量测序的snp检测方法 | |
KR20150028063A (ko) | 리포터 및 소광자가 결합된 프로브를 이용한 액상형 어레이 및 이를 이용한 표적핵산 또는 돌연변이 검출방법 | |
CN111088329B (zh) | 荧光复合扩增体系、试剂盒及其应用 | |
CN105385763B (zh) | 一种同时分析人基因组dna 24个基因座的荧光标记复合扩增的试剂盒及其应用 | |
Di Francia et al. | Decision criteria for rational selection of homogeneous genotyping platforms for pharmacogenomics testing in clinical diagnostics | |
CN104894246B (zh) | 一种两核苷酸合成测序分析多模板pcr产物的方法 | |
CN104313168B (zh) | 一种引物选择合成测序分析pcr产物单体型的方法 | |
CN108060237B (zh) | 基于55个y染色体snp遗传标记的法医学复合检测试剂盒 | |
CN104762406B (zh) | 一种两核苷酸不同步合成测序分析pcr产物单体型方法 | |
JPWO2007055255A1 (ja) | 複数の識別用核酸配列を増幅する方法 | |
CN105219851B (zh) | 一种焦测序定量检测甲基化的方法 | |
CN105256030B (zh) | 一种基于两核苷酸合成焦测序寻找新突变/snp位点的方法 | |
CN115992251A (zh) | 一种与湖羊生长性状相关的分子标记及应用 | |
CN116083592A (zh) | 一种与绵羊生长性状相关的分子标记及其应用 | |
CN105132573B (zh) | 一种两核苷酸合成焦测序定量检测甲基化的方法 | |
JP2008125471A (ja) | マルチプレックスな核酸増幅方法 | |
US8008002B2 (en) | Nucleic acid sequencing | |
CN106916882B (zh) | 用于辨识核苷酸基因多型性的基因型鉴定芯片的双重等位基因特异性聚合酶链锁反应的方法 | |
CN108642190A (zh) | 基于14个常染色体snp遗传标记的法医学复合检测试剂盒 | |
Zhussupova | PCR–diagnostics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170825 |
|
CF01 | Termination of patent right due to non-payment of annual fee |