CN104762406B

CN104762406B - 一种两核苷酸不同步合成测序分析pcr产物单体型方法

Info

Publication number: CN104762406B
Application number: CN201510198271.7A
Authority: CN
Inventors: 肖鹏峰; 潘荣芳
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2015-04-23
Filing date: 2015-04-23
Publication date: 2017-08-25
Anticipated expiration: 2035-04-23
Also published as: CN104762406A

Abstract

本发明公开了一种两核苷酸不同步合成测序分析PCR产物单体型的方法。通过两核苷酸实时合成测序，每个测序反应同时代加入两个不同的核苷酸，且PCR产物中不同DNA模板的合成测序不同步，使得相邻两个SNP位点上不同碱基的信息是由不同测序反应所提供。根据这些不同步合成测序反应所得到的不同SNP位点上的测序信息进行关联分析，确定PCR产物单体型。本发明拓广了分析范围，操作简单、可以降低分析成本；适合多个混合样本的单体型分析，可以直接测定混合样本中各个单体型的比例，可以用于从大规模样本中寻找、筛选核酸标志物。

Description

一种两核苷酸不同步合成测序分析PCR产物单体型方法

技术领域

本发明属于生物技术领域，是一种PCR产物单体型分析方法，具体涉及一种两核苷酸不同步合成测序分析PCR产物单体型方法。

背景技术

人类基因组单体型图计划本身说明了单体型研究的重要性，也为个体样本的单体型分析提供了重要的数据库。位于一条染色体特定区域的一组相互关联并倾向于以整体遗传给后代的SNP的组合叫作单体型(haplotype)。早期的研究工作就表明，单体型的分析可以极大地减少疾病关联研究的工作量，且提供比SNP基因型分析更大的信息量，有利于发现更多的信息。理论上说，一个包含N个独立双等位基因的SNP区域中可能存在2n种单体型，但实际上，由于缺乏重组和(或)反复突变，SNP之间常常存在连锁不平衡的关系，因此，单体型的种类不会超过(N+1)。对于二倍体个体(如单个人)的DNA样本分析，一般情况下就是要从大样本所包含的可能单体型中找出具体属于哪一种或者二种单体型。如果两个相邻SNP位点间有一个SNP位点为纯合型，那么其单体型就很容易判断。因此，单体型分析就聚焦在两个相邻杂合型SNP间二种单体型的确定。目前对于单体型的分析，普遍采用间接方法是利用多个SNP分型结果，以统计方法推断，这种方法得到广泛的应用，且用于构建单体型的相关软件也非常之多。然而，软件分析的结果对于临床样本而言，如果得不到直接的实验证实终究是不踏实的，临床检测也很难接受这样的分析结果。通过实验方法得到自然状态下真实的单体型情况需要进行单分子测序(如克隆测序、高通量测序等)，这些方法由于成本高，不适于大规模的个体样本分析。对于常规PCR产物中包含多个SNP位点的实验分析单体型方法，均采用一种等位基因特异引物-PCR(AS-PCR)的方法，以第一个SNP位点为扩增起始点，用两种特异引物将起始为两种的不同DNA模板分别进行扩增，然后分别进行测序，以确定其它SNP位点的碱基信息。然而，这种方法既无法知道单体型的含量(需要另外设计实验来确定)，也不一定适合所有SNP位点的扩增，且操作繁琐、效率不高。我们知道利用测序引物在不同模板上发生不同步合成反应，焦测序技术不仅能够分型SNP位点，同时也能够对其模板含量进行定量分析。沿着这一思路，如果在一个包含N个SNP位点的PCR产物中，这种不同步合成测序继续对各个SNP位点的碱基信息进行读取，则除了在SNP位置提供不同DNA模板的信息外，其它位置由于SNP碱基的错位测序，也可以提供不同DNA模板的加和信息，并从这些加和信息中构建方程组实现对不同DNA模板的含量分析。

最近，我们实验室提出一种基于两核苷酸实时合成测序的方法，该方法通过每次反应同时加入未标记的两种dNTPs实时测序，得到两组编码，解码这两组编码便能确定测序片段的具体碱基信息(肖鹏峰等，中国发明专利：ZL 201210128597.6)。该方法具有大幅提高测序长度，且测序得到的测序信号强度比传单核苷酸合成测序的信号强等特点。然而，该发明专利对一个DNA模板样本需要两次测序既增加了操作的琐碎程度，也增加了分析的成本，且同步测序反应的信息不能满足对单体型的分析。

发明内容

发明目的：为了克服现有技术中存在的不足，本发明提供一种两核苷酸不同步合成测序分析PCR产物单体型的方法，为PCR产物单体型方法提供一种快速、高效、灵敏的分析方法。

技术方案：为实现上述目的，本发明采用的技术方案为：

一种两核苷酸不同步合成测序分析PCR产物单体型方法，步骤包括：1)DNA提取；2)PCR扩增；3)测序；4)关联分析；

所述步骤3)的测序方法为：同时加入两个不同的核苷酸，PCR扩增产物中不同DNA模板的合成测序不同步，得到相邻两个SNP位点上不同的测序信息。

进一步的，在本发明中，所述步骤3)的具体方法包括以下步骤：

3-1)制备单链DNA模板：将PCR扩增产物与亲和素修饰的磁珠反应，修饰生物素的DNA链固定到所述磁珠上，在0.2M NaOH溶液下变性；将未固定的另一条DNA链清除；然后用洗液洗涤，得到固定的单链DNA模板；

3-2)测序引物杂交：将测序引物与所述单链DNA模板，在杂交反应体系中，80℃下放置5min，自然冷却至室温，完成杂交；

3-3)焦测序：配备焦测序反应体系，与所述步骤3-2)得到的杂交产物混合，按照循环加入两核苷酸方式对DNA模板进行循环焦测序反应，得到由按照先后顺序排列的单个测序反应的碱基片段编码信息。

进一步的，在本发明中，步骤3-2)中，所述测序引物是一段与单链DNA模板完全互补的一段序列；所述测序引物为5′-SEQ ID NO：1-3′所示：5′-ctaaaacgag gaagtattacatc-3′；

所述杂交反应体系的条件为：10mM Tris–HCl，2M NaCl，1mM EDTA，0.1％Tween20，pH 7.6。

进一步的，在本发明中，步骤3-3)中，焦测序反应体系包括pH 7.7的0.1M Tris-Ac，2mM EDTA，10mM Mg(Ac)₂，0.2％BSA，10mM DTT，10mM APS，0.4mg/mL PVP，4mM D-luciferin，2U/mL ATP sulfurylase，0.4mM luciferase，2U/mL apyrase VII，2U/mL DNA聚合酶I。

进一步的，在本发明中，所述循环加入两核苷酸方式包括(A+G)/(C+T),(A+C/(G+T),(A+T)/(C+G)三组中的一组或一组以上的循环测序方式；两核苷酸加入的顺序按照循环的方式；或按照以四种不同的两核苷酸为原料，每次加入一种两核苷酸来实施。

进一步的，在本发明中，所述步骤3)中，每个测序反应获得的测序信息包括两核苷酸种类信息和测序信号强度信息，所述测序信号强度与合成核苷酸数目成正比；

所述步骤4)中，根据不同步合成测序反应所得到的两个不同SNP位点上的测序信息进行关联分析，构建关联方程式，确定PCR产物单体型及含量；

所述关联方程式为：对于包含任意相邻两个SNP位点的PCR产物，不超过四种不同的DNA模板；设定这四种单体型1、…、i的含量分别为x₁、…、x_i，其中2≤i≤4，且x₁+……+x_i＝1；则PCR产物中混合DNA模板单个测序反应测序信号强度f_n、f_n’与x₁、…、x_i存在下列关系：(f_n-f_n’)＝a¹ _nx₁+…+aⁱ _n x_i；其中n表示第n次测序反应；f_n、f_n’分别表示第n次测序反应的测序信号强度与背景值；a¹ _n、…、aⁱ _n分别表示100％单体型DNA序列1、…、i在第n次测序反应中合成的核苷酸数目。

进一步的，在本发明中，所述SNP位点上的测序信息进行关联分析是指两个相邻SNP位点均是杂合型的单个样本的关联分析；

若PCR产物中包含若干个SNP位点的分析，将其分解成相邻两个SNP位点的单体型关联分析。

进一步的，在本发明中，所述步骤2)中，

扩增条件为：94℃起始变性5min；35个热循环为：94℃变性30s、61℃退火45s、72℃延伸45s；最后72℃延伸7min；

PCR扩增所用的PCR一条引物为5’端被生物素、氨基，或者丙烯酰胺等基团修饰，能够与表面修饰亲合素、羧基的固相载体反应，或者与丙烯酰胺单体聚合反应制备单链DNA模板，包括：

5’-SEQ ID NO：2-3′所示：5’-agtctacaga actttgaaag tatgtg-3’；

5’-biotin-SEQ ID NO：3-3’所示：5’-biotin-ctatgagagc agtcatttga ctttg-3’。

进一步的，在本发明中，所述核苷酸dNTPs合成实时合成释放的检测分子是相同的，所述检测分子为化学发光检测的焦磷酸盐、电化学检测的氢离子或者光学检测的荧光信号。

进一步的，在本发明中，所述PCR扩增产物的分析指包括单个样本PCR产物和混合样本PCR产物的分析。

有益效果：本发明提供的两核苷酸不同步合成测序分析PCR产物单体型的方法，应用两核苷酸同时加入到反应中的一次循环测序信息，根据PCR产物中不同DNA模板的合成测序不同步，使得相邻两个SNP位点上不同碱基的信息是由不同测序反应所提供。根据这些不同步合成测序反应所得到的不同SNP位点上的测序信息进行关联分析，确定PCR产物单体型。该发明与传统AS-PCR相比，具有如下有益效果：

1)本发明在测序长度能够保障的前提下，适合所有包括两个关联位点的PCR产物的单体型分析。相对于对传统AS-PCR对PCR引物设计的限制，本发明对PCR引物没有限制，任何包括相邻两位点序列的PCR产物均适合分析，拓广了分析范围。

2)本发明只需对PCR产物进行一次循环测序，相对于对传统AS-PCR方法需要两次扩增、两次测序，本发明操作简单、可以降低分析成本。

3)本发明能够对分析的各种单体型进行定量分析，相对于对传统AS-PCR对PCR产物进行的定性分析，本发明不但可以进行定性、同时可以进行定量分析，为样本的分析提供更多的参数。

4)本发明适合多个混合样本的单体型分析，可以直接测定混合样本中各个单体型的比例，可以用于从大规模样本中寻找、筛选核酸标志物。

5)本发明直接采用商品化、非标记的天然核苷酸进行合成测序，它可以在任何基于实时合成测序的测序平台进行。

附图说明

图1为本发明方法分析一个样本中包含MMP7(U25346)基因A/G(rs11568818)和C/T(rs11568819)核酸片段的PCR产物的单体型分析测序结果；图中纵坐标为信号强度(au)，横坐标为加入两核苷酸试剂的顺序，其中A＝(A+T)，T＝(C+G)。

具体实施方式

本发明利用两核苷酸不同步合成测序其测序长度的特点，“跟踪”不同步合成在不同DNA模板上的测序位置，并获取这些不同SNP位点的不同步测序信息就变得可能。同时利用这些不同测序信息提供不同DNA模板的加和信息，并从这些加和信息中构建方程组、并求解出不同DNA模板的含量，即实现不同单体型的实验分析。从而为单体型与疾病的相关性研究，以及实际样本的单体型临床检测提供一种新的分析方法。

下面结合附图对本发明作更进一步的说明。

一种两核苷酸不同步合成测序分析PCR产物单体型方法，步骤包括：1)DNA提取；2)PCR扩增；3)测序：每次测序反应同时加入两个不同的核苷酸，且PCR扩增产物中不同DNA模板的合成测序不同步，使得相邻两个SNP位点上不同的测序信息是由不同测序反应所提供；4)关联分析：根据这些不同步合成测序反应所得到的不同SNP位点上的测序信息进行关联分析，确定PCR产物单体型。

不同步合成是指PCR产物中包含的不同DNA模板在相邻两个SNP位点的测序信息是通过不同的合成测序反应获得的。单个测序反应获得的测序信息包括两核苷酸种类的信息和测序信号强度信息，所述测序信号强度与合成核苷酸数目成正比。根据不同步合成测序反应所得到的不同SNP位点上的测序信息进行关联分析，构建关联方程式，确定PCR产物单体型及含量；

关联方程式为：对于包含任意相邻两个SNP位点的PCR产物，不超过四种不同的DNA模板；设定这四种单体型1、…、i的含量分别为x₁、…、x_i，其中2≤i≤4，且x₁+……+x_i＝1；则PCR产物中混合DNA模板单个测序反应测序信号强度f_n、f_n’与x₁、…、x_i存在下列关系：(f_n-f_n’)＝a¹ _nx₁+…+aⁱ _n x_i；其中n表示第n次测序反应；f_n、f_n’分别表示第n次测序反应的测序信号强度与背景值；a¹ _n、…、aⁱ _n分别表示100％单体型DNA序列1、…、i在第n次测序反应中合成的核苷酸数目。

比如设定四种单体型1、2、3、4的含量分别为x₁、x₂、x_3、x₄，x₁+x₂+x₃+x₄＝1；则PCR产物中混合DNA模板测序反应测序信号强度f_n、f_n’与x₁、x₂、x_3、x₄存在下列关系：(f_n-f_n’)＝a¹ _nx₁+a² _n x₂+a³ _n x₃+a⁴ _n x₄。

实施例1：人样本包含MMP7(U25346)基因A/G(rs11568818)和C/T(rs11568819)核酸片段的PCR产物的单体型分析

以MMP7(U25346)基因包含A/G(rs11568818)和C/T(rs11568819)两个SNP位点的PCR产物制备的单链DNA模板为例，来说明不同步合成测序关联分析对单体型样本的检测。

A)从文献或者数据库中可以查出在下列四种理论存在的单体型中，“大样本”只存在单体型1、2、3，而不存在单体型4(下划线字母为SNP位点)。

单体型1如5’-SEQ ID NO：4所示：

5’-ACGAATACATTGTGTGCTTCCTGCCAATAAC

单体型2如5’-SEQ ID NO：5所示：

5’-ACGAATACATTGTGTGCTTCCTGCCAATAAT

单体型3如5’-SEQ ID NO：6所示：

5’-ACAAATACATTGTGTGCTTCCTGCCAATAAC

单体型4如5’-SEQ ID NO：7所示：

5’-ACAAATACATTGTGTGCTTCCTGCCAATAAT

B)按照(A+T)/(C+G)循环两核苷酸焦测序时，单体型1、2、3按照(A+T)/(C+G)循环两核苷酸合成测序分别得到的编码信息与每个测序反应的合成核苷酸数目a^m _n(m＝1～4)如表1所示。

C)假定单体型1、2、3的含量分别为x₁、x₂、x₃，且x₁+x₂+x₃＝1；则PCR产物中混合DNA模板测序反应峰强度与x₁、x₂、x₃有下列关系：(f_n-f_n’)＝a¹ _nx₁+a² _n x₂+a³ _n x₃。从表1可以看出，能够构建独立方程的反应包括第1、2、14、15、16个测序反应，但应注意第2、14个测序反应不能同时使用，它们对于单体型1和3而言不是相对独立的。如选取：

(f₂-f₂’)＝x₁+3x₂+x₃；

(f₁₆-f₁₆’)＝2x₁+x₂+x₃；

且1＝x₁+x₂+x₃，

那么可以求出：

x₁＝(f₁₆-f₁₆’)-1；

x₂＝[(f₂-f₂’)-1]/2；

x₃＝5/2-(f₁₆-f₁₆’)-(f₂-f₂’)/2；

从而确定实际样本的单体型及其含量(需要考虑实验误差)。

表1.三种单体型按照(A+T)/(C+G)循环在每个测序反应中的系数

表中斜体下划线字母包含相应单体型的SNP位点。表明单体型1、2、3的两个SNP位点分别在第2、1、2(第一个SNP位点)，第16、14、15(第二个SNP位点)个测序反应进行了测定。

一般地，任意相邻两个杂合型SNP位点的单体型的分析，在获得两核苷酸不同步合成测序信息后，即使没有文献资料、均可由候选四种单体型的不同步合成测序信息构建关联方程式，并假定其中任意两种单体型含量为0％，由实验中构建二个方程式，找出符合实验结果就可以实现单体型的分析。而关联分析方程式既可以是由(A+G)/(C+T)，(A+C/(G+T)，(A+T)/(C+G)三组循环测序中的一组测序信息构建，也可以由两组或者三组测序信息构建。

具体方法包括：

(1)将血样本采用传统的蛋白激酶K与苯酚/氯仿抽提法提取外周血中的基因组DNA；

(2)将PCR引物为：

5’-SEQ ID NO：2-3’所示：5’-agtctacaga actttgaaag tatgtg-3’；

5’-biotin-SEQ ID NO：3-3’所示：5’-biotin-ctatgagagc agtcatttga ctttg-3’；

与200mg基因组DNA，0.2mM dNTP，1U Taq DNA聚合酶,1×扩增缓冲液,1.8mMMgCl2的50μL PCR扩增体系进行扩增，扩增条件为：94℃起始变性5min；35个热循环为：94℃变性30s、61℃退火45s、72℃延伸45s；最后72℃延伸7min；

(3)将PCR扩增产物与亲和素修饰的磁珠反应，使修饰生物素的DNA链固定到磁珠上，在0.2M NaOH溶液下变性，将未固定的另一条DNA链清除；然后用洗液(10mM Tris–Acetate,pH 7.6)洗涤，得到固定的单链DNA模板，分成两份用于下列实验；

(4)将测序引物为5′-SEQ ID NO：1-3′所示：5′-ctaaaacgag gaagtattac atc-3′

与磁珠固定的其中一份单链DNA模板模板在反应体系((10mM Tris–HCl,2M NaCl,1mM EDTA(乙二胺四乙酸钠),0.1％Tween 20,pH 7.6)80℃下放置5分钟，然后自然冷却至室温，完成杂交；

(5)焦测序反应体系包括0.1M Tris-Ac(pH 7.7),2mM EDTA(乙二胺四乙酸钠),10mM Mg(Ac)2,0.2％BSA(小牛血清蛋白),10mM DTT(二巯苏糖醇),10mM APS(磷酰硫酸腺),0.4mg/mL PVP(聚乙烯吡咯烷酮),4mM D-luciferin(虫荧光素),2U/mL ATPsulfurylase(三磷酸腺苷硫酸化酶),0.4mM luciferase(荧光素酶),2U/mL apyrase VII(三磷酸腺苷双磷酸酶VII),2U/mL DNA聚合酶I(Klenow fragment,exo–)；焦测序反应体系与上述(4)杂交产物混合用于测序反应；

(6)将上述(5)的反应体系置于焦测序仪(PSQ 96MA system(Biotage AB,Uppsala,Sweden))中，按照(A+T)/(C+G)循环加入方式对DNA模板进行合成测序(参见专利ZL201210128597.9)；得到由按照先后顺序排列的单个测序反应的碱基片段编码信息；得到图1谱；

(7)根据图1谱测的峰值，转换成核苷酸合成的数目(合成一个核苷酸＝10au信号强度)，并按照表1构建三个独立的方程，求解三个方程得到x₁、x₂、x₃的数值；

x₁＝(f₁₆-f₁₆’)-1＝0.98-(-0.2)-1＝0；

x₂＝[(f₂-f₂’)-1]/2＝[((1.98-(-0.1))-1]/2＝0.495≈0.5

x₃＝5/2-(f₁₆-f₁₆’)-(f₂-f₂’)/2＝5/2-[0.98-(-0.2)]–[(1.98-(-0.1)]/2＝0.505≈0.5

(8)根据(7)求出的x₁、x₂、x₃确定PCR产物的单体型为单体型2和单体型3，且含量各为50％。

单体型2如5’-SEQ ID NO：5所示：5’-acgaatacat tgtgtgcttc ctgccaataat

单体型3如5’-SEQ ID NO：6所示：5’-acaaatacat tgtgtgcttc ctgccaataac

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种两核苷酸不同步合成测序分析PCR产物单体型方法，其特征在于：步骤包括：1)DNA提取；2)PCR扩增；3)测序；4)关联分析；

所述步骤3)的测序方法为：同时加入两个不同的核苷酸，PCR扩增产物中不同DNA模板的合成测序不同步，得到相邻两个SNP位点上不同步的测序信息；

所述步骤3)中，每个测序反应获得的测序信息包括两核苷酸种类信息和测序信号强度信息，所述测序信号强度与合成核苷酸数目成正比；

所述步骤4)中，根据不同步合成测序反应所得到的相邻两个SNP位点上的测序信息进行关联分析，构建关联方程式，确定PCR产物单体型及含量；

所述关联方程式为：对于包含任意相邻两个SNP位点的PCR产物，不超过四种不同的DNA模板；设定这四种单体型1、…、i的含量分别为x₁、…、x_i，其中2≤i≤4，且x₁+……+x_i＝1；则PCR产物中混合DNA模板单个测序反应测序信号强度f_n、f_n’与x₁、…、x_i存在下列关系：(f_n-f_n’)＝a¹ _nx₁+…+aⁱ _nx_i；其中n表示第n次测序反应；f_n、f_n’分别表示第n次测序反应的测序信号强度与背景值；a¹ _n、…、aⁱ _n分别表示100％单体型DNA序列1、…、i在第n次测序反应中合成的核苷酸数目；

所述SNP位点上的测序信息进行关联分析是指两个相邻SNP位点均是杂合型的单个样本的关联分析；若PCR产物中包含若干个SNP位点的分析，将其分解成相邻两个SNP位点的单体型关联分析。

2.根据权利要求1所述的两核苷酸不同步合成测序分析PCR产物单体型方法，其特征在于：所述步骤3)的具体方法包括以下步骤：

3-2)测序引物杂交：将测序引物与所述单链DNA模板在杂交反应体系中，80℃下放置5min，自然冷却至室温，完成杂交；

3.根据权利要求2所述的两核苷酸不同步合成测序分析PCR产物单体型方法，其特征在于：步骤3-2)中，所述测序引物是一段与单链DNA模板完全互补的一段序列；所述测序引物为5′-SEQ ID NO：1-3′所示：5′-ctaaaacgag gaagtattac atc-3′；

所述杂交反应体系的条件为：10mM Tris–HCl，2M NaCl，1mM EDTA，0.1％Tween 20，pH7.6。

4.根据权利要求2所述的两核苷酸不同步合成测序分析PCR产物单体型方法，其特征在于：步骤3-3)中，焦测序反应体系包括pH 7.7的0.1M Tris-Ac，2mM EDTA，10mM Mg(Ac)₂，0.2％BSA，10mM DTT，10mM APS，0.4mg/mL PVP，4mM D-luciferin，2U/mL ATPsulfurylase，0.4mM luciferase，2U/mL apyrase VII，2U/mL DNA聚合酶I。

5.根据权利要求2所述的两核苷酸不同步合成测序分析PCR产物单体型方法，其特征在于：所述循环加入两核苷酸方式包括(A+G)/(C+T),(A+C/(G+T),(A+T)/(C+G)三组中的一组或一组以上的循环测序方式；两核苷酸加入的顺序按照循环的方式，或按照以四种不同的两核苷酸为原料，每次加入一种两核苷酸来实施。

6.根据权利要求1所述的两核苷酸不同步合成测序分析PCR产物单体型方法，其特征在于：所述步骤2)中，扩增条件为：94℃起始变性5min；35个热循环为：94℃变性30s、61℃退火45s、72℃延伸45s；最后72℃延伸7min；

PCR扩增所用的PCR一条引物为5’端被生物素、氨基或者丙烯酰胺基团修饰，与表面修饰亲合素、羧基的固相载体反应，或者与丙烯酰胺单体聚合反应制备单链DNA模板，包括：

5’-SEQ ID NO：2-3’所示：5’-agtctacaga actttgaaag tatgtg-3’；

7.根据权利要求1所述的两核苷酸不同步合成测序分析PCR产物单体型方法，其特征在于：所述核苷酸dNTPs合成实时合成释放的检测分子是相同的，所述检测分子为化学发光检测的焦磷酸盐、电化学检测的氢离子或者光学检测的荧光信号。

8.根据权利要求1所述的两核苷酸不同步合成测序分析PCR产物单体型方法，其特征在于：所述PCR扩增产物的分析指包括单个样本PCR产物和混合样本PCR产物的分析。