CN105132573A

CN105132573A - 一种两核苷酸合成焦测序定量检测甲基化的方法

Info

Publication number: CN105132573A
Application number: CN201510623069.4A
Authority: CN
Inventors: 肖鹏峰; 刘文斌
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2015-09-25
Filing date: 2015-09-25
Publication date: 2015-12-09
Anticipated expiration: 2035-09-25
Also published as: CN105132573B

Abstract

本发明公开了一种两核苷酸合成焦测序定量检测甲基化的方法，将基因组DNA经亚硫酸氢盐转化后的PCR产物进行两核苷酸合成焦测序，连续记录每个测序反应得到包括两核苷酸种类及其核苷酸合成数目的测序编码信息。通过设定已确定的目标区域序列中所有CG位点中碱基C均不同程度的转化成T，再利用两核苷酸合成焦测序得到的信息，进行关联分析，实现目标区域序列中甲基化的定量分析。本发明能够大幅度提高测序长度，拓宽了传统焦测序的分析范围，适合单样本PCR产物、以及混合样本PCR产物序列的甲基化分析。

Description

一种两核苷酸合成焦测序定量检测甲基化的方法

技术领域

本发明属于生物技术领域，是一种PCR产物序列分析方法，具体涉及一种两核苷酸合成焦测序定量检测甲基化的方法。

背景技术

人类基因组计划和各种模式生物基因组计划的开展和完成，使人类步入了后基因时代，对当代的生物学研究和医学研究产生了巨大的影响，分子生物学相关学科得到了迅猛的发展。从基因水平上认识生命的差异，疾病发生、发展的规律，以及药物与生命体的相互作用将成为可能。就基因序列分析而言，后基因时代的重点已由全基因组序列测定转移到了对基因组中个体遗传差异及物种间遗传差异的比较。在基础研究方面，DNA的序列分析是进一步研究和改造目的基因的基础，研究疾病基因的遗传规律，克隆致病基因；在应用方面，直接寻找疾病的易感基因突变位点，通过对某一特定疾病的基因组样本中突变基因型进行大规模鉴定和检测，可以获得与该疾病相关基因型的信息。很多常见疾病的遗传学影响可归因于有限的等位基因变异。越来越多的证据表明，DNA甲基化参与了胚胎发育、基因印迹等过程。同时，它在疾病发展中也起着举足轻重的作用。甲基化状态的改变被认为是引起癌症的一个重要因素，这种变化包括基因组整体甲基化水平的降低和CpG岛局部甲基化水平的异常升高，从而导致基因组的不稳定(如染色体的不稳定、原癌基因的表达)和抑癌基因的不表达。

DNA甲基化分析包括定性与定量分析，目前有很多方法可以选择。基因组DNA经过亚硫酸氢盐处理后，原始序列中未被甲基化的胞嘧啶(C)残基转化为尿嘧啶(U)，并在PCR扩增中以胸腺嘧啶(T)出现；而被甲基化的胞嘧啶则保持不变。从亚硫酸氢盐转化这条主干道出发，之后可以选择限制性酶切分析、实时定量PCR、Sanger测序、焦磷酸测序、以及高通量DNA测序等。然而，并非所有方法都能提供单个CpG位点的定量数据。样本经亚硫酸氢盐处理后PCR产物的Sanger测序一度被认为是甲基化分析中的金标准，但如果对5-10个克隆测序，这种方法充其量只是半定量。高通量DNA测序对于甲基化研究，带来了非常灵敏的DNA甲基化图谱，以单分子分辨率覆盖整个CpG岛。高通量DNA技术实现了整个CpG岛的更全面覆盖，且单分子分辨率为甲基化模式的异质性提供了前所未有的信息。它能够平行研究多个位点。然而，这些优点也伴随着一些劣势，比如相当大的一笔投资、试剂昂贵、周转时间长、数据分析要求高等。这些特点使得高通量DNA测序技术更适用于在基因组范围内目标区域的确定，而对不同样品在目标区域的CpG位点的定量分析由于样品数量大，如果每个样品都采用高通量DNA测序技术进行分析，则成本就会过于巨大。

传统的焦磷酸测序技术能够快速地检测甲基化的频率，对样品中的甲基化位点进行定性及定量检测。样本经过亚硫酸氢盐处理后的PCR产物在焦测序延伸过程中，根据C和T的掺入量来定量确定单个位点的C-T比例。因此，不同位点的甲基化变异就能被准确检测。由于焦磷酸测序提供了真实的序列数据，甲基化状态也就以序列形式呈现。德国汉诺威医学院Potapova领导的研究小组对高通量DNA测序和焦测序进行了系统的交叉验证(BMCBiotechnology,2011,11:6)，对10个原发性肝癌标本中12个位点的甲基化模式在高通量DNA测序所获得的单个CpG位点的甲基化水平与传统焦测序相应值进行比较的统计分析表明，所有单个CpG位点的甲基化水平都有着极佳的一致性。表明传统的焦测序技术是一种可用于目标区域的CpG位点定量分析的简单、价格便宜的分析技术。

然而，传统焦测序技术由于每个反应需要加入相应体积的dNTP，这样，随着测序反应的进行，反应物的体积越来越大，其反应物的浓度也就越来越少，测序的准确性也就越来越低。传统焦测序一般在优化核苷酸加入顺序的前提下也只能测定大约60bp的片段长度(MashayekhiF,RonaghiM.A.Analyticalbiochemistry,2007,363,275-28719)，而这种每个甲基化位点需要两个测序反应的实现的传统焦测序技术对甲基化PCR产物的分析就更加受到测序长度的限制。一种变通的方法是将这段长序列用多个测序引物分段进行焦测序。然而，一方面，使用多个测序引物也会增加分析成本；另一方面，由于经过亚硫酸氢盐处理后被甲基化的胞嘧啶则保持不变，因此每个位点被甲基化的程度不同，PCR产物中两种DNA模板的含量也就不同，造成DNA模板类型的复杂，一般很难设计多个测序引物将其序列分段进行测定。因而传统焦测序在对长片段序列甲基化的定量检测中存在不足。最近，我们实验室提出一种基于两核苷酸实时合成测序的方法，该方法通过每次反应同时加入两种dNTPs合成测序，得到两组编码，然后解码这两组编码便能确定测序片段的具体碱基信息(肖鹏峰等，中国发明专利：ZL201210128597.6)。该方法具有大幅提高测序长度，且测序得到的测序信号强度比传单核苷酸合成测序的信号强等特点。然而，该发明专利只针对一个DNA模板样本进行分析，无法对包含多个甲基化的DNA模板序列进行分析，限制了序列分析的范围。由于经过亚硫酸氢盐处理后的PCR产物需要区分C、T碱基，而(dATPαS+dGTP)合成焦测序没有办法区分这两种碱基，因此，两核苷酸的测序不包括这组组合形式。

发明内容

为了克服现有技术中存在的不足，本发明提供一种两核苷酸合成焦测序定量检测甲基化的方法，为样本经过亚硫酸氢盐处理后的PCR产物提供一种快速、高效、灵敏的甲基化定量分析方法。

为实现上述目的，本发明采用以下技术方案：

一种两核苷酸合成焦测序定量检测甲基化的方法，其特征在于：其步骤包括：1)DNA提取；2)亚硫酸氢盐处理；3)PCR扩增；4)测序；5)关联分析；

所述步骤4)的测序方法为：每个测序反应同时加入两种不同的核苷酸，得到由连续单个测序信息构成的一组测序编码信息。

所述步骤4)的具体方法包括以下步骤：

4-1)制备单链DNA模板：将PCR扩增产物与链霉亲和素包裹的磁珠反应，生物素修饰的DNA链固定到所述磁珠上，在0.05-0.2MNaOH溶液下变性；将未固定的另一条DNA链清除；然后用洗液洗涤，得到固定的单链DNA模板；

4-2)测序引物杂交：将测序引物与所述单链DNA模板在杂交反应体系中，70-80℃下放置5-10min，自然冷却至室温，完成杂交；

4-3)测序：配备测序反应体系，与所述步骤3-2)得到的杂交产物混合，单个测序反应选择两核苷酸组合为(dATPαS+dCTP)、(dATPαS+dTTP)、(dGTP+dTTP)、(dCTP+dGTP)、(dCTP+dTTP)之一进行；连续测序反应选择不同的两组两核苷酸组合循环进行，或者根据分析的目标序列优化两核苷酸加入的顺序进行。

所述步骤4-2)中，所述测序引物是一段与单链DNA模板完全互补的一段序列。

所述步骤4)中，每个测序反应获得的测序信息包括两核苷酸种类信息和测序信号强度信息，所述测序信号强度与合成核苷酸数目成正比，即每个测序反应的测序信号强度均能够转化为核苷酸合成的数目。

所述步骤5)中，根据两核苷酸合成焦测序得到的一组测序反应获得编码信息，测序信号强度信息是包含零的正整数，或者是正非整数。

所述步骤5)的具体步骤为：

假定DNA分析片段内所有GC位点碱基“C”全被甲基化，得到一条100％被甲基化的DNA模板1序列，并转化成相应两核苷酸合成焦测序的最大一阶的整数编码信息；同时，假定DNA分析片段内所有GC位点基“C”全未被甲基化，得到一条100％未被甲基化的DNA模板2序列，并转化成相应两核苷酸合成焦测序的最大一阶的整数编码信息；

所述关联分析为：假定容易一个GC位点中C被甲基化的程度为x_i，其中0≤x_i≤1，那么，在经过亚硫酸氢盐处理的PCR产物这个碱基序列中，含有“C”的DNA模板序列含量为x_i，而含有由这个碱基未被甲基化转化而来的“T”DNA模板序列含量则为(1-x_i)；某个实际测序反应得到的信号强度即核苷酸合成数目等于DNA模板1序列和DNA模板2序列合成测序贡献之和，并由此构建出相应的方程式或方程组，求出x_i值，确定该位点的甲基化程度；

当i＝1，DNA模板1序列含量为x₁，DNA模板2序列含量为(1-x₁)；

当i＝2，该“C”碱基之前的DNA模板1序列含量为x₁，该“C”碱基及其之后的DNA模板1序列含量为x₂；由该“C”碱基转化成“T”碱基之前的DNA模板2序列含量为(1-x₁)，由该“C”碱基转化成“T”碱基及其之后的DNA模板2序列含量为(1-x₂)；

依次类推，当i＝i，该“C”碱基之前的DNA模板1序列含量为x_i-1，该“C”碱基及其之后的DNA模板1序列含量为x_i；由该“C”碱基转化成“T”碱基之前的DNA模板2序列含量为(1-x_i-1)，由该“C”碱基转化成“T”碱基及其之后的DNA模板2序列含量为(1-x_i)；将整过PCR产物测序信息上甲基化完成关联分析。

所述步骤2)中，通过采用传统的亚硫酸氢盐转化方法，或者采用市售的试剂盒、按照其操作流程实施。

所述步骤3)中，PCR扩增所用的PCR一条引物为5’端被生物素、氨基或者丙烯酰胺基团修饰，与表面修饰链霉亲合素、羧基的固相载体反应，或者与丙烯酰胺单体聚合反应制备单链DNA模板。

本发明的有益效果是：

本发明与传统焦测序相比，具有如下优点：

1)本发明适合所有经亚硫酸氢盐转化的PCR产物序列的甲基化分析。相对于传统的焦测序分析方法，本发明能够大幅度提高DNA序列的测定长度，拓宽了焦测序的分析范围。

2)本发明能够对经亚硫酸氢盐转化的单个样本PCR产物序列的甲基化进行定量分析，相对于传统的焦测序分析方法，本发明对同一位点甲基化的含量至少提供两个独立的测定数据，数据间可以相互校正，提高了分析的准确度和可靠性。

3)本发明适合多个混合样本的多模板PCR产物分析，可以直接测定混合样本中各个DNA模板的比例，可以用于从大规模样本中寻找、筛选核酸标志物。

4)本发明直接采用商品化、非标记的天然核苷酸进行合成测序，它可以在任何基于实时合成测序的测序平台进行。

附图说明

图1为本发明方法对任意拟定的包含多个甲基化位点的PCR产物DNA模板序列(5’-TTTTGGAG(C/T)TTG(C/T)AG(C/T)TTTG(C/T)GTTTTTG(C/T)-3’，其中(C/T)表示经亚硫酸氢盐转化后PCR产物中的可能碱基信息)两核苷酸合成焦测序定量检测甲基化的方法示意。

图2为人样本RARβ2基因启动子CpG岛的5个甲基化位点按照表1两核苷酸加入顺序得到的焦测序结果。

图3为人样本RARβ2基因启动子CpG岛的5个甲基化位点的关联分析。

具体实施方式

本发明提供的两核苷酸合成焦测序定量检测甲基化的方法，应用两核苷酸同时加入到反应中的测序信息，即每个测序反应得到包括两核苷酸种类及其核苷酸合成数目的测序编码信息，得到一组测序编码信息。然后，根据某个实际测序反应得到的信号强度(核苷酸合成数目)等于一定含量DNA模板1序列和一定含量DNA模板2序列的合成测序贡献之和，并由此构建出相应的方程式(组)，求出x_i值，确定该位点的甲基化程度。依次类推，可以将整个测序信息中各个位点的甲基化程度确定。

下面结合附图对本发明做进一步说明。

图1为本发明方法对任意拟定的包含多个甲基化位点的PCR产物DNA模板序列(5’-TTTTGGAG(C/T)TTG(C/T)AG(C/T)TTTG(C/T)GTTTTTG(C/T)-3’，其中(C/T)表示经亚硫酸氢盐转化后PCR产物中的可能碱基信息)两核苷酸合成焦测序定量检测甲基化的方法示意；

图中，第一行表示100％的DNA序列1在(dATPαS+dTTP)/(dCTP+dGTP)循环合成焦测序得到的测序信息((AT)⁰表示(dATPαS+dTTP)没有核苷酸参与合成；(AT)表示(dATPαS+dTTP)参与一个核苷酸合成；(CG)表示(dCTP+dGTP)参与一个核苷酸合成)，数字1、2、3、…、n表示对应的测序反应次序；在DNA序列1中，第1、2、3、…、i个碱基C的含量为x_i，则在DNA序列2中，第1、2、3、…、i个碱基C转化为对应T碱基的含量为(1-x_i)；第六行表示100％的DNA序列2在(dATPαS+dTTP)/(dCTP+dGTP)合成循环焦测序得到的测序信息(AT)表示(dATPαS+dTTP)参与一个核苷酸合成；(CG)表示(dCTP+dGTP)参与一个核苷酸合成)，数字1、2、3、…、n表示对应的测序反应次序；F₁、F₂、F₃、…、F_n表示第n测序反应的信号强度转化成寡核苷酸合成的数目。

在关联分析中，由于第1个测序反应只将DNA序列2中(1-x₁)含量的碱基T进行了测序，因此第1个测序反应的信号强度转化成寡核苷酸合成的数目F₁＝(1-x₁)；而第2个测序反应除了将DNA序列1中x₁含量的碱基C、G依次进行测序外，还将DNA序列1中碱基G进行了测序，因此第2个测序反应的信号强度转化成寡核苷酸合成的数目F₂＝2x₁+(1-x₁)＝1+x₁；由F₁或者F₂可以求解出x₁。

同理，在第4个测序反应在DNA序列2中，只将(1-x₁)含量的碱基G进行测序；而在DNA序列1中，首先对含量x₁的G进行测序外，还将依次实施对含量x₂的碱基C、G的测定，因此，F₄＝(1-x₁)+x₁+2x₂＝1+2x₂；在第5个测序反应在DNA序列2中，只将(1-x₂)含量的碱基T进行测序；而在DNA序列1中，则依次对含量x₂的TTT进行了测序，因此，F₅＝(1-x₂)+3x₂＝1+2x₂；由F₄或者F₅可以求解出x₂。

依照上述方法，依次可以将每个碱基C的含量求出。

下面结合实施例做进一步说明。

实施例：

人样本RARβ2基因启动子CpG岛的5个甲基化位点分析方法，具体方法包括：

(1)将血样本采用传统的蛋白激酶K与苯酚/氯仿抽提法提取外周血中的基因组DNA；

(2)亚硫酸氢钠修饰基因组DNA：按照CpGenomeTurboBisulfiteModificationKit(Millipore公司)提供的操作流程对基因组DNA进行亚硫酸氢钠处理，并纯化、回收修饰后DNA；

(3)PCR扩增：PCR引物:5’-biotin-GTTGTTTGAGGATTGGGATG-3’，5’-ATACCCAAACAAACCCTACTC-3’与200mg经亚硫酸氢钠处理处理的基因组DNA，0.2mMdNTP，1UTaqDNA聚合酶,1×扩增缓冲液,1.8mMMgCl₂的50μLPCR扩增体系进行扩增，扩增条件为：95℃起始变性5min；40个热循环为：94℃变性30s、54℃退火45s、72℃延伸45s；最后72℃延伸7min；

(4)PCR扩增产物与链霉亲和素修饰的磁珠反应，使修饰生物素的DNA链固定到磁珠上，在0.1MNaOH溶液下变性，将未固定的另一条DNA链清除；然后用洗液(10mMTris-Acetate,pH7.6)洗涤，得到固定的单链DNA模板；

(5)将测序引物5′-CCCAAACAAACCCTACTC-3′与磁珠固定的其中一份单链DNA模板模板在反应体系(10mMTris-HCl,2MNaCl,1mMEDTA(乙二胺四乙酸钠),0.1％Tween20,pH7.6)80℃下杂交5min，然后自然冷却至室温，完成杂交；

(6)焦测序反应体系包括0.1MTris-Ac(pH7.7),2mMEDTA(乙二胺四乙酸钠),10mMMg(Ac)₂,0.2％BSA(小牛血清蛋白),10mMDTT(二巯苏糖醇),10mMAPS(磷酰硫酸腺),0.4mg/mLPVP(聚乙烯吡咯烷酮),4mMD-luciferin(虫荧光素),2U/mLATPsulfurylase(三磷酸腺苷硫酸化酶),0.4mMluciferase(荧光素酶),2U/mLapyraseVII(三磷酸腺苷双磷酸酶VII),2U/mLDNA聚合酶I(Klenowfragment,exo–)；焦测序反应体系与上述(4)杂交产物混合用于测序反应；

(7)将上述(6)的反应体系置于焦测序仪(PSQ96MAsystem(BiotageAB,Uppsala,Sweden))中，按照表1的顺序依次分别加入两核苷酸进行焦测序，得到由按照先后顺序排列的单个测序反应的碱基片段编码信息图2；根据图2提取F₁、F₄、F₇、F₉、F₁₁转化为核苷酸数目的信息(10au的峰强度相当于一个核苷酸)，并构建方程组：

F₁＝0.69＝1-x₁

F₄＝0.58＝1-x₂

F₇＝0.63＝1-x₃

F₉＝0.53＝1-x₄

F₁₁＝0.49＝1-x₅

便可以求出x₁＝0.31、x₂＝0.42、x₃＝0.37、x₄＝0.47，x₅＝0.51，即为五个位点的甲基化程度。

表1.100％甲基化或未甲基化PCR产物DNA模板的理论测序结果

测序反应	1	2	3	4	5	6	7	8	9	10	11	12
													核苷酸	GT	AC	CT	GT	AC	CT	GT	AC	GT	CT	GT	AC
DNA1	1	2	2	1	1	2	1	1	1	5	1	3
													DNA2	0	3	2	0	2	2	0	3	0	5	0	4

注：GT表示(dGTP+dTTP)，依次类推

DNA1表示100％甲基化序列：CTTAGCGAGCGCAAGAGCTGTAGGGTTAG

DNA2表示100％未甲基化序列：TTTAGTGAGTGTAAGAGTTGTAGGGTTAG

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种两核苷酸合成焦测序定量检测甲基化的方法，其特征在于：其步骤包括：1)DNA提取；2)亚硫酸氢盐处理；3)PCR扩增；4)测序；5)关联分析；

2.如权利要求1所述的两核苷酸合成焦测序定量检测甲基化的方法，其特征在于：所述步骤4)的具体方法包括以下步骤：

3.如权利要求2所述的两核苷酸合成焦测序定量检测甲基化的方法，其特征在于：所述步骤4-2)中，所述测序引物是一段与单链DNA模板完全互补的一段序列。

4.如权利要求1或2所述的两核苷酸合成焦测序定量检测甲基化的方法，其特征在于：所述步骤4)中，每个测序反应获得的测序信息包括两核苷酸种类信息和测序信号强度信息，所述测序信号强度与合成核苷酸数目成正比，即每个测序反应的测序信号强度均能够转化为核苷酸合成的数目。

5.如权利要求1所述的两核苷酸合成焦测序定量检测甲基化的方法，其特征在于：所述步骤5)中，根据两核苷酸合成焦测序得到的一组测序反应获得编码信息，测序信号强度信息是包含零的正整数，或者是正非整数。

6.如权利要求5所述的两核苷酸合成焦测序定量检测甲基化的方法，其特征在于：所述步骤5)的具体步骤为：

当i＝1，DNA模板1序列含量为x₁，DNA模板2序列含量为(1-x₁)；

7.如权利要求1所述的两核苷酸合成焦测序定量检测甲基化的方法，其特征在于：所述步骤2)中，通过采用传统的亚硫酸氢盐转化方法，或者采用市售的试剂盒、按照其操作流程实施。

8.如权利要求1所述的两核苷酸合成焦测序定量检测甲基化的方法，其特征在于：所述步骤3)中，PCR扩增所用的PCR一条引物为5’端被生物素、氨基或者丙烯酰胺基团修饰，与表面修饰链霉亲合素、羧基的固相载体反应，或者与丙烯酰胺单体聚合反应制备单链DNA模板。