用于多重检测甲基化DNA的方法
技术领域
本公开文本涉及一种用于多重检测靶标DNA的甲基化的方法和一种用于检测靶标DNA的甲基化的组合物,并且更具体地,涉及一种用于检测靶标DNA的甲基化的方法,其包括:构建寡核苷酸,其包含能够与靶标DNA互补结合的靶标特异性序列和与靶标DNA不互补的人工引物;通过使用该寡核苷酸作为初级引物对靶标DNA进行线性扩增用于线性靶标富集(下文称为LTE);使用来自用作初级引物的寡核苷酸(其能够与该线性扩增的靶标DNA互补结合)的分离物和与该线性扩增的靶标DNA不互补的通用引物对该线性扩增的靶标DNA进行扩增;并且通过探针检测是否存在扩增产物。
背景技术
在哺乳动物细胞的基因组DNA中,除了A、C、G和T外还有第五个碱基,即5-甲基胞嘧啶,其中一个甲基基团与胞嘧啶环的第五个碳附接(5-mC)。5-mC总是仅与CG二核苷酸(5’-mCG-3’)的C附接,该CG二核苷酸通常被标记为CpG。CpG的C大多通过与甲基附接而甲基化。该CpG的甲基化抑制了基因组中的重复序列(如Alu或转座子)的表达。此外,该CpG是哺乳动物细胞中最常出现表观遗传变化的位点。该CpG的5-mC天然脱氨至T,并且因此,哺乳动物基因组中的CpG显示的频率仅为1%,远低于正常频率(1/4x1/4=6.25%)。
CpG异常整合的区域称为CpG岛。术语“CpG岛”是指长度为0.2-3kb并且C+G含量大于50%并且CpG比例大于3.75%的位点。人类基因组中有约45,000个CpG岛,并且主要在调节基因表达的启动子区域中发现它们。实际上,CpG岛出现在占人类基因约50%的管家基因的启动子中。已知异常DNA甲基化主要发生在基因的5’调节区,以减少基因的表达。
在本文中,基因的5’调节区包括启动子区、增强子区和=5’非翻译区。最近,有人积极地进行了检查血液、痰、唾液、粪便或尿液中肿瘤相关基因的启动子甲基化并将检查结果用于各种癌症的诊断和治疗的尝试。
众所周知,DNA通过包括细胞凋亡和坏死的过程从癌症患者的癌组织中的异常细胞释放到血液中,并且因此在血液的血清或血浆中以无细胞肿瘤DNA的形式存在,并且甲基化的DNA片段也存在于无细胞肿瘤DNA中。这种异常DNA甲基化的存在已被用作诊断癌症的一种标志物。
同时,一般来说,用于分析基因甲基化的方法是通过检测不参与甲基化的对照基因、通过PCR以证实PCR的适合性和输入DNA的存在与否、以及与其平行进行PCR以检测靶标DNA的甲基化。
具体而言,作为通过实时PCR来分析甲基化的方法,可以考虑以下方法:i)使用靶标DNA甲基化非依赖性引物作为实时PCR的引物并使用能够与甲基化靶标DNA杂交的甲基化特异性检测引物以检测PCR扩增产物的方法;ii)使用靶标DNA甲基化特异性引物作为实时PCR引物并使用能够与PCR扩增产物中含有的甲基化非依赖性序列杂交的检测探针的方法;并且iii)使用靶标DNA甲基化特异性引物作为实时PCR引物并使用能够与甲基化靶标DNA杂交的甲基化特异性检测探针以检测PCR扩增产物的方法。
然而,这些方法都直接使用未富集的DNA作为模板,并且必须同时使用两种引物(正向和反向)来扩增靶标DNA。因此,每当待在一个试管(单个反应器)中扩增的靶标增加时,存在进一步需要两种引物的问题。
用于多重PCR的引物被设计为使得单个试管中的不同引物可具有相似的杂交特性。在一定程度上退火温度和引物浓度可以通过计算得出,或者也可以凭经验使用。由于每次添加引物对时非特异性杂交会增加,每添加一个引物对时应修改反应条件。此外,归因于引物对的耗尽等可能发生伪影。5’-标签化寡核苷酸在PCR反应中的使用已有报道。然而,该扩增方法的一个关键特征是它包括每个引物的退火和分离引物延伸反应的步骤,并且因此不适合于实际的多重PCR概念。因此,为多重PCR创造完美的条件是一个非常困难和成本高昂的过程。因此,有必要开发一种能够在相同条件下同时同等程度扩增若干个靶标的多重PCR方法,无论不同引物的各特征如何。
在这一技术背景下,本申请的诸位发明人已经做出了大量努力来解决上述问题,并且开发了一种具有高检测限和准确度的用于检测甲基化靶标DNA的方法,并因此发现,当使用通用引物连接的寡核苷酸通过非对称线性扩增来富集靶标DNA且使用该富集的靶标DNA作为模板来检测靶标DNA,并且将通用引物与靶标特异性寡核苷酸连接时,即使与常规技术不同,仅添加一个引物用于靶标DNA的多重检测,也能够以期望的高灵敏度和准确度检测甲基化DNA,从而完成本公开内容。
发明内容
技术问题
本公开文本的一个目的是提供一种使用通用引物以多重方式检测甲基化DNA的方法。
本公开文本的另一个目的是提供一种用于多重检测甲基化DNA的组合物,其包含一种通用引物。
本公开文本的仍另一个目的是提供一种用于多重检测甲基化DNA的试剂盒,其包含该组合物。
技术方案
为了实现上述目的,本公开文本提供了一种用于检测甲基化DNA的方法,其包括以下步骤:用于检测甲基化DNA的方法,其包括:(a)用修饰非甲基化DNA位点以使其区分于甲基化DNA位点的至少一种试剂处理含靶标DNA的样品;(b)构建寡核苷酸,其包含被设计为能够与用该试剂处理的靶标DNA互补结合的靶标特异性序列和不与靶标DNA互补结合的通用引物;(c)使用步骤(a)中用该试剂处理的靶标DNA作为模板,并使用步骤(b)中构建的该寡核苷酸作为引物,进行单向非对称线性扩增;(d)使用能够与步骤(c)中线性扩增的DNA互补结合的寡核苷酸和通用引物扩增靶标DNA;并且(e)通过能够与步骤(d)中扩增的靶标DNA序列互补杂交的探针检测该靶标DNA的甲基化。
本公开文本还提供了一种用于检测甲基化DNA的组合物,其包含:至少一种用于处理含靶标DNA样品的试剂,该试剂修饰非甲基化DNA以使其区分于甲基化DNA;寡核苷酸,其包含能够与用该试剂处理的靶标DNA序列互补结合的靶标特异性序列和不与靶标DNA互补结合的通用引物;能够与线性扩增的靶标DNA互补结合的寡核苷酸和通用引物;以及能够与线性扩增的靶标DNA序列互补杂交的探针。
本公开文本还提供了一种用于检测甲基化DNA的试剂盒,其包含该组合物。
附图说明
图1是示意性显示用于多重检测甲基化靶标DNA的方法的概念图。
图2显示了本公开文本的方法和常规方法之间甲基化DNA检测灵敏度比较的结果。
图3示意性地显示了设计用于靶标DNA的引物和探针(在本公开文本的方法中使用)的过程。
图4a和4b显示了本公开文本的方法(使用针对靶标DNA的引物和探针进行)和常规方法之间甲基化DNA检测灵敏度比较的结果。
具体实施方式
除非另外定义,否则本文中使用的所有技术性和科学性术语具有与本发明所属领域中的普通技术人员通常所理解的含义相同的含义。通常,本文使用的命名法和下文将描述的实验方法是本领域公知且常用的方法。
在一方面,本公开文本涉及一种用于检测甲基化DNA的方法,其包括以下步骤:(a)用至少一种修饰非甲基化DNA位点以使其区分于甲基化DNA位点的试剂处理含靶标DNA的样品;
(b)构建寡核苷酸,其包含被设计为能够与用该试剂处理的靶标DNA互补结合的靶标特异性序列和不与靶标DNA互补结合的通用引物;
(c)使用步骤(a)中用该试剂处理的靶标DNA作为模板,并使用步骤(b)中构建的寡核苷酸作为引物,进行单向非对称线性扩增;
(d)使用能够与步骤(c)中线性扩增的DNA互补结合的寡核苷酸和不与线性扩增的靶标DNA互补结合的通用引物来扩增该靶标DNA;
(e)通过能够与步骤(d)中扩增的靶标DNA序列互补杂交的探针检测该靶标DNA的甲基化。
在本公开文本中,开发了一种能够通过以高灵敏度检测甲基化DNA进行疾病早期诊断的方法,并且检查了该方法的性能。在本公开文本的一个例子中,首先使用能够与靶标DNA互补结合的靶标特异性序列和不与已结合靶标特异性序列的靶标DNA结合的通用引物对内部对照基因和靶标DNA进行线性扩增,并且然后通过如下检测方法分析甲基化DNA,该方法使用能够与靶标DNA互补序列互补结合的寡核苷酸、能够与靶标DNA序列互补杂交的探针以及不与线性扩增的靶标DNA互补结合的通用引物。结果证实,本公开文本的方法可以比常规方法更高的灵敏度和准确度检测甲基化DNA。
确切地说,用重亚硫酸氢盐处理衍生自正常人的粪便DNA和衍生自每个分期的结直肠癌患者的粪便DNA,并将非甲基化胞嘧啶全部转化为尿嘧啶,并且然后使用能够特异性结合甲基化SDC2(靶标DNA)和COL2A1(内部对照)中每个并且能够互补结合与通用引物融合的靶标DNA的寡核苷酸对这些DNA进行线性扩增,之后使用能够与每个靶标探针杂交的特异性探针、能够与靶标DNA互补序列互补结合的寡核苷酸以及通用引物进行实时PCR(图1)。结果可以证实,本公开文本的方法能够以比使用不包括通用引物的引物进行的常规qMSP(定量甲基化特异性PCR)方法更高的灵敏度和准确度来检测甲基化DNA(图2和图4)。
在本公开文本中,步骤(a)是用至少一种修饰非甲基化DNA位点以使其区分于甲基化DNA位点的试剂处理含靶标DNA的样品。
本公开文本中使用的“甲基化”意指甲基与胞嘧啶基环的第5个碳原子附接,形成5-甲基胞嘧啶(5-mC)。5-甲基胞嘧啶(5-mC)总是仅与CG二核苷酸(5’-mCG-3’)的C附接,该二核苷酸通常被标记为CpG。CpG的C大多通过与甲基附接而甲基化。该CpG的甲基化抑制了基因组中的重复序列(如Alu或转座子)的表达。此外,该CpG是哺乳动物细胞中最常出现表观遗传变化的位点。该CpG的5-mC天然脱氨至T,并且因此,哺乳动物基因组中的CpG显示的频率仅为1%,远低于正常频率(1/4x1/4=6.25%)。
CpG异常整合的区域称为CpG岛。术语“CpG岛”是指长度为0.2-3kb并且C+G含量大于50%并且CpG比例大于3.75%的位点。人类基因组中有约45,000个CpG岛,并且主要在调节基因表达的启动子区域中发现它们。实际上,CpG岛出现在占人类基因约50%的管家基因的启动子中。
靶标DNA中CpG甲基化的存在可能是疾病的一种指示剂。例如,可以测量靶标DNA的启动子、5’-非翻译区和内含子中任何一个的CpG甲基化。
含有CpG的基因通常是DNA。然而,本公开文本的方法可以应用于含有DNA的样品或含有DNA和RNA(包括mRNA)的样品,其中DNA或RNA可以是单链或双链的。可替代地,样品也可以是含有DNA-RNA杂交体的样品。
也可以使用核酸混合物。如本文所用,术语“多重”包括在一种基因中存在多个待检测的特定核酸序列区域的情况和单个试管(单个反应器)包含多个靶标DNA的情况。待检测的特定核酸序列可以是大分子片段,并且该特定序列可以从一开始就以构成整个核酸序列的分离分子的形式存在。核酸序列不一定是纯形式的核酸,并且核酸可以是复杂混合物(如含有人类总DNA的一种)中的一小部分。
确切地说,本公开文本涉及用于在单个反应器中的样品中检测多个靶标DNA甲基化的方法,其中样品可含有多个多靶标DNA。只要靶标DNA不仅是一个对照基因,还是当其表达受异常甲基化抑制时影响癌症发生或进展的任何基因,该靶标DNA就可以无限制地使用。
样品可以衍生自人体。例如,样品可以衍生自肝癌、胶质母细胞瘤、卵巢癌、结肠癌、头颈癌、膀胱癌、肾细胞癌、胃癌、乳腺癌、转移癌、前列腺癌、胰腺癌或肺癌患者。在本公开文本中,样品可以是选自固体或液体组织、细胞、粪便、尿液、血液、血清和血浆中的任何一种。
可以无限制地使用至少一种修饰非甲基化DNA位点以使其区分于甲基化DNA位点的试剂,只要该试剂可以区分非甲基化胞嘧啶碱基和甲基化胞嘧啶碱基即可。例如,试剂可以是选自重亚硫酸盐、亚硫酸氢盐、二亚硫酸盐及其组合中的一种或多种,但不限于这些。确切地说,用试剂甲基化的胞嘧啶碱基不被转化,但是未用试剂甲基化的胞嘧啶碱基可以转化为尿嘧啶或除胞嘧啶之外的另一碱基。
在本公开文本中,步骤(b)是构建寡核苷酸的步骤,该寡核苷酸包含被设计为能够与经试剂处理的靶标DNA互补结合的靶标特异性序列和不与靶标DNA互补结合的通用引物。
对于常见多重PCR,应构建并同时使用与靶标数目对应的正向和反向引物对。然而,在本公开文本的方法中,仅一个能够通过通用引物与靶标DNA序列互补结合的靶标特异性序列(反向引物)可用于实时PCR过程,以同时检测若干个多重甲基化DNA,并且仅一种能够与线性扩增DNA互补结合的寡核苷酸(正向引物)可以使用,以与待检测的靶标相同的数量。因此,仅少量引物可用于同时检测若干个靶标的甲基化,并且因此降低了PCR的复杂性和PCR效率的变化。
靶标特异性序列是能够与靶标DNA互补结合的序列,并且作为靶标特异性序列,也可以选择性使用能够与靶标DNA的甲基化位点互补结合的序列,以及能够与靶标DNA的非甲基化位点互补结合的序列。
靶标特异性序列可以包括,例如,一个或多个CpG二核苷酸。确切地说,靶标特异性序列可以包括与选自由SEQ ID NO:2、5、9、14、17、21和26表示的序列的一个或多个序列具有至少50%(确切地说,至少55%、60%、70%、80%或90%)同一性的序列。
可用于本公开文本中的通用引物可以与能够与靶标DNA序列互补结合的靶标特异性序列(反向引物)和能够与线性扩增DNA互补结合的寡核苷酸(反向引物)中的任何一个连接,或者与该反向引物和该正向引物两者连接。
通用引物只要包含不与可扩增的靶标DNA(无论该靶标DNA如何,例如,它可包含人类基因组中不存在的核苷酸序列)互补结合的核苷酸序列即可无限制地使用。确切地说,通用引物可以包括与由SEQ ID NO:7表示的核酸序列具有至少50%(确切地说,至少55%、60%、70%、80%或90%)同一性的序列。此外,通用引物可以包括诸如T7、SP6、M13等的序列,但不限于此。
而且,通用引物可以是选自由SEQ ID NO:35至41表示的序列的一个或多个序列。通用引物可以是,例如,5’-TAATACGACTCACTATAGG-3’(SEQ ID NO:35)的T7序列,5’-TATTTAGGTGACACTATAG-3’(SEQ ID NO:36)的SP6序列,或5’-GTAAAACGACGGCCAG-3(SEQ IDNO:37:-20F)、5’-GTTTTCCCAGTCACGAC-3’(SEQ ID NO:38:-40F)、5’-CGCCAGGGTTTTCCCAGTCACGAC-3’(SEQ ID NO:39:-47F)、5’-GAAACAGCTATGACCATG-3’(SEQID NO:40:R)或5’-AGCGGATAACAATTTCACACAGG-3’(SEQ ID NO:41:-48R)的M13序列。
本公开文本的方法包括如下的步骤(c):使用步骤(a)中用该试剂处理的靶标DNA作为模板,并且使用步骤(b)中构建的寡核苷酸作为引物,进行非对称线性扩增。
通过步骤(c)在实时PCR过程中用重亚硫酸氢盐处理的DNA不立即使用,而是使用线性扩增的DNA,并且因此检测率和检测灵敏度极好(图2和4)。
在本公开文本中,仅一个靶标DNA在一个方向上线性非对称扩增,并且因此造成靶标DNA的富集。在一个实施方案中,用于富集甲基化靶标DNA的线性扩增可以通过单向PCR进行,用作引物的寡核苷酸包含与靶标特异性序列的5’末端结合的通用引物。
线性扩增意指扩增产物相对于扩增循环(包括双链变性、引物退火和核酸合成)的数量线性产生。线性扩增区分于聚合酶链式反应(PCR),其相对于扩增循环的数量以指数方式产生扩增产物。
接下来,本公开文本的方法包括如下的步骤(d):使用能够与步骤(c)中线性扩增的DNA互补结合的寡核苷酸和通用引物来扩增该靶标DNA。
在一些情况下,步骤(d)可能还包括一个检测靶标DNA的甲基化的步骤,该步骤是通过使用一种自报告或能量转移标记引物进行。
如本文所用,术语“自报告”也称为“能量转移标记”,并且可以与“能量转移标记”互换使用。如本文所用,术语“自报告通用引物”可与术语“能量转移标记引物”互换使用。
“自报告”或“能量转移标记”意指引物能够自淬灭或自探测,这样当没有发生扩增时,归因于自淬灭而不会发出荧光,而当发生扩增时,淬灭得到解除并发出荧光。自报告或能量转移标记物质包括但不限于TaqMan探针、荧光团和分子信标。
在一个例子中,能够与线性扩增的DNA互补结合的寡核苷酸(正向引物)可包含能够与步骤(d)中构建的靶标DNA互补结合并扩增靶标DNA的序列,例如,一个或多个CpG二核苷酸。
确切地说,寡核苷酸可以包括与由选自SEQ ID NO:1、4、8、10至13、15、16、18至20、22至25、27和28表示的序列的一个或多个序列具有至少50%(确切地说,至少55%、60%、70%、80%或90%)同一性的序列。
以与上述步骤(b)中相同的方式适用通用引物的描述。
本公开文本的方法包括一个步骤(e):通过能够与步骤(d)中扩增的靶标DNA序列互补杂交的探针检测该靶标DNA的甲基化。
在一个例子中,甲基化的检测可以是通过选自以下的任一种方法进行:PCR、甲基化特异性PCR、实时甲基化特异性PCR、使用甲基化DNA特异性结合蛋白的PCR、使用甲基化DNA特异性结合抗体的PCR、定量PCR、DNA芯片分析、测序、合成测序、以及连接测序。
用于检测甲基化的方法
(1)甲基化特异性PCR:
当用重亚硫酸氢盐处理基因组DNA以通过甲基化特异性PCR检测甲基化时,5’-CpG’-3区域中的胞嘧啶如果被甲基化则保持完整,但如果胞嘧啶未甲基化则变为尿嘧啶。因此,基于重亚硫酸氢盐处理后转化的碱基序列,构建了对应于具有5’-CpG-3’碱基序列的区域的PCR引物组。当通过PCR扩增基因组DNA时,如果基因组DNA被甲基化,则采用对应于甲基化碱基序列的引物在PCR混合物中检测PCR产物,并且可通过琼脂糖凝胶电泳定量分析该甲基化。在本文中,用于检测甲基化的探针可以是TaqMan探针、分子信标探针或自报告或能量转移标记探针,但不限于此。
(2)实时甲基化特异性PCR
实时甲基化特异性PCR是一种由甲基化特异性PCR方法改进得来的实时测量方法,并且包括用重亚硫酸氢盐处理基因组DNA,设计对应于甲基化碱基序列的PCR引物,并使用这些引物进行实时PCR。基因组DNA的甲基化的检测方法包括两种方法:使用与扩增的碱基序列互补的TanMan探针的检测方法和使用Sybergreen的检测方法。因此,实时甲基化特异性PCR可实现甲基化DNA的选择性定量分析。在本文中,使用体外甲基化DNA样品绘制标准曲线,并且还将碱基序列中不含5’-CpG-3’序列的一个基因扩增作为标准化的阴性对照组,以定量分析甲基化的程度。
(3)使用甲基化DNA特异性结合蛋白的PCR、定量PCR和DNA芯片测定
当将一种仅与甲基化DNA特异性结合的蛋白质与DNA混合时,该蛋白质仅与甲基化DNA特异性结合。因此,使用甲基化特异性结合蛋白的PCR或DNA芯片分析可仅对甲基化DNA进行选择性分离。
此外,DNA的甲基化也可以通过定量PCR方法测量,并且用甲基化DNA特异性结合蛋白分离的甲基化DNA可以用荧光探针标记,并与含有互补探针的DNA芯片杂交,从而测量DNA的甲基化。
(4)差异性甲基化的检测—亚硫酸氢盐测序法
另一种用于检测含甲基化CpG的核酸的方法包括以下步骤:使含核酸的样品与修饰未甲基化胞嘧啶的试剂接触;并且使用CpG特异性寡核苷酸引物扩增样品中含有CpG的核酸,其中该寡核苷酸引物区分经修饰的甲基化核酸和非甲基化核酸并检测该甲基化核酸。扩增步骤是可选和理想的,但不是必需的。该方法依赖于PCR反应以区分经修饰的(例如,经化学修饰的)甲基化DNA和非甲基化DNA。
(5)重亚硫酸氢盐测序法
另一种用于检测含甲基化CpG的核酸的方法包括以下步骤:使含核酸的样品与修饰非甲基化胞嘧啶的试剂接触;并且通过非甲基化依赖性寡核苷酸引物扩增样品中含有CpG的核酸。在本文中,寡核苷酸引物可以扩增核酸而不区分经修饰的甲基化核酸和非甲基化核酸。扩增产物可以通过Sanger方法使用测序引物测序,或通过与重亚硫酸氢盐测序连接的下一代测序方法测序以检测甲基化核酸。
(6)在本文中,下一代测序方法可以通过合成测序和连接测序进行。该方法的特征在于,将单个DNA片段在空间上分离,而不是制备细菌克隆,并将其进行原位扩增(克隆扩增)和测序。在本文中,该方法同时分析了数十万个片段,并且因此被称为“大规模并行测序”。
该方法基于合成测序实现,并且依赖于在依次附接单核苷酸或二核苷酸的同时获得信号的方法。它包括焦磷酸测序、离子激流和Solexa方法。
基于合成测序的NGS系统包括Roche 454平台、Illumina HiSeq平台、Ion PGM平台(Life Technology)和PacBio平台(Pacific BioSciences)。该454和Ion PGM平台使用乳液PCR(一种克隆扩增方法),而HiSeq平台使用Bridge扩增。合成测序方法通过检测合成DNA时生成的磷酸盐来分析一个序列,同时依次附接单核苷酸、氢离子或预标记的荧光染料。为了检测序列,该454平台使用一种采用磷酸盐的焦磷酸测序方法,而Ion PGM平台使用氢离子检测。HiSeq和PacBio平台通过检测荧光来分析序列。
连接测序是一种采用DNA连接酶的测序技术,并且是通过鉴定DNA核苷酸序列中特定位置的核苷酸来进行。与采用聚合酶的大多数测序技术不同,连接测序不使用聚合酶,并且使用DNA连接酶不连接错配序列的特征。它包括一个SOLiD系统。在该技术中,每个步骤中读取两个碱基,并且通过引物重置过程独立地重复读取步骤五次。从而每个碱基读取两次,以增加准确度。
在连接测序的情况下,在由16种组合构成的二核苷酸引物组中,依次连接对应于目的核苷酸序列的二核苷酸引物,并分析这些连接的组合,从而确定目的DNA的核苷酸序列。
对于本公开文本中使用的引物,当在步骤(a)中用试剂(例如重亚硫酸氢盐)处理靶标DNA时,5’-CpG’-3区域中的胞嘧啶如果被甲基化则保持完整,但如果没有被甲基化,则胞嘧啶变为尿嘧啶。因此,基于在试剂(例如重亚硫酸氢盐)处理后转化的碱基序列,可以构建对应于具有5’-CpG-3’碱基序列的区域的PCR引物。
引物可以被设计为与靶标DNA的待扩增位点的每条链“大体上”互补。这意味着引物必须足够互补才能在聚合反应条件下与它们各自的链杂交。
通过能够与靶标DNA杂交的探针来检测由步骤(d)中的能够与线性扩增的DNA互补结合的寡核苷酸和通用引物扩增的产物的甲基化,并且该探针只要能够与靶标杂交以检测甲基化便可无限制地使用,但它可能包含例如一种或多种CpG二核苷酸。此外,除了上述寡核苷酸或通用引物之外,还有一种使用自报告荧光物质或能量转移标记引物进行检测的方法。
确切地说,探针可以包括与选自由SEQ ID NO:3、6、29、30、以及31至34表示的序列的一个或多个序列具有至少为50%(确切地说,至少55%、60%、70%、80%或90%)同一性的序列。
在一些实施方案中,探针两端可能附接有报告物或淬灭物。报告物可以是选自以下的一个或多个:FAM(6-羧基荧光素)、德克萨斯红、HEX(2’,4’,5’,7’,-四氯-6-羧基-4,7-二氯荧光素)、JOE、Cy3和Cy5。淬灭物可以是选自一个或多个:TAMRA(6-羧基四甲基-罗丹明)、BHQ1、BHQ2和Dabcyl。淬灭物可以是选自以下一个或多个:TAMRA(6-羧基四甲基-罗丹明)、BHQ1、BHQ2和Dabcyl。
在另一方面,本公开文本涉及一种用于检测甲基化DNA的组合物,其包含:至少一种用于处理含有靶标DNA的样品的试剂,该试剂修饰非甲基化DNA以使其区分于甲基化DNA;
寡核苷酸,其包含能够与用该试剂处理的靶标DNA序列互补结合的靶标特异性序列和不与靶标DNA互补结合的通用引物;
能够与线性扩增的靶标DNA互补结合的寡核苷酸;不与线性扩增的靶标DNA互补结合的通用引物;以及
能够与线性扩增的靶标DNA序列互补杂交的探针。
根据本公开文本的组合物与上述构成重叠,包括用至少一种修饰甲基化DNA和非甲基化DNA以使其彼此区分的试剂进行处理,使用一种扩增用该试剂处理的靶标DNA并包含能够与靶标DNA序列互补结合的靶标特异性序列和不与靶标DNA杂交的通用序列的寡核苷酸进行线性扩增,并使用能够与线性扩增的靶标DNA互补结合的寡核苷酸、通用引物和探针来检测甲基化DNA,并且因此省略了其具体描述。
在仍另一方面,本公开文本涉及一种用于检测靶标DNA的甲基化的试剂盒,其包含该组合物。
在一个例子中,试剂盒可以包括区室化以在其中接收样品的载体装置、接收试剂的容器、含有用于扩增靶标DNA的5’-CpG-3’碱基序列的PCR引物的容器、以及含有用于检测扩增的PCR产物的探针的容器。
载体装置适用于容纳一个或多个容器,如小瓶、试管等,每个容器包含待在该方法中使用的单独元素中的一个。根据本文提供的本发明方法的描述,本领域技术人员可以容易地确定各容器中所需试剂的分配。
实施例
在下文中,将参照实施例进一步详细描述本公开文本。对于本领域普通技术人员而言显而易见的是,这些实施例仅用于说明目的,不应理解为限制本公开文本的范围。
实施例1:使用衍生自细胞系的甲基化DNA确定检测限
作为人结直肠癌细胞系的HCT116、SW480和HT-29细胞系购自韩国细胞系库(Korean Cell Line Bank,韩国首尔),并在含有10%胎牛血清(JBI,韩国首尔)、青霉素和链霉素的RPMI培养基(JBI,韩国首尔)中于孵化器中在37℃、5%二氧化碳下培养。
使用QiaAmp DNA Mini试剂盒(Qiagen,Hilden,德国)提取基因组DNA,并通过EZDNA Methylation-Gold试剂盒(ZYMO Research,Irvine,美国)用重亚硫酸氢钠处理。简言之,将基因组DNA在65℃下用亚硫酸氢盐处理2.5小时,并且然后通过将其在室温下放置20分钟进行脱磺酸。接下来,将其与Zymo-Spin IC柱(Zymo Research,Irvine,美国)结合,并且然后用10μl蒸馏水提取并在20℃下储存。
为确定本公开文本的方法的检测限,将其与不包括LTE过程的meSDC2-qMSP进行比较,将衍生自HCT116细胞系的甲基化DNA以100至10pg的浓度分配,并且然后将其与使用Illustra GenomiPhi V2DNA扩增试剂盒(GE Healthcare,Cleveland,美国)扩增的20ng人类白细胞基因组DNA(BioChain Insititute Inc.,Hayward,加拿大)混合,随后进行连续稀释。
接下来,使用包含与SEQ ID NO:2的SDC2特异性序列连接的SEQ ID NO:7的通用引物的寡核苷酸和包含与SEQ ID NO:5的COL2A1特异性序列连接的SEQ ID NO:7的通用引物,在以下条件下对DNA进行线性扩增:95℃下5分钟,并且然后进行35个循环,每个循环由以下组成:在95℃下持续15秒并在60℃下持续1分钟。接下来,使用SEQ ID NO:3的探针、能够与线性扩增DNA互补结合的SEQ ID NO:1的寡核苷酸、SEQ ID NO:6的探针、能够与线性扩增DNA互补结合的SEQ ID NO:4的寡核苷酸、以及SEQ ID NO:7的通用引物,在以下条件下进行实时PCR:95℃下5分钟,并且然后进行40个循环,每个循环由以下组成:在95℃下持续15秒并在60℃下持续1分钟。重复该试验24次(表1和图1)。然后,使用Rotor Gene Q软件分析Ct(循环阈值)值。
[表1]引物和探针序列
加下划线的:CpG二核苷酸;斜体:通用引物;
I:肌苷核苷酸
*SEQ ID NO:2和SEQ ID NO:5的序列分别是SDC2和COL2A1靶标特异性序列,并且对应于除ID NO:7的通用引物序列以外的序列,并且将包含靶标特异性序列和不与靶标DNA杂交的通用引物的寡核苷酸用作引物。
结果证实,常规方法显示在200pg DNA中检测率为100%,但在20pg中检测率为37.5%,并且在10pg中检测率为0%,而本公开文本的方法显示在200pg至20pg中检测率为100%,并且显示即使在10pg中检测率也有33.3%(图2和表2)。
[表2]传统方法(qMSP)与本公开文本的方法(LTE-qMSP)之间检测率的比较
实施例2:LTE-qMSP和qMSP之间的比较
为评价SDC2基因诊断结直肠癌的能力,设计了18组可代表SDC2基因所有CpG岛的甲基化特异性检测引物和探针(表3),并进行了LTE-qMSP。为此,从25个正常人和25名结直肠癌患者的粪便中分离出基因组DNA(QIAamp DNA Stool Mini试剂盒,Qiagen),并通过EZDNA methylation-Gold试剂盒用重亚硫酸氢盐处理。然后,用10μl无菌蒸馏水提取DNA,并将其用于LTE-qMSP(线性靶标富集-甲基化-特异性实时PCR)。使用经重亚硫酸氢盐处理的基因组DNA作为模板,使用下表3中所示设计的靶标特异性序列(R)进行线性靶标富集(LTE)(图3)。使用Rotor-Gene Q PCR系统(Qiagen)和共20μl的PCR反应溶液(模板DNA,10μl;5XAptaTaq DNA Master(Roche Diagnostics),4μl;COL2A1靶标特异性序列,1μl(1皮摩尔);SDC2靶标特异性序列,1μl(1皮摩尔);蒸馏水,4μl),在以下PCR条件下进行LTE反应:在95℃下处理5分钟,并且然后35个循环,每个循环由以下组成:在95℃下持续15秒并在60℃下持续1分钟。
使用Rotor-Gene Q PCR系统(Qiagen)进行qMSP。使用总共40μl的PCR反应溶液(20μl的主要LTE产物;8μl的5X AptaTaq DNA Master(Roche Diagnostics);1μl(10皮摩尔)能够与DNA互补结合的PCR引物;1μl(10皮摩尔)能够与SDC2互补结合的寡核苷酸;1μl(5皮摩尔)能够与COL2A1互补结合的寡核苷酸;1μl(10皮摩尔)通用引物(SEQ ID NO:7);1μl(5皮摩尔)SDC2TaqMan探针;1μl(2.5皮摩尔)COL2A1 TaqMan探针;6μl的蒸馏水)在以下PCR条件下进行:在95℃下处理5分钟,并且然后进行40个循环,每个循环由以下组成:在95℃下持续15秒并在适合的退火温度(58℃至61℃)下持续1分钟。通过测量循环阈值(Ct)来确定是否将PCR产物扩增。使用EpiTect PCR对照DNA组(Qiagen,目录号59695)测试甲基化和非甲基化对照DNA。使用COL2A1基因(Kristensen等人,2008)作为内部对照基因。
[表3]SDC2基因LTE-qMSP的引物和探针序列
*斜体:通用序列(SEQ ID NO:7)
*R1至R6的序列为靶标特异性序列,其对应于除SEQ ID NO:7的通用序列之外的序列。
*F1至F17对应于能够与线性扩增的靶标DNA互补结合的寡核苷酸。
A.第6组的LTE-qMSP和qMSP之间的比较的结果
根据实施例1中描述的方法,比较LTE-qMSP方法和qMSP方法之间通过第6组检测的灵敏度。结果证实,常规方法显示在200pg DNA中检测率为100%,但在20pg中检测率为37.5%,并且在10pg中检测率为0%,而本公开文本的方法显示在200pg至20pg中检测率为100%,并且显示即使在10pg中检测率也有33.3%(图4a和表4)。
[表4]传统方法(qMSP)与本公开文本的方法(LTE-qMSP)之间的检测率的比较
B.第17组的LTE-qMSP和qMSP之间的比较的结果
根据实施例1中描述的方法,比较LTE-qMSP方法和qMSP方法之间通过第17组检测的灵敏度。结果证实,qMSP方法显示在200pg DNA中检测率为100%,但在20pg中检测率为45.0%,并且在10pg中检测率为0%,而本公开文本的方法显示在200pg至20pg中检测率为100%,并且在20pg中检测率为91.7%,并且显示即使在10pg中检测率也有29.2%(图4b和表5)。
[表5]传统方法(qMSP)与本公开文本的方法(LTE-qMSP)之间的检测率的比较
实施例3:SDC2基因通过LTE-qMSP在粪便中诊断结直肠癌的能力的评价
通过Ct值测量实施例2的表3中所示的每个样品中的甲基化的程度,并通过ROC曲线分析(MedCalc程序,比利时)计算每个引物和探针组的灵敏度和特异性(表6)。
使用衍生自正常人和结直肠癌患者的粪便DNA分析SDC2基因的甲基化。结果证实,结直肠癌的诊断灵敏度高达76%(19/25)至88.0%(22/25),并且特异性高达88.0%(3/25)至100%(0/25)。这表明SDC2基因甲基化对于结直肠癌的诊断非常有用。
[表6]SDC2基因诊断结直肠癌的能力的评价
为了进一步评估LTE-qMSP方法的甲基化多重检测能力,使用单个试管中的粪便DNA评价组1和组2的组合诊断结直肠癌的能力。
[表7]组1和组12的组合诊断结直肠癌的能力的评价
对组1和组12的组合进行了临床验证,并且结果证实灵敏度和特异性极高,分别为88%和92%。因此,再次证实可以使用LTE-qMSP方法检测甲基化,其中在单个试管中同时扩增若干个甲基化靶标。
工业适用性
如上所述,根据本公开文本的用于检测甲基化DNA的方法使用一种通用引物,并且因此即使仅使用一个额外的引物时,也可以有效地扩增多靶标DNA,即使样品中含有各种类型的基因。此外,用于通过线性扩增检测甲基化的PCR(实时PCR)的复杂性和PCR效率的复杂性会降低,指示检测的灵敏度显著较高并且该方法是有用的。此外,该方法的优点在于,它可以在线性扩增靶标DNA的步骤(LTE步骤)中以更高的特异性富集甲基化的靶标DNA。
尽管已经参考具体特征对本公开文本进行了详细描述,但是对于本领域技术人员来说清楚的是,该描述仅针对优选实施方案并不限制本公开文本的范围。因此,本公开文本的实质范围将由所附权利要求及其等同物限定。
文本文件
参见所附序列表。
<110> 基因特力株式会社
<120> 用于多重检测甲基化DNA的方法
<130> PP-B1956
<150> KR 10-2016-0129110
<151> 2016-10-06
<160> 41
<170> KoPatentIn 3.0
<210> 1
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> SDC2互补结合的寡核苷酸
<400> 1
gtagaaatta ataagtgaga gggc 24
<210> 2
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> SDC2 specific seq
<400> 2
aaagattcgg cgaccaccga acgactcaaa ctcgaaaact cg 42
<210> 3
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> SDC2探针
<400> 3
ttcggggcgt agttgcgggc gg 22
<210> 4
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> COL2A1互补结合的寡核苷酸
<400> 4
gtaatgttag gagtattttg tggta 25
<210> 5
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> COL2A1 specific seq
<400> 5
aaagattcgg cgaccaccga ctacccaaaa aaacccaatc cta 43
<210> 6
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> COL2A1探针
<400> 6
agaagaaggg aggggtgtta ggagagg 27
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 通用引物
<400> 7
aaagattcgg cgaccaccga 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 1-F1
<400> 8
aagaaaagga ttgagaaaac 20
<210> 9
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 1-R1
<400> 9
aaagattcgg cgaccaccga cgaaaaaaat tcctacaaaa ttacacg 47
<210> 10
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 2-F2
<400> 10
ggtttgtcgg tgagtagagt cggc 24
<210> 11
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 3-F3
<400> 11
gttatagcgc ggagtcgcgg c 21
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 4-F4
<400> 12
ggttttcgga gttgttaatc 20
<210> 13
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 5-F5
<400> 13
ttatttggga gttatattgt c 21
<210> 14
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 5-R2
<400> 14
aaagattcgg cgaccaccga cgcgccgcgc ctccctcccc g 41
<210> 15
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 6-F6
<400> 15
ttttagtcgt ttaggggagt tc 22
<210> 16
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 7-F7
<400> 16
cgtagtcgcg gagttagtgg tttc 24
<210> 17
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 7-R3
<400> 17
aaagattcgg cgaccaccga cgctaactta aaaaaaaact acg 43
<210> 18
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 8-F8
<400> 18
cgcgttgttt tttagatatt ttc 23
<210> 19
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 9-F9
<400> 19
cgcgcggatc gcgcgttttc gtc 23
<210> 20
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 10-F10
<400> 20
cggtacggga aaggagttcg cg 22
<210> 21
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 10-R4
<400> 21
aaagattcgg cgaccaccga cgacacgaaa ttaatactcc g 41
<210> 22
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 13-F12
<400> 22
tcgcgttttc ggggcgtagt tgc 23
<210> 23
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 14-F13
<400> 23
cggcgggagt aggcgtagga ggaggaagc 29
<210> 24
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 15-F14
<400> 24
aggaagcgag cgttttcgag tttc 24
<210> 25
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 16-F15
<400> 25
aatcgttgcg gtattttgtt tc 22
<210> 26
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 16-R6
<400> 26
aaagattcgg cgaccaccga ccaaaaaccg actactccca accg 44
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 17-F16
<400> 27
gattcgtgtg cgcgggttgc 20
<210> 28
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 18-F17
<400> 28
cgagcgttgg gtaggaggtt tc 22
<210> 29
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 探针 1
<400> 29
cgtgtaattt tgtaggaatt tttttcg 27
<210> 30
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针 2
<400> 30
cggggaggga ggcgcggcgc g 21
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 探针 3
<400> 31
cgtagttttt ttttaagtta gcg 23
<210> 32
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 探针 4
<400> 32
cggagtatta atttcgtgtc g 21
<210> 33
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 探针 5
<400> 33
cgagttttcg agtttgagtc gt 22
<210> 34
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针 6
<400> 34
cggttgggag tagtcggttt ttgg 24
<210> 35
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> T7通用
<400> 35
taatacgact cactatagg 19
<210> 36
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> SP6通用
<400> 36
tatttaggtg acactatag 19
<210> 37
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> M13通用
<400> 37
gtaaaacgac ggccag 16
<210> 38
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> M13通用
<400> 38
gttttcccag tcacgac 17
<210> 39
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> M13通用
<400> 39
cgccagggtt ttcccagtca cgac 24
<210> 40
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> M13通用
<400> 40
gaaacagcta tgaccatg 18
<210> 41
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> M13通用
<400> 41
agcggataac aatttcacac agg 23