DNA胞嘧啶残基的甲基化是真核生物重要的表观遗传改变。在人类和其他哺乳动物中,甲基胞嘧啶几乎只存在于胞嘧啶-鸟嘌呤(CpG)二核苷酸。DNA甲基化在基因调控中扮演重要角色并且甲基化模式的改变涉及人类癌症和某些人类疾病。人类恶性肿瘤观察到的最早和最普通的遗传改变是CpG岛的异常甲基化,尤其是定位于基因的5’调控区域的CpG岛,导致这些基因的表达改变。因此,在早期检测、风险评估、疗效评价、复发的监测等方面,人们对使用DNA甲基化标记作为诊断指示剂有着极大的兴趣。在研究胚胎发育、细胞分化、转基因表达、转录调控、维持甲基化及其它事件中,人们对DNA甲基化也具有极大的科学兴趣。
提供一种检测甲基化的基因组座位的方法。在某些实施方案中,所述方法包括:a)用修饰胞嘧啶为尿嘧啶的试剂处理包含未甲基化和甲基化的基因组座位拷贝的核酸样品以产生经处理的核酸;b)使用第一引物和第二引物从经处理的核酸扩增产物,其中所述第一引物与基因组座位中包含甲基胞嘧啶的位点杂交,所述扩增优选地扩增所述基因组座位的甲基化拷贝,以产生扩增的样品;以及c)使用活瓣分析(flap assay)检测所扩增的样品中所述基因组座位的扩增的甲基化拷贝的存在,所述活瓣分析采用侵入寡核苷酸,其具有相应于基因组座位中甲基化位点的3’末端G或C核苷酸。
附图说明
图1示意性说明活瓣分析的一些一般原则。
图2示意性说明了所述方法的一个实施方案。
图3显示重亚硫酸盐处理之前和之后人类波形纤维蛋白基因(VIM)的片段的甲基化和未甲基化拷贝的核苷酸序列,
图4显示与图3显示的片段进行比对的示例性正向引物、示例性反向引物和示例性活瓣寡核苷酸的核苷酸序列。图4显示的核苷酸序列列在序列表中,如未甲基化的VIM(SEQ ID NO:18)、甲基化的VIM(SEQ ID NO:19)、SEQ ID NO:13(正向引物)、SEQ ID NO:15(活瓣探针)和SEQ ID NO:14(反向引物)。
图5-7每个提供更详细描述于本申请实施例部分的数据。
定义
本文使用的术语“样品”涉及材料或材料的混合物,通常情况下,尽管这不是必须的,以液体形式,含有一种或多种感兴趣的分析物。
术语“核苷酸”旨在包括那些不仅包含已知嘌呤和嘧啶碱基而且包含已被修饰的其他杂环碱基的基团(moieties)。这些修饰包括甲基化的嘌呤或嘧啶,酰基化的嘌呤或嘧啶,烷基化的核糖或其他杂环。此外,术语“核苷酸”包括那些包含半抗原或荧光标记并可以不仅包含常规核糖和脱氧核糖的糖,而且也可以包含其他糖的基团。修饰的核苷或核苷酸也包括对所述糖基团的修饰,例如,一个或多个羟基被卤素原子或脂肪族基团取代,官能化为醚、胺等。
术语“核酸”和“寡核苷酸”在本文中可以互换使用,用于描述任意长度的聚合物,例如,长于大约2个碱基,长于大约10个碱基,长于大约100个碱基,长于大约500个碱基,长于大约1000个碱基,长达大约10,000个或更多碱基组成的核苷酸,例如,脱氧核糖核苷酸或核糖核苷酸,并可通过酶法或合成法制备(例如,PNA记载于美国专利号5,948,902和其中所引用的参考文献)其可以与天然存在的核酸以序列特异性的方式进行杂交,该方式与两种天然存在的核酸杂交类似,例如,能够参与沃森-克里克碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶(分别为G、C、A和T)。
本文使用的术语“核酸样品”指含有核酸的样品。
本文使用的术语“靶多核苷酸”指研究中的目的多核苷酸。在某些实施方案中,靶多核苷酸含有研究中的一个或多个目的靶位点。
本文使用的术语“寡核苷酸”指大约2至200个核苷酸的核苷酸单链多聚体。寡核苷酸可以通过合成或可以通过酶法制备,并且,在一些实施方案中,长度为10至50个核苷酸。寡核苷酸可以含有核糖核苷酸单体(即,可以为寡核糖核苷酸)或脱氧核糖核苷酸单体。例如,寡核苷酸的长度可以为10至20、11至30、31至40、41至50、51至60、61至70、71至80、80至100、100至150或150至200个核苷酸。
本文使用的术语“双链体”或“双链的”描述两个互补的碱基配对的多核苷酸,即,杂交在一起。
本文使用的术语“引物”指这样的寡核苷酸,其具有与靶多核苷酸的一个区域互补的核苷酸序列。在引物延伸条件下,使用靶核酸作为模板,引物结合至所述互补区域并延伸。引物可为大约15至大约50个核苷酸范围内,但也可使用在上述长度范围之外的引物。引物可通过聚合酶的作用从引物的3’末端开始延伸。不能通过聚合酶的作用从其3’末端开始延伸的寡核苷酸不是引物。
本文使用的术语“延伸”指向核酸末端添加一个或更多的核苷酸,例如通过寡核苷酸的连接或通过使用聚合酶。
本文使用的术语“扩增”指使用靶核酸作为模板产生一个或更多拷贝的靶核酸。
本文使用的术语“变性”指核酸双链体分开为两条单链。
本文的术语“测定(determining)”、“测量(measuring)”、“评估(evaluating)”、“评估(assessing)”、“分析(assaying)”、“检测(detecting)”、“分析(analyzing)”可以互换使用,指任何形式的测量,并包括测定一种成分(element)存在与否。这些属于包括定性和/或定量测定。评估可为相对或绝对。“评估其存在”包括测定存在的某种物质的量,以及测定其存在或不存在。
术语“使用”有其常规含义,因此,是指采用,例如,将方法或组合物付诸运行至结束。
本文使用的术语“Tm”指寡核苷酸双链体的解链温度,在该温度,一半的双链体保持杂交而一半的双链体解离成单链。寡核苷酸双链体的Tm可以通过实验测定或使用下述公式预测:Tm=81.5+16.6(log10[Na+])+0.41(部分G+C)–(60/N),其中N是链长且[Na+]小于1M。参见Sambrook和Russell(2001;Molecular Cloning:ALaboratory Manual,3rd ed.,Cold Spring Harbor Press,Cold SpringHarbor N.Y.,ch.10)。还有其他预测寡核苷酸双链体的Tm的公式并且一个公式可以或多或少地适用于给定的条件或一组条件。
本文使用的术语“Tm-匹配的”指多个核酸双链体有在定义范围内的Tm,例如,在互相的5℃或10℃范围内。
本文使用的术语“反应混合物”指试剂的混合物,所述试剂能够在适当的外部条件下经过一段时间一起反应产生产物。反应混合物可以包含PCR试剂和活瓣切割试剂,例如,各自在本领域已知的配方。
本文使用的术语“混合物”指成分的组合,所述成分是散在的并没有任何特定顺序。混合物是异质的且没有在空间上分离成其不同成分。混合物成分的实施例包括大量不同的溶解于相同水溶液的成分,或大量不同的附着到固相载体的成分或在没有特定顺序上不同成分在空间上没有不同。混合物是无法定位的(addressable)。举例说明,作为本领域中通常已知的,空间上分离的表面结合多核苷酸的阵列不是表面结合多核苷酸的混合物,因为此类表面结合多核苷酸空间上不同且所述阵列是可以定位的。
本文使用的术语“PCR试剂”指对模板进行聚合酶链式反应(PCR)所必需的所有试剂。正如本领域中已知的,PCR试剂基本上包括第一引物、第二引物、热稳定聚合酶和核苷酸。取决于所使用的聚合酶,也可存在离子(例如,Mg2+)。PCR试剂可以任选地包含可扩增靶序列的模板。
本文使用的术语“活瓣分析”指一种分析,其中活瓣寡核苷酸以重叠依赖的方式通过活瓣核酸内切酶切割从而释放随后被检测到的活瓣。活瓣分析的原理众所周知并且记载于,例如,Lyamichev等人.(Nat.Biotechnol.199917:292-296)、Ryan等人(Mol.Diagn.19994:135-44)和Allawi等人(J Clin Microbiol.200644:3443–3447)。为了清楚,某些应用于活瓣分析的试剂记载如下。活瓣分析的原理如图1所示。如图1所示的活瓣分析,侵入寡核苷酸2和活瓣寡核苷酸4与靶6杂交产生包含在位置10处有一个核苷酸重叠的第一复合体8。第一复合体8是活瓣核酸内切酶的底物。活瓣核酸内切酶12切割活瓣寡核苷酸4从而释放活瓣14,活瓣14与FRET盒16杂交,FRET盒16包含猝灭剂“Q”和附近的淬灭荧光基团“R”,“R”被猝灭剂Q淬灭。活瓣14与FRET盒16的杂交产生包含在位置20处有一个核苷酸重叠的第二复合体18。第二复合体也是活瓣核酸内切酶的底物。活瓣核酸内切酶12切割FRET盒16导致荧光基团22的释放,这产生荧光信号。这些成分在下面进行更详细的记载。
本文使用的术语“侵入寡核苷酸”指一种与靶核苷酸的一个区域互补的寡核苷酸。侵入寡核苷酸的3’末端核苷酸可以与靶的核苷酸碱基配对,也可以不配对(例如,其可为例如5-甲基胞嘧啶或尿嘧啶)。
本文使用的术语“活瓣寡核苷酸”指一种包含活瓣区域和与靶核酸的区域互补的区域的寡核苷酸。侵入寡核苷酸上的靶互补区域和活瓣寡核苷酸重叠单个核苷酸,因而当它们与靶核酸退火时,互补序列重叠。正如已知的,如果:a)侵入核苷酸的3’末端核苷酸和b)与活瓣寡核苷酸中的那个核苷酸重叠的核苷酸二者均与靶核酸中的核苷酸碱基配对,那么形成一种具体结构。这种结构是酶的底物,所述酶如下定义为活瓣核酸内切酶,其从活瓣寡核苷酸的靶互补区域切割活瓣。如果侵入寡核苷酸的3’末端核苷酸没有与靶核酸中的核苷酸碱基配对,或如果活瓣寡核苷酸中的重叠核苷酸没有与靶核酸中的核苷酸碱基配对,复合体不是所述酶的底物。
本文使用的术语“活瓣核酸内切酶”或简称“FEN”指一类核苷酸分解酶,其作为结构特异性核酸内切酶作用于DNA结构,所述DNA结构于一条链上包含单链5’突出端或活瓣,该条链被核酸的另一条链取代,即,使得在单链和双链DNA之间的交界处有重叠核苷酸。FEN催化单链和双链DNA交界处的磷酸二酯键水解断裂,释放所述突出端,或所述活瓣。活瓣核酸内切酶由Ceska和Savers(Trends Biochem.Sci.199823:331-336)及Liu等(Annu.Rev.Biochem.200473:589-615)综述。FEN可以是单独的酶、多亚基酶或作为其它酶或者蛋白复合体的活性存在,例如,DNA聚合酶。活瓣核酸内切酶可以是热稳定的。
本文使用的术语“切割的活瓣”指活瓣分析的切割产物的单链寡核苷酸。
本文使用的术语“FRET盒”指包含荧光基团和附近的淬灭所述荧光基团的猝灭剂基团的发夹寡核苷酸。切割的活瓣与FRET盒的杂交产生活瓣核酸内切酶所需的二级底物。一旦形成该底物,包含5’荧光基团的碱基从盒切割出,从而产生荧光信号。
本文使用的术语“活瓣分析试剂”指对底物进行活瓣分析所需的所有试剂。正如本领域已知的,活瓣分析包括如上所述的侵入寡核苷酸、活瓣寡核苷酸、活瓣核酸内切酶和FRET盒。活瓣分析试剂可以任选地包含所述侵入寡核苷酸和活瓣寡核苷酸结合的靶。
本文使用的术语“基因组座位”指基因组中的指定区域。基因组座位存在于来自同一个体的不同细胞的基因组的相同位置,或不同个体中。一个细胞或个体的基因组座位与不同细胞或个体的相同基因组座位相同或非常相似(即,超过99%相同)。不同细胞或个体中相同基因组座位之间核苷酸序列的差异可以是因为一个或多个核苷酸取代。基因组座位可通过基因坐标、名字或使用符号进行定义。已用修饰未甲基化的胞嘧啶为尿嘧啶的试剂处理的核酸样品的基因组座位与未甲基化样品的基因组座位具有相同的序列,除了序列中未甲基化的胞嘧啶(但不是甲基化的胞嘧啶)被修饰称为尿嘧啶。在已经用该试剂经处理的核酸样品中基因组座位的扩增拷贝中,尿嘧啶转变成胸腺嘧啶。
本文使用的术语“甲基化状态”指在甲基化位点的胞嘧啶残基存在或者不存在甲基。为了清楚起见,未被甲基化的胞嘧啶将被称为“未甲基化的胞嘧啶”或“未甲基化的C”,而被甲基化的胞嘧啶(即,5-甲基胞嘧啶)将被称为“甲基化的胞嘧啶”、“甲基化的C”或“甲基C”。
本文使用的“甲基化位点”指已知的至少有时在基因组座位中是甲基化的胞嘧啶核苷酸的位置。甲基化位点的胞嘧啶可以是未甲基化的胞嘧啶或甲基化的胞嘧啶。换句话说,术语“甲基化位点”指基因组座位中具体的胞嘧啶,其甲基化状态寻求确定。甲基化位点可通过例如基因组坐标或相对于基因的起始密码子的坐标进行定义。
正如将在下面更为详细地记载的,所述方法的某些实施方案包括用试剂处理核酸样品,所述试剂通过脱氨基作用特异性将未甲基化的胞嘧啶转变成尿嘧啶。因此,在未处理的样品中,甲基化位点是被未甲基化的胞嘧啶或甲基化的胞嘧啶占用的,取决于位点的甲基化状态。同样,处理后的样品中甲基化位点将被甲基化的胞嘧啶或尿嘧啶占用,取决于在处理之前样品位点的甲基化状态。
本文使用的术语“相应于(corresponds to)”及语法等价词,例如,“相应的(corresponding)”指术语所指元素之间的特定关系。例如,相应于较长核酸中的序列的寡核苷酸含有与所述核酸中的核苷酸序列相同的核苷酸序列或者与所述核酸中的核苷酸序列互补。
在相应于甲基化位点的寡核苷酸中的核苷酸或相应于甲基化的胞嘧啶的寡核苷酸中的核苷酸的上下文中,术语“相应于”及其语法等价词旨在当两个核酸(例如,包含甲基化的胞嘧啶的寡核苷酸和基因组DNA)比对或碱基配对时找出相对于甲基化位点相应地定位(即,定位于对面的)的核苷酸。同样,除非另有指明(例如,在与特定残基“没有碱基配对”或“碱基配对”的核苷酸的情形下),“相应于”甲基化位点的核苷酸与甲基化的位点或是未甲基化的位点碱基配对。为了清楚起见,在寡核苷酸中,位于相应于序列(例如基因组座位)中甲基化的胞嘧啶的G或C核苷酸可以:a)与序列中甲基化的胞嘧啶碱基配对,b)与扩增的序列中相应于甲基化的胞嘧啶定位的胞嘧啶碱基配对,或c)与扩增的序列中的该胞嘧啶互补的G残基碱基配对。
正如将在下面更为详细记载的,所述方法也可包括扩增核酸产物样品,所述样品已用特异性将未甲基化的胞嘧啶转变成尿嘧啶的试剂处理(参见,例如,Frommer等,Proc.Natl.Acad.Sci.199289:1827-1831)。作为扩增步骤的结果,甲基化的胞嘧啶转变为胞嘧啶,并且尿嘧啶转变成胸腺嘧啶。初始样品中胞嘧啶核苷酸的甲基化状态可因此通过测定扩增产物位于所考虑的胞嘧啶相同位置的碱基对是否是C/G碱基对(其表明所考虑的胞嘧啶是甲基化的)或A/T碱基对(其表明胞嘧啶残基是未甲基化的)来评价。因此,初始样品中胞嘧啶的甲基化状态可通过扩增已用特异性将未甲基化的胞嘧啶转变成尿嘧啶的试剂处理的样品的双链产物来确定,并且然后检查相应于扩增产物的无论哪一条链(即,无论上面的链或者下面的链)的靶胞嘧啶的位置来确定A或T存在(其表明所考虑的胞嘧啶是甲基化的),或G或C存在(其表明所考虑的胞嘧啶是甲基化的)与否。因此,在与双链扩增产物杂交的寡核苷酸(所述产物是通过用特异性将未甲基化的胞嘧啶转变成尿嘧啶的试剂处理的样品的基因组座位扩增产生的)的上下文中,“相应于”甲基化位点的核苷酸是与甲基化位点的无论上面的链或者下面的链碱基配对的核苷酸。
本文使用的“甲基化的序列”是含有甲基化位点的核苷酸序列,即,已知至少有时甲基化的胞嘧啶核苷酸。
本文使用的术语“未甲基化的”,引用核苷酸序列的,指没有甲基化的序列的拷贝。
本发明使用的术语“甲基化的”,引用核苷酸序列的,指包含5-甲基胞嘧啶的序列的拷贝。基因组座位的甲基化可,例如,改变蛋白质的表达,其导致具有这种甲基化基因组座位的细胞的表型改变(例如,癌症相关的表型)。另外,基因组座位的甲基化可能是沉默的。
包含“基因组座位的未甲基化和甲基化的拷贝”的样品及其语法等价词,指包含同一基因组座位的多种DNA分子的样品,其中所述样品包含基因组座位的未甲基化拷贝和同一基因组座位的甲基化拷贝。在这个上下文中,术语“拷贝”并非旨在意味着序列互相拷贝。相反,术语“拷贝”旨在表明序列是不同细胞或个体的同一基因组座位的。换句话说,样品包含由相同核苷酸序列的核酸分子的混合物,除了一些分子包含甲基化的胞嘧啶残基。
本文使用的术语“甲基化的程度”指样品中与特定靶核苷酸种类的成员相比该样品中被甲基化的特定靶核苷酸种类成员的相对值、百分比或分数。
本文使用的术语“修饰未甲基化的胞嘧啶为尿嘧啶的试剂”指特异性脱氨基作用于未甲基化的胞嘧啶生成尿嘧啶的任何试剂。这种试剂是特异性的因为它们不对5-甲基胞嘧啶脱氨基作用而生成尿嘧啶。重亚硫酸盐是这种试剂的一个实例。
本文使用的术语“经处理的核酸样品”是已用修饰未甲基化的胞嘧啶为尿嘧啶的试剂处理的核酸样品。
本文使用的术语“初始样品”指还没有用修饰未甲基化的胞嘧啶为尿嘧啶的试剂处理的核酸样品
本文使用的术语“核苷酸序列”指核酸中核苷酸的连续序列。作为很明显的是,核苷酸序列中核苷酸的数量可差异很大。在具体实施方案中,核苷酸序列(例如,寡核苷酸的核苷酸序列)可以是长度足够与其他核酸中的互补核苷酸序列杂交的。在这些实施方案中,核苷酸序列的长度可为范围至少10至50个核苷酸,例如,12至20个核苷酸,尽管在这些范围之外的长度可用于多种情形。
在与第二核酸完全互补的第一核酸的上下文中,本发明使用的术语“与……完全互补”指当第一核酸中核苷酸的连续序列的每一个核苷酸与第二核酸中互补的核苷酸碱基配对的情形。
本文使用的术语“引物对”用于指能够用于聚合酶链式反应来扩增基因组座位的两个引物。在某些情形下引物对可被认为含有“第一引物”和“第二引物”或“正向引物”和“反向引物”。任何这些术语的使用是任意的并且并未旨在说明引物与双链核酸的上面的链还是下面的链杂交与否。
“CpG”岛定义为长度超过500bp、G/C含量至少55%、并且观察到的CpG/预计的CpG比为至少0.65的DNA区域,如Takai等,Proc.Natl.Acad.Sci.200299:3740-3745定义的。使用该公式来鉴定CpG岛排除了其它富含GC的基因组序列例如Alu重复序列。
具体实施方式
在更详细地描述本发明之前,应当理解,本发明并不局限于所描述的特定实施方案,当然,因而可以发生变化。还应当理解,本文使用的术语仅为了用于描述特定实施方案,并没有意图是限制性的,因为在本发明的范围将仅由所附的权利要求限定。
当提供范围值时,应当理解,每个间值,除非上下文明确指出否则到下限单位的十分之一,在范围的上限和下限之间和任何其他规定的或在指定范围内的间值,包含于本发明。这些更小范围的上限和下限可独立地被包含于所述更小的范围并也包含于本发明,受所述规定的范围中任何明确排除的限制。当所述规定的范围包括一个或二者限制时,排除那些所包括的限制之一或二者的范围也包含于本发明。
除非另外定义,本发明使用的所有技术和科学术语对于本发明所属的技术领域的普通技术人员来说具有通常理解的相同含义。尽管与本文记载的那些方法和材料相似或相同的任何方法和材料也能够用于本发明的实践或检测,现在记载优选的方法和材料。
本说明书引用的所有出版物和专利在此通过引用并入本发明,就像每个单独的出版物或专利具体地和单独地指出通过引用并入并且通过引用并入本发明并公开和记载出版物所引用的方法和/材料。任何出版物的引用是在申请日前为了公开并不应当解释为承认本发明无权凭借着在先发明早于这种公开。此外,所提供的出版物的日期可不同于实际公开日期,其可能需要单独确认。
必须注意如本发明使用的和所附权利要求使用的,除非上下文明确指出否则单数形式“一个(a)”、“一个(an)”和“该(the)”包括复数对象。还注意权利要求可撰写成排除任何可选成份。正因为如此,该声明旨在作为使用这些排他性术语如“仅仅”、“仅”和权利要求成份的记载的类似的术语或使用“负面”限制的先行基础。
正如对于本领域技术人员阅读该公开明显的,本发明记载的和示例的每个单独的实施方案有分立的组成和特征,其可以很容易地与任何其它几种实施方案的特征分开或组合而不脱离本发明的范围或精神。任何记载的方法可以记载的事件顺序进行或逻辑上可能的任何其它顺序进行。
在下面的记载中,本领域技术人员将理解大量的聚合酶和活瓣核酸内切酶的任何一个可用于所述方法,包括但不限于,那些从热稳定的或超热稳定的原核生物、真核生物或古细菌生物分离出的。本领域技术人员也将理解用于所述方法的酶,例如,聚合酶和活瓣核酸内切酶,不仅包括天然存在的酶,而且包括重组酶,所述重组酶包括野生型酶的酶活性片段、切割产物、突变体和变体。
在进一步记载的方法中,将先定义用于所述方法的试剂混合物,随后是样品可被处理的方法的记载和可用于所述方法的反应条件。
反应混合物
反应混合物可能会有所不同,这取决于如何进行反应,例如,是否,例如,第一和第二引物之一或两者都与甲基化的序列杂交,或者是否第一引物(其用于基因组座位的扩增)也用作活瓣分析的侵入核苷酸,在这种情形下不需要在分析混合物中包含不同的侵入寡核苷酸。
一般而言,所述方法中使用的反应混合物可通常含有:a)扩增试剂,其包括热稳定聚合酶、核苷酸、用于从经处理的核酸样品扩增靶基因组座位的第一引物和第二引物;其中:i.第一引物与基因组座位中甲基化的序列杂交,并任选地含有相应于基因组座位中甲基化的胞嘧啶的3’G或C末端核苷酸;以及ii.优选地扩增基因组座位的甲基化拷贝的试剂,来生成扩增的样品;b)活瓣分析试剂,其包括活瓣核酸内切酶、FRET盒、活瓣寡核苷酸和,如果第一引物没有包含相应于甲基化的胞嘧啶的3’末端核苷酸,侵入寡核苷酸,其与第一引物不同,其具有相应于甲基化的胞嘧啶的3’G或C末端核苷酸;以及c)经处理的核酸样品,其中经处理的核酸样品是通过用修饰未甲基化的胞嘧啶为尿嘧啶的试剂处理包含基因组座位的甲基化拷贝和未甲基化拷贝的初始核酸样品而制备的。活瓣寡核苷酸在相应于甲基化的胞嘧啶的位置含有G或C核苷酸。反应混合物特征在于其能扩增并检测样品中基因组座位的甲基化拷贝的存在。
正如上文所述,所述扩增通常采用与基因组座位中甲基化的序列杂交并优选扩增基因组座位的甲基化拷贝的第一引物。在某些实施方案中,所述第一引物可包含一个或多个核苷酸(例如,G残基),其与甲基化序列(如果它们没有甲基化则已被转变为尿嘧啶)中相应的甲基化的胞嘧啶核苷酸碱基配对。在具体实施方案中,所述第一引物可包含多至3或4个与甲基化序列中相应的甲基化胞嘧啶碱基配对的核苷酸,尤其是对引物的3’末端,从而使得所述引物成为优选扩增基因组座位的甲基化拷贝的甲基化特异性引物。在一个实施方案中,所述引物可含有3’末端核苷酸,其与甲基化序列中的甲基化胞嘧啶碱基配对、或者与互补于甲基化的胞嘧啶的扩增子中的G残基碱基配对,以及1、2或3个还与序列中其他甲基化的胞嘧啶或它们的互补碱基碱基配对的核苷酸。因此,所述第一引物可在与基因组座位中第二甲基化的胞嘧啶相应的数量相对应的位置包含一个或多个内部G或C核苷酸。
而因此基因组座位的甲基化拷贝的优选的扩增可通过其中仅一个引物是甲基化特异性的一对引物完成,在具体实施方案中,第一和第二引物都可以是甲基化特异性的,这样它们可以都与基因组座位中甲基化的序列杂交。
所述甲基化特异性的引物的设计可存在于反应混合物中,所述反应混合物可改编自,例如,所述引物设计方法由下述文献记载,例如,Herman等(Methylation-specific PCR:a novel PCR assay formethylation status of CpG islands.Proc.Natl.Acad.Sci.199693:9821–6)和Ehrich等(Quantitative high-throughput analysis of DNAmethylation patterns by base-specific cleavage and mass spectrometry.Proc.Natl.Acad.Sci.2005102:15785–90),以及那些综述的Li(Designing PCR primer for DNA methylation mapping.MethodsMol Biol.2007402:371-84)、Derks等(Methylation-specific PCRunraveled.Cell Oncol.200426:291-9)和Cottrell等(Sensitivedetection of DNA methylation.Ann N Y Acad.Sci.2003983:120-30)。由于人类和其它基因组座位中很多(如果不是大多数所有CpG岛)的性质是已知的(参见,例如Lauss等,Br.J.Cancer.MethCancerDB–aberrant DNA methylation in human cancer200898:816–817;Wang等,Bioinformatics,An evaluation of new criteria for CpG islands inthe human genome as gene markers200320:1170-1177),分析大量不同基因组座位的甲基化特异性引物的设计可以不需过度努力而完成。
正如上文所述,反应混合物中不同侵入寡核苷酸的存在可取决于第一引物是否也用作活瓣分析中的侵入寡核苷酸。因此,在一些实施方案中,第一引物包含与引物结合的序列中甲基化的胞嘧啶碱基配对的3’末端核苷酸。在这些实施方案中,所述第一引物可用作活瓣分析中的侵入寡核苷酸,因此,反应混合物不必包含除了第一引物之外的侵入寡核苷酸。在其它实施方案中,第一引物没有包含与在甲基化的序列中甲基化的胞嘧啶碱基配对的3’末端核苷酸。在这些实施方案中,反应混合物可包含不同的侵入寡核苷酸,其包含相应于甲基化位点的3’末端G或C核苷酸。在这些实施方案中,侵入寡核苷酸的3’末端核苷酸可与扩增产物中引物序列内的甲基化位点碱基配对。
在可选的实施方案中,反应混合物可包含侵入寡核苷酸,其包含与基因组座位中甲基化的胞嘧啶或它的互补碱基配对的3’末端核苷酸的第一引物以及包含相应于甲基化位点的3’末端G或C核苷酸的侵入寡核苷酸。在这些实施方案中,第一引物的3’末端核苷酸和侵入寡核苷酸的3’末端核苷酸与基因组座位中不同甲基化位点的核苷酸碱基配对。在一个实施方案中,侵入寡核苷酸的3’末端核苷酸与扩增产物中引物序列内部的甲基化位点碱基配对。
在具体实施方案中,分离的侵入寡核苷酸可包含除了与其它甲基化位点的核苷酸碱基配对的3’末端核苷酸之外的其它核苷酸(例如,G或C核苷酸)。换句话说,分离的侵入寡核苷酸可包含1个或多个(例如,1、2、3或4或更多)相应于甲基化胞嘧啶的内部G或C核苷酸。这些内部核苷酸增强侵入寡核苷酸与已从基因组座位的甲基化拷贝扩增的核酸结合的特异性,因而增强检测的保真度。以相似的方式,与扩增产物杂交的活瓣寡核苷酸的部分可包含1个或多个(例如,1、2、3或4或更多)相应于甲基化胞嘧啶的内部G或C核苷酸,其用于增强侵入寡核苷酸与已从基因组座位的甲基化拷贝扩增的核酸结合的特异性,因而增强检测的保真度。因此,在某些实施方案中,活瓣寡核苷酸可包含1个或多个相应于基因组座位中第二甲基化胞嘧啶的相应数量的内部G或C核苷酸位置。
在于反应混合物的试剂的确切的性质和浓度可与独立地应用于PCR和活瓣切割分析的试剂相似或相同,例外的是反应混合物包含Mg2+的浓度高于应用于常规PCR反应混合物(其包含Mg2+浓度在大约1.8mM与3mM之间)。在某些实施方案中,本发明记载的反应混合物包含Mg2+浓度范围为4mM至10mM,例如,6mM至9mM。可用于所述反应混合物的示例性的反应缓冲液和DNA聚合酶包括那些记载于多种出版物的(例如,Ausubel,等人.,Short Protocols inMolecular Biology,3rd ed.,Wiley&Sons1995和Sambrook等人.,Molecular Cloning:A Laboratory Manual,Third Edition,2001ColdSpring Harbor,N.Y.)。适于PCR的反应缓冲液和DNA聚合酶可从多种供应商处购买,例如,Invitrogen(Carlsbad,CA),Qiagen(Valencia,CA)和Stratagene(La Jolla,CA)。尽管许多其它聚合酶可应用于某些实施方案,示例性聚合酶包括Taq,Pfu,Pwo,UlTma和Vent。与聚合酶一同适合使用的反应成份以及适合使用的条件的指引,可在聚合酶提供的文献中发现。引物设计记载于多种出版物,例如,Diffenbach和Dveksler(PCR Primer,A Laboratory Manual,ColdSpring Harbor Press1995);R.Rapley(The Nucleic Acid ProtocolsHandbook(2000),Humana Press,Totowa,N.J.);Schena和Kwok等(Nucl.Acid Res.199018:999-1005)。引物和探针设计软件程序也有市售的,包括但不限于,Primer Detective(ClonTech,Palo Alto,Calif.),Lasergene,(DNASTAR,Inc.,Madison,Wis.);和Oligo软件(NationalBiosciences,Inc.,Plymouth,Minn)以及iOligo(Caesar Software,Portsmouth,N.H)。
示例性的活瓣切割分析试剂见于Lyamichev等(Nat.Biotechnol.199917:292-296),Ryan等(Mol.Diagn.19994:135-44)和Allawi等(JClin Microbiol.200644:3443–3447)。活瓣核酸内切酶的合适条件或者是已知的,或者可使用本领域已知的方法容易测定(参见,例如,Kaiser等J.Biol.Chem.274:21387-94,1999)。可用于所述方法的示例性的活瓣核酸内切酶包括但不限于,水生栖热菌(Thermus aquaticus)DNA聚合酶I、嗜热栖热菌(Thermus thermophilus)DNA聚合酶I、哺乳动物FEN-1、闪烁古生球菌(Archaeoglobus fulgidus)FEN-1、詹氏甲烷球菌(Methanococcus jannaschii)FEN-1、激烈火球菌(Pyrococcus furiosus)FEN-1、嗜热碱甲烷杆菌(Methanobacteriumthermoautotrophicum)FEN-1、嗜热栖热菌(Thermus thermophilus)FEN-1、CLEAVASETM(Third Wave,Inc.,Madison,Wis.)、酿酒酵母(S.cerevisiae)RTH1,酿酒酵母(S.cerevisiae)RAD27、裂殖酵母(Schizosaccharomyces pombe)rad2、噬菌体T55'-3'核酸外切酶、Pyroccus horikoshii FEN-1、人类核酸外切酶1、小牛胸腺5'-3'核酸外切酶,包括其真细菌、真核生物和古细菌同源物,例如II类结构特异性酶家族成员,以及酶活性突变体或其变体。切割酶的说明可见于,在其它地方中,Lyamichev等,Science260:778-83,1993;Eis等,Nat.Biotechnol.19:673-76,2001;Shen等,Trends in Bio.Sci.23:171-73,1998;Kaiser等J.Biol.Chem.274:21387-94,1999;Ma等,J.Biol.Chem.275:24693-700,2000;Allawi等,J.Mol.Biol.328:537-54,2003;Sharma等,J.Biol.Chem.278:23487-96,2003;和Feng等,Nat.Struct.Mol.Biol.11:450-56,2004。
在具体实施方案中,反应混合物可包含用于平行分析多个(例如,至少2、3、4或更多)不同靶序列的试剂。在这种情况下,反应混合物可包含多对PCR引物,具有不同活瓣的多个不同的活瓣寡核苷酸,和用于检测不同活瓣的多个不同FRET盒,一旦它们被切割。在一个实施方案中,混合物中的寡核苷酸可具有共同的活瓣但不同的结合序列,允许,例如,大量的甲基化的胞嘧啶中的任何一个切割共同的FRET盒并报告信号,其中单个荧光基团指示甲基化的胞嘧啶的存在。在这个实施方案中,样品中哪个位点是甲基化的可在鉴定甲基化的胞嘧啶的存在之后进行测定。任选地,如果PCR引物之一没有用作侵入寡核苷酸,反应可以包含多个侵入寡核苷酸。FRET盒切割后,可观察到多个可区分的荧光信号。尽管可应用许多其它的荧光基团,荧光基团可选自,例如,6-羧基荧光素(FAM),其激发和发射波长分别为485nm和520nm,雷德蒙红(Redmond Red),其激发和发射波长分别为578nm和650nm,雅基马黄(Yakima Yellow),其激发和发射波长分别为532nm和569nm,以及Quasor670,其激发和发射波长分别为644nm和670nm。在某些情况下,至少PCR引物对之一,活瓣寡核苷酸和FRET盒可用于检测内参。在该分析中,参照试剂可以,例如,用于扩增和检测不是甲基化的基因组座位或,例如,用于扩增和检测相同座位的拷贝。在这些实施方案中,反应混合物可包含,除了其它必须试剂之外,至少具有在甲基化位点与A或T残基碱基配对的3’末端核苷酸的寡核苷酸,(P17)从而提供对基因组座位的未甲基化的拷贝的检测。这些实施方案还可采用扩增基因组座位未甲基化的拷贝的引物。
正如将是明显的,设计用于所述方法的多种寡核苷酸使其互不干扰。例如,在具体的实施方案中,活瓣寡核苷酸可在其3’末端加帽,从而阻止其延伸。同样,在某些实施方案中,如果不用作PCR引物之一,侵入寡核苷酸可在其3’末端加帽。在具体的实施方案中,如果侵入寡核苷酸不用作PCR引物之一,那么侵入寡核苷酸的浓度可以在PCR引物浓度的5%至50%范围内,例如,10%至40%。此外,在某些情形下,活瓣部分和活瓣寡核苷酸的靶互补区域的Tm可独立地比PCR引物的Tm低至少10℃(例如,低10-20℃),这导致a)活瓣寡核苷酸与靶核酸在较高温度(65℃至75℃)较少的杂交以及b)任何切割的活瓣与FRET盒在较高温度(65℃至75℃)较少的杂交,因而允许基因组座位通过PCR在活瓣没有有效杂交的温度进行扩增。
在一个多重反应中,引物设计成具有类似的热力学性质,例如,相似的Tm,G/C含量,发夹稳定性,并且在某些实施方案中可以全部有相似的长度,例如,从18至30nt,例如,20-25nt长。用于反应混合物的其它试剂也可为Tm匹配的。
所述分析混合物可以存在于容器中,包括但不限于,试管;多孔板,例如96孔、384孔、1536孔板;和微流控装置。在某些实施方案中,多个多重反应在同一个反应容器中进行。取决于反应如何进行,反应混合物体积可为5μl至200μl,例如,10μl至100μl,尽管可以预见此范围之外的体积。
在某些实施方案中,所述反应混合物还可以含有核酸样品。在具体的实施方案中,样品可以含有基因组DNA或其扩增产物(例如,使用Lage等Genome Res.200313:294-307或例如公开的专利申请US20040241658的方法扩增的基因组DNA)。在示例性的实施方案中,基因组样品可以包含从哺乳动物细胞例如人、小鼠、大鼠或猴子细胞而来的基因组DNA。所述样品可由培养的细胞或临床样品的细胞制备,所述临床样品例如,组织活检、刮或灌洗或法医样品细胞(即,在犯罪现场收集的样品细胞)。在具体的实施方案中,基因组样品可来自福尔马林固定石蜡包埋(FFPE)样品。
样品分析方法
在具体的实施方案中,核酸样品可获取自生物样品,例如细胞、组织、体液和粪便。感兴趣的体液包括但不限于,血液、血清、血浆、唾液、黏液、痰(phlegm)、脑脊髓液(cerebral spinal fluid)、胸腔积液、眼泪、阴道管液(lactal duct fluid)、淋巴液、痰液(sputum)、脑脊液(cerebrospinal fluid)、关节液、尿液、羊水和精液。在具体的实施方案中,样品可获取自个体,例如,人类,并可在用于个体分析之前处理。例如,核酸可在用之前从样品提取,方法是已知的。
例如,DNA可通过任何不同的方法从粪便中提取,包括记载于,例如Coll等(J.of Clinical Microbiology198927:2245-2248),Sidransky等(Science1992256:102-105),Villa(Gastroenterology1996110:1346-1353)和Nollau(BioTechniques199620:784-788),以及美国专利5463782、7005266、6303304和5741650。除了其它之外,用于从粪便中提取DNA的商业化DNA提取试剂盒包括QIAamp粪便迷你试剂盒(QIAGEN,Hilden,Germany),Instagene Matrix(Bio-Rad,Hercules,Calif.),和RapidPrep微基因组DNA分离试剂盒(Pharmacia Biotech Inc.,Piscataway,N.J.)。
处理初始核酸样品以生成处理的核酸样品包括将初始核酸样品在为了将核酸中未甲基化的胞嘧啶脱氨基从而变成尿嘧啶的条件(例如,时间长度和温度等)下与修饰未甲基化的胞嘧啶为尿嘧啶的试剂接触。这些方法是已知的记载于,例如,Clark等(Nucleic Acids Res.199422:2990-7),McDonald等(Biotechniques.199722:272-4),Herman等(Proc.Natl.Acad.Sci.199693:9821-6)和Paul等(Biotechniques199621:126-33)以及许多其它参考文献。
处理后,样品,本文称为“经处理的样品”,与其它试剂结合生成上述反应混合物,然后经受一组或多组热循环条件。
示例性的条件包括,例如那些记载于Allawi等(J Clin Microbiol.200644:3443–3447)。在一个实施方案中,反应混合物可经受常规PCR热循环(即,多轮变性温度超过90℃,例如,大约95℃,退火温度65℃-75℃且延伸温度65℃-75℃)随后一段高温以变性热稳定的聚合酶(例如,大约99℃),并且然后一段温度为低于延伸温度约10℃,在此过程中检测荧光。
在其它实施方案中,反应混合物可经受循环条件,其中扩增产物的量的增加(由荧光的量表明)可实时检测,其中术语“实时”旨在指在反应进程和产物积累的同时进行检测。检测可以拷贝的绝对数量表示或与样品中的对照核酸标准化之后的相对量表示。在一个实时实施方案中,反应可经受记载于,例如,Tadokoro(J.Vir.Methods2009155:182-186)的热循环条件。在这个实施方案中,反应混合物可经受四步骤的多个循环,包括温度超过90℃(例如,大约95℃)的变性步骤,温度范围为61℃-69℃的退火,温度50℃的活瓣切割,以及温度72℃的延伸。在这个实施方案中,荧光可在每个循环监测以提供在反应混合物中积累的产物的量的实时检测。
在可选的实施方案中,反应混合物经受下列热循环条件:第一组5至15(例如,8至12)个以下循环:i.至少90℃的第一温度;ii.60℃-75℃范围(例如,65℃至75℃)的第二温度;iii.65℃-75℃范围的第三温度;随后:第二组的20-50个以下循环:i.至少90℃的第四温度;ii.比第二温度低至少10℃的第五温度(例如,50℃至55℃的范围);以及iii.65℃-75℃范围的第六温度。在热循环过程中,例如,在第一组和第二组循环之间,没有额外的试剂需要加到反应混合物中。在具体的实施方案中,热稳定聚合酶在第一组和第二组条件之间不是失活的,因此允许靶在第二组循环的每个循环过程中扩增。在具体的实施方案中,第二和第三温度可以是相同的温度,这样进行“两步”热循环条件。每个循环可独立地持续10秒至3分钟的范围,尽管很容易采用此范围之外的持续时间。在第二组循环的每个循环中(例如,当反应处于第五温度),活瓣探针切割产生的信号可被测定从而提供样品中靶核酸的量的实时检测。
图2示意性示例了所述方法的例子的一些原则。如上所述,但是,所述方法可以多种不同的方式进行,例如,通过采用第一引物作为侵入寡核苷酸或通过使用单个甲基化特异性引物。因此,图2显示的是所述方法的一个例子,不应当用来限制成仅所示的实施方案。
参照图2,所述方法包括用修饰未甲基化的胞嘧啶为尿嘧啶以生成处理的样品36的试剂处理包括基因组座位32的甲基化的拷贝和基因组座位34的未甲基化拷贝的初始样品30。这个处理转变例如38的未甲基化的胞嘧啶为例如40的尿嘧啶。在处理过程中,例如42的甲基化的胞嘧啶保持为未甲基化的胞嘧啶。处理的样品36然后与其他试剂混合。
产物44然后从处理的样品36使用第一引物46和第二引物48进行扩增,其中第一引物与基因组座位中甲基化的序列杂交并且所述扩增优选地扩增基因组座位的甲基化拷贝,生成扩增的样品50。如图所示,第一引物46和第二引物48都与甲基化的序列杂交。然而,在实践中,仅引物之一需要与甲基化的序列杂交。在具体的实施方案中和如上所述,第一引物可具有与甲基化的胞嘧啶碱基配对的3’末端核苷酸,虽然这不是必须的(如果反应采用与第一引物不同的侵入寡核苷酸)。这些引物通常包含在甲基化位点的G核苷酸,因而允许引物从包含甲基化的胞嘧啶的序列(没有被处理影响)相比包含未甲基化的胞嘧啶的序列(处理使其转变为U)更具有效地杂交和延伸。如图2所示,扩增的样品50中的产物44的存在可使用活瓣分析来检测,所述活瓣分析采用具有与相应于甲基化位点的G或C残基碱基配对的3’末端核苷酸的侵入寡核苷酸52。G或C残基的选择由相应于要检测的甲基化位点的核苷酸是在扩增产物的上面还是下面的链来决定。如图所示,侵入寡核苷酸52具有末端G核苷酸,因为它与相应于初始样品30中的甲基化位点的C碱基配对。同样,如上所述,如图2所示的实施方案采用分开的侵入寡核苷酸。在其它实施方案中,第一寡核苷酸可用作所述方法中的侵入寡核苷酸,因此,没有必要在分析中使用分开的侵入寡核苷酸。如图2所示,侵入寡核苷酸的3’末端核苷酸与甲基化的“内部”位点碱基配对,在这个意义上位点是在扩增区域的内部且不是第一和第二引物的一部分。
如图所示,活瓣分析依赖于包含侵入寡核苷酸52、活瓣寡核苷酸56和由活瓣核酸内切酶(未显示)作用产物下面的链释放的活瓣60的复合物53的切割。释放的活瓣60然后与FRET盒62杂交形成第二复合物63,第二复合物由活瓣核酸内切酶切割,从复合物切割荧光基团并产生可被检测用于显示扩增的样品中的产物44的量的荧光信号64。
图3和4的例子示例了上述方法的某些方面。图3显示人类波形纤维蛋白基因的甲基化的和未甲基化的拷贝的核苷酸序列,重亚硫酸盐处理之前(SEQ ID NOS:1和2)以及之后(SEQ ID NOS:3和4)。图4显示示例性正向引物、示例性反向引物和示例性活瓣寡核苷酸的核苷酸序列,与图3所示的重亚硫酸盐处理的片段进行比对。
样品中产物的量可相对于样品中存在的对照核酸的量进行标准化,从而确定样品中基因组座位的甲基化拷贝的相对量。在某些实施方案中,对照核酸可以是与基因组座位不同的座位,在某些情形下,可使用采用与甲基化相同位点的A或T残基碱基配对的具有3’末端核苷酸的侵入寡核苷酸的活瓣分析来检测,从而检测基因组座位的未甲基化拷贝的存在。对照可以在同一个反应混合物或不同的反应混合物与检测产物平行的方式进行检测。如果在同一个反应混合物检测对照,活瓣分析可包括进一步的试剂,具体为第二侵入寡核苷酸、第二活瓣探针,所述第二活瓣探针具有第二活瓣及产生与用于检测产物的FRET盒不同的信号的第二FRET盒。在具体实施方案中,反应混合物还可包括PCR试剂和用于扩增和检测另一个在某些样品中已知具有甲基化的基因组座位的甲基化状态的活瓣试剂。
在某些情形下,指示切割的活瓣的量的荧光可通过自动荧光计检测,设计成进行实时PCR,具有如下特征:激发FRET盒的荧光基团的光源,加热和冷却反应混合物的系统以及检测FRET盒的荧光的荧光计。这些特征的组合,允许实时检测切割的活瓣,因而允许样品中的靶核酸的量得到定量。运行实时PCR反应的自动荧光计是本领域已知的并且可以适用于该具体分析,例如,Bio-Rad Laboratories的ICYCLERTM(Hercules,Calif.),Stratagene的Mx3000PTM,MX3005PTM和MX4000TM,ABI PRISMTM7300,7500,7700和7900Taq Man(Applied Biosystems,Foster City,Calif.),SMARTCYCLERTM,ROTORGENE2000TM(Corbett Research,Sydney,Australia)和GENE XPERTTM系统(Cepheid,Sunnyvale,Calif.)以及LIGHTCYCLERTM(Roche Diagnostics Corp.,Indianapolis,Ind.)。不同反应温度之间的升温速度并不是决定性的并且,在某些实施方案中,可应用预设于热循环仪上的默认升温速度。
在某些情形下,所述方法可进一步包括对几个循环切割的量进行制图,从而提供靶核酸丰度的实时评价。预测可通过测定临界循环次数来计算(即,该荧光增至预定的阈值之上的循环;“Ct”值或“Cp”值)。该预测可与对照进行比较(对照可在同一反应混合物作为感兴趣的基因组座位进行分析)以提供标准化的预测。热循环仪也可以含有测定每个样品的临界循环的应用软件。测定临界循环的示例性方法见于,例如,Luu-The等(Biotechniques200538:287-293)。
还提供了进行样品分析的装置。在某些实施方案中,所述装置包括:a)被编排用于进行上述方法的热循环仪和b)包含上述反应混合物的容器。
实用性
所记载的方法可用于多种应用,这些应用通常包括样品分析应用,其中在给定的样品中检测甲基化的序列的存在。
在一些实施方案中,生物样品可获取自患者,并且样品可使用所述方法分析。在具体的实施方案中,所述方法可用于鉴定和/或评价生物样品中基因组座位甲基化拷贝的量,所述样品包含基因组座位的未甲基化拷贝和甲基化拷贝。在这个实施例中,样品可包含基因组座位的野生型拷贝比突变体拷贝至少多100倍(例如,至少1,000倍,至少5,000倍,至少10,000倍,至少50,000倍或至少100,000倍)。
具体地,上述方法可用于诊断,预测治疗的反应,或研究与异常甲基化相关联的癌性病症或其它哺乳动物疾病,包括但不限于:a)印迹疾病,包括Beckwith-Wiedemann综合征(与BWS基因组座位于11p15.5相关联),Prader-Willi综合征(与印记区域于15p11-q13相关联),Angelman综合征(也与印记区域于15p11-q13相关联),奥尔布赖特遗传性骨病(与印记于GNAS相关联),假性甲状旁腺功能减退症1a和1b型(与印记于HYMAI、PLAG1和ZAC-AS相关联),短暂的新生儿糖尿病和某些癌症(与IGF2/H19基因组座位、CDKN1C基因、DIRAS3基因和MEST基因相关联);b)重复不稳定性疾病包括脆性X综合征(与位于FRAXA的甲基化相关联)和面肩肱型肌营养不良症(与位于FSHD基因组座位的甲基化相关联);c)甲基化通路缺陷造成的疾病,例如系统性红斑狼疮,免疫缺陷(SLE,其是全局性T细胞低甲基化的结果)和着丝粒不稳定以及面部异常综合征(ICF)和d)其它疾病例如α-地中海贫血/精神障碍综合征,X-连锁(与ATRX的异常甲基化相关联)。这些疾病由Robertson综述(DNAmethylation and human disease Nat.Reviews20056:597-610)。上述方法,可,例如,用于鉴定未出生的孩子的异常甲基化。
在多种座位中CpG岛的高度甲基化与多种癌症相关联。不受任何特定的理论的束缚,可以相信,甲基化失活下列基因的表达,包括肿瘤抑制基因,细胞周期相关基因,DNA错配修复基因,激素受体和组织或细胞粘附分子。例如,DNA修复基因MLH1和MGMT和肿瘤抑制子,p16,CDKN2和MTS1的肿瘤特异性表达缺陷直接与高度甲基化相关。CpG岛增高的甲基化被认为导致这些基因的灭活导致遗传损伤水平增高,诱发细胞至随后基因不稳定,其随后导致肿瘤发展。
高度甲基化与如表1(Das et al J.Clin.Oncol.200422:4632-42改编而来)所示的几种癌症相关联。因此,所述方法可用作这些癌症的诊断方法。
表1
缩写:APC,腺瘤性结肠息肉病;BRCA1,乳腺癌1;CDKN2A/p16,细胞周期蛋白依赖激酶2A;DAPK1,死亡相关蛋白激酶1;ER,雌激素受体;GSTP1,谷胱甘肽-S-转移酶Pi1;hMLH1,MutL同系物1;MGMT,O-6甲基鸟嘌呤-DNA甲基转移酶;RASSF1A,Ras相关域家族成员1;Rb,视网膜母细胞瘤;VHL,vonHippel-Lindau;GIT,胃肠道;NHL,非霍奇金淋巴瘤。
下列基因的高度甲基化也与癌症相关联:PYCARD,CDH13,COX2,DAPK1,ESR1,GATA4,SYK,MLH1,TP73,PRDM2,PGR,SFRP1,SOCS1,SOCS3,STK11,TMEFF2,THBS1,RASSF5,PRKCDBP,MGMT,CDKN2A,SFRP1,TMEFF2,HS3ST2(3OST2),RASSF1A,GATA4和RARB。
在这些实施方案中,所述方法可用于检测基因中异常甲基化(例如,高度甲基化或低甲基化),异常甲基化可与,例如,乳腺癌,黑色素瘤,肾癌,子宫内膜癌,卵巢癌,胰腺癌,白血病,大肠癌,前列腺癌,间皮瘤,神经胶质瘤,meullobastoma,红细胞增多症,淋巴瘤,肉瘤或多发性骨髓瘤等相关联。
用于诊断癌症的DNA甲基化标记物可从大量出版物综述例如:Qureshi等(Int J Surg.2010Utility of DNA methylation markers fordiagnosing cancer.8:194-8),Muraki等(Oncol Rep.2009EpigeneticDNA hypermethylation:clinical applications in endometrial cancer22:967-72),Balch等(Endocrinology.2009Minireview:epigeneticchanges in ovarian cancer.150:4003-11),Pfeifer(Semin Cancer Biol.2009DNA methylation patterns in lung carcinomas19:181-7)Szalmás等(Semin Cancer Biol.2009Epigenetic alterations in cervicalcarcinogenesis19:144-52),Hoque(Expert Rev Mol Diagn.2009DNAmethylation changes in prostate cancer:current developments andfuture clinical implementation9:243-57),和Campan等(Curr TopMicrobiol Immunol.2006DNA methylation profiles of female steroidhormone-driven human malignancies310:141-78)。
在一个实施方案中,所述方法可用于检测粪便DNA的甲基化,从而提供对结直肠癌的诊断方法。在这些实施方案中,所述方法可用于研究例如BMP3、EYA2、ALX4或波形纤维蛋白的甲基化。这些基因和它们的甲基化记载于,例如,Chen等(J Natl Cancer Inst.2005Detection in fecal DNA of colon cancer-specific methylation of thenonexpressed vimentin gene.97:1124-32),Zou等(Cancer EpidemiolBiomarkers Prev.2007Highly methylated genes in colorectalneoplasia:implications for screening.16:2686-96)和Li(NatBiotechnol.2009Sensitive digital quantification of DNA methylationin clinical samples.27:858-63)。
所述方法可用于诊断患有癌症或癌前状况(例如,腺瘤等)的患者,单独地,或与其它临床技术(例如,物理检查如结肠镜检查)或分子生物学技术(例如,免疫组化分析)结合。例如,获取自所述分析的结果可与其他信息结合,例如,其他基因组座位的甲基化状态信息,其它基因组座位的突变信息,相同基因组座位或不同基因组座位的重排或取代信息,细胞遗传学信息,重排信息,基因表达信息或端粒长度的信息,来提供癌症或其他疾病的整体诊断。
在一个实施方案中,样品可收集自第一位置的患者,例如在临床环境,如在医院或在医生办公室,以及所述样品可转至第二位置,例如,处理样品和进行上述方法生产报告的实验室。本发明所述“报告”是电子的或有形的文件,包括提供检测结果的报告元素,检测结果可包括Ct值或Cp值或者类似的指示样品中基因组座位突变拷贝存在的结果。一旦生成,所述报告可转至其他位置(可为与第一位置相同的位置),可由健康专家(例如,临床医生,实验室技术人员,或如肿瘤科医生,外科医生,病理学家的医生)作为临床诊断的一部分进行解读。
试剂盒
还提供实践如上所述方法的试剂盒。试剂盒的成份可存在于分开的容器,或多种成份可存在于单一容器。试剂盒的成份可包括:a)第一引物和第二引物,其中第一引物相应于基因组座位中甲基化序列并任选地包含与甲基化序列中甲基化的胞嘧啶或它的互补碱基碱基配对的3’末端核苷酸;以及b)活瓣分析试剂,其包括活瓣核酸内切酶,FRET盒和,如果第一引物没有包含与甲基化序列中甲基化的胞嘧啶碱基配对的3’末端核苷酸,具有与基因组座位中相应于甲基化位点的G或C残基碱基配对的3’末端核苷酸的侵入寡核苷酸。这些试剂的详情如上所述。试剂盒还可包含修饰未甲基化的胞嘧啶为尿嘧啶的试剂。试剂盒还包括用于扩增和检测对照核酸的PCR和活瓣试剂。
除了上述成份,试剂盒还可包括使用试剂盒成份实践所述方法的说明书。实践所述方法的说明书通常记录在合适的记录介质上。例如说明书可以打印于例如纸或塑料等的基质上。这样,说明书可作为包装附页存在于试剂盒中,存在于试剂盒或其成份的容器的标签(即,与包装或者子包装结合)等。在其它实施方案中,说明书作为存在于合适的计算机可读存储介质上的电子存储数据文件存在,例如CD-ROM、磁盘等。又在其它实施方案中,实际说明书不在试剂盒中,而是以从远程资源获取说明书的方式例如通过因特网提供。这个实施方案的例子是包括网址的试剂盒,通过该网址可查看说明书和/或下载说明书。获取说明书的这种方式与说明书一起记录于合适的基质。除了所述说明书,试剂盒还可包括一种或多种对照样品,例如,用于测试试剂盒的阳性或阴性对照分析物。
在本说明书中引用的所有出版物和专利申请通过引用的方式并入本文,就像每个单独的出版物或专利申请具体地和单独地通过引用的方式并入。任何出版物的引用是在申请日前为了公开,不应当被解释为承认本发明无权凭借着在先发明早于这种公开。
尽管上述发明通过示例和实施例的方式为了清楚理解的目的已详细描述,对本技术领域的普通技术人员明显的是,在不脱离所附的权利要求书的精神或范围的情况下,可对本发明进行某种改变和修改。
实施例1
在未甲基化的C6ORF150存在下检测甲基化的C6ORF150序列
所述分析是设计用来在未甲基化序列存在下检测和定量甲基化的CpG序列。为了模拟甲基化和未甲基化的基因组DNA,制备质粒并克隆以匹配重亚硫酸盐反应之后未甲基化的C转变成U的序列,它的行为就好像它是在PCR过程中的T,如图3的波形纤维蛋白序列所示例。对于每个实施例,甲基化的序列使用具有完整CG基序的质粒而代表未甲基化的质粒用TG基序替换。
在这个实施例中,2个CG被设计在每个引物上,并且它们不在引物的3’末端。所述分析然后用于在4个不同水平检测掺入未甲基化拷贝中的甲基化拷贝,包括104甲基化拷贝于105未甲基化拷贝(1:10),103甲基化拷贝于105未甲基化拷贝(1:100),102甲基化拷贝于105未甲基化拷贝(1:1000)以及10甲基化拷贝于105未甲基化拷贝(1:10000)。
代表甲基化序列的质粒的靶序列如下,每个C碱基相应于类似基因组DNA的甲基C:
ATGGAATGTTAGGGGCGTTTCGATGGATTTTATCGAGTTTTCGGTTGTTTTCGAGGTCGTTTTGTTTAAGGCGGGAAAGTTCGGTTTCGTTAGGAAGTCGGGATTTCGGTAGAAAAAGAGCGTTTCGGATATTTAGGAGAGGTCGTTCGTTCGCGTAATTGGGGTTCGCGTTAAAAAGGTTTTTTAGCGCGTTTAGGATACGTAGTC(SEQ ID NO:1)
所述分析采用正向引物5’-GGGATTTCGGTAGAAAAAGAGCGT-3’(SEQ ID NO:2),反向引物5’-ACCTTTTTAACGCGAACCCCA-3’(SEQ ID NO:3),侵入寡核苷酸,其不是正向PCR引物5’-TCGGATATTTAGGAGAGGTg-3’(SEQ IDNO:4),和活瓣探针5’-GACGCGGAGCGTTCGTTCGCG-3’/3C6/(SEQ ID NO:5),其中相应于甲基化碱基的区域以下划线显示并且为了抑制引物延伸,3’末端用己二醇基团封闭。活瓣探针的首先9个碱基是由活瓣核酸内切酶切割的区域并然后与FRET盒结合。注意侵入探针的3’末端碱基,显示小写的g,是设计与靶错配从而阻止通过Taq聚合酶的引物延伸。引物、侵入寡核苷酸和活瓣探针作为非目录产品由Integrated DNA Technologies(IDT,Coralville,Iowa)提供。
引物和侵入探针的结合区域在靶序列中以下划线显示,并且活瓣探针的靶结合区域斜体显示:
ATGGAATGTTAGGGGCGTTTCGATGGATTTTATCGAGTTTTCGGTTGTTTTCGAGGTCGTTTTGTTTAAGGCGGGAAAGTTCGGTTTCGTTAGGAAGTCGGGATTTCGGTAGAAAAAGAGCG TTTCGGATATTTAGGAGAGGTCGTTCGTTCGCGTAATTGGGGT TCGCGTTAAAAAGGTTTTTTAGCGCGTTTAGGATACGTAGTC(SEQ ID NO:1)。
使用的FRET盒是5’-FAM/TCT/猝灭剂/AGCCGGTTTTCCGGCT GAGACTCCGCGTCCGT-3’/3C6(SEQ ID NO:6),其中FAM是荧光素,猝灭剂是
Dark猝灭剂,并且为了抑制引物延伸3’末端用己二醇基团封闭。FRET盒由Hologic(Madison,Wisconsin)提供。
循环条件是95℃3min;50个循环95℃20sec,50℃1min和70℃30sec,最终保持在40℃。荧光信号获取是在循环的50℃的点完成的。PCR反应在
480Multiwell96Plates(Roche,Indianapolis)上、于含7.5mM MgCl
2和250μM dNTPs(Promega,Madison,Wisconsin)的10mM MOPS pH7.5中完成。Taq聚合酶是iTaq酶(BioRad,Hercules,California),切割酶是Cleavase2.0(Hologic,Madison,Wisconsin)。正向引物浓度是500nM,反向引物浓度是500nM,活瓣探针是500nM,侵入寡核苷酸探针是70nM并且FRET盒于终浓度200nM使用。所有的扩增和检测在LightCycler480光学热循环仪(Roche,Indianapolis,Indiana)上进行。
图5显示扩增样品中不同比例的突变体与野生型的动力学扩增曲线数据和交叉点Cp的数据。在这些分析中,Cp作为荧光上升至最大荧光的18%的点进行计算。
用于这个实施例的引物、侵入探针和活瓣探针的设计不能检测102甲基化拷贝于105未甲基化拷贝(1:1000;图5)。检测103甲基化拷贝于105未甲基化拷贝(1:100)和104甲基化拷贝于105未甲基化拷贝(1:10)的反应也被过量的未甲基化基因拷贝所抑制(图5)。
实施例2
在未甲基化的ZNF804B存在下检测甲基化的ZNF804B序列
所述分析是设计用来在未甲基化的ZNF804B序列存在下检测和定量甲基化的ZNF804B的CpG序列。为了模拟甲基化和未甲基化的基因组DNA,制备质粒并克隆以匹配重亚硫酸盐反应之后未甲基化的C转变成U的序列,它的行为就好像它是在PCR过程中的T,如图3的波形纤维蛋白序列所示例。对于每个实施例,甲基化的序列使用具有完整CG基序的质粒而代表未甲基化的质粒用TG基序替换。
在这个实施例中,1个CG被设计在每个引物上,并且它们不在引物的3’末端。所述分析然后用于在4个不同水平检测掺入未甲基化拷贝中的甲基化拷贝,如实施例1的,包括104甲基化拷贝于105未甲基化拷贝(1:10),103甲基化拷贝于105未甲基化拷贝(1:100),102甲基化拷贝于105未甲基化拷贝(1:1000)以及10甲基化拷贝于105未甲基化拷贝(1:10000)。
代表甲基化序列的质粒的靶序列如下,每个C碱基相应于类似基因组DNA的甲基C:
TTAATTTGTTTGTTTTATTTGTGGTTGTATAGTTTATTTTTGTAATCGGTTGGGGAGTTGTTGTTTTTGTTAACGTCGTCGTTAGTTAGAGCGTTGAAGAAAAGTTGAAGGTTAGTAGGTAACGAAAGAGTAAAGA(SEQ ID NO:7)
所述分析采用正向引物5’-GTGGTTGTATAGTTTATTTTTGTAATCGGT-3’(SEQ ID NO:8),反向引物5’-ACCTTCAACTTTTCTTCAACGCTC-3’(SEQ ID NO:9),侵入寡核苷酸,其不是正向PCR引物5’-GGGAGTTGTTGTTTTTGTTAAg-3’(SEQ ID NO:10),和活瓣探针5’-GACGCGGAGCGTCGTCGTTAG-3’/3C6/(SEQ ID NO:11),其中相应于甲基化碱基的区域以下划线显示,并且为了抑制引物延伸,3’末端用己二醇基团封闭。活瓣探针的首先9个碱基是由活瓣核酸内切酶切割的区域并然后与FRET盒结合。注意侵入探针的3’末端碱基,显示小写的g,是设计与靶错配从而阻止通过Taq聚合酶的引物延伸。引物、侵入寡核苷酸和活瓣探针作为非目录产品由Integrated DNA Technologies(IDT,Coralville,Iowa)提供。
引物和侵入探针的结合区域在靶序列中以下划线显示,并且活瓣探针的靶结合区域斜体显示:
TTAATTTGTTTGTTTTATTTGTGGTTGTATAGTTTATTTTT GTAATCGGTTGGGGAGTTGTTGTTTTTGTTAACGTCGTCGTTAGTTAGAGCGTTGAAGAAAAGTTGAAGGTTAGTAGGTAACGAAAGAGTAAAGA(SEQ ID NO:7)。
使用的FRET盒是5’-FAM/TCT/猝灭剂/AGCCGGTTTTCCGGCT GAGACTCCGCGTCCGT-3’/3C6(SEQ ID NO:6),其中FAM是荧光素,猝灭剂是
Dark猝灭剂,并且为了抑制引物延伸3’末端用己二醇基团封闭。FRET盒由Hologic(Madison,Wisconsin)提供。
循环条件是95℃3min;50个循环95℃20sec,50℃1min和70℃30sec,最终保持在40℃。荧光信号获取是在循环的50℃的点完成的。PCR反应在
480Multiwell96Plates(Roche,Indianapolis)上、于含7.5mM MgCl
2和250μM dNTPs(Promega,Madison,Wisconsin)的10mM MOPS pH7.5中完成。Taq聚合酶是iTaq酶(BioRad,Hercules,California),切割酶是Cleavase2.0(Hologic,Madison,Wisconsin)。正向引物浓度是500nM,反向引物浓度是500nM,活瓣探针是500nM,侵入寡核苷酸探针是70nM并且FRET盒于终浓度200nM使用。所具有的扩增和检测在LightCycler480光学热循环仪(Roche,Indianapolis,Indiana)上进行。
图6显示扩增样品中不同比例的突变体与野生型的动力学扩增曲线数据和交叉点Cp的数据。在这些分析中,Cp作为荧光上升至最大荧光的18%的点进行计算。
用于这个实施例的引物、侵入探针和活瓣探针的设计不能检测10甲基化拷贝于105未甲基化拷贝(1:10000;图6)。检测102甲基化拷贝于105未甲基化拷贝(1:1000)和103甲基化拷贝于105未甲基化拷贝(1:100)的反应也被过量的未甲基化基因拷贝所抑制(图6)。
实施例3
在未甲基化的波形纤维蛋白存在下检测甲基化的波形纤维蛋白序列
所述分析是设计用来在未甲基化的波形纤维蛋白(VIM)序列存在下检测和定量甲基化的VIM的CpG序列。为了模拟甲基化和未甲基化的基因组DNA,制备质粒并克隆以匹配重亚硫酸盐反应之后未甲基化的C转变成U的序列,它的行为就好像它是在PCR过程中的T,如图3的波形纤维蛋白序列所示例。甲基化的序列使用具有完整CG基序的质粒而代表未甲基化的质粒用TG基序替换。
在这个实施例中,3个CG被设计在波形纤维蛋白甲基化分析的每个引物上,其中之一在正向引物的3’末端。在该分析中,所述正向引物也是侵入寡核苷酸。在两种意义上,在活瓣探针的切割位点也存在CG基序。所述分析然后用于在4个不同水平检测掺入未甲基化拷贝中的甲基化拷贝,如实施例1和2的,包括104甲基化拷贝于105未甲基化拷贝(1:10),103甲基化拷贝于105未甲基化拷贝(1:100),102甲基化拷贝于105未甲基化拷贝(1:1000)以及10甲基化拷贝于105未甲基化拷贝(1:10000)。
代表甲基化序列的质粒的靶序列如下,每个C碱基相应于类似基因组DNA的甲基C:
TCGTGTTTTCGTTTTTTTATCGTAGGATGTTCGGCGGTTCGGGTATCGCGAGTCGGTCGAGTTTTAGTCGGAGTTACGTGATTACGTTTATTCGTATTTATAGTTTGGGCGACG(SEQ ID NO:12)
所述分析采用正向引物5’-GGCGGTTCGGGTATCG-3’(SEQID NO:13),反向引物5’-CGTAATCACGTAACTCCGACT-3’(SEQID NO:14),和活瓣探针5’-GACGCGGAGGCGAGTCGGTCG-3’/3C6/(SEQ ID NO:15),其中相应于甲基化碱基的区域以下划线显示,并且为了抑制引物延伸,3’末端用己二醇基团封闭。活瓣探针的首先9个碱基是由活瓣核酸内切酶切割的区域并然后与FRET盒结合。引物和活瓣探针作为非目录产品由Integrated DNA Technologies(IDT,Coralville,Iowa)提供。
引物和侵入探针的结合区域在靶序列中以下划线显示,并且活瓣探针的靶结合区域斜体显示:
TCGTGTTTTCGTTTTTTTATCGTAGGATGTTCGGCGGTTC GGGTATCGCGAGTCGGTCGAGTTTTAGTCGGAGTTACGTGAT TACGTTTATTCGTATTTATAGTTTGGGCGACG(SEQ IDNO:12)。
使用的FRET盒是5’-FAM/TCT/猝灭剂/AGCCGGTTTTCCGGCT GAGACTCCGCGTCCGT-3’/3C6(SEQ ID NO:6),其中FAM是荧光素,猝灭剂是Dark猝灭剂,并且为了抑制引物延伸,3’末端用己二醇基团封闭。FRET盒由Hologic(Madison,Wisconsin)提供。
循环条件是95℃2min;45个循环95℃20sec,53℃1mi;并保持在40℃。荧光信号获取是在循环的53℃的点完成的。PCR反应在
480Multiwell96Plates(Roche,Indianapolis)上、于含7.5mM MgCl
2和250μM dNTPs(Promega,Madison,Wisconsin)的10mM MOPS pH7.5和中完成。Taq聚合酶是iTaq酶(BioRad,Hercules,California),切割酶是Cleavase2.0(Hologic,Madison,Wisconsin)。正向引物浓度是500nM,反向引物浓度是500nM,活瓣探针是500nM,并且FRET盒于终浓度200nM使用。所具有的扩增和检测在LightCycler480光学热循环仪(Roche,Indianapolis,Indiana)上进行。
图7显示扩增样品中不同比例的突变体与野生型的动力学扩增曲线数据和交叉点Cp的数据。在这些分析中,Cp作为荧光上升至最大荧光的18%的点进行计算。
用于这个实施例的引物、侵入探针和活瓣探针的设计可以线性检测低至于105个未甲基化拷贝中的10个甲基化拷贝(1:10000),该设计(图7)明显优于实施例1和2的表现(图5和6)。