发明内容
本发明第一方面提供引物分子和/或探针分子在制备诊断个体甲状腺结节良恶性的检测试剂或诊断试剂盒中的应用,以及装置在制备诊断个体甲状腺结节良恶性的诊断试剂盒中的应用;所述引物分子相同于、互补于或在严谨条件下杂交于目标标志物并包含至少9个连续的核苷酸;所述探针分子与目标标志物的扩增产物在严谨条件下杂交;所述装置用于确定目标标志物中的至少一个CpG二核苷酸的甲基化状态或水平。
本发明第二方面提供区分基因组DNA至少一个靶区域内甲基化和未甲基化CpG二核苷酸的至少一种试剂或成组试剂在制备用于检测和/或分类个体中甲状腺结节良恶性的方法的试剂盒中的用途,其中所述方法包括使从所述个体生物样品中分离的基因组DNA与所述至少一种试剂或成组试剂接触,其中所述靶区域等同于或互补于目标标志物的至少16连续核苷酸的序列,其中所述连续核苷酸包含至少一个CpG二核苷酸序列,由此至少部分地提供对甲状腺结节良恶性的检测和/或分类。
本发明第三方面提供将5位未甲基化的胞嘧啶碱基转化为尿嘧啶或在杂交性能方面可检测地不同于胞嘧啶的其它碱基的一种或多种试剂、扩增酶以及至少一种包含至少9个连续核苷酸的引物在制备用于检测和/或分类个体中甲状腺结节良恶性的方法的试剂盒中的用途,其中所述方法包括:a)从所述个体生物样品分离基因组DNA;b)用所述一种或多种试剂处理a)的所述基因组DNA或其片段;c)使所述经处理的基因组DNA或其经处理的片段与所述扩增酶和所述至少一种引物接触,所述引物相同于、互补于或在严谨条件下杂交于目标标志物,其中所述经处理的基因组DNA或其片段被扩增以产生至少一种扩增产物或不被扩增;以及d)基于所述扩增物是否存在或其性质,确定所述目标标志物的至少一个CpG二核苷酸的甲基化状态或水平,或者反映所述目标标志物的多个CpG二核苷酸平均甲基化状态或水平的均值或值,由此至少部分地检测和/或分类个体中甲状腺结节的良恶性。
本发明第四方面提供一种或多种甲基化敏感限制酶和扩增酶以及至少一种包含至少9个连续核苷酸的引物在制备用于检测和/或分类个体中甲状腺结节良恶性的方法的试剂盒中的用途,其中,所述引物相同于、互补于或在严谨条件下杂交于目标标志物;所述方法包括:a)从所述个体生物样品分离基因组DNA;b)以所述一种或多种甲基化敏感限制酶消化a)所述的基因组DNA或其片段,使所得消化产物与所述扩增酶和所述至少一种引物接触;和c)基于所述扩增物是否存在或其性质,确定所述目标标志物的至少一个CpG二核苷酸的甲基化状态或水平,由此至少部分地检测和/或分类个体中甲状腺结节的良恶性。
本发明第五方面提供衍生自目标标志物的经处理的核酸在制备用于诊断个体甲状腺结节良恶性的试剂盒中的用途,其中所述处理适合于将所述目标标志物的至少一个未甲基化的胞嘧啶碱基转化至尿嘧啶或在杂交上可检测地不同于胞嘧啶的其它碱基。
本发明第六方面提供一种用于检测目标标志物至少一个CpG二核苷酸的的甲基化水平或状态以诊断个体甲状腺结节良恶性的诊断试剂或诊断试剂盒,其包含引物分子和/或探针分子;其中,所述引物分子相同于、互补于或在严谨条件下杂交于目标标志物并包含至少9个连续的核苷酸,所述探针分子与目标标志物的扩增产物在严谨条件下杂交。
本发明第七方面提供一种诊断个体或患者的甲状腺结节良恶性的方法,所述方法包括检测该个体或患者的生物样品中目标标志物的至少一个CpG二核苷酸的甲基化状态或水平,并基于所述甲基化状态或水平来诊断其甲状腺结节良恶性。
本发明第八方面提供一种用于检测并诊断个体甲状腺结节良恶性的装置,所述装置包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:(1)获取样品中目标标志物的至少一个CpG二核苷酸的甲基化状态或水平,和(2)根据(1)的甲基化状态或水平判读甲状腺结节良恶性。
本发明上述各方面所述的方案中,所述目标标志物为下述(1)-(4)项所述的基因或序列:(1)TTC34基因或基因组的TTC34序列,(2)SLC16A3基因或基因组的SLC16A3序列,(3)RARG基因或基因组的RARG序列,以及(4)选自RCOR2基因或基因组的RCOR2序列和ITPKA基因或基因组的ITPKA序列中的任意一种或全部两种。
优选地,所述目标标志物的Hg19坐标如下:TTC34基因,chr1:2572708-2717433;RCOR2基因,chr11:63678702-63684636;ITPKA基因,chr15:41786456-41795364;SLC16A3基因,chr17:80193650-80197375;RARG基因,chr12:53604350-53626040。
优选地,所述目标标志物为所述各基因采用以下引物扩增得到的一个或多个目标区域:
TTC34基因的目标区域:SEQ ID NO:1和2所示的序列或与SEQ ID NO:1和2具有至少90%相同性的序列作为引物扩增得到的TTC34基因的片段;
RCOR2基因的目标区域:SEQ ID NO:3和4所示的序列或与SEQ ID NO:3和4具有至少90%相同性的序列作为引物扩增得到的RCOR2基因的片段;
ITPKA基因的目标区域:SEQ ID NO:5和6所示的序列或与SEQ ID NO:5和6具有至少90%相同性的序列作为引物扩增得到的ITPKA基因的片段;
SLC16A3基因的目标区域:SEQ ID NO:7和8所示的序列或与SEQ ID NO:7和8具有至少90%相同性的序列作为引物扩增得到的SLC16A3基因的片段;
RARG基因的目标区域:SEQ ID NO:9和10所示的序列或与SEQ ID NO:9和10具有至少90%相同性的序列作为引物扩增得到的RARG基因的片段。
优选地,所述目标区域的Hg19坐标如下:
TTC34基因的目标区域,chr1: 2706494-2706702;
RCOR2基因的目标区域,chr11: 63687060-63687339;
ITPKA基因的目标区域,chr15: 41793298-41793573;
SLC16A3基因的目标区域,chr17: 80189548-80189879;
RARG基因的目标区域,chr12: 53613026-53613303。
优选地,所述目标标志物的引物分子分别为:
TTC34:SEQ ID NO:1和2,或与其扩增得到的片段在严谨条件下杂交的引物分子;
RCOR2:SEQ ID NO:3和4,或与其扩增得到的片段在严谨条件下杂交的引物分子;
ITPKA:SEQ ID NO:5和6,或与其扩增得到的片段在严谨条件下杂交的引物分子;
SLC16A3:SEQ ID NO:7和8,或与其扩增得到的片段在严谨条件下杂交的引物分子;
RARG:SEQ ID NO:9和10,或与其扩增得到的片段在严谨条件下杂交的引物分子。
优选地,所述与目标标志物的扩增产物在严谨条件下杂交的探针分子分别为:
TTC34:SEQ ID NO:11或与其具有至少90%相同性的序列;
RCOR2:SEQ ID NO:12或与其具有至少90%相同性的序列;
ITPKA:SEQ ID NO:13或与其具有至少90%相同性的序列;
SLC16A3:SEQ ID NO:14或与其具有至少90%相同性的序列;
RARG:SEQ ID NO:15或与其具有至少90%相同性的序列。
优选地,所述检测试剂或诊断试剂盒还包括检测内参基因ACTB的引物分子和/或探针分子。
优选地,所述内参基因ACTB的引物分子为SEQ ID NO:16和17所示的序列与由SEQID NO:16和17作为引物扩增得到的ACTB基因的片段在严谨条件下杂交的序列,所述内参基因ACTB的探针包含SEQ ID NO:18所示序列或与其有至少90%相同性的序列。
优选地,所述各方面的各实施方案中,所用的探针还含有可检测物。在一个或多个实施方案中,所述可检测物是本领域常规使用的5’端荧光报告基团和3’端标记淬灭基团。在一个或多个实施方案中,所述荧光报告基因选自Cy5、Texas Red、FAM和VIC。
优选地,所述各方面的各实施方案中,所述检测试剂或诊断试剂盒还包括选自以下一种或多种物质:PCR缓冲液、聚合酶、dNTP、限制性内切酶、酶切缓冲液、荧光染料、荧光淬灭剂、荧光报告剂、外切核酸酶、碱性磷酸酶、内标、对照物、KCl、MgCl2和(NH4)2SO4。
优选地,所述各方面的各实施方案中,所述检测试剂或诊断试剂盒还包括经转化的阳性标准品,其中未甲基化的胞嘧啶转化为不与鸟嘌呤结合的碱基。在一个或多个实施方案中,所述阳性标准品是完全甲基化的。
优选地,所述各方面的各实施方案中,检测甲基化的试剂是选自以下方法的一个或多个中所用的试剂:基于重亚硫酸盐转化的PCR(例如甲基化特异性PCR)、DNA测序(如亚硫酸氢盐测序、全基因组甲基化测序、简化甲基化测序)、甲基化敏感的限制性内切酶分析法、荧光定量法、甲基化敏感性高分辨率熔解曲线法、基于芯片的甲基化图谱分析、质谱(例如飞行质谱)。优选地,所述试剂选自以下一种或多种:重亚硫酸盐及其衍生物、荧光染料、荧光淬灭剂、荧光报告剂、内标、对照物。
优选地,所述各方面的各实施方案中,所述个体或患者为哺乳动物,尤其是人。
优选地,所述各方面的各实施方案中,所述样品来自哺乳动物的组织、细胞或者体液,例如甲状腺组织或血液。在一个或多个实施方案中,所述样品是甲状腺结节活检物,优选是细针穿刺活检物。在一个或多个实施方案中,所述样品是血浆。
在一个或多个实施方案中,所述样品来自具有甲状腺良性或恶性结节的对象。在一个或多个实施方案中,所述样品来自甲状腺肿大的患者。
在一个或多个实施方案中,所述DNA是全基因组DNA和/或cfDNA。
在一个或多个实施方案中,所述DNA经转化,其中未甲基化的胞嘧啶转化为不与鸟嘌呤结合的碱基。所述转化使用酶促方法进行,优选脱氨酶处理,或所述转化使用非酶促方法进行,优选用亚硫酸氢盐或重硫酸盐处理。
在一个或多个实施方案中,所述检测包括但不限于:基于重亚硫酸盐转化的PCR(例如甲基化特异性PCR)、荧光定量法。
在一个或多个实施方案中,所述检测是荧光定量PCR检测,还包括使用本文所述探针。
在一个或多个实施方案中,PCR的反应液包含Taq DNA聚合酶、PCR缓冲液(buffer)、dNTPs、KCl、MgCl2和(NH4)2SO4。优选地,Taq DNA聚合酶为热启动Taq DNA聚合酶。优选地,Mg2+终浓度为1.0-20.0 mM。
在一个或多个实施方案中,PCR中各引物浓度为100-500 nM。
在一个或多个实施方案中,PCR中各探针浓度为100-500 nM。
在一个或多个实施方案中,PCR反应条件为,95 ℃预变性5 min;95 ℃变性15 s,60 ℃退火延伸60 s,50个循环。
在一个或多个实施方案中,判读方法为:根据各基因的甲基化水平计算得分,得分大于0则结果为阳性,即甲状腺结节为恶性结节。在一个或多个实施方案中,得分小于0则结果为阴性,即甲状腺结节为良性结节。
在PCR实施方案中,优选地,甲基化水平= 2–∆Ct待检样品/2–∆Ct阳性标准品 × 100%,其中,∆Ct = Ct目的基因 – Ct内参基因。
在测序实施方案中,甲基化水平 = 甲基化碱基数/总碱基数。
本发明的主要优点在于:通过同时进行多个靶序列的检测,提高了甲状腺结节良恶性鉴别的灵敏度和特异性。采用PCR法,操作简单,结果易于判读,对仪器要求不高,以试剂盒的形式更方便临床上的推广应用。
具体实施方式
虽然本申请公开了本申请的各个方面和各种实施方式,但是本领域技术人员可以在不脱离本申请的精神和范围的前提下做出各种等同改变或修改。本申请公开的各个方面和各种实施方式均是示例性的,并不旨在限制本申请的范围,本申请的实际保护范围以权利要求书为准。除非另有说明,否则本申请中使用的所有技术和科学术语均是本领域技术人员通常理解的含义。本申请引用的所有参考文献、专利和专利申请均通过引用并入本申请。
需注意的是,在本申请的说明书和权利要求书中,单数形式的“一个”、“一种”和“所述”均包括其复数形式,除非上下文另有说明。因此,例如,“一种试剂”包括多种试剂。
在本申请的说明书和权利要求书,除非另有说明,否则术语“包含”、“包括”或“含有”是指含有所列出的数值、步骤或成分,但也不排除还含有其他数值、步骤或成分。
经过深入的研究,本发明人发现了一些与恶性甲状腺结节相关的目标标志物,这些目标标志物包括:TTC34基因或基因组的TTC34序列、RCOR2基因或基因组的RCOR2序列、ITPKA基因或基因组的ITPKA序列、SLC16A3基因或基因组的SLC16A3序列以及RARG基因或基因组的RARG序列。通过对来自个体的包含DNA的生物样品中的目标标志物中的一个或多个的甲基化水平进行检测可鉴别甲状腺结节良恶性。
I.目标标志物及其目标区域
如本文所用,术语“目标标志物”是指这样的目的核酸或基因区域:其甲基化水平指示着结甲状腺结节良恶性。术语“目标标志物”应被认为包括其所有转录变体及其所有启动子和调控元件。如本领域技术人员所理解的,已知某些基因在个体之间表现出等位基因变异或单核苷酸多态性(“SNP”)。SNP包括不同长度的简单的重复序列(例如二核苷酸和三核苷酸重复)的插入和缺失。因此,本申请应被理解为扩展到由任何其他突变、多态性或等位基因变异产生的标志物/基因的所有形式。另外,应当理解,术语“目标标志物”应既包括标志物或基因的正义链序列,也包括标志物或基因的反义链序列。
本文所用的术语“目标标志物”被宽泛地解释为既包括 1)在生物样品或基因组DNA中发现的原始标志物(处于特定的甲基化状态),也包括 2)其经过处理的序列(例如亚硫酸氢盐转化后的对应区域或 MSRE 处理后的对应区域)。亚硫酸氢盐转化后的对应区域与基因组序列中的目标标志物不同之处在于,一个或多个未甲基化的胞嘧啶残基被转化为尿嘧啶碱基、胸腺嘧啶碱基或在杂交行为上与胞嘧啶不同的其他碱基。经 MSRE 处理的对应区域与基因组序列中的目标标志物不同之处在于,该序列在一个或多个 MSRE 切割位点处被切割。
在本文中,应该理解的是,本文所述各产品、用途和方法中所涉及的目标标志物TTC34、RCOR2、ITPKA、SLC16A3和RARG基因既可通过引用其名称又可通过其染色体坐标来进行描述。所述染色体坐标与 2009 年 2 月发布的人类基因组数据库 Hg19 版本一致(在本文中称为“Hg19 坐标”)。应理解的是,本所述的某个基因及其基因组的序列也包括各基因的含有至少一个CpG二核苷酸序列的片段。在一些实施方案中,该片段为本文所述的各基因的目标区域。
在一些实施方案中,所述各基因的目标区域分别为:
(1)由SEQ ID NO:1和2或与其有至少90%相同性的序列作为引物扩增得到的TTC34基因的片段;
(2)由SEQ ID NO:3和4或与其有至少90%相同性的序列作为引物扩增得到的RCOR2基因的片段;
(3)由SEQ ID NO:5和6或与其有至少90%相同性的序列作为引物扩增得到的ITPKA基因的片段;
(4)由SEQ ID NO:7和8或与其有至少90%相同性的序列作为引物扩增得到的SLC16A3基因的片段;和
(5)由SEQ ID NO:9和10或与其有至少90%相同性的序列作为引物扩增得到的RARG基因的片段。
在优选的实施方案中,所述基因及其目标区域的Hg19坐标定义如下:
本发明的目标标志物也包括上述每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb。可在公共数据库(例如 UCSC Genome Browser、Ensemble 和NCBI 网站)中获得上述Hg19坐标的特定核苷酸序列,以及每个区域的各个起始位点的上游5kb和各个末端位点的下游5kb。
本发明的目标标志物还包括非酶促法转化((如亚硫酸氢盐转化)后上述目标区域后获得的对应区域,以及酶促法转化(如MSRE转化)上述目标区域后获得的对应区域。
在一些实施方式中,本发明的目标标志物也包括上述各基因或各目标区域的各类变体。变体包括来自相同区域的、与本文所述的基因或区域具有至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性(即,具有一个或多个缺失、插入、取代、反向序列等)的核酸序列。因此,本申请内容应理解为延伸至实现相同结果的此类变体,尽管事实上个体间的实际核酸序列具有微小的遗传变异。
如本文所用,术语“序列同一性的百分比(%)”是指候选序列的氨基酸(或核酸)残基和参考序列的氨基酸(或核酸)残基进行序列比对后的相同百分比,比对时可以引入间隔(如有必要)以使得相同的氨基酸(或核酸)数目达到最多。换言之,氨基酸序列(或核酸序列)的序列同一性百分比(%)可以通过用与参考序列相同的氨基酸残基(或碱基)的数目除以候选序列或参考序列中氨基酸残基(或碱基)的总数(以较短者为准)来计算。氨基酸残基的保守取代可以被认为或可以不被认为是相同的残基。可以通过以下方式来确定氨基酸(或核酸) 序列同一性的百分比,例如,可以使用公开的工具如 BLASTN、BLASTp(可在美国国家生物技术信息中心(NCBI)的网站上获得,也可参见 Altschul S.F. et al., J. Mol.Biol., 215:403–410 (1990); Stephen F. et al., Nucleic Acids Res., 25:3389–3402 (1997))、ClustalW2(可在欧洲生物信息研究所的网站上找到),也可参见 HigginsD.G. et al., Methods in Enzymology, 266:383-402 (1996); Larkin M.A. et al.,Bioinformatics (Oxford, England), 23(21): 2947-8 (2007))和 ALIGN 或 Megalign(DNASTAR)软件。本领域技术人员可以使用所述工具提供的默认参数,或者可以(例如,通过选择合适的算法)定制适合比对的参数。
本发明的目标标志物也包括上述基因或目标区域、或上述目标区域的起始位点上游5kb和末端位点下游 5kb经非酶促法转化(如亚硫酸氢盐转化)后的对应区域或经酶促方法处理(如甲基化敏感限制酶处理)后的对应区域。
II.目标标志物的来源及制备
本文中,所述目标标志物可以来自任何感兴趣的个体的生物样品。本文所用的术语“个体”包括人类和非人类的动物。非人类动物包括所有脊椎动物,例如哺乳动物和非哺乳动物。“个体”也可以是家畜,例如牛、猪、绵羊、家禽和马;或啮齿动物,例如大鼠、小鼠;或非人类灵长类动物,例如猿、猴、恒河猴;或家养的动物,例如狗或猫。在一些实施方式中,个体是人类或非人类灵长类动物。在一些实施方式中,个体是人类。在本申请中,“个体”、“对象”和“受试者”可互换使用。
应理解,上述第I部分给出的序列为人的序列。当涉及非人动物的序列时,可采用现有技术容易地确定上述基因在非人动物基因组中的对应位置和对应序列。
本文所用的术语“生物样品”是指获自或衍生自个体的生物组合物,其包含基于物理、生化、化学和/或生理特征待表征或待识别的细胞和/或其他分子实体(例如DNA)。生物样品包括但不限于通过本领域技术人员已知的任何方法获得的个体的细胞、组织、器官和/或生物体液。在一些实施方式中,所述生物样品选自下组:组织学切片、组织活检、石蜡包埋的组织、体液、手术切除样本、分离的血细胞、分离自血液的细胞,及其任意组合。在一些实施方式中,所述体液选自下组:全血、血清、血浆,及其任意组合。选择最适合的样品将取决于情境的性质。在一些实施方式中,所述生物样品为个体的全血。在一些实施方式中,所述生物样品为个体的血浆。本领域技术人员知道从全血制备血浆的各种方法。例如,在一些实施方式中,血浆通过将来自个体的全血离心一次、两次、三次、四次、五次或更多次来获得。在一些实施方式中,所述生物样品是甲状腺结节活检物,优选是细针穿刺活检物。
待检测的DNA可分离自所述生物样品。可以通过使用本领域已知的各种方法从生物样品中分离和纯化出待检测的DNA。可使用市售试剂盒来进行分离和纯化。例如,通过以下方式从细胞和组织中分离DNA:在高度变性和还原条件下裂解原材料、部分使用蛋白质降解酶、纯化通过苯酚/氯仿提取工艺获得的核酸组分,并通过渗析或乙醇沉淀从水相中回收核酸(参见例如 Sambrook, J., Fritsch, E. F. in T. Maniatis, C S H, MolecularCloning, 1989)。又例如,现在有许多试剂体系特别适用于从琼脂糖凝胶中纯化DNA片段、从细菌裂解物中分离质粒DNA,以及从血液、组织或细胞培养物中分离较长链的核酸(基因组DNA、总细胞 RNA)。许多这些可商购的纯化体系中是基于相当众所周知的原理,即,在不同离液盐的溶液的存在下将核酸与矿物载体相结合。在这些体系中,细磨的玻璃粉、硅藻土或硅胶的悬浮液被用作载体材料。在例如 US7888006B2和EP1626085A1中描述了从生物样品中分离和纯化DNA的一些其他方法。在方法之间进行选择将受到几个因素的影响,包括时间、费用和所需的DNA数量。
在一些实施方式中,生物样品中包含的DNA包括基因组DNA。本文所用的术语“基因组DNA”是指包含细胞或生物体的完整基因组及其片段或部分的DNA。基因组DNA是来源于个体的大段DNA(例如长于大约 10、20、30、40、50、60、70、80、90、100、200 或 300kb),并且可以具有天然修饰,例如DNA甲基化。
在一些实施方式中,生物样品中包含的DNA包括细胞DNA。本文所用的术语“细胞DNA”是指存在于细胞内的DNA,或从体内细胞中获取DNA并在体外分离、或以其他方式在体外操作,只要该DNA未从体内细胞中移除。
在一些实施方式中,生物样品中包含的DNA包括细胞外游离DNA。本文所用的术语“细胞外游离DNA”是指在体内的细胞外存在的DNA片段。该术语也可以被用于指代获取自体内的细胞外来源并在体外分离、或操作的DNA片段。细胞外游离DNA中的DNA片段通常具有约100 到 200bp 的长度,推测与被包裹于核小体的DNA片段的长度有关。细胞外游离DNA(cfDNA)包括例如细胞外游离胎儿DNA和循环肿瘤DNA。细胞外游离胎儿DNA在孕妇的体内(例如血液)中循环,代表胎儿基因组,而循环肿瘤DNA在癌症患者的体内(例如血液)中循环。在一些实施方式中,细胞外游离DNA可基本上不含个体的细胞DNA。例如,所述细胞外游离DNA可包含小于约1,000ng/mL、小于约100ng/mL、小于约10ng/mL、小于约1ng/mL的细胞DNA。
可以通过使用本领域已知的常规技术来制备细胞外游离DNA。例如,可以通过以约200-20,000g、约 200-10,000g、约 200-5,000g、约 300-4000g等的速度离心血液样品约3-30分钟、约 3-15分钟、约 3-10分钟、约 3-5分钟来获得血液样品的细胞外游离DNA。例如,在一些实施方式中,可以通过将个体的血浆或血清离心一、二、三、四、五次或更多次来获得血液样本的细胞外游离DNA。在一些实施方式中,为了从包含可溶性DNA的无细胞组分中分离细胞及其片段,可以通过微滤来获得所述生物样品。通常来说,微滤可以通过使用过滤器来进行,例如,0.1微米~0.45微米的膜过滤器,诸如 0.22微米的膜过滤器。
在一些实施方式中,使用商购的DNA提取产品从全血、血清或血浆中提取细胞外游离DNA用于分析。这种提取方法据称对循环DNA的回收率高(>50%),某些产品(例如Qiagen生产的 QIAamp Circulating Nucleic Acid Kit)据称可提取小尺寸的DNA片段。所使用的典型样品量为 1-5mL血清或血浆。
在一些实施方式中,细胞外游离DNA包括循环肿瘤DNA。循环肿瘤DNA(“ctDNA”)是与细胞无关的体液(例如血液、尿液、唾液、痰、粪便、胸膜液、脑脊液等)中肿瘤来源的片段化DNA。通常,ctDNA高度片段化,平均长度约为150个碱基对。ctDNA通常包括体液(例如血浆)中细胞外游离DNA的极小部分,例如ctDNA可能构成血浆DNA的不到约10%。通常,该百分比小于约1%,例如小于约0.5%或小于约0.01%。另外,血浆DNA的总量通常非常低,例如约10ng/mL血浆。ctDNA的数量因人而异,并且取决于肿瘤的类型、位置,对于癌性肿瘤,则取决于癌症的阶段。但是,ctDNA通常在体液中非常罕见,只能通过极其敏感和特异性的技术进行检测。检测 ctDNA可能有助于检测和诊断肿瘤、指导肿瘤特异性治疗、监测治疗以及监测癌症的缓解。
III.碱基转化
本文中,DNA 甲基化是(例如,通过DNA甲基转移酶的作用)将甲基添加到DNA分子上(例如,添加至DNA分子的一个或多个胞嘧啶碱基)的生物学过程。在哺乳动物中,DNA甲基化出现于胞嘧啶-磷酸-鸟嘌呤(CpG)二核苷酸(即“CpG 位点”)的 5’位置,当其出现在基因的启动子或第一个外显子中的 5’-CpG-3’二核苷酸中时,会导致基因的表观遗传失活。已充分证明了DNA甲基化在调节基因表达、肿瘤发生、以及其他遗传和表观遗传疾病中起重要作用。
如本文所用,术语“甲基化的胞嘧啶残基”是指胞嘧啶残基的衍生物,其中一个甲基连接至胞嘧啶环的碳原子上(例如 C5)。术语“未甲基化的胞嘧啶残基”是指未衍生化的胞嘧啶残基,其中与“甲基化的胞嘧啶残基”相反,在胞嘧啶环的碳原子(例如 C5)上没有甲基连接。其内的胞嘧啶残基被甲基化的 CpG位点就是甲基化的CpG位点,而其内的胞嘧啶残基未被甲基化的CpG位点是未甲基化的CpG位点。
如本文所述,DNA或RNA的碱基之间可发生转化。本文所述“转化”、“胞嘧啶转化”或“CT转化”是利用非酶促或酶促方法处理DNA,将未修饰的胞嘧啶碱基(cytosine,C)转化为不与鸟嘌呤(G)结合的碱基(例如尿嘧啶碱基(uracil,U))的过程。一些试剂能够区分DNA中的未甲基化和甲基化的CpG位点,从而获得经处理的DNA。该试剂可以选择性地作用于未甲基化的胞嘧啶残基,但不能显著地作用于甲基化的胞嘧啶残基。或者该试剂可以选择性地作用于甲基化的胞嘧啶残基,而不显著地作用于未甲基化的胞嘧啶残基。例如,一些试剂可以选择性地将未甲基化的胞嘧啶残基转化为尿嘧啶、胸腺嘧啶或杂交上与胞嘧啶不同的另一碱基,而甲基化的胞嘧啶残基依然处于未转化状态;又例如,一些试剂可以选择性地切割甲基化的残基,或者选择性地切割未甲基化的残基。由此,原始DNA以取决于是否被甲基化的方式转化为经处理的DNA,从而可以通过其杂交行为将经处理的DNA与原始DNA区分开。
如本文所用,“经处理的DNA”是指已经用能够区分DNA中的未甲基化和甲基化的CpG位点的试剂处理后的DNA,即DNA中的DNA甲基化状态已经改变。
更具体而言,可采用非酶促或酶促方法进行胞嘧啶转化。示例性地,非酶促方法包括亚硫酸氢盐或重硫酸盐处理。在一些实施方式中,非酶促方法所用的试剂包括亚硫酸氢盐试剂。如本文所用,术语“亚硫酸氢盐试剂”是指,例如本申请所公开的可用于区分甲基化和未甲基化的CpG二核苷酸序列的包括亚硫酸氢盐、亚硫酸氢根离子或其任意组合的试剂。在本申请中,用亚硫酸氢盐试剂处理DNA也被描述为“亚硫酸氢盐反应”或“亚硫酸氢盐处理”,指的是转化未甲基化的胞嘧啶残基的反应,特别是在亚硫酸氢根离子存在的情况下,核酸中未甲基化的胞嘧啶残基被转化为尿嘧啶碱基、胸腺嘧啶碱基或在杂交行为上与胞嘧啶不同的其他碱基,而其中甲基化的胞嘧啶残基未被显著地转化。换言之,亚硫酸氢盐处理可用于区分甲基化的 CpG二核苷酸和未甲基化的CpG二核苷酸。Frommer, M., et al., Proc Natl Acad Sci USA 89 (1992) 1827-31 和 Grigg, G., Clark, S., Bioessays 16 (1994) 431-6 中详细描述了用于检测甲基化的胞嘧啶残基的亚硫酸氢盐反应。亚硫酸氢盐反应包括脱氨基步骤和脱磺酸基步骤(参见 Grigg and Clark, 同上)。“甲基化的胞嘧啶残基未被显著地转化”这一陈述,不排除非常小的百分比(例如,小于0.1%、小于0.2%、小于0.3%、小于0.4%、小于0.5%、小于0.6%、小于0.7%、小于0.8%、小于0.9%、小于1%、小于2%、小于3%、小于4%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于11%、小于12%、小于13%、小于14%、小于15%、小于16%、小于17%、小于18%、小于19%、小于20%)的甲基化的胞嘧啶残基被转化为尿嘧啶、胸腺嘧啶或在杂交行为上与胞嘧啶不同的其他碱基,尽管其意在仅仅转化未甲基化的胞嘧啶残基。
在例如参考 Frommer M., et al.(同上)或 Grigg and Clark(同上)的情况下(它们公开了亚硫酸氢盐处理的基本参数),本领域技术人员知道如何进行亚硫酸氢盐处理,特别是脱氨基步骤和脱磺酸基步骤。孵育时间和温度对脱氨基效率的影响、以及影响DNA降解的参数都已公开。
在一些实施方式中,所述亚硫酸氢盐试剂选自下组:亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子,及其任意组合。在一些实施方式中,所述亚硫酸氢盐试剂是亚硫酸氢钠。在一些实施方式中,亚硫酸氢盐试剂是可商购的,例如,MethylCodeTM Bisulfite Conversion Kit、EpiMarkTM BisulfiteConversion Kit、EpiJETTM Bisulfite Conversion Kit、EZDNAMethylation-GoldTM Kit等。在一些实施方式中,根据试剂盒的使用说明书进行亚硫酸氢盐反应。
示例性的酶促方法包括脱氨酶处理,以及使用试剂选择性地切割未甲基化的残基但不切割甲基化的残基,或者选择性地切割甲基化的残基但不切割未甲基化的残基。优选地,所述试剂是甲基化敏感限制酶(MSRE)。
术语“甲基化敏感限制酶”是指根据其识别位点的甲基化状态而选择性地消化核酸的酶。对于当识别位点未被甲基化或半甲基化时才特异剪切的限制酶来说,当识别位点被甲基化时,不会发生剪切,或以显著降低的效率剪切。对于当识别位点被甲基化时才特异剪切的限制酶来说,当识别位点未被甲基化时,不会发生剪切,或以显著降低的效率剪切。在一些实施方式中,甲基化敏感限制酶的识别序列含有CG二核苷酸(例如cgcg或cccggg)。在一些实施方式中,当该CG二核苷酸中的胞嘧啶在C5碳原子处被甲基化时,甲基化敏感限制酶不进行剪切。
示例性的MSRE选自下组:HpaII酶、SalI酶、SalI-HF®酶、ScrFI酶、BbeI酶、NotI酶、SmaI酶、XmaI酶、MboI酶、BstBI酶、ClaI酶、MluI酶、NaeI酶、NarI酶、PvuI酶、SacII酶、HhaI酶及其任意组合。
使用本领域已知的方法,使用能区分目标区域内的甲基化的CpG二核苷酸和未甲基化的CpG二核苷酸的甲基化敏感限制酶或包含甲基化敏感限制酶的一系列限制酶试剂来确定甲基化,例如但不限于,差异性甲基化杂交(“DMH”)。
在一些实施方式中,生物样品中的DNA可以在用甲基化敏感限制酶处理之前被切割。这样的方法是本领域已知的,并且可以既包括物理方式也包括酶促方式。特别优选的是使用一种或多种对甲基化不敏感的并且其识别位点富含AT并且不包含CG二核苷酸的限制酶。使用此类酶使得DNA片段中的CpG位点和CpG富集区域得以保存。在一些实施方式中,此类限制酶选自MseI酶、BfaI酶、Csp6I15酶、Tru1I酶、Tru9I酶、MaeI酶、XspI酶及其任意组合。
经转化的DNA任选经纯化。适用于本文的DNA纯化方法本领域周知。
IV.定量分析
可检测本文所述任意1种、任意2种、任意3种、任意4种和全部5种目标标志物或其目标区域中的至少一个CpG二核苷酸的甲基化状态或甲基化水平,用以鉴别甲状腺结节良恶性。本发明所述的检测试剂和诊断试剂盒可用于所述甲基化状态或甲基化水平的检测。
本文中,所述“良性”和“恶性”表示甲状腺结节的性质。通常,良性表现为结节生长缓慢、质地均匀、活动度好、表面光滑、呈囊性改变、无淋巴结肿大、无钙化等。恶性表现为不可控的恶性细胞生长、扩散和组织浸润。提示甲状腺结节为恶性的超声征象包括:结节的高度大于宽度、缺乏声晕、微小钙化、边界不规则、回声减低、实性结节、结节内部血流丰富等。在一些实施方式中,恶性甲状腺结节包括甲状腺癌。
如本文所用,术语“甲基化状态”指的是DNA区域内的一个特定的核苷酸或多个核苷酸的甲基化的存在、不存在和/或甲基化的数量。特定DNA序列的甲基化状态(例如,本文所述的目标标志物)可以指示序列中每个碱基的甲基化状态,或者可以指示序列中的碱基对的子集的甲基化状态(例如,胞嘧啶残基的甲基化状态或一个或多个特定的限制酶识别序列的甲基化状态),或者可以指示序列中区域甲基化密度的信息,虽然不能提供甲基化发生在序列中何处的精确信息。甲基化状态可以任选地由“甲基化水平”或“甲基化率”来表示或指示。甲基化水平可以通过例如定量分析在用甲基化敏感性限制性酶进行限制性消化后存在的完整DNA的量来确定。在该例中,如果使用定量PCR对DNA中的特定序列进行定量分析,模板DNA的量大约等于模拟处理的对照则表明该序列未高度甲基化,而模板量明显少于模拟处理的样品中的模板量则表明该序列中存在甲基化DNA。因此,如上述例子中的甲基化水平代表着甲基化状态,并且因此可以用作甲基化状态的定量指标。当需要将样品中序列的甲基化状态与阈值水平进行比较时,这尤其有用。
在DNA序列内一个或多个特定的CpG甲基化位点(每个具有两个CpG二核苷酸序列)的甲基化状态包括“未甲基化”、“完全甲基化”和“半甲基化”。术语“半甲基化”是指双链DNA其中仅其一条链被甲基化的甲基化状态。术语“超甲基化”是指,相对于正常对照DNA样品中的相应的CpG二核苷酸处5-甲基胞嘧啶的数量,在检测的DNA样品的DNA序列中一个或多个CpG二核苷酸处5-甲基胞嘧啶的数量增加所对应的平均甲基化状态。一个残基的甲基化状态可以是定性读数或定量读数,例如通过甲基化水平来表示的。在本申请中,术语“甲基化状态”、“甲基化水平”和“甲基化率”可以互换使用。根据本申请,可以同时确定一个以上的不同甲基化水平。
DNA序列(例如目标标志物)内的一个或多个CpG二核苷酸序列的甲基化水平/状态可以通过本领域中已知的各种分析方法来确定,优选为定量分析方法。示例性的分析方法包括:聚合酶链式反应,包括实时聚合酶链式反应,数字聚合酶链式反应,和基于重亚硫酸盐转化的PCR(例如甲基化特异性PCR(Methylation-specific PCR,MSP));核酸测序;全基因组甲基化测序;简化甲基化测序;基于质量的分离(例如电泳法、质谱法);靶标捕获(例如杂交、微阵列);甲基化敏感的限制性内切酶分析法;甲基化敏感性高分辨率熔解曲线法;基于芯片的甲基化图谱分析;质谱;和荧光定量法。本文中,检测包括检测基因或位点处的任一条链。
在一些实施方式中,通过实时PCR进行定量分析。实时PCR的非限制性实例包括Cottrell et al.,Nucl. Acids Res. 32: e10,2003描述的HeavyMethylTM PCR;Eads et al.,Cancer Res. 59:2302-2306,1999描述的MethyLight™ PCR;Rand et al.,Nucl. Acids Res. 33:e 127,2005描述的Headloop PCR。
如本文所用,术语“HeavyMethylTM PCR”是指本领域公认的一种实时PCR技术,其中一个或多个不可延伸性核酸(例如,寡核苷酸)封闭物以甲基化特异性方式与亚硫酸氢盐处理的核酸结合(即,封闭物在中等至高等严谨条件下与未突变的DNA特异性结合)。使用一种或多种引物进行扩增反应,所述引物可以任选地是甲基化特异性的,但旁侧分布一个或多个封闭物。在未甲基化的核酸(即突变的DNA)存在的情况下,封闭物结合并且无PCR产物产生。使用基本上像例如 Holland et al., Proc. Natl. Acad. Sci. USA, 88:7276-7280,1991所述的TaqManTM分析方法,样品中核酸的甲基化水平得以确定。
如本文所用,术语“MethyLight™ PCR”是指基于本领域公认的一种基于荧光的实时PCR技术,其中采用了称为TaqManTM探针的双标记荧光寡核苷酸探针,并且被设计为可同位于正向和反向扩增引物之间的富含CpG的序列杂交。所述的 TaqMan™探针包含一个荧光“报告因子部分”和“淬灭剂部分”共价结合到与 TaqMan™寡核苷酸的核苷酸相连的接头部分(例如,亚磷酰胺)。在PCR扩增过程中,与富含CpG的序列杂交的TaqMan™探针被Taq聚合酶的5’核酸酶活性切割,从而在PCR反应过程中产生以实时方式检测的信号。在该方法中,可以将分子信标用作可检测的探针,并且该系统不依赖于所使用的DNA聚合酶的5’-3’核酸外切酶活性(参见 Mhlanga and Malmberg,Methods 25:463-471,2001)。
如本文所用,术语“Headloop PCR”是指本领域公认的一种实时PCR,其选择性地扩增目标核酸,但是通过将3’茎环延伸形成不能进一步提供扩增模板的发卡结构来抑制非扩增目标变体的扩增。
在一些实施方式中,所述实时PCR是多重实时 PCR。如本文所用,术语“多重”可指,通过使用一个以上的标志物,每个标志物具有至少一个不同的检测特征,例如荧光特征(例如,激发波长、发射波长、发射强度、FWHM(半峰高处的全宽度)或荧光寿命)或独特的核酸或蛋白序列特征,可以同时对多个标志物(例如多个核酸序列)的存在和/或量进行测定的分析或其他分析方法。
在一些实施方式中,通过核酸测序进行定量分析。核酸测序的示例性方法是本领域已知的,参见,例如 Frommer et al., Proc. Natl. Acad. Sci. USA 89:1827-1831,1992; Clark et al., Nucl. Acids Res. 22:2990-2997, 1994。例如,通过将未使用亚硫酸氢盐处理的样品获得的序列或目标区域的已知核苷酸序列与使用亚硫酸氢盐处理的样品获得的序列进行比较,有助于鉴定DNA序列中甲基化胞嘧啶。与未处理的样品相比,在亚硫酸氢盐处理的样品中的任意胞嘧啶位点检测到的胸腺嘧啶残基都可以认为是由亚硫酸氢盐处理而引起的突变,即该位点存在甲基化的胞嘧啶。
用于测序DNA的方法是本领域已知的,包括例如双脱氧链终止法或Maxam-Gilbert法(参见 Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd Ed., CSHP,New York 1989))、焦磷酸测序(参见 Uhlmann et al., Electrophoresis, 23: 4072-4079, 2002)、固相焦磷酸测序(参见 Landegren et al., Genome Res., 8(8):769-776,1998)、固相微测序(参见例如,Southern et al., Genomics, 13:1008-1017, 1992)、采用FRET 的微测序(参见例如,Chen and Kwok, Nucleic Acids Res. 25:347- 353, 1997)、连接法测序或超深度测序(参见 Marguiles et al., Nature 437 (7057):376-80(2005))。
在一些实施方式中,通过基于质量的分离(例如电泳、质谱法)进行定量分析。例如,甲基化胞嘧啶残基的存在可以通过联合亚硫酸氢盐限制分析法(COBRA)进行检测,基本如 Xiong and Laird, Nucl. Acids Res., 25:2532-2534, 2001 所述。这种方法利用了在使用可以选择性地突变未甲基化的胞嘧啶残基的化合物(例如,亚硫酸氢盐)处理之后,在甲基化和未甲基化的核酸之间的限制酶识别位点的差异。例如,限制性核酸内切酶Taq1切割序列TCGA,在对未甲基化核酸进行亚硫酸氢盐处理后该序列将是TTGA,因此将不被切割。然后使用本领域已知的检测手段例如电泳和/或质谱法,检测消化的和/或未消化的核酸。又例如,在用选择性突变未甲基化胞嘧啶残基的化合物处理后,基于核苷酸序列和/或二级结构的差异,使用不同的技术来检测扩增产物中核酸差异,例如甲基化特异性单链构象分析(MS-SSCA)(Bianco et al., Hum. Mutat., 14:289-293, 1999)、甲基化特异性变性梯度凝胶电泳(MS-DGGE)(Abrams and Stanton, Methods Enzymol., 212:71-74,1992)和甲基化特异性变性高效液相色谱(MS- DHPLC)(Deng et al., Chin. J. Cancer Res., 12:171-191, 2000)。
在一些实施方式中,通过靶标捕获(例如杂交、微阵列)进行定量分析。通过杂交的合适的检测方法是本领域已知的,例如 Southern、斑点印迹、狭缝印迹或其他核酸杂交方式(Kawai et al., Mol. Cell. Biol. 14:7421 -7427, 1994; Gonzalgo et al.,Cancer Res. 57:594-599, 1997)。在一些实施方式中,用于杂交分析的探针被可检测地标记。在一些实施方式中,用于杂交分析的基于核酸的探针是未标记的。这种未标记的探针可以固定在固体载体如微阵列上,并且可以与被可检测地标记的目标核酸分子杂交。微阵列的一个实例是甲基化特异性微阵列,其可用于区分具有转化的胞嘧啶残基的序列和具有未转化的胞嘧啶残基的序列(参见 Adorjan et al., Nucl. Acids Res., 30: e21, 2002)。基于杂交的分析还可被用于用甲基化敏感的限制酶处理后的核酸。又例如,可通过寡核苷酸探针确定DNA序列内CpG二核苷酸序列的甲基化状态,所述寡核苷酸探针与PCR扩增引物同时与亚硫酸氢盐处理的DNA杂交(其中所述引物可以是甲基化特异性引物或标准引物)。
在一些实施方式中,定量分析在检测试剂的存在下进行。如本文所用,术语“检测试剂”是在定量分析步骤中用于检测核酸的存在、不存在或量的试剂。本领域已知的各种检测试剂在本申请中都可使用。在一些实施方式中,检测试剂选自下组:荧光探针、嵌入染料、生色团标记的探针、放射性同位素标记的探针和生物素标记的探针。
优选地,本文中,示例性探针序列如下:
TTC34基因探针:CGAACCGCAACAAACGCTCG(SEQ ID NO:11);
RCOR2基因探针:CCGACTCGCGCCAAACTCGA(SEQ ID NO:12);
ITPKA基因探针:ACGCTAAAATCACCTTCACTACGCC(SEQ ID NO:13);
SLC16A3基因探针:ATGTAAGCGGATATAGAGCGGTAGGGTA(SEQ ID NO:14);
RARG基因探针:CGCAACCACGCAAAAACACACGC(SEQ ID NO:15)。
在一些实施方式中,对照标志物为ACTB,其示例性的探针的核苷酸序列如SEQ IDNO:18所示:ACCACCACCCAACACACAATAACAAACACA。
荧光探针的5’端通常标记有荧光染料(例如 FAM、HEX/VIC、TAMRA、Texas Red 或Cy5),3’端标记有猝灭剂(例如 BHQ1、BHQ2、BHQ3、DABCYL或 TAMRA)。
标记可以通过直接或间接方法来完成。直接标记涉及将标记直接(共价或非共价)偶联至试剂上。间接标记涉及第二试剂与第一试剂的结合(共价或非共价)。第二试剂应与第一试剂特异性结合。所述第二试剂可以与合适的标记偶联和/或第二试剂是可与第二试剂结合的第三试剂的目标(受体)。使用二级、三级甚至更高阶的试剂通常会增加信号强度。合适的二级和高级试剂可以包括抗体、二级抗体和众所周知的链霉亲和素-生物素系统(Vector Laboratories,Inc.)。试剂或底物也可以被本领域中已知的一个或多个标签“标记”。
示例性的经标记的探针如下:
TTC34基因探针:Cy5-CGAACCGCAACAAACGCTCG-BHQ1;
RCOR2基因探针:Texas Red-CCGACTCGCGCCAAACTCGA-BHQ2;
ITPKA基因探针:Cy5-ACGCTAAAATCACCTTCACTACGCC-BHQ1;
SLC16A3基因探针:Texas Red-ATGTAAGCGGATATAGAGCGGTAGGGTA- BHQ2;
RARG基因探针:FAM-CGCAACCACGCAAAAACACACGC-BHQ1;
ACTB基因探针:VIC-ACCACCACCCAACACACAATAACAAACACA-BHQ1。
在一些实施方式中,定量分析包含使用定量引物对和DNA聚合酶对经处理的DNA进行扩增。如本文所用,术语“定量引物对”是指在定量分析步骤中使用的一个或多个引物对。优选地,所述定量引物对能够与所述经处理的DNA的至少 9 个连续核苷酸在严谨条件下、中等严谨条件下或高度严谨条件下杂交。
在一些实施方式中,所述定量分析包括基于经处理的DNA中一个或多个CpG二核苷酸、TpG二核苷酸或CpA二核苷酸的存在或水平,确定一个或多个目标标志物的甲基化水平。在一些实施方式中,所述定量分析包括基于经处理的DNA中一个或多个CpG二核苷酸的存在或水平来确定胞嘧啶残基的甲基化水平。在一些实施方式中,所述定量分析包括基于所述经处理的DNA中一个或多个TpG二核苷酸的存在或水平来确定胞嘧啶残基的甲基化水平。在一些实施方式中,所述定量分析包括基于所述经处理的DNA中CpA二核苷酸的存在来确定胞嘧啶残基的甲基化水平。
在一些实施方式中,定量分析步骤是通过将经处理的DNA产物分为多个组分来进行的。在一些实施方式中,对多个组分进行多个不同的定量分析测试,其中在多个组分之一中定量分析所述经处理的DNA产物(如果存在于所述组分中的话)的不同组合。在一些实施方式中,定量分析每个组分中的对照标志物。
在一些实施方式中,基于预扩增的DNA通过使用MSP(参见 Herman,同上)分别定量分析每个目标标志物的甲基化水平。例如,通过使用在中等和/或高度严谨条件下与未转化序列特异性杂交的一种或多种引物,仅当模板在CpG位点包含甲基化胞嘧啶时才产生扩增产物。
在一些实施方式中,所述定量引物对被设计为扩增所述经处理的DNA产物中的至少一部分,即定量分析被设计为巢式PCR。巢式PCR是PCR的一种改进,旨在提高灵敏度和特异性。巢式PCR涉及使用两个引物组和两个连续的PCR反应。进行第一轮扩增以产生第一扩增子,并使用一个引物对进行第二轮扩增,其中一个或两个引物与由初始引物对界定的区域内的位点退火,即第二个引物对被认为是“嵌套”在第一对引物中。以这种方式,不包含正确内部序列的来自第一次PCR反应的背景扩增产物在第二次PCR 反应中不再被进一步扩增。
通常,PCR的反应液包含Taq DNA聚合酶、PCR缓冲液、引物、探针、dNTPs、Mg2+。优选地,Taq DNA聚合酶为热启动Taq DNA聚合酶。示例性地,Mg2+终浓度为1.0-20.0 mM;各引物浓度为100-500 nM;各探针浓度为100-500 nM。示例性的PCR反应条件为,95℃预变性5min;95℃变性15 s,60℃退火延伸60 s,50个循环。
在一些实施方案中,本发明的方法包括预扩增步骤。对目标标志物进行预扩增的目的之一是增加经处理的DNA中的目标标志物的数量。如本文所用,术语“扩增”大体上指任何能够导致分子或一组相关分子的拷贝数增加的过程。当“扩增”被用于多核苷酸分子时,是指通常从少量多核苷酸开始产生多拷贝的多核苷酸分子或多核苷酸分子的一部分的多份拷贝,其中被扩增的物质(扩增子,PCR 扩增子)通常是可被检测到的。多核苷酸的扩增涵盖多个化学和酶促过程。扩增的形式包括通过聚合酶链式反应(逆转录 PCR、PCR)、链置换扩增(SDA)反应、转录介导扩增(TMA)反应、基于核酸序列的扩增(NASBA)反应或连接酶链反应(LCR),从一个或几个拷贝的模板 RNA或DNA分子生成多个DNA拷贝。
可用预扩增引物预扩增经处理的DNA中的所述目标标志物。如本文所用,术语“引物”是指这样的单链寡核苷酸,其能够在合适的条件(例如缓冲液和温度)下,在四种不同的三磷酸核苷和用于聚合的试剂(例如DNA聚合酶)的存在下,作为模板指导的DNA合成的起始点。在任何给定的情况下,引物的长度取决于例如引物的预期用途,并且通常在15至30个核苷酸的范围内。短的引物分子通常需要较低的温度才能与模板形成足够稳定的杂交复合物。引物不必反映模板的确切序列,但必须足够互补以能与该模板杂交。引物位点是模板上与引物杂交的区域。引物对是一组引物,其包括与待扩增的序列的5’末端杂交的5’正向引物和与待扩增的序列的3’末端的互补链杂交的3’反向引物。本领域技术人员可以基于本领域的公知常识根据待扩增的标志物设计引物(参见,例如PCR Primer: A LaboratoryManual, Cold Spring Harbor Laboratories, NY, 1995)。此外,一些用于设计在各种各样分析中使用的最佳探针和/或引物的软件包是公开的,例如可从美国马萨诸塞州剑桥市的基因组研究中心(the Center for Genome Research, Cambridge, Mass., USA)获得的Primer 3。显然,在设计探针或引物时其潜在用途也应考虑在内。例如,设计用于本发明目的的引物可以包括至少一个CpG 位点,或者从该引物获得的扩增产物可以包括至少一个CpG位点。用于设计检测DNA甲基化状态的引物的工具也是本领域已知的,例如 MethPrimer(Li LC and Dahiya R. MethPrimer: designing primers for methylation PCRs.Bioinformatics. 2002 Nov;18(11):1427-31)。在本申请中,通过将预扩增引物作为引物池,经处理的DNA中的任何目标标志物(目标标志物的每至少一部分或目标标志物的一个亚区域)均可以被预扩增。
如本文所用,术语“互补”是指核苷酸或核酸之间的杂交或碱基配对,例如, 双链DNA分子的两条链之间,或待测序或扩增的单链核酸上的引物结合位点和寡核苷酸引物之间。互补核苷酸通常是A和T(或A和U),或C和G。当一条链的核苷酸以最佳的方式对齐、并比较、并有适当的核苷酸插入或缺失后,与另一链的至少约80%(通常至少约90%至95%,更优选地为约98%至100%)的核苷酸配对,两条单链 RNA 或DNA分子就被称为是互补的。或者,当RNA链或DNA链在选择性杂交条件下与其互补序列杂交时,互补存在。通常,当在至少14至25个核苷酸的一段上具有至少约65%(优选至少约75%、更优选至少约90%)的互补性时,将发生选择性杂交。参见M. Kanehisa, Nucleic Acids Res. 12:203 (1984),作为参考并入本文。
在一些实施方式中,预扩增引物池包含至少一个甲基化特异性引物对。在一些实施方式中,预扩增引物池包含多个甲基化特异性引物对。在一些实施方式中,预扩增步骤通过甲基化特异性PCR(“MSP”)进行,甲基化特异性PCR是使用甲基化特异性引物的PCR。Herman et al., Methylation-specific PCR: a novelPCRassay for methylationstatus ofCpGislands. Proc Natl Acad Sci USA. 1996 September 3; 93 (18): 9821-6 和 United States Patent No. 6,265,171 中已描述了该技术(即MSP)。
如本文所用,术语“甲基化特异性引物对”是指经特异性设计以识别CpG位点以利用甲基化的差异来扩增经处理的DNA中的特定目标标志物的引物对。引物仅作用于具有特定甲基化状态或没有特定甲基化状态的分子。例如,引物可以是寡核苷酸,在严谨条件、中等严谨条件或高度严谨条件下,其可以以甲基化特异性方式与具有甲基化的特定CpG位点特异性杂交,但不能与没有甲基化的特定CpG位点杂交。因此,引物将特异性扩增在特定CpG位点具有甲基化的目标标志物。又例如,引物可以是寡核苷酸,在严谨条件、中等严谨条件或高度严谨条件下,其可以以甲基化特异性的方式与未甲基化的特定的CpG位点特异性杂交,但是不能与甲基化的特定的CpG位点杂交。因此,引物将特异性扩增在特定CpG位点没有甲基化的目标标志物。因此,在本申请中,对在经处理的DNA内的至少一个目标标志物的预扩增中使用甲基化特异性引物,可以区分甲基化的和未甲基化的CpG位点。本申请的甲基化特异性引物对包含至少一个与亚硫酸氢盐处理的CpG二核苷酸杂交的引物。因此,所述特异性针对甲基化DNA的引物的序列包含至少一个CpG二核苷酸,并且所述特异性针对未甲基化DNA的引物的序列在CpG的C位置上包含“T”,和/或在CpG中G位置上包含“A”。
甲基化特异性引物对通常包含正向引物和反向引物,所述引物均包含寡核苷酸序列,所述寡核苷酸序列与所述目标标志物之一(或目标标志物的亚区域)的至少9个连续核苷酸在严谨条件下、中等严谨条件下或高度严谨条件下杂交,其中所述目标标志物之一(或目标标志物的亚区域)的至少9个连续核苷酸包含至少一个(例如 1、2、3、4、5、6、7、8、9、10或更多个)CpG 位点。
如本文所用,术语“杂交”可以指其中两条单链多核苷酸非共价形式结合以形成稳定的双链多核苷酸的过程。在一个方面,所得的双链多核苷酸可以是“杂交物”或“双链”。“杂交条件”中的盐浓度通常约小于1M,经常小于约500mM并且可以小于约200mM。“杂交缓冲液”包括缓冲盐溶液,例如5% SSPE,或本领域已知的其他此类缓冲液。杂交温度可以低至5℃,但是通常高于22℃,并且更为通常地高于约30℃,并且通常超过37℃。杂交通常在严谨条件下进行,即在该条件下序列将与其目标序列杂交但不与其他非互补序列杂交。严谨条件取决于序列,且在不同情况下有所不同。例如,更长的片段可能需要比短片段更高的杂交温度才能进行特异性杂交。由于其他因素可能会影响杂交的严谨性,包括碱基组成和互补链的长度,有机溶剂的存在以及碱基错配的程度,因此参数组合比单独使用任何一个参数的绝对测量更为重要。通常严谨条件被选定为比特定序列在特定的离子强度和pH下的解链温度(Tm)低约5℃。Tm可以是双链核酸分子群体中的一半被分离成单链的温度。用于计算核酸的 Tm 的几个方程式是本领域众所周知的。如标准参考文献所示,当核酸在 1M NaCl 水溶液中时,可以通过公式 Tm=81.5+0.41(%G+C)计算出简单估算的 Tm 值(参见例如Anderson and Young, Quantitative Filter Hybridization, in Nucleic Acid Hybridization (1985))。其他参考文献(例如 Allawi and SantaLucia, Jr.,Biochemistry, 36:10581-94 (1997))包括替代的计算方法,其计算Tm时将结构和环境以及序列特征等考虑在内。
通常,杂交物的稳定性是关于离子浓度和温度的函数。通常,杂交反应在较低严谨条件下进行,然后在具有不同但较高严谨性的洗涤液中洗涤。示例性的严谨条件包括pH约7.0至约8.3、温度至少25℃、钠离子(或其他盐)浓度为至少0.01M至不超过1M。例如,5 xSSPE(750 mM NaCl,50 mM 磷酸钠,5 mM EDTA,pH 7.4)和约 30°C 的温度适合于等位基因特异性杂交,尽管合适的温度取决于杂交区域的长度和/或 GC含量。在一个方面,确定错配百分比的“杂交严谨性”可以如下:1)高度严谨性:0.1 x SSPE,0.1% SDS,65°C;2)中等严谨性(也称为中度严谨性):0.2 x SSPE,0.1% SDS,50 °C;3)低严谨性:1.0 x SSPE,0.1%SDS,50°C。应当理解,使用替代的缓冲剂、盐和温度可以达到相同的严谨性。例如,中等严谨杂交可以是指允许核酸分子(例如探针)结合互补核酸分子的条件。杂交的核酸分子通常具有至少60%的同一性,包括例如至少70%、75%、80%、85%、90%或95%的同一性。中等严谨条件可以是与下述条件达到同等效果的条件:42°C,50%甲酰胺,5 x Denhardt溶液,5x SSPE,0.2%SDS杂交,然后用42°C,0.2x SSPE,0.2% SDS进行洗涤。高度严谨条件可以通过如下条件提供,例如,42°C,50%甲酰胺,5 x Denhardt溶液,5 x SSPE,0.2% SDS杂交,然后 65°C,0.1xSSPE和 0.1% SDS中洗涤。低严谨性杂交可以是与下述条件达到同等效果的条件:22°C,10%甲酰胺,5 x Denhardt溶液,6 x SSPE, 0.2%SDS杂交,然后在1 x SSPE,0.2% SDS中于37°C洗涤。Denhardt的溶液包含1%聚蔗糖,1%聚乙烯吡咯烷酮和1%牛血清白蛋白(BSA)。20 xSSPE(氯化钠,磷酸钠,EDTA)包含3 M氯化钠、0.2 M磷酸钠和0.025 M EDTA。其他合适的中等严谨性和高度严谨性杂交缓冲液和条件是本领域技术人员众所周知的,并且描述于例如Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd ed., Cold SpringHarbor Press, Plainview, N.Y. (1989)和 Ausubel et al., Short Protocols inMolecular Biology, 4th ed., John Wiley & Sons (1999)。
在一些实施方式中,预扩增引物池还包含用于扩增对照标志物的对照引物对。通常,对照标志物是具有已知特征(例如,序列已知,每个细胞的拷贝数已知)的核酸,用于与实验目标(例如,浓度未知的核酸)进行比较。对照可以是内源的,优选为不变的基因,可以将分析中的实验核酸或目标核酸相对其进行标准化。此类因为样品间差异而标准化的对照可能发生在例如样品处理,分析效率等,并且允许精确的样品间数据比较,定量分析扩增效率和偏差。
在一些实施方案中,针对本文所述目标标志物的预扩增引物对可以是例如本文SEQ ID NO:1-10所述的相应引物对。
V.甲状腺结节良恶性鉴定
在本发明优选的实施方案中,目标标志物为SLC16A3基因或基因组的SLC16A3序列、TTC34基因或基因组的TTC34序列和RARG基因或基因组的RARG序列,以及ROCR2基因或基因组的ROCR2序列或ITPKA基因或基因组的ITPKA序列;优选地,检测来自该个体的血液样品如血浆中这些目标标志物的甲基化状态或甲基化水平。
本文中,各基因或其目标区域的甲基化水平(甲基化率)的计算方式为:在PCR实施方案中,甲基化水平= 2–∆Ct待检样品/2–∆Ct阳性标准品 × 100%,其中,∆Ct = Ct目的基因 – Ct内参基因;在测序实施方案中,甲基化水平 = 甲基化碱基数/总碱基数。如本文所用,术语“Ct值”是指在背景信号以上可以检测到PCR产物的荧光的循环数。Ct值与样品中目标标志物的数量成反比,即Ct值越低,样品中目标标志物的数量就越大。
本文中,当检测两个以上基因或其目标区域时,对两个以上基因或其目标区域的甲基化水平进行二元Logistic回归分析,得到拟合方程。其中,若得分大于0,则判定结果为阳性,即为恶性结节。
在一些实施方案中,检测对象血液中TTC34基因或基因组的TTC34序列或其目标区域、RCOR2基因或基因组的RCOR2序列或其目标区域、SLC16A3基因或基因组的SLC16A3序列或其目标区域和RARG基因或基因组的RARG序列或其目标区域的甲基化水平,其中,对四个基因或其目标区域的甲基化水平进行二元Logistic回归分析,拟合方程为:得分= 2.23 +3.57 × TCC34甲基化水平 – 24.82 × RCOR2甲基化水平 – 4.66 × SLC16A3甲基化水平 – 0.75 × RARG甲基化水平;其中,若得分大于0,则判定结果为阳性,即为恶性结节。
在一些实施方案中,检测对象血液中TTC34基因或基因组的TTC34序列或其目标区域、ITPKA基因或基因组的ITPKA序列或其目标区域、SLC16A3基因或基因组的SLC16A3序列或其目标区域和RARG基因或基因组的RARG序列或其目标区域的甲基化水平,其中,对四个基因或其目标区域的甲基化水平进行二元Logistic回归分析,拟合方程为:得分= 2.47 +3.27 × TTC34甲基化水平 – 3.71 × ITPKA甲基化水平 – 6.48 × SLC16A3甲基化水平– 0.69 × RARG甲基化水平;其中,若得分大于0,则判定结果为阳性,即为恶性结节。
除上述判定之外,本领域技术人员还可以基于各种因素,例如年龄、性别、病史、家族史、症状等,来确定个体的甲状腺结节是否为恶性或为恶性的风险。
VI.组合物和试剂盒
本发明提供一种用于甲状腺结节良恶性鉴别的甲基化检测试剂盒和组合物,所述试剂盒和组合物包括引物分子。根据待检测的目标标志物或其目标区域,试剂盒和组合物中含有能够与所述待检测的目标标志物或其目标区域在严谨条件下、中等严谨条件下或高度严谨条件下杂交的引物对。
在一些实施方案中,试剂盒和组合物中的引物对可选自以下引物对中的任意一对或任意多对:
(1)能扩增出由SEQ ID NO:1和2作为引物扩增得到的TTC34基因的片段的引物对;
(2)能扩增出由SEQ ID NO:3和4作为引物扩增得到的RCOR2基因的片段的引物对;
(3)能扩增出由SEQ ID NO:5和6作为引物扩增得到的ITPKA基因的片段的引物对;
(4)能扩增出由SEQ ID NO:7和8作为引物扩增得到的SLC16A3基因的片段的引物对;
(5)能扩增出由SEQ ID NO:9和10作为引物扩增得到的RARG基因的片段的引物对。
在一些实施方案中,所述引物对选自下组引物对中的至少一对或多对:SEQ IDNO:1和2;SEQ ID NO:3和4;SEQ ID NO:5和6;SEQ ID NO:7和8;SEQ ID NO:9和10。
在一些实施方案中,所述试剂盒和组合物中所含的引物对为用于扩增选自下组的目标标志物或其目标区域的引物对:TTC34基因或基因组的TTC34序列或其目标区域、RCOR2基因或基因组的RCOR2序列或其目标区域、SLC16A3基因或基因组的SLC16A3序列或其目标区域和RARG基因或基因组的RARG序列或其目标区域;和TTC34基因或基因组的TTC34序列或其目标区域、ITPKA基因或基因组的ITPKA序列或其目标区域、SLC16A3基因或基因组的SLC16A3序列或其目标区域和RARG基因或基因组的RARG序列或其目标区域。在这些实施方案中的一些优选实施方案中,所述引物对的引物序列分别为:SEQ ID NO:1和2、SEQ ID NO:3和4、SEQ ID NO:7和8、和SEQ ID NO:9和10; SEQ ID NO:1和2、SEQ ID NO:5和6、SEQ IDNO:7和8、和SEQ ID NO:9和10。
引物还可包括检测内参如ACTB的引物,例如能扩增出由SEQ ID NO:16和17序列作为引物扩增得到的ACTB基因的片段的引物。在一些实施方案中,内参的引物对为SEQ IDNO:16和17。
在一些实施方式中,所述引物被包装在单一容器内或被包装在独立容器内。在一些实施方式中,所述试剂盒进一步包含一个或多个封闭寡核苷酸。
在一些实施方式中,所述试剂盒和组合物进一步包含检测试剂。在一些实施方式中, 所述检测试剂选自下组:荧光探针,嵌入染料、生色团标记的探针,放射性同位素标记的探针和生物素标记的探针。
在优选的实施方案中,根据待检测的目标标志物或其目标区域,试剂盒和组合物中可含有向对应的荧光探针。具体而言,试剂盒和组合物中的荧光探针可以是用于检测下组目标标志物或其目标区域的荧光探针:TTC34基因或基因组的TTC34序列其目标区域、RCOR2基因或基因组的RCOR2序列其目标区域、SLC16A3基因或基因组的SLC16A3序列其目标区域和RARG基因或基因组的RARG序列其目标区域;TTC34基因或基因组的TTC34序列其目标区域、ITPKA基因或基因组的ITPKA序列其目标区域、SLC16A3基因或基因组的SLC16A3序列其目标区域和RARG基因或基因组的RARG序列其目标区域。优选的实施方案中,针对上述各基因或其目标区域的荧光探针的核苷酸序列以及具体的荧光探针可如前文第IV部分所述。更具体而言,试剂盒中的荧光探针的核苷酸序列可以是选自下组:SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:14和SEQ ID NO:15;SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14和SEQID NO:15。
探针还包括检测内参基因如ACTB的探针。在一些实施方案中,检测内参基因ACTB的探针的核苷酸序列如SEQ ID NO:18所示。
在一些实施方式中,所述试剂盒还可包含DNA聚合酶和/或适合存放从个体获取的生物样品的容器。在一些实施方式中,所述试剂盒进一步含使用说明书和/或对试剂盒检测结果的解释。
在一些实施方式中,所述试剂盒和组合物还可包括用于酶促法或非酶促法进行转化的试剂。在优选的实施方案中,所示试剂盒还包括亚硫酸氢盐试剂或甲基化敏感限制酶(MSRE)。在一些实施方式中,所述亚硫酸氢盐试剂选自下组:亚硫酸氢铵、亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢钙、亚硫酸氢镁、亚硫酸氢铝、亚硫酸氢根离子,及其任意组合。在一些实施方式中,亚硫酸氢盐试剂是亚硫酸氢钠。在一些实施方式中,所述 MSRE 选自下组:HpaII酶、SalI 酶、SalI-HF®酶、ScrFI 酶、BbeI 酶、NotI 酶、SmaI 酶、XmaI 酶、MboI 酶、BstBI酶、ClaI 酶、MluI 酶、NaeI 酶、NarI 酶、PvuI 酶、SacII 酶、HhaI 酶及其任意组合。
所述试剂盒和组合物还可包括经转化的阳性标准品,其中未甲基化的胞嘧啶转化为不与鸟嘌呤结合的碱基。所述阳性标准品可以是完全甲基化的。
所述试剂盒和组合物还可包括PCR反应试剂。优选地,所述PCR反应试剂包括TaqDNA聚合酶、PCR缓冲液(buffer)、dNTPs、Mg2+。
在一些实施方式中,所述试剂盒和组合物还包含可用于进行CpG位置特异性甲基化分析的标准试剂,其中所述分析包括以下一种或多种技术:MS-SNuPE、MSP、MethyLight™、HeavyMethylTM、COBRA 和核酸测序。
在一些实施方式中,所述试剂盒和组合物可包含选自下组的额外的试剂:缓冲液(例如限制酶、PCR、保存或洗涤缓冲液)、DNA回收试剂或试剂盒(例如沉淀、超滤、亲和柱)和DNA回收组件等。
本申请的试剂盒可进一步包含在DNA富集领域中已知的以下组分的一种或几种:蛋白组分,所述蛋白选择性地结合甲基化的DNA;三链形成核酸组分,一个或多个接头,任选地在合适的溶液中;用于进行连接的物质或溶液,例如连接酶、缓冲液;用于进行柱层析的物质或溶液;用于进行免疫学为基础的富集(例如免疫沉淀)的物质或溶液;用于进行核酸扩增的物质或溶液,例如 PCR;一种染料或几种染料,若适用于偶联剂,若适用于溶液中;用于进行杂交的物质或溶液;和/或用于进行洗涤步骤的物质或溶液。
在其他一些实施方案中,本发明的组合物含有分离的核酸分子,所述分离的核酸分子选自以下的一种或多种:(1)由SEQ ID NO:1和2或与其有至少90%相同性的序列作为引物扩增得到的TTC34基因的片段;(2)由SEQ ID NO:3和4或与其有至少90%相同性的序列作为引物扩增得到的RCOR2基因的片段;(3)由SEQ ID NO:5和6或与其有至少90%相同性的序列作为引物扩增得到的ITPKA基因的片段;(4)由SEQ ID NO:7和8或与其有至少90%相同性的序列作为引物扩增得到的SLC16A3基因的片段;(5)由SEQ ID NO:9和10或与其有至少90%相同性的序列作为引物扩增得到的RARG基因的片段;。
在优选的实施方案中,所述组合物含有:TTC34基因目标区域、RCOR2基因目标区域、SLC16A3基因目标区域和RARG基因目标区域;或TTC34基因目标区域、ITPKA基因目标区域、SLC16A3基因目标区域和RARG基因目标区域。
本申请还包括记载有本文所述分离的核酸分子的序列和任选的其甲基化信息的介质,所述介质用于与基因甲基化测序数据比对以确定所述核酸分子的存在、含量和/或甲基化水平。优选地,所述介质是印有所述序列和任选的其甲基化信息的卡片,例如纸质、塑料、金属、玻璃卡片。优选地,所述介质是存储有所述序列和任选的其甲基化信息和计算机程序的计算机可读介质,当所述计算机程序被处理器执行时,实现下述步骤:将样品的甲基化测序数据与所述序列比较,从而获得所述样品中含所述序列的核酸分子的存在在、含量和/或甲基化水平。
本申请还包括一种用于鉴别甲状腺结节良恶性的装置,所述装置包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:(1)获取样品中选自以下一种或多种本文所述的目标标志物或其目标区域的甲基化水平,(2)根据(1)的甲基化水平判读甲状腺结节良恶性。优选地,所述获取步骤采用本申请第IV部分所述的任意一种方法进行;优选地,所述判读采取本申请第V部分所述的任意一种方法进行。
VII.用途
本申请还提供本文所述的引物对、引物对的组合以及任选的探针或探针组合在诊断甲状腺结节良恶性中的应用,以及在制备用于诊断甲状腺结节良恶性的试剂或试剂盒中的应用。
优选地,所述试剂盒如本申请第VI部分中任一方案所述。优选地,所述试剂盒用于实施本文第II部分、第III部分、第IV部分和第V部分中任意一个或多个部分所述的各个步骤和方法。
本申请还提供本申请所述的分离的核酸分子做为检测靶标在甲状腺结节良恶性诊断中的应用。
以下结合附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。除非特别说明,以下实施例所用试剂和材料均为市购。
实施例
实施例中使用到以下引物和探针:
TTC34基因正向引物F:
CCCRCAAAATCCTCAAAAC(SEQ ID NO:1),
TTC34基因反向引物R:
GAGTGTTTGTTGTTGGTAGG(SEQ ID NO:2),
RCOR2基因正向引物F:
CGAAAAAAACATTCCCGAAAAC(SEQ ID NO:3),
RCOR2基因反向引物R:
TCGAGAATTCGGGGTTTTTA(SEQ ID NO:4),
ITPKA基因正向引物F:
ACGCAAACCGAAAACTTC(SEQ ID NO:5),
ITPKA基因反向引物R:
GTGTGGYGGGTGTTGATA(SEQ ID NO:6),
SLC16A3基因正向引物F:
GTAAATGAGGTTTGTGTGTTTGTTT(SEQ ID NO:7),
SLC16A3基因反向引物R:
CACCTCTAACCCCCRCAAA(SEQ ID NO:8),
RARG基因正向引物F:
CRAACACAACACTTTCCAAAACC(SEQ ID NO:9),
RARG基因反向引物R:
GTTTGTGAGGGGATGTTTGTG(SEQ ID NO:10),
ACTB基因正向引物F:
TGGAGGAGGTTTAGTAAGTTTTTTG(SEQ ID NO:16),
ACTB基因反向引物R:
CCTCCCTTAAAAATTACAAAAACCA(SEQ ID NO:17)。
TTC34基因探针:CGAACCGCAACAAACGCTCG(SEQ ID NO:11)
RCOR2基因探针:CCGACTCGCGCCAAACTCGA(SEQ ID NO:12)
ITPKA基因探针:ACGCTAAAATCACCTTCACTACGCC(SEQ ID NO:13)
SLC16A3基因探针:ATGTAAGCGGATATAGAGCGGTAGGGTA(SEQ ID NO:14)
RARG基因探针:CGCAACCACGCAAAAACACACGC(SEQ ID NO:15)
ACTB基因探针:ACCACCACCCAACACACAATAACAAACACA(SEQ ID NO:18)。
实施例1:TTC34基因、RCOR2基因、SLC16A3基因和RARG基因联合用于甲状腺结节良恶性判别
对196例甲状腺癌患者和148例甲状腺良性结节患者的血浆cfDNA进行甲基化特异的PCR,发现TTC34基因、RCOR2基因、SLC16A3基因和RARG基因在甲状腺癌和甲状腺良性结节病例组织DNA的甲基化水平具有差异,结果如图1所示。
1.1 样本准备
使用QIAamp DNA Mini Kit(QIAGEN,货号:51304)对196例甲状腺癌和148例甲状腺良性结节的血浆进行cfDNA抽提;使用QubitTM dsDNA HS Assay Kit(Thermo,货号:Q32854)检测DNA的浓度;使用1%琼脂糖凝胶电泳进行质检。
1.2 DNA转化
使用MethylCodeTM Bisulfite Conversion Kit(Thermo,货号:MECOV50)对步骤1得到的DNA进行重亚硫酸盐转化,未甲基化的胞嘧啶(cytosine, C)经过转化变为尿嘧啶(uracil, U);甲基化的胞嘧啶转化后不发生改变。
1.3 PCR混合物准备
采用多重甲基化特异的PCR法(Multiplex MSP),PCR混合物包括PCR反应液、引物混合物、探针混合物,进行单个样本的配制。引物混合物包含TTC34基因、RCOR2基因、SLC16A3基因、RARG基因和内参基因的各一对引物。引物如SEQ ID NO:1、2、3、4、7、8、9、10、16、17所示;探针如SEQ ID NO:11、12、14、15、18所示。
PCR反应体系如下:
1.4 PCR反应
设置PCR程序为94 ℃预变性2 min;94 ℃变性30 s,60 ℃退火延伸1 min,45个循环。60 ℃退火延伸阶段收集荧光信号。
检测结果分析
甲基化水平(methylation level) = 2–∆Ct待检样品/2–∆Ct阳性标准品 × 100,其中,∆Ct =Ct目的基因 – Ct内参基因。
对TTC34基因、RCOR2基因、SLC16A3基因和RARG基因的甲基化水平进行二元Logistic回归分析,拟合方程为得分(Score)= 2.23 + 3.57 × TTC34甲基化水平 –24.82 × RCOR2甲基化水平– 4.66 × SLC16A3甲基化水平 – 0.75 × RARG甲基化水平,判读方法为所检测TTC34、RCOR2、SLC16A3和RARG基因的得分大于0,则判定结果为阳性,即为恶性结节。
TTC34、RCOR2、SLC16A3和RARG基因的ROC分析如图1,特异性达到68%,灵敏度为68%。
实施例2:TTC34基因、ITPKA基因、SLC16A3基因和RARG基因联合用于甲状腺结节良恶性判别
申请人对196例甲状腺癌患者和148例甲状腺良性结节患者的血浆cfDNA进行甲基化特异的PCR,发现TTC34基因、ITPKA基因、SLC16A3基因和RARG基因在甲状腺癌和甲状腺良性结节病例组织DNA的甲基化水平具有差异,结果如图2所示。
2.1 样本准备
使用QIAamp DNA Mini Kit(QIAGEN,货号:51304)对196例甲状腺癌和148例甲状腺良性结节的血浆进行cfDNA抽提;使用QubitTM dsDNA HS Assay Kit(Thermo,货号:Q32854)检测DNA的浓度;使用1%琼脂糖凝胶电泳进行质检。
2.2 DNA转化
使用MethylCodeTM Bisulfite Conversion Kit(Thermo,货号:MECOV50)对步骤1得到的DNA进行重亚硫酸盐转化,未甲基化的胞嘧啶(cytosine, C)经过转化变为尿嘧啶(uracil, U);甲基化的胞嘧啶转化后不发生改变。
2.3 PCR混合物准备
采用多重甲基化特异的PCR法(Multiplex MSP),PCR混合物包括PCR反应液、引物混合物、探针混合物,进行单个样本的配制。引物混合物包含TTC34基因、ITPKA基因、SLC16A3基因、RARG基因和内参基因的各一对引物。引物如SEQ ID NO:1、2、5、6、7、8、9、10、16、17所示;探针如SEQ ID NO:11、13、14、15、18所示。
PCR反应体系如下:
2.4 PCR反应
设置PCR程序为94 ℃预变性2 min;94 ℃变性30 s,60 ℃退火延伸1 min,45个循环。60 ℃退火延伸阶段收集荧光信号。
2.5 检测结果分析
甲基化水平(methylation level) = 2–∆Ct待检样品/2–∆Ct阳性标准品 × 100,其中,∆Ct =Ct目的基因 – Ct内参基因。
对TTC34基因、ITPKA基因、SLC16A3基因和RARG基因的甲基化水平进行二元Logistic回归分析,拟合方程为得分(Score)= 2.47 + 3.27 × TTC34甲基化水平 – 3.71× ITPKA甲基化水平 – 6.48 × SLC16A3甲基化水平 – 0.69 × RARG甲基化水平,判读方法为所检测TTC34、ITPKA、SLC16A3和RARG基因的得分大于0,则判定结果为阳性,即为恶性结节。
TTC34、ITPKA、SLC16A3和RARG基因的ROC分析如图2,特异性达到64%,灵敏度为68%。
以上所述实施例仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 上海鹍远生物技术有限公司
<120> 甲状腺结节良恶性相关标志物及其应用
<130> 212506
<160> 18
<170> SIPOSequenceListing 1.0
<210> 1
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
cccrcaaaat cctcaaaac 19
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gagtgtttgt tgttggtagg 20
<210> 3
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cgaaaaaaac attcccgaaa ac 22
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tcgagaattc ggggttttta 20
<210> 5
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
acgcaaaccg aaaacttc 18
<210> 6
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gtgtggyggg tgttgata 18
<210> 7
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gtaaatgagg tttgtgtgtt tgttt 25
<210> 8
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
cacctctaac ccccrcaaa 19
<210> 9
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
craacacaac actttccaaa acc 23
<210> 10
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gtttgtgagg ggatgtttgt g 21
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
cgaaccgcaa caaacgctcg 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ccgactcgcg ccaaactcga 20
<210> 13
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
acgctaaaat caccttcact acgcc 25
<210> 14
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
atgtaagcgg atatagagcg gtagggta 28
<210> 15
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
cgcaaccacg caaaaacaca cgc 23
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tggaggaggt ttagtaagtt ttttg 25
<210> 17
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
cctcccttaa aaattacaaa aacca 25
<210> 18
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
accaccaccc aacacacaat aacaaacaca 30