发明内容
本申请的目的是提供一种新的筛选甲基化PCR检测的目标区域的方法,甲基化PCR检测的试剂盒,及该试剂盒的应用。
本申请采用了以下技术方案:
本申请的一方面公开了一种筛选甲基化PCR检测的目标区域的方法,包括以下步骤;
(1)从甲基化芯片数据库中获取待分析肿瘤的甲基化芯片及对应的转录组测序数据;
(2)统计正常组与癌症组的甲基化程度值,筛选在不同组别中具有显著差异的甲基化位点;
(3)联合转录组测序表达谱的分析,统计相关系数,筛选负相关位点,获得甲基化候选位点列表;
(4)将步骤(3)获取的甲基化候选位点列表,与现有披露的所有相关的文献进行关联,筛选获得文献支持报道多且组间甲基化差异程度大、与表达量负相关的位点;与此同时,对步骤(3)获取的甲基化候选位点列表使用回归方法,对已有公开的肿瘤组织样本进行训练集和测试,获取最佳敏感性、特异性的位点集合;即获得本申请的甲基化PCR检测的目标区域。
需要说明的是,本申请的方法综合分析甲基化芯片数据库、转录组测序表达谱和文献研究结果,在这些数据基础上,经过多重数据过滤分析,并结合回归算法,补充文献以外的其它基因,弥补了目前常见biomaker筛选方法的缺陷,整合了所有可以利用的数据和机器学习的算法进行全面、可靠的预测。本申请的一种实现方式中,采用本申请的目标区域筛选方法,从TCGA数据库27k+450k位点范围内筛选到几十个与结直肠癌和肺癌高度相关的异常甲基化基因,缩小了检测范围,使检测内容更有针对性,能够在PCR、焦磷酸测序等小通量的技术平台上实现对标志物的检测;节约了检测费用和时间。
优选的,步骤(1)中,甲基化芯片数据库为TCGA甲基化芯片数据库,甲基化芯片为甲基化450K芯片。
优选的,步骤(3)中,相关系数包括与位点甲基化程度beta值相关的系数,即spearman、pearson、kendall三个系数,通过这三个系数筛选负相关的位点,其中,相关系数绝对值越接近1,表示越相关。
优选的,步骤(4)中,回归算法为LASSO回归算法。其中,LASSO即least absoluteshrinkage and selection operator的缩写。
优选的,步骤(2)中,筛选在不同组别中具有显著差异的甲基化位点,具体包括,通过TCGA样本命名规则,对样本进行归类,要求正常组与癌症组间的甲基化信号值差异即两个组间候选位点的t检验满足P值小于0.01,delta-beta值至少为0.2,同时要求任何一个组,平均甲基化程度信号值,即beta值最多为0.1。
需要说明的是,以上步骤(2)的优选方案,目的是为了筛选其中一组为低甲基化或没有发生甲基化的状态,另一组为高甲基化的状态,此时筛选得到的biomarker最有意义;其中,低甲基化或没有发生甲基化的组通常是正常组,高甲基化的组通常是癌症组。
本申请的另一面公开了采用本申请的方法获得的与结直肠癌相关的甲基化异常的目标区域,这些目标区域包括SEPTIN9、BMP3、RASSF2、PCDH10、SDC2、IGFBP3、NDRG4、TFPI2、GATA5、SFRP2、CHFR和ALX4基因。
本申请的另一面公开了本申请与结直肠癌相关的甲基化异常的目标区域在制备结直肠癌检测试剂中的应用。
需要说明的是,SEPTIN9、BMP3、RASSF2、PCDH10、SDC2、IGFBP3、NDRG4、TFPI2、GATA5、SFRP2、CHFR和ALX4基因都是已知的基因,但是,本申请率先采用本申请的方法从数据库众多的基因中筛选出这些与结直肠癌直接相关的基因,通过对这些基因的甲基化进行检测,即可实现对结直肠癌的早期诊断或筛查。可以理解,针对这些基因可以制备结直肠癌检测试剂,例如特异性的甲基化检测引物、探针等。
本申请的另一面公开了采用本申请的方法获得的与肺癌相关的甲基化异常的目标区域,这些目标区域包括PTGER4、PBX1、DUOX1、SCT、CSDAP1、MEIS2、SHOX2、PAX6、DRD5和TBX5基因。
本申请的另一面公开了本申请与肺癌相关的目标区域在肺癌检测中的应用。
可以理解,PTGER4、PBX1、DUOX1、SCT、CSDAP1、MEIS2、SHOX2、PAX6、DRD5和TBX5基因也是已知的基因,本申请创造性的从众多基因中筛选出这些基因,通过对这些基因的甲基化检测可以实现肺癌的早期诊断或筛查,为肺癌的检测提供了更准确可靠的检测靶标位点。
本申请的再一面公开了一种甲基化PCR检测结直肠癌的试剂盒,该试剂盒中包括第一组引物至第八组引物中的至少一组,每组引物都由甲基化特异引物对和非甲基化特异引物对组成;第一组引物中,甲基化特异引物对上下游引物分别为SEQ ID NO.1和2所示序列,非甲基化特异引物对上下游引物分别为SEQ ID NO.3和4所示序列;第二组引物中,甲基化特异引物对上下游引物分别为SEQ ID NO.5和6所示序列,非甲基化特异引物对上下游引物分别为SEQ ID NO.7和8所示序列;第三组引物中,甲基化特异引物对上下游引物分别为SEQ ID NO.9和10所示序列,非甲基化特异引物对上下游引物分别为SEQ ID NO.11和12所示序列;第四组引物中,甲基化特异引物对上下游引物分别为SEQ ID NO.13和14所示序列,非甲基化特异引物对的上下游引物为SEQ ID NO.15和16所示序列;第五组引物中,甲基化特异引物对上下游引物分别为SEQ ID NO.17和18所示序列,非甲基化特异引物对的上下游引物为SEQ ID NO.19和20所示序列;第六组引物中,甲基化特异引物对上下游引物分别为SEQ ID NO.21和22所示序列,非甲基化特异引物对的上下游引物为SEQ ID NO.23和24所示序列;第七组引物中,甲基化特异引物对上下游引物分别为SEQ ID NO.25和26所示序列,非甲基化特异引物对的上下游引物为SEQ ID NO.27和28所示序列;第八组引物中,甲基化特异引物对上下游引物分别为SEQ ID NO.29和30所示序列,非甲基化特异引物对的上下游引物为SEQ ID NO.31和32所示序列。
需要说明的是,本申请甲基化PCR检测结直肠癌的试剂盒中,第一组引物至第八组引物依序为检测SEPTIN9、ALX4、RASSF2、SFRP2、SDC2、TFPI2、NDRG4、CHFR八个基因甲基化的特异性引物,可以理解,这八个基因是按照本申请的方法获得的与结直肠癌相关的甲基化异常的目标区域中权重较高的八个基因,针对这八个基因的甲基化情况检测,可以实现结直肠癌的早期诊断。
本申请的再一面公开了一种甲基化PCR检测肺癌的试剂盒,该试剂盒中包括第九组引物至第十三组引物中的至少一组,每组引物都由甲基化特异引物对和非甲基化特异引物对组成;第九组引物中,甲基化特异引物对上下游引物分别为SEQ ID NO.33和34所示序列,非甲基化特异引物对的上下游引物为SEQ ID NO.35和36所示序列;第十组引物中,甲基化特异引物对上下游引物分别为SEQ ID NO.37和38所示序列,非甲基化特异引物对的上下游引物为SEQ ID NO.39和40所示序列;第十一组引物中,甲基化特异引物对的上下游引物为SEQ ID NO.41和42所示序列,非甲基化特异引物对的上下游引物为SEQ ID NO.43和44所示序列;第十二组引物中,甲基化特异引物对的上下游引物为SEQ ID NO.45和46所示序列,非甲基化特异引物对的上下游引物为SEQ ID NO.47和48所示序列;第十三组引物中,甲基化特异引物对的上下游引物为SEQ ID NO.49和50所示序列,非甲基化特异引物对的上下游引物为SEQ ID NO.51和52所示序列。
需要说明的是,本申请甲基化PCR检测肺癌的试剂盒中,第九组引物至第十三组引物依序为检测PTGER4、TBX5、DUOX1、CSDAP1、MEIS2五个基因甲基化的特异性引物,可以理解,这五个基因是按照本申请的方法获得的与肺癌相关的甲基化异常的目标区域中权重较高的五个基因,针对这五个基因的甲基化情况检测,可以实现肺癌的早期诊断。
优选的,以上两个试剂盒中还分别包括参考引物组,参考引物组包括甲基化特异引物对,甲基化特异引物对上下游引物分别为SEQ ID NO.53和54所示序列。
其中,参考引物组是检测ACTB基因的甲基化的引物组,即以ACTB为参考基因。
在本申请进一步的改进方案中,以上两个试剂盒中,所有甲基化特异引物对的上游引物和/或下游引物的3’末端最后一位碱基为双脱氧核苷酸。
需要说明的是,上游引物和/或下游引物的3’末端最后一位碱基为双脱氧核苷酸,该设计是为了将焦磷酸解激活聚合反应(Pyrophosphorolysis-activatedpolymerization,简称PAP)与甲基化PCR结合起来,进一步提高甲基化PCR扩增的特异性。
还需要说明的是,2000年Liu等在其发表的文献中,Liu Q&Sommer SS.,Pyrophosphorolysis-activated polymerization(PAP):application to allele-specific amplification,Biotechniques,2000.29(5):1072-6.,将Ⅱ型DNA聚合酶的焦磷酸解和聚合活性结合在一个反应中,将引物3’端脱氧核苷酸dNMP更换为双脱氧核苷酸ddNMP,使用无3’-5’外切酶活性的DNA聚合酶,只有3’末端与模板匹配的引物才能进行扩增,这种扩增依赖焦磷酸解反应的激活,称为焦磷酸解激活聚合反应。与传统的ARMS-PCR相比,这一改进显著增加了扩增特异性。PAP技术被认为是目前等位基因识别特异性最高的技术,主要应用于体细胞突变检测,但是在甲基化检测方面鲜有报道。
本申请的再一面公开了一种核酸甲基化的检测方法,包括采用针对目标区域设计的PAP引物,并利用PAP PCR技术对目标区域进行甲基化检测。
需要说明的是,本申请率先将PAP PCR技术引入甲基化的检测过程中,提高了甲基化检测的特异性,为基于甲基化检测的肿瘤早期筛选奠定了基础。
优选的,核酸甲基化的检测方法中,目标区域按照本申请的筛选甲基化PCR检测的目标区域的方法获得。
优选的,PAP引物的上下游引物中至少一条引物的3’末端最后一位碱基为双脱氧核苷酸。
需要说明的是,由于双脱氧核苷酸的修饰在提高PAP PCR特异性的同时,会降低扩增效率,因此,本申请的一种实现方式中,只对上游引物和下游引物中的其中一条引物进行3’末端最后一位碱基为双脱氧核苷酸修饰。这样,既能达到提高检测特异性的目的,又能尽量保障扩增效率。
本申请的有益效果在于:
本申请筛选甲基化PCR检测的目标区域的方法,综合分析了甲基化芯片数据库、转录组测序表达谱和文献研究结果,并结合多重数据过滤分析和回归算法,能够更准确、高效、灵敏、特异的获得待分析肿瘤的甲基化PCR检测目标区域,为基于甲基化检测的肿瘤早期筛查奠定了基础。
实施例
一、甲基化PCR检测目标区域筛选
本例以具有明确甲基化特征的结直肠癌和肺癌为对象进行甲基化PCR检测目标区域的筛选,具体如下:
1.从Broad研究所Firehose网站(网址:http://gdac.broadinstitute.org/)下载TCGA的结直肠癌(Colorectal adenocarcinoma)、肺腺癌(Lung adenocarcinoma)、肺鳞状细胞癌Lung squamous cell carcinoma)甲基化450k芯片及对应的转录组测序(RNA-seq)的三级数据,该三级数据汇总了癌种满足样本条件,比如有活检的新鲜组织样本,的所有样本经过标准化处理获取每个位点/转录本的信号值的文件,或可以使用firehose_get工具下载,参考脚本如下:
./firehose_get-tasks Methylation_Preprocess.Level_3stddata latest -cCOAD COADREAD LUSC -a
./firehose_get-tasks Correlate_Methylation_vs_mRNA analyses latest -cLUAD COAD COADREAD LUSC –a
2、统计正常组与癌症组甲基化程度值,筛选在不同组别中具有显著差异的甲基化位点。首选通过TCGA样本命名规则,对样本进行归类,要求正常组与癌症组间甲基化信号值差异即两个组间候选位点的t检验满足P值小于0.01,delta-beta值至少为0.2,或者更高,比如0.5;同时要求任何一个组,平均甲基化程度信号值即beta值最多为0.1,此目的是为了筛选其中一组,通常是正常组,为低甲基化或没有发生甲基化的状态,另一组,通常是癌症组,为高甲基化的状态,此时筛选得到的biomarker才有意义。
3、联合转录组测序表达谱的分析,统计相关系数,筛选负相关位点。通常,癌症组某个基因的高甲基化状态会导致该基因表达的失活或表达水平的下降,也即某个基因的甲基化状态会影响基因的表达。分别统计标准化后的表达量与该基因对应位点甲基化程度beta值的相关系数即spearman、pearson、kendall相关系数,筛选到负相关的位点,同时相关系数绝对值越接近1,表示越相关。
4.与文献列表基因进行overlap获取。以上三步获取得到的甲基化候选位点列表,与自主文献调研的基因进行关联,筛选到文献支持报道多且组间甲基化差异程度大、与表达量负相关的位点。
5.通过机器学习算法,抓取特征集。与第4步并行,对前3步骤得到的候选位列表,使用LASSO(least absolute shrinkage and selection operator)回归等机器学习方法,对已有公开的TCGA肿瘤组织样本部分进行训练集,部分进行测试,获取最佳敏感性、特异性的位点集合。
根据以上方法,本例筛选到了12个与结直肠癌高度相关的异常甲基化基因和10个与肺癌高度相关的异常甲基化基因,详细如表1所示。
表1结直肠癌和肺癌的甲基化PCR检测目标区域
二、甲基化PCR检测引物设计
1.常规的甲基化PCR检测引物
本例针对表1筛选到的基因分别设计了甲基化特异性引物和同一区域相应的非甲基化特异性引物。引物设计采用两种不同的思路:
一是针对特定的CG位点设计引物:根据TCGA数据库提供的明确的甲基化位点,某一位点的CG,采用oligo等软件,在适当的参数范围内,例如引物长度18-30bp,Tm 55-62℃,产物长度70-150bp,针对该位点设计符合甲基化PCR需求的引物,特定的C碱基在引物的3’末端最后3个碱基内,一条引物序列中包含2个或以上的CG二核苷酸。
二是基因明确但不针对特定的CG位点设计引物,而是确定该基因的启动子序列后,利用在线甲基化引物设计软件methprimer或ABI的甲基化引物设计软件methyl_primer_express_software,设置一定的参数,例如引物长度18-30bp,Tm 55-62℃,产物长度70-150bp,针对启动子区域设计配对的甲基化和非甲基化特异性引物,作为PCR引物。
Methprimer的网址为:http://www.urogene.org/methprimer/
本例在表1所列基因中,优先选择权重较高的基因设计其甲基化特异性引物和非甲基化特异性引物。权重根据数据库筛选时排名,并结合文献报道的基因功能、在临床样本中的性能等特征得出。所设计的引物序列如表2所示,其中,ACTB为参考基因。
表2甲基化特异引物对和非甲基化特异引物对
表2中,甲基化上游引物即甲基化特异性引物对的上游引物,甲基化下游引物即甲基化特异性引物对的下游引物,非甲基化上游引物即非甲基化特异性引物对的上游引物,非甲基化下游引物即非甲基化特异性引物对的下游引物。
2.PAP引物
本例以结直肠癌检测NDRG4的甲基化特异性引物对为例进行PAP引物设计,同时,设计了检测参考基因ACTB的甲基化特异性引物对的PAP引物,PAP引物如表3所示。其余没有设计为PAP引物的,以正常状态使用。
表3PAP引物
PAP引物与表2中引物的不同之处在于3’末端的碱基为双脱氧碱基。引物合成时只合成不带双脱氧碱基的序列,双脱氧碱基在后续进行寡核苷酸连接反应。由于PAP-PCR在提高扩增特异性的同时,可显著降低扩增效率,所以本例所用的PAP引物是单边双脱氧引物,即一对引物只有其中一条进行3’末端双脱氧修饰,如表3所示,以平衡扩增特异性和扩增效率。
双脱氧碱基修饰的具体方法如下:
寡核苷酸连接反应,反应体系总计30μL,包括:5×TdT缓冲液(invitrogenTM,Thermo Fisher Scientific)6μL、100μM的Oligo(invitrogenTM,Thermo FisherScientific)5μL、1nmol/μL的ddNTP(SIGMA,SIGMA-ALDRICH)12μL、15U/μL的末端脱氧核苷酸转移酶TdT(invitrogenTM,Thermo Fisher Scientific)6.7μL、分子生物实验级别水(SIGMA,SIGMA-ALDRICH)0.3μL。
反应体系配制好后,在37℃反应4h。然后采用尿素变性聚丙烯酰氨凝胶电泳(PAGE)回收纯化。
尿素变性聚丙烯酰氨凝胶电泳(PAGE)具体如下:
将凝固的尿素变性PAGE胶置于盛有1×TBE的垂直电泳槽中,于250V恒压条件下,预电泳30min备用;寡核苷酸连接反应结束后,从37℃取出,放至室温,每30μL的体系加15μL溴酚黄上样缓冲液,混合均匀,制成点样液;将点样液加入PAGE胶加样孔底部,200V恒压电泳,约1h;电泳结束后,小心将PAGE胶取下转移至1×TBE配置的EB染色液中,染色10min。
切胶回收目的片段,将获取的胶块捣碎,于粉碎的胶块中加入适量的1×NEBbuffer2(NEB);将悬浮体系置于56℃水浴锅中水浴1h,每隔15min震荡混匀一次;水浴后的混合体系倒入Spin-X离心过滤管中,全速离心1min,离心后弃滤膜及碎胶,保留收集管中的流穿液体;用移液器测量流穿液体体积,测量后,向流穿液体中加3倍体积的无水乙醇、20μL的3M NaAc(pH5.6)以及2μL糖元(Glycogen)(5mg/mL),颠倒混匀,置于-20℃沉淀过夜;将第一天的醇沉体系置于离心机中,4℃全速离心30min;离心后小心倒掉上清,向管底沉淀加700μL的75%乙醇溶液,颠倒混合后置于4℃全速离心10min;再次离心后倒掉上清,向管底沉淀加700μL的75%乙醇溶液,颠倒混合后置于4℃全速离心10min;倒掉上清,将管子开盖置于通风处晾干;向管中沉淀加适量无DNase的水回溶;即获得双脱氧碱基修饰的引物。
本例采用飞行时间质谱检测双脱氧碱基修饰前后的质量值变化,以确定双脱氧碱基修饰是否成功。具体的,分别对NDRG4的甲基化下游引物,即未双脱氧碱基修饰的引物,和NDRG4的甲基化下游引物PAP,即双脱氧碱基修饰的引物进行飞行时间质谱检测,结果如图1所示,图1中图A是未双脱氧碱基修饰的引物的检测结果,图B是双脱氧碱基修饰的引物的检测结果,结果显示双脱氧碱基修饰后,引物的分子量增加与预期相符,说明3’端双脱氧碱基修饰成功。同样的,分别对ACTB的甲基化上游引物,即未双脱氧碱基修饰的引物,和ACTB的甲基化上游引物PAP,即双脱氧碱基修饰的引物进行飞行时间质谱检测,结果如图2所示,图2中图A是未双脱氧碱基修饰的引物的检测结果,图B是双脱氧碱基修饰的引物的检测结果,结果显示双脱氧碱基修饰后,引物的分子量增加与预期相符,说明3’端双脱氧碱基修饰成功。
三、甲基化PCR检测
本例采用健康人血细胞作为阴性参考品,提取健康人外周血细胞DNA进行试验,以购买的商品化的人甲基化基因组DNA(CpGenome Universal Methylated DNA,Chemicon)为阳性参考品,另外采用一例结直肠癌组织的DNA作为结直肠癌的阳性样品,分别采用一例肺腺癌癌组织的DNA和一例肺鳞癌癌组织的DNA作为肺癌的阳性样品;阴、阳性参考品和三个阳性样品均进行亚硫酸氢盐转化后作为模板DNA进行检测。具体如下:
1.DNA提取
从样本中提取基因组DNA。提取试剂盒为DNeasy Blood&Tissue Kit,实验操作步骤如下:
1)缓冲液和试剂的准备
Buffer ACB和ATL:使用前,充分溶解。
Buffer AW1和AW2:按照说明书加入无水乙醇。
2)提取前的准备工作
将血细胞样本平衡至室温,所有离心操作都在室温下进行;
打开水浴锅或Thermomixer调至56℃。
3)提取步骤
裂解细胞:取200μL血细胞至1.5mL EP管,加入40μL蛋白酶K,补充PBS缓冲液至440μL;加入400μLBuffer AL,旋涡混匀,56℃孵育10min。
提取柱结合:加入无水乙醇400μL,充分混匀,转移至DNeasy Mini spin column提取柱内,8000rpm离心1min,将提取柱转移至新的2mL收集管内。
洗涤:加入500μLAW1,8000rpm离心1min,将提取柱转移至新的2mL收集管内;加入500μL AW2,14000rpm离心3min,将提取柱转移至新的1.5mL EP管内;
洗脱:加入200μL洗脱液AE,室温放置1min,8000rpm离心1min,收集滤液。可将滤液重新过柱一次以增加DNA产量。
4)浓度测定
本例采用Qubit测DNA浓度,结果显示,提取的DNA量符合后续检测的使用需求。
2.亚硫酸氢盐转化与回收
本例亚硫酸氢盐转化所用试剂盒为EZ DNAMethylation-GoldTMKit,试剂盒编号D5005。具体如下:
1)CT Conversion Reagent的制备:从试剂盒中取出CT Conversion Reagent(固体混合物),然后添加900μL水,50μL的M-Dissolving Buffer和300μL的M-Dilution Buffer到一管的CT Conversion Reagent中,在室温下震荡溶解10分钟。
2)M-WASH BUFFER的制备:添加24mL 100%的乙醇到M-Wash Buffer中,制成最终可以使用的M-Wash Buffer。
3)每次转换的DNA最佳量为200-500ng,在待转换的10ng血浆DNA样本中加入200nglambda DNA,总体积约为20μL并转移到PCR管中。
4)在PCR管中添加130μL的CT Conversion Reagent,通过轻弹试管或移液器操作来混合样品。
5)将样品管放到PCR仪上按以下步骤操作:98℃放置3分钟,64℃放置2.5小时,立刻进行下一步操作或者在4℃下存储备用,4℃下存储最多20小时。
7)添加600μL的M-Binding Buffer到Zymo-Spin ICTMColumn中,并将柱放入试剂盒所提供的Collection Tube中。
8)装填样品到含有M-Binding Buffer的Zymo-Spin ICTMColumn。盖上盖将柱颠倒数次来混合样品。
9)>10,000×g离心30秒,去除流出液。
10)添加200μL的M-Wash Buffer到柱中,>10,000×g离心30秒。
11)添加200μL的M-Desulphonation Buffer到柱中,在室温反应15分钟,反应后,>10,000×g离心30秒。
12)添加200μL的M-Wash Buffer到柱中。>10,000×g离心30秒。再添加200μL的M-Wash Buffer并且>10,000×g离心30秒。
13)直接添加12μL的M-Elution Buffer到柱基质中。将柱放置在1.5mL的EP管中,>10,000×g离心洗脱DNA。即获得亚硫酸氢盐转化的DNA。
3.甲基化PCR检测
采用表2和表3的引物,对阴性参考品和阳性参考品的亚硫酸氢盐转化的DNA进行了检测,表2的引物采用常规的甲基化PCR检测体系和条件,常规甲基化PCR检测体系和条件参考文献:Imran Nawaz et al.,Epigenetics 9:8,1138–1148,2014.,在此不累述。
表3的PAP引物的甲基化PCR检测体系总计10μL,包括:10×extaqBuffer(AMBION)1μL、160mM的(NH4)2SO4 1μL、2.5mM each的dNTPs 0.8μL、100×Na4PPi(SIGMA)0.1μL、10U/μL的KlenTaq-S(SCIENTECHCORP)0.2μL、2.5μM的双脱氧修饰Primer 0.8μL、2.5μM的Primer0.8μL、500mM的Tris-HCl 1μL、50mM的MgCl2 0.7μL、DNA模板和水3.6μL。
其中,双脱氧修饰Primer是指经过末端双脱氧碱基修饰的上游引物或下游引物,本例具体的是NDRG4的甲基化下游引物PAP或ACTB的甲基化上游引物PAP。Primer是指没有经过末端双脱氧碱基修饰的下游引物或上游引物。
表3的PAP引物的甲基化PCR的反应条件为,95℃1min,然后进入45个循环:94℃15s、60℃30s、64℃30s、68℃60s、72℃45s。
表2和表3的引物甲基化PCR反应完成后,采用2%凝胶电泳检测PCR产物。
4.结果
PAP甲基化特异性PCR体系以亚硫酸氢盐转化后的阳性和阴性参考品DNA为模板,以2%凝胶电泳检测PCR产物;结果显示,ACTB管家基因的PAP引物,在阳性参考品和阴性参考品中均有扩增出单一条带,如图3所示;并且,片段大小与预期相符;图3中,第一泳道为100bp ladder marker、第二泳道为阳性参考品、第三泳道为阴性参考品。NDRG4基因的的PAP引物,在阳性参考品中有扩增出单一条带,而在阴性参考品和空白对照中都没有扩增条带,并且片段大小与预期相符,如图4所示;图4中,第一泳道为阳性参考品、第二泳道为阴性参考品、第三和第四泳道为水空白对照、第五泳道为50bp ladder marker,水空白对照是指,以水为模板进行PCR扩增的对照。
另外,采用2100检测NDRG4在阳性参考品中的条带,结果如图5所示,结果显示,2100检测的阳性参考品中NDRG4基因的扩增条带大小的确与预期相符,说明所设计的PAP甲基化特异性引物对能够对甲基化的NDRG4基因进行特异性扩增。
表2所示的引物中,第一组引物至第八组引物的甲基化特异引物在阳性参考品和结直肠癌的阳性样品中都有扩增出单一条带,在阴性参考品中没有扩增条带,而非甲基化特异引物在阴性参考品中有扩增出条带,与预期相符。结果如图6至图11所示,图6为第五组引物对靶标基因SDC2的检测结果,图7为第六组引物对靶标基因TFPI2的检测结果,图8为第八组引物对靶标基因CHFR的检测结果,图6-图8中,第一泳道为100bp ladder marker,第二泳道为甲基化特异引物对阳性参考品的扩增产物,第三泳道为甲基化特异引物对结直肠癌的阳性样品的扩增产物,第四泳道为甲基化特异引物对阴性参考品的扩增产物,第五泳道为非甲基化特异引物对阴性参考品的扩增产物。
图9依序包括SFRP2、ALX4和SEPTIN9三个靶标基因的扩增结果,其中,第一泳道为100bp ladder marker,第二至第五泳道依序为SFRP2靶标基因的甲基化特异引物对阳性参考品的扩增产物、甲基化特异引物对结直肠癌的阳性样品的扩增产物、甲基化特异引物对阴性参考品的扩增产物、非甲基化特异引物对阴性参考品的扩增产物,第六至第九泳道依序为ALX4靶标基因的甲基化特异引物对阳性参考品的扩增产物、甲基化特异引物对结直肠癌的阳性样品的扩增产物、甲基化特异引物对阴性参考品的扩增产物、非甲基化特异引物对阴性参考品的扩增产物,第十至第十三泳道依序为SEPTIN9靶标基因的甲基化特异引物对阳性参考品的扩增产物、甲基化特异引物对结直肠癌的阳性样品的扩增产物、甲基化特异引物对阴性参考品的扩增产物、非甲基化特异引物对阴性参考品的扩增产物。
图10为第七组引物对靶标基因NDRG4的检测结果,由于非甲基化特异引物对阴性参考品的扩增产物与甲基化特异引物对阳性参考品、结直肠癌阳性样品等的扩增产物在不同的凝胶块上进行的电泳,因此图10由两部分组成,其中,A图中,第一泳道为100bp laddermarker,第二泳道为甲基化特异引物对阳性参考品的扩增产物,第三泳道为甲基化特异引物对结直肠癌的阳性样品的扩增产物,第四泳道为甲基化特异引物对阴性参考品的扩增产物,B图中,第一泳道为100bp ladder marker,第二泳道为非甲基化特异引物对阴性参考品的扩增产物。
图11为第三组引物对靶标基因RASSF2的检测结果,由于点样时靶标基因RASSF2的四个扩增产物并非靠近marker,并且是与其它样品一起进行的点样,因此,图11也由两部分组成,其中,A图为截取自RASSF2的四个扩增产物同一电泳凝胶块的100bp ladder marker,B图中,第一泳道为甲基化特异引物对阳性参考品的扩增产物,第二泳道为甲基化特异引物对结直肠癌的阳性样品的扩增产物,第三泳道为甲基化特异引物对阴性参考品的扩增产物,第四泳道为空白对照,第五泳道为非甲基化特异引物对阴性参考品的扩增产物。
第九组引物至第十三组引物的甲基化特异引物在阳性参考品和两个肺癌阳性样品中都有扩增出单一条带,在阴性参考品中没有扩增条带,而非甲基化特异引物在阴性参考品中有扩增出条带,与预期相符。部分结果如图12所示,图12为第九组引物对靶标基因PTGER4的检测结果,由于点样时靶标基因PTGER4的五个扩增产物并非靠近marker,并且是与其它样品一起进行的点样,因此,图12由两部分组成,其中,A图为截取自PTGER4的五个扩增产物同一电泳凝胶块的100bp ladder marker,B图中,第一泳道为甲基化特异引物对阳性参考品的扩增产物,第二泳道为甲基化特异引物对肺腺癌的肺癌阳性样品的扩增产物,第三泳道为甲基化特异引物对肺鳞癌的肺癌阳性样品的扩增产物,第四泳道为甲基化特异引物对阴性参考品的扩增产物,第五泳道为非甲基化特异引物对阴性参考品的扩增产物。
以上试验显示,本例设计的SEPTIN9、ALX4、RASSF2、SFRP2、SDC2、TFPI2、NDRG4、CHFR、PTGER4、TBX5、DUOX1、CSDAP1、MEIS2十三个基因的甲基化检测引物组,能够特异性的对阳性参考品和各自的阳性样品的甲基化进行检测,为基于甲基化检测的结直肠癌和肺癌的早期筛选奠定了基础。
以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换。
SEQUENCE LISTING
<110> 深圳华大基因股份有限公司
广州华大基因医学检验所有限公司
深圳华大临床检验中心
<120> 筛选甲基化PCR检测的目标区域的方法、试剂盒及应用
<130> 17I25318
<160> 54
<170> PatentIn version 3.3
<210> 1
<211> 25
<212> DNA
<213> 人工序列
<400> 1
tattagttat tatgtcggat ttcgc 25
<210> 2
<211> 21
<212> DNA
<213> 人工序列
<400> 2
caaaatcctc tccaacacgt c 21
<210> 3
<211> 28
<212> DNA
<213> 人工序列
<400> 3
gtttattagt tattatgttg gattttgt 28
<210> 4
<211> 22
<212> DNA
<213> 人工序列
<400> 4
acaaaatcct ctccaacaca tc 22
<210> 5
<211> 19
<212> DNA
<213> 人工序列
<400> 5
gatttgcgtt ttttattgc 19
<210> 6
<211> 21
<212> DNA
<213> 人工序列
<400> 6
cgaccgacaa aaaaattata c 21
<210> 7
<211> 22
<212> DNA
<213> 人工序列
<400> 7
tgagatttgt gttttttatt gt 22
<210> 8
<211> 24
<212> DNA
<213> 人工序列
<400> 8
acaaccaaca aaaaaattat acca 24
<210> 9
<211> 25
<212> DNA
<213> 人工序列
<400> 9
gtttagtttg gttggatttg agttc 25
<210> 10
<211> 25
<212> DNA
<213> 人工序列
<400> 10
ccgtaaaatt aaaaaataaa aacgc 25
<210> 11
<211> 24
<212> DNA
<213> 人工序列
<400> 11
ttagtttggt tggatttgag tttg 24
<210> 12
<211> 29
<212> DNA
<213> 人工序列
<400> 12
aaaccataaa attaaaaaat aaaaacacc 29
<210> 13
<211> 19
<212> DNA
<213> 人工序列
<400> 13
cgtcggttgt tagtttttc 19
<210> 14
<211> 19
<212> DNA
<213> 人工序列
<400> 14
ctacaacatc gtaaacgcg 19
<210> 15
<211> 22
<212> DNA
<213> 人工序列
<400> 15
agttgttggt tgttagtttt tt 22
<210> 16
<211> 22
<212> DNA
<213> 人工序列
<400> 16
accctacaac atcataaaca ca 22
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<400> 17
agtcggcgta gttatagcgc 20
<210> 18
<211> 21
<212> DNA
<213> 人工序列
<400> 18
taactcccaa ataaacccga a 21
<210> 19
<211> 28
<212> DNA
<213> 人工序列
<400> 19
tgagtagagt tggtgtagtt atagtgtg 28
<210> 20
<211> 21
<212> DNA
<213> 人工序列
<400> 20
taactcccaa ataaacccaa a 21
<210> 21
<211> 21
<212> DNA
<213> 人工序列
<400> 21
tcgtttggag tagaaagtcg c 21
<210> 22
<211> 24
<212> DNA
<213> 人工序列
<400> 22
cgaaatccat aatacaaaaa atcg 24
<210> 23
<211> 23
<212> DNA
<213> 人工序列
<400> 23
ttgtttggag tagaaagttg tgt 23
<210> 24
<211> 25
<212> DNA
<213> 人工序列
<400> 24
caaaatccat aatacaaaaa atcaa 25
<210> 25
<211> 22
<212> DNA
<213> 人工序列
<400> 25
gtattttagt cgcgtagaag gc 22
<210> 26
<211> 25
<212> DNA
<213> 人工序列
<400> 26
aatttaacga atataaacgc tcgac 25
<210> 27
<211> 25
<212> DNA
<213> 人工序列
<400> 27
ggtattttag ttgtgtagaa ggtgg 25
<210> 28
<211> 26
<212> DNA
<213> 人工序列
<400> 28
aaatttaaca aatataaaca ctcaac 26
<210> 29
<211> 24
<212> DNA
<213> 人工序列
<400> 29
ttttttatga gtgtagatat tggc 24
<210> 30
<211> 21
<212> DNA
<213> 人工序列
<400> 30
aaaataaaaa cgacgaaacg c 21
<210> 31
<211> 25
<212> DNA
<213> 人工序列
<400> 31
gttttttatg agtgtagata ttggt 25
<210> 32
<211> 28
<212> DNA
<213> 人工序列
<400> 32
caaaaaaaaa ataaaaacaa caaaacac 28
<210> 33
<211> 19
<212> DNA
<213> 人工序列
<400> 33
cgttagttta tgcgtcgta 19
<210> 34
<211> 25
<212> DNA
<213> 人工序列
<400> 34
aaataaaata accatctaaa tctcg 25
<210> 35
<211> 26
<212> DNA
<213> 人工序列
<400> 35
tatgtattgt tagtttatgt gttgta 26
<210> 36
<211> 30
<212> DNA
<213> 人工序列
<400> 36
acaataaata aaataaccat ctaaatctca 30
<210> 37
<211> 23
<212> DNA
<213> 人工序列
<400> 37
gaggttttta ttcgatcgtt ttc 23
<210> 38
<211> 21
<212> DNA
<213> 人工序列
<400> 38
ctataccgtc tctactacct t 21
<210> 39
<211> 26
<212> DNA
<213> 人工序列
<400> 39
ggagaggttt ttatttgatt gttttt 26
<210> 40
<211> 26
<212> DNA
<213> 人工序列
<400> 40
caaaactata ccatctctac tacctt 26
<210> 41
<211> 23
<212> DNA
<213> 人工序列
<400> 41
tattttagtt aggtgggatt tgg 23
<210> 42
<211> 25
<212> DNA
<213> 人工序列
<400> 42
gaatatccgc gactaaaaaa taacg 25
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<400> 43
tattttagtt aggtgggatt 20
<210> 44
<211> 26
<212> DNA
<213> 人工序列
<400> 44
aaatatccac aactaaaaaa taaaca 26
<210> 45
<211> 19
<212> DNA
<213> 人工序列
<400> 45
agcgaggagt ttaagaagc 19
<210> 46
<211> 22
<212> DNA
<213> 人工序列
<400> 46
cgacgacaaa aataaaatcg cg 22
<210> 47
<211> 18
<212> DNA
<213> 人工序列
<400> 47
agtgaggagt ttaagaag 18
<210> 48
<211> 22
<212> DNA
<213> 人工序列
<400> 48
acaacaacaa aaataaaatc ac 22
<210> 49
<211> 21
<212> DNA
<213> 人工序列
<400> 49
tttcgtttta aggcgtcgtt g 21
<210> 50
<211> 19
<212> DNA
<213> 人工序列
<400> 50
ccacctaaac cacgaaccg 19
<210> 51
<211> 22
<212> DNA
<213> 人工序列
<400> 51
ttttgtttta aggtgttgtt ga 22
<210> 52
<211> 22
<212> DNA
<213> 人工序列
<400> 52
catatacaaa aaccctcaca ca 22
<210> 53
<211> 25
<212> DNA
<213> 人工序列
<400> 53
tggtgatgga ggaggtttag taagt 25
<210> 54
<211> 27
<212> DNA
<213> 人工序列
<400> 54
aaccaataaa acctactcct cccttaa 27