HOXA7甲基化检测试剂
技术领域
本发明属于基因诊断领域,更具体地,本发明涉及一种基于人HOXA7基因甲基化的肺癌诊断试剂或含有该试剂的试剂盒。
技术背景
肺癌是起源于支气管粘膜、腺体或肺泡上皮的肺部恶性肿瘤。按照病理类型可以分为:1.小细胞肺癌(small cell lung cancer,SCLC):一种特殊病理学类型的肺癌,有明显的远处转移倾向,预后较差,但多数病人对放化疗敏感。2.非小细胞肺癌(non-smallcell lung cancer,NSCLC):除小细胞肺癌以外其他病理学类型的肺癌,包括鳞状细胞癌、腺癌、大细胞癌等。在生物学行为和临床病程方面具有一定差异。按照发生位置又可以分为:1.中心型肺癌(central lung cancer):生长在肺段支气管开口及以上的肺癌。2.周围型肺癌(peripheral lung cancer):生长在肺段支气管开口以远的肺癌。
近年来,人口老龄化、大气污染及吸烟等因素的影响,致使中国肺癌的发病率和死亡率逐年递增,根据国家癌症中心发布的《2017中国肿瘤登记年报》显示,全国每分钟约7人确诊患癌,其中肺癌发病率与死亡率均为第一位。中国已成为世界上肺癌人数最多的国家,专家预测到2025年中国肺癌的人数将达到100万。而根据流行病学研究显示:吸烟是引起肺癌的重要因素。世界上约80%-90%的肺癌可归因于吸烟。与非吸烟者相比,45-64岁每日吸香烟1-19支和20支以上者患肺癌的相对危险度分别为4.27和8.61,与从不吸烟者比较,长期每日吸烟1-19支和20支以上者死于肺癌的相对危险度分别为6.14和10.73。虽然肺癌的治疗技术日新月异,但5年生存率从4%仅上升至12%左右,现有的抗肿瘤药物仍只能起到缓解病情作用,患者无进展生存期平均仅延长3个月~5个月,但对于Ⅰ期肺癌患者,手术后5年生存率高达约60%~70%。因此肺癌的早期诊断与早期手术是提高肺癌5年生存率、降低死亡率最有效的方法之一。
肺癌目前的临床辅助诊断主要有以下几种,但是他们都不能完全做到早发现,早诊断:
1.血液生化检查:对于原发性肺癌,目前无特异性血液生化检查。肺癌病人血液碱性磷酸酶或血钙升高考虑骨转移的可能,血液碱性磷酸酶、谷草转氨酶、乳酸脱氢酶或胆红素升高考虑肝转移的可能。
2.肿瘤标志物检查:(1)CEA:30%~70%肺癌患者血清中有异常高水平的CEA,但主要见于较晚期肺癌患者。目前血清中CEA的检查主要用于估计肺癌预后以及对治疗过程的监控。(2)NSE:是小细胞肺癌首选标志物,用于小细胞肺癌的诊断和监测治疗反应,根据检测方法和使用试剂的不同,参考值不同。3)CYFRA21-1:是非小细胞肺癌的首选标记物,对肺鳞癌诊断的敏感性可达60%,根据检测方法和使用试剂的不同,参考值不同。
3.影像学检查:(1)胸部X线检查:应包括胸部正位和侧位片。在基层医院,胸部正侧位片仍是肺癌初诊时最基本和首选的影像诊断方法。一旦诊断或疑诊肺癌,即行胸部CT检查。(2)CT检查:胸部CT是肺癌的最常用和最重要的检查方法,用于肺癌的诊断与鉴别诊断、分期及治疗后随诊。有条件的医院在肺癌病人行胸部CT扫描时范围应包括肾上腺。应尽量采用增强扫描,尤其是肺中心型病变的患者。CT是显示脑转移瘤的基本检查方法,有临床症状者或进展期病人应行脑CT扫描,并尽可能采用增强扫描。CT引导下肺穿刺活检是肺癌的重要诊断技术,有条件的医院可将其用于难以定性的肺内病变的诊断,以及临床诊断肺癌需经细胞学、组织学证实而其它方法又难以取材的病例。(3)超声检查:主要用于发现腹部重要器官及腹腔、腹膜后淋巴结有无转移,也用于颈部淋巴结的检查。对于贴邻胸壁的肺内病变或胸壁病变,可鉴别其囊实性及进行超声引导下穿刺活检;超声还常用于胸水抽取定位。(4)骨扫描:对肺癌骨转移检出的敏感性较高,但有一定的假阳性率。可用于以下情况:肺癌的术前检查;伴有局部症状的病人。
4.其它检查:(1)痰细胞学检查:目前肺癌简单方便的无创诊断方法,连续涂片检查可提高阳性率约达60%,是可疑肺癌病例的常规诊断方法。(2)纤维支气管镜检查:肺癌诊断中最重要的手段之一,对于肺癌的定性定位诊断和手术方案的选择有重要的作用。对拟行手术治疗的患者为必需的常规检查项目。而经支气管镜穿刺活检检查(TBNA),虽利于治疗前分期,但因技术难度和风险较大,有需要者应转上级医院进一步检查。(3)其他:如经皮肺穿刺活检、胸腔镜活检、纵隔镜活检、胸水细胞学检查等,在有适应证的情况下,可根据现有条件分别采用以协助诊断。
影像学检查中的多层螺旋CT和低剂量CT(LDCT)是发现早期肺癌和降低死亡率的有效筛查工具,全美国家肺癌筛查研究(NLST)已经表明LDCT相比胸部X线筛查可降低20%肺癌的死亡率。在临床实践工作中证明,任何肺癌筛查项目的成败取决于高危人群的识别,融合多重高危因素的风险预测模型已被世界公认是识别肺癌高危人群的方法之一。风险模型通过协助临床医生改进干预措施或治疗手段,从而进一步改善肺癌患者的疗效。虽然世界已经认同针对高危人群的筛查能够降低肺癌目前较高的死亡率,但高危人群界定仍然是难以解决的问题。为了使肺癌筛查的效益-伤害比达到最大化,关键的问题第一是如何界定高危患病风险的人群;第二是用什么方法对该人群进行筛查,包括高危因素的界定,总体风险的量化汇总以及筛查效益界值的选择。
随着技术的飞速发展,肿瘤标志物检测成为继影像学诊断,病理诊断之后的肿瘤诊断治疗新领域,能够对肿瘤的诊断,检测,治疗产生重大的影响。肿瘤标志物可以在体液或者是组织中检测到,能够反映肿瘤的存在,分化程度,预后估计和个性化用药以及治疗效果等。早期肺癌患者没有明显的症状,难以被医生和患者察觉,再加之其在血液或生化项目上没有明显的特异性的标识物,因此难以通过常规的诊断方法进行早期发现和早期诊断,因此对肺癌早期诊断,尤其是大规模应用人群筛查上较为困难。
越来越多的研究表明,在肿瘤形成过程中包含两大类机制。一个是通过DNA核苷酸序列改变而形成突变,即遗传学机制。肿瘤作为一种遗传学疾病在分子生物学领域已经得到证实。另外一个就是表观遗传学(epigenetics)机制,即不依赖DNA序列改变导致基因表达水平的变化,它在肿瘤形成过程中的作用越来越受到重视。遗传学与表观遗传学两种机制相互交叉存在,共同促进了肿瘤的形成。基因的异常甲基化在肿瘤发生的早期就可出现,并且在肿瘤逐步发展的过程中,基因异常甲基化的程度增加。对常见的98种人类原发肿瘤的基因组进行分析,发现每种肿瘤至少有600个异常甲基化的CpG岛。
许多研究显示启动子异常甲基化在许多肿瘤的发生过程中是一个频发的早期事件,因此肿瘤相关基因的甲基化状态是肿瘤发生的一个早期敏感指标,被认为是一种有前景的肿瘤分子生物标志物(biomarker)。更为重要的是,癌变细胞可以释放DNA到外周血中。正常人外周血中都存在纳克级的游离DNA。研究发现外周血血浆/血清、肿瘤累及器官相关的体液(如唾液、痰等)中同样可以检测到肿瘤组织中存在的肿瘤相关基因的启动子异常甲基化。这些生物样品比较容易获得,并且通过PCR技术将其中的DNA进行大量的扩增后能够很灵敏的检测到,因此检测其中某些肿瘤相关基因的启动子区甲基化状态,可以为肿瘤的早期诊断提供非常有价值的信息。与其它类型的肿瘤分子标记物相比,检测启动子异常甲基化有更多的优点。某一基因在不同类型肿瘤中,其启动子异常甲基化的区域是相同的,检测比较方便;另外与等位基因缺失这样的标志物相比,异常甲基化是一个阳性信号,很容易与正常组织中的阴性背景区分。Esteller等检测了22例非小细胞肺癌(NSCLC)的肿瘤组织和血清中p16、DAPK、GSTP1及MGM T等基因的启动子区异常甲基化状态,发现68%(15/22)的肿瘤组织中存在至少一种基因的启动子甲基化;而在15例组织阳性病例中,有11例同时在血清中也检测到了启动子异常甲基化的存在。另有许多研究者也分别从肝癌、头颈部癌、食管癌及结肠癌患者的肿瘤组织和血清中同时检测出了某些肿瘤相关基因的启动子甲基化。
现有的肺癌检测技术中主要存在灵敏度低、假阳性高,有创,并且,目前常规检测技术难以检出早期肺癌。
而肺癌的无创检测,例如,痰液检测,难度则更大。尽管也有研究者研究肺癌患者痰液中的肿瘤标志物,然而,对比起其他肿瘤患者血液样本的肿瘤标志物检测及评估,痰液样本的成功率却很低。这是因为①痰液的成分比较复杂,不同的人群在不同的疾病或者环境下痰液的成分和粘度等差异比较大;②痰液中含有较多的气管上皮细胞和细菌,口腔黏膜细胞等非肺癌细胞的成分,一般的样本处理方法无法有效的富集到数目充足的肺癌来源的DNA;③有很多的吸烟患者并不表现出咳痰。A J Hubers等人在《Molecular sputumanalysis for the diagnosis of lung cancer》中对过去10篇文献研究显示,肺癌组织中标志物的中位数的甲基化程度为48%,而痰液的中位数的甲基化程度为38%,结果显示甲基化标志物在组织中的检出率明显高于痰液。同时,Rosalia Cirincione(Methylationprofile in tumor and sputum samples of lung cancer patientsdetected by spiralcomputed tomography:A nested case–contro)报道了RARbeta2、P16、RASSF1A在肺癌组织中检出率分别达到65.5%、41.4%、51.7%,而在痰液中分别只有44.4%、5%、5%。
目前肺癌的漏检率较高。特别是,对于腺癌这种类型,痰液无创检测更加是难上加难,检出率极其低。这是因为,多数腺癌起源于较小的支气管,为周围型肺癌,肺深部的脱落细胞更加难以通过痰液咳出。因此,目前腺癌的痰液检测手段几乎为零。
尽管现有技术中已经发现了一些肺癌相关的肿瘤标志物,但是,受限于针对这些肿瘤标志物的检测试剂或者检测手段,导致这些肿瘤标志物的灵敏度和特异性不能满足需求,因此,目前本领域中仍然需要进一步研究能够切实地应用于肺癌的筛查手段。然而,虽然无创式的筛查具有取样方面独到的优势,然而,其也具有其他方面的一些局限,例如,肺癌中的腺癌这种类型,由于其肺深部的脱落细胞难以通过痰液咳出,通常说来,本领域技术人员会认为该种类型的肺癌不适宜采用无创筛查。另一方面,即使是其他类型的肺癌,目前已报道的无创筛查方法也很难达到临床使用的要求。尽管相关研究已进展多年,但至今仍未有可以推向临床的肺癌无创筛查方法。
发明内容
本发明的目的在于提供一种HOXA7基因的核酸片段在制备肺癌诊断中的应用。
本发明的另一个目的在于提供一种引物,及其在制备肺癌诊断试剂或试剂盒中的应用。
本发明的另一个目的在于提供一种探针,及其在制备肺癌诊断试剂或试剂盒中的应用。
本发明的另一个目的还在于提供一种诊断人HOXA7基因甲基化的试剂、试剂盒和方法。
本发明的另一个目的还在于提供一种特异性强、敏感度高的肺癌诊断试剂和试剂盒。
本发明的进一步目的在于提供一种针对的肺腺癌具有高敏感性和特异性的肺癌诊断试剂和试剂盒。
本发明的另一个目的还在于提供一种对肺癌应用范围广的肺癌诊断试剂和试剂盒。
本发明的另一个目的还在于提供一种无创的肺癌诊断试剂和试剂盒。
本发明的上述目的通过以下技术手段实现:
发明人经过深入的研究,提供了一种HOXA7基因甲基化的检测试剂。发明人不仅在组织样本中验证了该检测试剂对肺癌的检出具有较高的特异性和灵敏性,同时验证了在痰液样本和灌洗液样本中具有同样高的特异性和灵敏性。
HOXA7基因是HOX(homebox同源盒)基因家族的一员,属于染色体7p15-p14上的HOXA簇基因,与其他的HOX基因一样,均含有一段180bp的DNA片段,转录由60个氨基酸组成的同源结构域。HOXA7在正常造血细胞的增殖分化中发挥调节作用,目前研究比较多的是HOXA7的异常表达在白血病的发生和发展中起着重要的作用,也有部分报道HOXA7基因的甲基化与肺癌相关。
本发明的第一方面提供了一种核酸片段在制备肺癌诊断试剂或试剂盒中的应用;其中,所述的核酸片段来源于HOXA7基因。具体地,所述的核酸片段选自SEQ ID NO:22或SEQID NO:24所示的序列;作为优选的实施方式,所述的核酸片段选自SEQ ID NO:24所示的序列。
另一方面,本发明还提供了一种引物,所述的引物对SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:43、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:52、SEQ IDNO:53中的任意一条所示;作为本发明中优选的实施方式,所述的引物选自SEQ ID NO:1和SEQ ID NO:2所示的引物对。
另一方面,本发明还提供了一种探针,所述的探针选自SEQ ID NO:3、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ IDNO:48、SEQ ID NO:51、SEQ ID NO:54中任意一条所示。作为本发明中优选的实施方式,所述的核酸探针选自SEQ ID NO:3。
另一方面,本发明还提供了上述的引物或核酸探针在制备肺癌的诊断试剂或试剂盒中的应用。
另一方面,本发明还提供了一种肺癌的诊断试剂,所述的试剂含有HOXA7基因甲基化的检测试剂。
其中,所述的HOXA7基因甲基化的检测试剂检测HOXA7基因经转化试剂修饰后的序列。其中,转化试剂是指使DNA中胞嘧啶脱氨基成为尿嘧啶,同时使5-MeC基本上不受影响的试剂。示例性的转化试剂包括肼盐、重亚硫酸氢盐(例如重亚硫酸氢钠等)、亚硫酸氢盐(例如偏亚硫酸氢钠、亚硫酸氢钾、亚硫酸氢铯、亚硫酸氢铵等)、或在适当的反应条件下可产生肼盐、重亚硫酸盐、亚硫酸氢盐的化合物中的一种或几种。作为一种示范性的实施方式,所述的HOXA7基因甲基化的检测试剂检测经重亚硫酸盐修饰后的序列。
甲基化的发生是胞嘧啶上多了一个甲基,经过经亚硫酸氢盐或重亚硫酸氢盐或肼盐处理后,胞嘧啶会变成脲嘧啶,因为在进行PCR扩增时尿嘧啶与胸腺嘧啶相似而会被识别为胸腺嘧啶,体现在PCR扩增序列上就是没有发生甲基化的胞嘧啶变成了胸腺嘧啶(C变成T),甲基化的胞嘧啶(C)则不会发生变化。PCR检测甲基化基因的技术通常为甲基化特异性PCR(Methylmion Specific PCR,MSP),针对处理后的甲基化片段(即片段中未改变的C)设计引物,进行PCR扩增,如果有扩增则说明发生了甲基化,无扩增则没有甲基化。
作为可选的实施方式,所述试剂的检测区域为HOXA7基因的CG富集区域或非CG富集区域或CTCF(CTCF-binding sites)区域。作为优选的实施方式,所述试剂的检测区域为HOXA7基因的CG富集区域或CTCF(CTCF-binding sites)区域。
或者所述试剂针对的检测区域为HOXA7基因的基因体(gene body)或其启动子区域。
作为本发明中优选的实施方式,所述的试剂针对检测区域含有SEQ ID NO:22(区域1)或SEQ ID NO:24(区域2)所示的序列。作为更优选的实施方式,所述的试剂针对检测区域含有SEQ ID NO:24所示的序列。
发明人经实验发现,HOXA7基因检测区域的选择,会对肿瘤的检测效能产生影响,根据HOXA7基因高甲基化区域设计的引物,不同区域设计的引物对检测结果有明显的差异,好的区域对肿瘤的检出率比差的区域高出50%~60%。发明人经过实验比较发现,对GC富集区域或CTCF(CTCF-binding sites)区域的检测结果要明显较非高甲基化区域好。
本发明的诊断试剂,含有扩增引物。作为可选的实施方式,所述的引物选自SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:50、SEQIDNO:52、SEQ ID NO:53中的至少任意一条。作为优选的实施方式,所述的引物选自如SEQ IDNO:1和SEQ ID NO:2所示引物对。
所述的引物用于扩增HOXA7基因的特定区域。本领域公知,引物的成功设计对于PCR是至关重要。相对于一般的PCR,在基因的甲基化检测中,引物的设计影响更为关键,这是由于甲硫化反应促使DNA链中的“C”转化为“U”,导致GC含量降低,使PCR反应后在序列中出现长的连续“T”,容易引起DNA链的断裂,导致很难选择具有合适的Tm值及稳定的引物;另一方面,为了区别硫化处理和没有硫化处理以及未完全处理的DNA,需要引物有足够数量的“C”,这些都增加了选择稳定引物的困难。因此,DNA甲基化检测中,引物所针对的扩增片段的选择,如扩增片段长短和位置,以及引物的选择等等都对检测的灵敏度和特异性产生影响。发明人经实验也发现,不同的扩增目的片段和引物对检测效果有所区别。很多时候,发现了某些基因或核酸片段在肿瘤和非肿瘤中具有表达差异,然而其距离转化为肿瘤的标志物,应用到临床中,仍存在很长的距离。其中最主要的原因是因为检测试剂的限制,导致该潜在肿瘤标志物的检测灵敏度和特异性难以满足检测需求,或者检测方法操作复杂、成本高,难以在临床中大规模应用。
本发明的诊断试剂,还含有探针。作为可选的实施方式,所述的探针选自SEQ IDNO:3、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ IDNO:45、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54中的任意一条。作为优选的实施方式,所述的探针选自SEQ ID NO:3。作为本发明的优选方式,为方便临床使用,检测探针标记的荧光基团可以是VIC、ROX、FAM、Cy5、HEX、TET、JOE、NED、Texas Red等;淬灭基团可以是TAMRA、BHQ、MGB、Dabcyl等等,以适用于目前临床检测常用的多通道PCR检测系统,实现在一个反应管中进行多色荧光检测。
作为一种更优选的实施方式,本发明的诊断试剂含有SEQ ID NO:1和SEQ ID NO:2所示引物对以及如SEQ ID NO:3所示的探针。
作为可选的实施方式,本发明的试剂还含有亚硫酸氢盐、重亚硫酸氢盐或肼盐,用于将甲基化的胞嘧啶修饰成胸腺嘧啶。当然,也可以不包含在本发明的试剂中,在使用时独立购买即可。
作为可选的实施方式,本发明的试剂还含有DNA聚合酶、dNTPs、Mg2+离子、缓冲液中的一种或几种;优选地,含有DNA聚合酶、dNTPs、Mg2+离子和缓冲液,用于对HOXA7基因进行扩增反应。
作为可选的实施方式,本发明的试剂还含有内参基因的检测试剂。
优选地,所述的内参基因为β-actin或COL2A1,除了这两个内参基因,也可以采用现有技术的其他的甲基化检测的内参基因。进一步的,所述的内参基因的检测试剂含有针对内参基因的引物和探针。作为优选的实施方式,所述的内参基因β-actin的检测试剂含有SEQ ID NO:16、SEQ ID NO:17所示的引物对,以及SEQ ID NO:18的探针。所述的内参基因COL2A1的检测试剂含有SEQ ID NO:55(TTTTGGATTTAAGGGGAAGATAAA)和SEQ ID NO:56(TTTTTCCTTCTCTACATCTTTCTACCT)所示的引物对,以及SEQ ID NO:57(AAGGGAAATTGAGAAATGAGAGAAGGGA)所示的探针。
本发明另一方面提供了含有上述引物、探针、肺癌诊断试剂的试剂盒。
作为一种可选的实施方式,本发明的试剂盒包括:划分成其内接收试剂的一个或多个容器。优选地,包括第一容器,其包含敏感地转化未甲基化的胞嘧啶的转化试剂;第二容器,其包含用于扩增的引物物;第三容器,其包含探针。
本发明另一方面提供了一种检测HOXA7基因的DNA甲基化的方法,其包括以下步骤:
(1)将待测样品进行亚硫酸氢盐或重亚硫酸氢盐或肼盐处理,获得经修饰的待测样品;
(2)利用上述的试剂或试剂盒对步骤(1)经修饰的待测样品进行HOXA7基因甲基化情况检测。
作为可选的方式,采用甲基化特异性聚合酶链反应(MSP)或实时荧光定量甲基化特异性聚合酶链反应(real-time fluorescent quantitative methylation-specificPCR,qMSP)进行检测。其余现有技术中报道的DNA甲基化检测方法也可以应用于本发明中。现有技术的甲基化检测方法通过专利USSN62/175,916引入本发明。
本发明另一方面还提供了一种肺癌的诊断系统,其特征在于,所述的系统含有:
c.HOXA7基因的DNA甲基化检测构件,以及,
d.结果判断构件。
优选地,所述的HOXA7基因的DNA甲基化检测构件含有上述试剂或试剂盒;
优选地,所述的结果判断构件用于根据检测构件检测的HOXA7基因的DNA甲基化结果,输出肺癌的患病风险和/或肺癌类型;
作为优选的实施方式,所述的患病风险是根据通过结果判断构件比较待测样本与正常样本的甲基化结果,当待测样本与正常样本的甲基化具有显著差异或极显著差异时,结果判断构件输出待测样本患病风险高。
本发明中,所述的试剂/试剂盒/方法的检测样本选自痰液、肺部灌洗液、肺部组织、胸水,血液、血清、血浆、尿液、前列腺液、泪液或粪便等等。作为优选的实施方式,所述的诊断/检测试剂的检测样本选自痰液、组织或肺部灌洗液。作为更优选的实施方式,所述的诊断/检测试剂的检测样本选自痰液。
HOXA7基因在组织中的甲基化水平与肺癌的发病关联度很高。185例组织中,HOXA7基因正常组和全部肺癌组比较,其特异性高达95%,而灵敏度为63.3%,虽然灵敏度较本发明实验中另外一个肿瘤标志物SHOX2基因低,而让人意外的发现是,HOXA7基因在痰液以及肺部灌洗液中所检出的甲基化水平与肺癌的发病也保持了极高的关联度,在痰液中,敏感性为88.6%,特异性95%,在肺部灌洗液中,敏感性为76.2%,特异性95%,敏感性甚至高于组织中,这在分子标记物中是极少见的,甚至是绝无仅有的。
在发明人研究的多种分子标记物中,无一不是痰液样本的检测敏感性或特异性对比组织样本大幅下降。例如,SHOX2、PCDHGA12、HOXD8、GATA3这几个被报道跟肺癌有关的基因,其中,SHOX2在组织中的检测敏感性为80.6%,高于HOXA7基因的灵敏度,而在痰液中则敏感度降低到62.9%,显著低于HOXA7基因的88.6%(注,正常组和全部癌症组比较)。在肺部灌洗液中,SHOX2基因的灵敏度更下降至52.4%,严重影响肺癌的诊断,而HOXA7的灵敏度则提升至76.2%。
研究发现,多种肺癌标记物仅在组织中显示出良好的检测敏感性和特异性;而在痰液和肺部灌洗液样本中,无论如何设计和优化检测区域、检测引物、探针等,敏感性仍大幅下降,严重影响了肺癌的诊断。
而HOXA7基因在痰液和肺部灌洗液样本中的灵敏度不降反升,且保持高达95%的特异性,这使得这种基因极其特别地可以作为痰液和肺部灌洗液样本中可靠的肺癌标记物。其中,原因之一是本发明针对了HOXA7的检测区域、引物、探针等进行了精益求精的优化。
本发明中,所述的肺癌选自小细胞肺癌(small cell lung cancer,SCLC)和非小细胞肺癌(non-small cell lung cancer,NSCLC);进一步地,所述的非小细胞肺癌选自鳞状细胞癌、腺癌或大细胞癌。作为优选的实施方式,所述的肺癌选自腺癌。
经实验证实,本发明的试剂/试剂盒,在多种不同类型肺癌中,均具有很高的特异性以及较高的灵敏度,即便是在肺腺癌中,也具有比其他肿瘤标志物高的灵敏度。目前,肺腺癌的漏检率较高。一方面,由于肺腺癌较容易发生于女性及不抽烟者,发病率比鳞癌和未分化癌低,发病年龄较小,女性相对多见;另一方面,多数腺癌起源于较小的支气管,为周围型肺癌,肺深部的脱落细胞更加难以通过痰液咳出;再一方面,肺腺癌早期一般没有明显的临床症状。因此,对肺腺癌的检测更具困难性和价值性。
发明人经实验发现,在痰液中,本发明的试剂/试剂盒对腺癌的检测灵敏度达到了88.9%,相比于SHOX2(腺癌灵敏度33.3%)有突破性的提升,在肺部灌洗液中,HOXA7对腺癌的检测灵敏度已经达到了72.7%,相比SHOX2(腺癌灵敏度36.4%)也有了大幅度的提升,且非显而易见地,均高于在组织中灵敏度。因此,对于腺癌来说,优选的检测样本为痰液,即便是以肺部灌洗液作为检测样本,其也具有相对比其他标志物更为突出的灵敏度,有利于及时发现患者异常,进一步结合其他检测手段确诊是否为腺癌。因此,本发明的HOXA7甲基化检测试剂/试剂盒对于腺癌的检测来说具有极大的应用意义。
本发明的有益效果:
1.本发明所提供的肺癌诊断试剂/试剂盒不仅可以以组织作为检测样本,且突出的,其在痰液和肺部灌洗液中具有更高的灵敏度,可以简便地以痰液和肺部灌洗液作为检测样本,对肺癌进行可靠的诊断。痰液样品获得非常容易,而且不会对病人造成任何的痛苦和不便。使用样本量极少,取样过程非常方便且对病人无任何影响。同时样品便于邮寄或者是随身带到医院做检查。
2.本发明的肺癌诊断试剂/试剂盒可以检测多种类型的肺癌,且针对难检测的腺癌,其也具有相对其他标志物更高的灵敏度。
3.本发明的肺癌诊断试剂/试剂盒无需考虑检测的对象和年龄,适用范围广。
4.本发明所提供的试剂/试剂盒是通过甲基化水平来检测和诊断癌症,越来越多的研究证实甲基化改变是肿瘤发生过程中的早期事件,检测甲基化异常更易发现早期病变。
附图说明
图1 HOXA7、SHOX2、PCDHGA12、HOXD8、GATA3在组织标本中检测的ROC曲线;
图2 HOXA7、SHOX2、PCDHGA12、HOXD8、GATA3在痰液标本中检测的ROC曲线;
图3 HOXA7与SHOX2_n3在痰液标本中检测的ROC曲线;
图4 HOXA7与SHOX2_n3在痰液标本中的扩增曲线(A为HOXA7的扩增图,B为SHOX2_n3的扩增图;
图5 HOXA7与SHOX2_n3在所有灌洗液标本中检测的ROC曲线;
图6 HOXA7与SHOX2_n3在灌洗液标本中的扩增曲线(A为HOXA7的扩增图,B为SHOX2_n3的扩增图)。
具体实施方式
本发明的待测样本包括:肺泡灌洗液,取自病变部位的组织,胸水,痰液,血液,血清,血浆,尿液,前列腺液,粪便,唾液,泪等。
本发明中的“引物”或“探针”是指一种寡核苷酸,其包含与靶核酸分子(例如靶基因)的至少6个连续核苷酸的序列互补的区域。在一些实施方案中,引物或探针包含与靶分子的至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19或至少20个连续或不连续的分块核苷酸的序列互补的区域。当引物或探针包含与靶分子的至少x个连续核苷酸互补的区域时,所述引物或探针与靶分子的至少x个连续核苷酸至少95%互补。在一些实施方案中,引物或探针与靶分子至少96%、至少97%、至少98%、至少99%或100%互补。
本发明中的“诊断”,除了肺癌的早期诊断,还包括肺癌中期和晚期的诊断,且也包括肺癌筛选、风险评估、预后、疾病识别、病症阶段的诊断和治疗性靶标的选择。
肺癌标志物HOXA7的应用使得肺癌的早期诊断成为可能。当确定在癌症细胞中甲基化的基因在临床上或形态学上正常表象的细胞中甲基化时,这就表明该正常表象的细胞向癌症发展。这样,肺癌可在早期通过在正常表象的细胞中的肺癌特异性基因HOXA7的甲基化而诊断。
其中,早期诊断指的是在转移之前发现癌症的可能性,优选在可观察到组织或者细胞的形态学变化之前。
除了肺癌的早期诊断,本发明的试剂/试剂盒还有希望用于肺癌筛选、风险评估、预后诊断、疾病识别、病症阶段的诊断和治疗性靶标的选择。
作为病症阶段可选的实施方式,可通过在肺癌在不同阶段或时期的进展可通过从样品中获取的HOXA7的甲基化程度的测量进行诊断。通过比较从肺癌的每个阶段的样品中分离出的核酸的HOXA7基因甲基化程度与从没有细胞增殖性异常的肺部组织中的样品中分离出的一个或多个核酸的HOXA7基因甲基化程度,可检测样品中肺癌的具体阶段。
以下通过具体的实施例进一步说明本发明的技术方案,具体实施例不代表对本发明保护范围的限制。其他人根据本发明理念所做出的一些非本质的修改和调整仍属于本发明的保护范围。
实施例1:检测靶基因的选择
甲基化DNA作为检测靶标具有明显的优点,相比蛋白质类标志物,DNA是可以扩增的,并且很容易检测到;与突变类标志物相比,DNA发生甲基化的部位都位于基因的特定部位,一般在启动子区,使检测变得更容易和方便。为了完成本发明,发明人筛选了数百个基因,并从中选择出较好的HOXA7、SHOX2、PCDHGA12、HOXD8、GATA3作为候选的检测基因,β-actin基因作为内参基因,研究各个基因甲基化位点分布情况,设计检测的引物探针分别用于实时荧光定量甲基化特异性聚合酶链反应(real-time fluorescent quantitativemethylation-specific PCR,qMSP)检测。各基因检测引物探针如下:
HOXA7的检测引物和探针为:
HOXA7的检测引物和探针为:
SEQ ID NO:1 HOXA7-F2引物F:TAAAGGCGTTTGCGATAAGAC
SEQ ID NO:2 HOXA7-R2引物R:TAACCCGCCTAACGACTACG
SEQ ID NO:3 HOXA7-P2探针:FAM-AGGGCGCGTTGTATGGCGC-BQ1
SHOX2的检测引物和探针为:
SEQ ID NO:4 SHOX2引物F:TTTAAAGGGTTCGTCGTTTAAGTC
SEQ ID NO:5 SHOX2引物R:AAACGATTACTTTCGCCCG
SEQ ID NO:6 SHOX2探针:
FAM-TTAGAAGGTAGGAGGCGGAAAATTAG-BQ1
PCDHGA12的检测引物和探针为:
SEQ ID NO:7 PCDHGA12引物F:TTGGTTTTTACGGTTTTCGAC
SEQ ID NO:8 PCDHGA12引物R:AAATTCTCCGAAACGCTCG
SEQ ID NO:9 PCDHGA12探针:
FAM-ATTCGGTGCGTATAGGTATCGCGC-BQ1
HOXD8的检测引物和探针为:
SEQ ID NO:10 HOXD8引物F:TTAGTTTCGGCGCGTAGC
SEQ ID NO:11 HOXD8引物R:CCTAAAACCGACGCGATCTA
SEQ ID NO:12 HOXD8探针:
FAM-AAAACTTACGATCGTCTACCCTCCG-BQ1
GATA3的检测引物和探针为:
SEQ ID NO:13 GATA3引物F:TTTCGGTAGCGGGTATTGC
SEQ ID NO:14 GATA3引物R:AAAATAACGACGAACCAACCG
SEQ ID NO:15 GATA3探针:
FAM-CGCGTTTATGTAGGAGTGGTTGAGGTTC-BQ1
β-actin的检测引物和探针为:
SEQ ID NO:16 β-actin引物F:TTTTGGATTGTGAATTTGTG
SEQ ID NO:17 β-actin引物R:AAAACCTACTCCTCCCTTAAA
SEQ ID NO:18 β-actin探针:FAM-TTGTGTGTTGGGTGGTGGTT-BQ1实验过程:
1、提取DNA
收集确诊肺癌患者的标本和非肺癌患者的标本,分别包括石蜡组织标本、痰液标本、灌洗液标本。样品经过预处理及分离细胞后,按美基生物公司试剂盒HiPure FFPE DNAKit(D3126-03)说明书进行DNA提取。
2、DNA修饰
以ZYMO RESEARCH生物公司试剂盒EZ DNA MethylationTM KIT(D5002)说明进行重亚硫酸氢盐修饰。
3、扩增与检测
表1 配液体系
扩增体系:
表2PCR反应过程
4、检测结果
4.1、石蜡组织中的检测结果
样本信息:肺组织样本共计185例,其中正常组织样本87例,癌组织样本98例,98例癌症组样本中有鳞癌15例,腺癌81例,未明确分类的肺癌2例,其中癌和癌旁对照样本73对。
HOXA7、SHOX2、PCDHGA12、HOXD8、GATA3在所有组织标本中检测的ROC曲线图1所示。各基因在组织中检测的统计结果表3所示。
表3 组织中的检测结果
从以上结果可以看出,在组织样本中,无论是将肺癌作为一个整体进行比较分析,还是按照肺癌的亚型进行比较分析,SHOX2的检测效果最好,HOXA7、PCDHGA12和GATA3的检测效果次之,HOXD8的检测效果最差,只达到40.8%。
根据以上结果,为了研究痰液中的不同基因的检测情况,发明人对HOXA7、SHOX2、PCDHGA12、HOXD8和GATA3这5个标志物在痰液中进行进一步的筛选,因为痰液作为无创性的检测样本,更具重要意义。
实施例2:HOXA7、SHOX2、PCDHGA12、HOXD8和GATA3基因在痰液中的检测
样本信息:测试痰液样本共计90例,其中正常对照组样本55例,癌症组对照样本35例,35例癌症组样本中有鳞癌12例,小细胞癌6例,腺癌9例,大细胞癌2例,未明确分类的肺癌6例。
试验过程:
a.收集确诊为肺癌患者和非肺癌患者的痰液标本,使用DTT解稠后,离心取沉淀分离细胞,使用PBS洗涤2遍,然后使用美基生物公司(Magen)的DNA提取试剂盒(HiPure FFPEDNA Kit,D3126-03)提取DNA。
b.使用ZYMO RESEARCH生物公司的DNA转化试剂盒(EZ DNA Methylation Kit,D5002)进行DNA的重亚硫酸氢盐修饰。
c.配液体系如下:
表4 配液体系
d.扩增体系如下:
表5 扩增体系
e.检测结果如下:
表6 痰液中的检测结果
f.HOXA7、SHOX2、PCDHGA12、HOXD8、GATA3在痰液标本中检测的ROC曲线见图2,统计结果见表6,从以上结果可以看出,在痰液样本中,同时检测这5个基因进行比较,无论是将肺癌作为一个整体进行比较分析,还是按照肺癌的亚型进行比较分析,HOXA7的检测效果都要优于其他4个基因的检测效果。特别是对腺癌的检测效果,HOXA7的检出率为88.9%,而其他基因的检出率最高仅为33.3%,HOXA7的检出率远高于其他基因。腺癌一般为周围型,由于支气管的树状生理结构,肺深部的脱落细胞更加难以通过痰液咳出,因此对这部分的检测更加困难和有意义。
实施例3:HOXA7以及SHOX2基因在痰液中的检测
大量文献显示SHOX2可用作检测肺癌的标志物,并且有专利显示[CN201510203539-诊断人SHOX2基因和人RASSF1A基因甲基化的方法和试剂盒-申请公开],SHOX2在肺泡灌洗液、病变部位组织、胸水、痰液等样本中具有较高的检出率。为了验证HOXA7的检测效果,本发明人同时检测HOXA7与SHOX2基因的检出效率,在该实施例中,SHOX2基因的检出效率采用专利CN201510203539中公开的引物和探针序列,并将SHOX2基因表述为SHOX2_n3,以区别于本发明实施例1和2中采用自行设计的引物和探针检测的SHOX2基因。
各基因检测引物探针如下:
HOXA7的检测引物和探针为:
SEQ ID NO:1 HOXA7-F2引物F:TAAAGGCGTTTGCGATAAGAC
SEQ ID NO:2 HOXA7-R2引物R:TAACCCGCCTAACGACTACG
SEQ ID NO:3 HOXA7-P2探针:FAM-AGGGCGCGTTGTATGGCGC-BQ1
SHOX2_n3的检测引物和探针为:
SEQ ID NO:19 SHOX2_n3引物F:TTTGGATAGTTAGGTAATTTTCG
SEQ ID NO:20 SHOX2_n3引物R:CGTACACGCCTATACTCGTACG
SEQ ID NO:21 SHOX2_n3.2探针:
FAM-CCCCGATCGAACAAACGAAAC-BQ1
a.配液体系如下:
表7 配液体系
|
HOXA7 |
SHOX2_n3 |
β-actin |
反应组份 |
加入量(ul) |
加入量(ul) |
加入量(ul) |
上游引物(100uM) |
0.125 |
0.125 |
0.125 |
下游引物(100uM) |
0.125 |
0.125 |
0.125 |
探针(100uM) |
0.05 |
0.05 |
0.05 |
镁离子(25mM) |
5 |
5 |
5 |
dNTPs(10mM) |
1 |
1 |
1 |
Taq聚合酶(5unit/ul) |
0.5 |
0.5 |
0.5 |
5X缓冲液 |
5 |
5 |
5 |
灭菌水 |
12.2 |
12.2 |
12.2 |
模板DNA |
1 |
1 |
1 |
总体积 |
25 |
25 |
25 |
b.扩增体系如下:
表8 扩增体系
表9 SHOX2_n3反应程序
c.检测结果如下:
利用标准曲线计算各基因在标本中的甲基化拷贝数,采用比值=拷贝数/ACTB拷贝数*100来进行判断两组样本的甲基化程度,最后选取HOXA7的阈值为0.77,SHOX2_n3的阈值为1.3,作为判断癌症组和对照组的标准,换算后的比值超过设定阈值可判断为阳性“+”,等于或小于设定阈值可判断为阴性“-”。根据此标准,90例痰液标本的检测结果如下:
表10 检测结果
d.结果分析
表11 统计结果
e.HOXA7与SHOX2_n3在痰液标本中检测的ROC曲线见图3,扩增曲线见图4,统计结果见表11,从以上结果可以看出,将肺癌作为一个整体进行比较分析,还是按照肺癌的亚型进行比较分析,HOXA7的检测效果都要优于SHOX2基因的检测效果,非显而易见地,HOXA7在痰液中的检测灵敏度高于在组织中的检测灵敏度。特别是对腺癌的检测效果,HOXA7检出率为88.9%,远远高于SHOX2基因33.3%。腺癌一般为周围型,由于支气管的树状生理结构,肺深部的脱落细胞更加难以通过痰液咳出。而本发明首次发现一种能以痰液作为样本检测腺癌,并可将灵敏度大幅提升至88.9%的标志物,这一突破对腺癌的检测具有重大的意义。
实施例4:HOXA7与SHOX2基因在灌洗液中的检测
样本信息:测试肺泡灌洗液样本共计79例,其中正常对照组样本58例,癌症组对照样本21例,21例癌症组样本中有鳞癌6例,小细胞癌4例,腺癌11例。
试验过程:
a.收集确诊为肺癌患者和非肺癌患者的肺泡灌洗液标本,离心分离细胞,然后使用Magen的DNA提取试剂盒(HiPure FFPE DNA Kit,D3126-03)提取DNA。
b.使用ZYMO RESEARCH生物公司的DNA转化试剂盒(EZ DNA Methylation Kit,D5002)进行DNA的重亚硫酸氢盐修饰。
c.扩增检测体系如下:
表12 扩增体系
|
HOXA7 |
SHOX2_n3 |
β-actin |
反应组份 |
加入量(ul) |
加入量(ul) |
加入量(ul) |
上游引物(100uM) |
0.125 |
0.125 |
0.125 |
下游引物(100uM) |
0.125 |
0.125 |
0.125 |
探针(100uM) |
0.05 |
0.05 |
0.05 |
镁离子(25mM) |
5 |
5 |
5 |
dNTPs(10mM) |
1 |
1 |
1 |
Taq聚合酶(5unit/ul) |
0.5 |
0.5 |
0.5 |
5X缓冲液 |
5 |
5 |
5 |
灭菌水 |
12.2 |
12.2 |
12.2 |
模板DNA |
1 |
1 |
1 |
总体积 |
25 |
25 |
25 |
d.检测体系如下:
表13 检测体系
表14 SHOX2_n3反应程序
e.检测结果如下:
利用标准曲线计算各基因在标本中的甲基化拷贝数,采用比值=拷贝数/ACTB拷贝数*100来进行判断两组样本的甲基化程度,最后选取HOXA7的阈值为0.7,SHOX2_n3的阈值为0.6,作为判断癌症组和对照组的标准,换算后的比值超过设定阈值可判断为阳性“+”,等于或小于设定阈值可判断为阴性“-”。根据此标准,79例灌洗液标本的检测结果如下:
表15 检测结果
表16 分析结果
f.HOXA7与SHOX2_n3在所有灌洗液标本中检测的ROC曲线见图5,扩增曲线见图6,统计结果见表16。从以上结果可以看出,同时检测HOXA7和SHOX2,将肺癌作为一个整体进行比较分析,HOXA7的检出率为76.2%,远远高于SHOX2的52.4%,且也高于HOXA7在组织中的灵敏度。按照肺癌的亚型进行比较分析,鳞癌组HOXA7的检测结果比SHOX2的要高出16.6%。特别是对腺癌的检测效果,其灵敏性达到72.7%,远远高于SHOX2的36.4%,且仍然高于HOXA7在组织中的灵敏度,这在腺癌的检测领域是十分罕见的。Dou Y等人(Plasma smallncRNA pair panels as novel biomarkers for early-stage lungadenocarcinomascreening)报道,以血浆为检测样本,腺癌的诊断灵敏性70.4%,特异性72.7%,虽然本发明灵敏度没有显著高于,但是本发明对腺癌的检测可以保持高达的95%的灵敏度,具有更高的准确率。因为腺癌一般为周围型,由于支气管的树状生理结构,肺泡灌洗液不容易接触到肺深部的肺泡或者癌组织。而本发明首次发现一种能以痰液作为样本检测腺癌,并可将灵敏度大幅提升至72.7%的标志物,这一突破对腺癌的检测具有重大的意义。
综合上述的4个实施例,能够充分的说明HOXA7在对肺癌检测诊断,尤其是应用痰液,肺泡灌洗液等生物样本上具有更好的检测效果。能够更加容易的应用于大规模的人群筛查,具有更加优越的社会经济学价值。
实施例5:HOXA7的检测区域、引物、探针对检测效果的影响
一、检测区域对检测效果的影响
各种研究资料表明,同一个基因的甲基化状态和分布并不均匀,因此对于同一个基因来说,选择不同的区域设计的甲基化引物、探针检测体系对同一样本,同一肿瘤的诊断检测效能并不一样,甚至有时候选择的区域不合适造成对肿瘤完全没有诊断效果,本发明人经过多个检测区域反复的研究和比较,部分示范性的检测区域如下表17。
表17 待检测序列
我们根据序列SEQ ID NO:22(区域1)和序列SEQ ID NO:24(区域2)设计不同的甲基化引物和探针,各引物探针信息见表18,其中组8、组9、组10是根据区域1设计的甲基化引物和探针;组1、组2、组3、组4、组5、组6、组7是根据区域2设计的甲基化引物和探针(引物和探针的序列见表19)。
在36例肺组织样本检测以上10组引物探针组合,其中正常组织样本11例,癌组织样本25例,25例癌症组样本中有鳞癌4例,腺癌21例。检测结果如下表18。
表18 在组织中的检测结果
所处区域 |
组别 |
引物探针组合 |
特异性 |
灵敏性 |
区域2 |
组1 |
H7-F2,H7-R2,H7-P2 |
100% |
80% |
区域2 |
组2 |
H7-F3,H7-R3,H7-P3 |
100% |
76% |
区域2 |
组3 |
H7-F4,H7-R4,H7-P4 |
100% |
56% |
区域2 |
组4 |
H7-F5,H7-R5,H7-P5 |
100% |
72% |
区域2 |
组5 |
H7-F6,H7-R6,H7-P6 |
100% |
80% |
区域2 |
组6 |
H7-F7,H7-R7,H7-P7 |
100% |
72% |
区域2 |
组7 |
H7-F8,H7-R8,H7-P8 |
100% |
56% |
区域1 |
组8 |
H7-F9,H7-R9,H7-P9 |
100% |
48% |
区域1 |
组9 |
H7-F10,H7-R10,H7-P10 |
100% |
16% |
区域1 |
组10 |
H7-F11,H7-R11,H7-P11 |
100% |
24% |
结果显示,无论区域1如何设计引物和探针,针对区域1的检测灵敏度最高仅能达到48%,而无论采用本发明设计的何种引物和探针,区域2的检测灵敏度最低也可达到56%,最高达到80%。因此,区域2的检出率明显较区域1高(见表18)。
二、引物和探针对检测效果的影响
除了检测区域会影响检测效果,引物和探针也对肿瘤标志物的检测效果有极大的影响,发明人在研究过程中,设计了多对引物及其对应的探针,以寻找到尽可能提高检测灵敏度和特异性的探针和引物,以使本发明的检测试剂能够实际应用到临床检测中。部分引物和探针如下表19所示,检测结果如表20所示。所有的引物和探针均由英潍捷基(上海)贸易有限公司合成。
表19 引物和探针
表20 在组织中的检测结果
组别 |
引物探针组合 |
特异性 |
灵敏性 |
组1 |
H7-F2,H7-R2,H7-P2 |
100% |
80% |
组2 |
H7-F3,H7-R3,H7-P3 |
100% |
76% |
组3 |
H7-F4,H7-R4,H7-P4 |
100% |
56% |
组4 |
H7-F5,H7-R5,H7-P5 |
100% |
72% |
组5 |
H7-F6,H7-R6,H7-P6 |
100% |
80% |
组6 |
H7-F7,H7-R7,H7-P7 |
100% |
72% |
组7 |
H7-F8,H7-R8,H7-P8 |
100% |
56% |
组8 |
H7-F9,H7-R9,H7-P9 |
100% |
48% |
组9 |
H7-F10,H7-R10,H7-P10 |
100% |
16% |
组10 |
H7-F11,H7-R11,H7-P11 |
100% |
24% |
本发明中,采用表19中的引物和探针对组织样本的进行了验证。在36例肺组织样本检测以上10组引物探针组合,其中正常组织样本11例,癌组织样本25例,25例癌症组样本中有鳞癌4例,腺癌21例。检测结果如上表20,结果显示组1、组2、组4、组5、组6均有较好的检出率。
为了进一步验证其在痰液中的检出率,我们选取了22例痰液标本,采用表19中的引物和探针进行验证,其中包括7例正常对照,15例肺癌对照,15例肺癌中有鳞癌7例,腺癌7例,大细胞癌1例,检测结果如下表21。
从22例痰液标本的检测结果显示,组1:H7-F2,H7-R2,H7-P2的检出率最高,达到73.3%。
虽然在组织样本中,组1和组5的灵敏度均能达到80%,但针对痰液检测样本,组5的灵敏度却大幅下降至53.3%,这也从一方面证实了针对痰液样本,设计具有高灵敏度的检测试剂尤其不易。
最终,根据各组引物探针的检测结果,最优选的引物探针序列如下表22。
表22 优化后的引物
序列表
<110> 广州市康立明生物科技有限责任公司
<120> HOXA7甲基化检测试剂
<130> PT20181306-DD-P
<160> 57
<170> SIPOSequenceListing 1.0
<210> 1
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
taaaggcgtt tgcgataaga c 21
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
taacccgcct aacgactacg 20
<210> 3
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
agggcgcgtt gtatggcgc 19
<210> 4
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tttaaagggt tcgtcgttta agtc 24
<210> 5
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aaacgattac tttcgcccg 19
<210> 6
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ttagaaggta ggaggcggaa aattag 26
<210> 7
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ttggttttta cggttttcga c 21
<210> 8
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
aaattctccg aaacgctcg 19
<210> 9
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
attcggtgcg tataggtatc gcgc 24
<210> 10
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ttagtttcgg cgcgtagc 18
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
cctaaaaccg acgcgatcta 20
<210> 12
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aaaacttacg atcgtctacc ctccg 25
<210> 13
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tttcggtagc gggtattgc 19
<210> 14
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
aaaataacga cgaaccaacc g 21
<210> 15
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
cgcgtttatg taggagtggt tgaggttc 28
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ttttggattg tgaatttgtg 20
<210> 17
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
aaaacctact cctcccttaa a 21
<210> 18
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ttgtgtgttg ggtggtggtt 20
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
tttggatagt taggtaattt tcg 23
<210> 20
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
cgtacacgcc tatactcgta cg 22
<210> 21
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ccccgatcga acaaacgaaa c 21
<210> 22
<211> 880
<212> DNA
<213> Homo sapiens
<400> 22
accacatggc tccagtttgc ggtggcaatc tctctgcagc tgcaagagat gctgcgcctt 60
ccccgtctgg atccgagtct aagtccggcc tgtcgcccac tggacctggg tgagagaaga 120
cttgggcaga gtcgatctgc tcatagctga gtcctgccca caaggccacc gcggggcagg 180
ctgttgcggg ggacagagac ccttccaggg tctgggcagg cggacaggag agggatgggg 240
aggatcccaa gcttggtcca gggctcacta gcaggagtcg gcgggggggc ggggtggggg 300
gtgctgcgtg gggccgggcc gcctggcgtc cgcagacccc agtgcggagg ttggccgcca 360
gctgggcgct cccgcggagc ctccaggtct ttttccgcgg gacgcgccag gcccgccggg 420
cgcgggcgga ttctttggcc gcatatttga gcctcttgcc cttccattct aggcggctgc 480
gggccctgcg gagcgagacc acctgtgagg actgctgaga ttggcggagg cggtcatgtg 540
ggcggtcacg tgctgcggcg agctccgtcc aaaagaaaat ggggtttggt gtaaatctgg 600
gggtgtaatg ttatcatata tcactctacc tcgtaaaacc gacactgaaa gctgccggac 660
aacaaatcac aggtcaaaat tatgagttct tcgtattatg tgaacgcgct ttttagcaaa 720
tatacggcgg gggcttctct gttccaaaat gccgagccga cttcttgctc ctttgctccc 780
aactcacaga gaagcggcta cggggcgggc gccggcgcct tcgcctcgac cgttccgggc 840
ttatacaatg tcaacagccc cctttatcag agcccctttg 880
<210> 23
<211> 880
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
attatatggt tttagtttgc ggtggtaatt tttttgtagt tgtaagagat gttgcgtttt 60
tttcgtttgg attcgagttt aagttcggtt tgtcgtttat tggatttggg tgagagaaga 120
tttgggtaga gtcgatttgt ttatagttga gttttgttta taaggttatc gcggggtagg 180
ttgttgcggg ggatagagat ttttttaggg tttgggtagg cggataggag agggatgggg 240
aggattttaa gtttggttta gggtttatta gtaggagtcg gcgggggggc ggggtggggg 300
gtgttgcgtg gggtcgggtc gtttggcgtt cgtagatttt agtgcggagg ttggtcgtta 360
gttgggcgtt ttcgcggagt ttttaggttt tttttcgcgg gacgcgttag gttcgtcggg 420
cgcgggcgga ttttttggtc gtatatttga gttttttgtt tttttatttt aggcggttgc 480
gggttttgcg gagcgagatt atttgtgagg attgttgaga ttggcggagg cggttatgtg 540
ggcggttacg tgttgcggcg agtttcgttt aaaagaaaat ggggtttggt gtaaatttgg 600
gggtgtaatg ttattatata ttattttatt tcgtaaaatc gatattgaaa gttgtcggat 660
aataaattat aggttaaaat tatgagtttt tcgtattatg tgaacgcgtt ttttagtaaa 720
tatacggcgg gggttttttt gttttaaaat gtcgagtcga ttttttgttt ttttgttttt 780
aatttataga gaagcggtta cggggcgggc gtcggcgttt tcgtttcgat cgtttcgggt 840
ttatataatg ttaatagttt tttttattag agtttttttg 880
<210> 24
<211> 326
<212> DNA
<213> Homo sapiens
<400> 24
cgtccggcta cggcctgggc gccgacgcct acggcaacct gccctgcgcc tcctacgacc 60
aaaacatccc cgggctctgc agtgacctcg ccaaaggcgc ctgcgacaag acggacgagg 120
gcgcgctgca tggcgcggct gaggccaatt tccgcatcta cccctggatg cggtcttcag 180
gtaggcgcag tcgctaggcg ggccaggctg gcggagcggg accgggagcg gggagcgcag 240
cgctggggag cgcggagcgc ggggcgcggg gccggaagag cggagccagg ctgttgcgag 300
ccggtagccc cgtgactccc ggcgca 326
<210> 25
<211> 326
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
cgttcggtta cggtttgggc gtcgacgttt acggtaattt gttttgcgtt ttttacgatt 60
aaaatatttt cgggttttgt agtgatttcg ttaaaggcgt ttgcgataag acggacgagg 120
gcgcgttgta tggcgcggtt gaggttaatt ttcgtattta tttttggatg cggtttttag 180
gtaggcgtag tcgttaggcg ggttaggttg gcggagcggg atcgggagcg gggagcgtag 240
cgttggggag cgcggagcgc ggggcgcggg gtcggaagag cggagttagg ttgttgcgag 300
tcggtagttt cgtgattttc ggcgta 326
<210> 26
<211> 972
<212> DNA
<213> Homo sapiens
<400> 26
agcccggggc ggggtggggc tggagctcct gtctcttggc cagctgaatg gaggcccagt 60
ggcaacacag gtcctgcctg gggatcaggt ctgctctgca ccccaccttg ctgcctggag 120
ccgcccacct gacaacctct catccctgct ctgcagatcc ggtcccatcc ccactgccca 180
ccccaccccc ccagcactcc acccagttca acgttccacg aacccccaga accagccctc 240
atcaacaggc agcaagaagg gccccccgcc catcgcccca caacgccagc cgggtgaacg 300
ttggcaggtc ctgaggcagc tggcaagacg cctgcagctg aaagatacaa ggccagggac 360
aggacagtcc catccccagg aggcagggag tatacaggct ggggaagttt gcccttgcgt 420
ggggtggtga tggaggaggc tcagcaagtc ttctggactg tgaacctgtg tctgccactg 480
tgtgctgggt ggtggtcatc tttcccacca ggctgtggcc tctgcaacct tcaagggagg 540
agcaggtccc attggctgag cacagccttg taccgtgaac tggaacaagc agcctccttc 600
ctggccacag gttccatgtc cttatatgga ctcatctttg cctattgcga cacacactca 660
gtgaacacct actacgcgct gcaaagagcc ccgcaggcct gaggtgcccc cacctcacca 720
ctcttcctat ttttgtgtaa aaatccagct tcttgtcacc acctccaagg agggggagga 780
ggaggaaggc aggttcctct aggctgagcc gaatgcccct ctgtggtccc acgccactga 840
tcgctgcatg cccaccacct gggtacacac agtctgtgat tcccggagca gaacggaccc 900
tgcccacccg gtcttgtgtg ctactcagtg gacagaccca aggcaagaaa gggtgacaag 960
gacagggtct tc 972
<210> 27
<211> 972
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
agttcggggc ggggtggggt tggagttttt gttttttggt tagttgaatg gaggtttagt 60
ggtaatatag gttttgtttg gggattaggt ttgttttgta ttttattttg ttgtttggag 120
tcgtttattt gataattttt tatttttgtt ttgtagattc ggttttattt ttattgttta 180
ttttattttt ttagtatttt atttagttta acgttttacg aatttttaga attagttttt 240
attaataggt agtaagaagg gtttttcgtt tatcgtttta taacgttagt cgggtgaacg 300
ttggtaggtt ttgaggtagt tggtaagacg tttgtagttg aaagatataa ggttagggat 360
aggatagttt tatttttagg aggtagggag tatataggtt ggggaagttt gtttttgcgt 420
ggggtggtga tggaggaggt ttagtaagtt ttttggattg tgaatttgtg tttgttattg 480
tgtgttgggt ggtggttatt ttttttatta ggttgtggtt tttgtaattt ttaagggagg 540
agtaggtttt attggttgag tatagttttg tatcgtgaat tggaataagt agtttttttt 600
ttggttatag gttttatgtt tttatatgga tttatttttg tttattgcga tatatattta 660
gtgaatattt attacgcgtt gtaaagagtt tcgtaggttt gaggtgtttt tattttatta 720
ttttttttat ttttgtgtaa aaatttagtt ttttgttatt atttttaagg agggggagga 780
ggaggaaggt aggttttttt aggttgagtc gaatgttttt ttgtggtttt acgttattga 840
tcgttgtatg tttattattt gggtatatat agtttgtgat tttcggagta gaacggattt 900
tgtttattcg gttttgtgtg ttatttagtg gatagattta aggtaagaaa gggtgataag 960
gatagggttt tt 972
<210> 28
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gcgtttgcga taagacggac 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
ccaacctaac ccgcctaacg 20
<210> 30
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
cgttgtatgg cgcggttgag g 21
<210> 31
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
cgttcggtta cggtttgggc 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gccctcgtcc gtcttatcgc 20
<210> 33
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
tcgacgttta cggtaatttg ttttgcg 27
<210> 34
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
atttcgttaa aggcgtttgc 20
<210> 35
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
tccgccaacc taacccg 17
<210> 36
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
cggacgaggg cgcgttgtat 20
<210> 37
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
cgttaaaggc gtttgcgata agac 24
<210> 38
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
tacgctcccc gctcccgat 19
<210> 39
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
gacggacgag ggcgcgttgt atg 23
<210> 40
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
caacgctacg ctccccgct 19
<210> 41
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gcgataagac ggacgagggc 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
ccgatcccgc tccgccaacc 20
<210> 43
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
cgttaggcgg gttaggttgg c 21
<210> 44
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
gccgaaaatc acgaaactac cg 22
<210> 45
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
agcgggatcg ggagcggg 18
<210> 46
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
tcgggtcgtt tggcgttc 18
<210> 47
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
aacctaacgc gtcccgcg 18
<210> 48
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
ttggtcgtta gttgggcgtt ttcgc 25
<210> 49
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
ggcgttcgta gattttagtg c 21
<210> 50
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
caaataatct cgctccgca 19
<210> 51
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
ggtcgttagt tgggcgtttt cg 22
<210> 52
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
gcgttaggtt cgtcgggc 18
<210> 53
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
aaactcgccg caacacgtaa 20
<210> 54
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
cggatttttt ggtcgtatat ttgagt 26
<210> 55
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
ttttggattt aaggggaaga taaa 24
<210> 56
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
tttttccttc tctacatctt tctacct 27
<210> 57
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
aagggaaatt gagaaatgag agaaggga 28