CN116219007A - 检测结直肠癌的生物标志物组及其应用 - Google Patents

检测结直肠癌的生物标志物组及其应用 Download PDF

Info

Publication number
CN116219007A
CN116219007A CN202211123798.XA CN202211123798A CN116219007A CN 116219007 A CN116219007 A CN 116219007A CN 202211123798 A CN202211123798 A CN 202211123798A CN 116219007 A CN116219007 A CN 116219007A
Authority
CN
China
Prior art keywords
gene
colorectal cancer
areg
zkscan3
crc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211123798.XA
Other languages
English (en)
Inventor
王宇
楼朝平
王伟
曾勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaoxing Jiquan Biotechnology Co ltd
Hunan Cancer Hospital
Original Assignee
Shaoxing Jiquan Biotechnology Co ltd
Hunan Cancer Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaoxing Jiquan Biotechnology Co ltd, Hunan Cancer Hospital filed Critical Shaoxing Jiquan Biotechnology Co ltd
Priority to CN202211123798.XA priority Critical patent/CN116219007A/zh
Publication of CN116219007A publication Critical patent/CN116219007A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种检测结直肠癌的生物标志物组,包括AREG基因和ZKSCAN3基因。本发明还提供了检测AREG基因和ZKSCAN3基因的表达水平的试剂在制备检测结直肠癌的产品中的应用。本发明还提供了一种检测结直肠癌的产品,包括检测AREG基因和ZKSCAN3基因的表达水平的试剂。本发明的生物标志物组具有灵敏性高、特异性高和准确性高的优点,尤其适合用于早期结直肠癌的检测。

Description

检测结直肠癌的生物标志物组及其应用
技术领域
本发明涉及分子诊断技术领域,具体涉及一种检测结直肠癌的生物标志物组及其应用。
背景技术
结直肠癌(CRC)是全球最常见和最致命的癌症之一[1,2],其发病率在许多亚洲国家迅速上升[3]。CRC患者的存活率在很大程度上取决于诊断时的癌症分期。诊断为I期和II期肿瘤的CRC患者的5年生存率通常比较高,分别为91%和82%,但诊断为IV期肿瘤的患者的5年生存率通常急剧下降,仅为12%[4,5]。大多数CRC的发展本质上是缓慢和渐进的,因此如果能够及早发现并切除癌前息肉和早期肿瘤,则CRC是有可能治愈的[6]。不幸的是,大多数CRC是在晚期发现的,每年导致近100万人死亡[7]。因此,早期发现CRC对于降低高CRC死亡率至关重要。
目前,内镜检查结合活检病理检查仍然是临床CRC诊断的金标准[6,8]。结肠镜检查虽然可以有效检测CRC[9],但由于其侵入性、复杂的肠道准备和早筛需要重复检测[10],患者依从性较差。其他非侵入性筛查方法包括粪便免疫化学试验(FIT)、粪便潜血试验(FOBT)和血清生物标志物(如癌胚抗原(CEA)和碳水化合物抗原19-9(CA19-9))。然而,这些测试要么特异性较低,要么无法及时可靠地检测出早期CRC[11-13]。此外,基于特定突变和甲基化特征的粪便DNA检测也主要作为家庭检测提供,但由于其相对较高的成本和复杂的程序而尚未在临床中广泛使用[14,15]
因此,临床急需一种准确、简单、安全和低成本的新型方法来检测早期CRC。
发明内容
本发明的发明目的是针对现有技术的缺陷,提供了一种检测结直肠癌的生物标志物组及其应用。
一方面,本发明提供了一种检测结直肠癌的生物标志物组,包括AREG基因和ZKSCAN3基因。
另一方面,本发明提供了检测AREG基因和ZKSCAN3基因的表达水平的试剂在制备检测结直肠癌的产品中的应用。
可选地,所述结直肠癌是I期结直肠癌、II期结直肠癌、III期结直肠癌或IV期结直肠癌;优选地,所述结直肠癌是I期结直肠癌或II期结直肠癌;更优选地,所述结直肠癌是I期结直肠癌。
可选地,所述试剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
可选地,所述试剂包括AREG基因和ZKSCAN3基因的特异性引物;可选地,还包括HPRT1基因的特异性引物。
可选地,AREG基因的特异性引物包括SEQ ID NO:1和SEQ ID NO:2的序列;ZKSCAN3基因的特异性引物包括SEQ ID NO:3和SEQ ID NO:4的序列;HPRT1基因的特异性引物包括SEQ ID NO:5和SEQ ID NO:6的序列。
可选地,检测结直肠癌的方法包括:
获得受试者的血液白细胞;
测量AREG基因和ZKSCAN3基因在血液白细胞中的标准化转录物表达,根据公式HIR-CRC=1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))计算HIR-CRC得分,其中,AREG表示AREG基因相对于HPRT1基因的标准化表达量,ZKSCAN3表示ZKSCAN3基因相对于HPRT1基因的标准化表达量;
将HIR-CRC得分与截止值进行比较以确定受试者是否患有结直肠癌;其中,所述截止值是0.5;当HIR-CRC得分大于0.5时,确定受试者患有结直肠癌。
另一方面,本发明提供了一种检测结直肠癌的产品,包括检测AREG基因和ZKSCAN3基因的表达水平的试剂。
可选地,所述产品是试剂盒、药物、基因芯片或检测试纸。
可选地,所述产品是试剂盒。
可选地,所述试剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
可选地,所述试剂包括AREG基因和ZKSCAN3基因的特异性引物;可选地,还包括HPRT1基因的特异性引物。
可选地,AREG基因的特异性引物包括SEQ ID NO:1和SEQ ID NO:2的序列;ZKSCAN3基因的特异性引物包括SEQ ID NO:3和SEQ ID NO:4的序列;HPRT1基因的特异性引物包括SEQ ID NO:5和SEQ ID NO:6的序列。
有上述技术方案可知,本发明的检测结直肠癌的生物标志物组及其应用,至少具有如下优点:
本发明的生物标志物组的检测性能不依赖于受试者的疾病状态,也不依赖于受试者的CEA或CA19-9的水平,具有灵敏性高、特异性高和准确性高的优点。
本发明的检测方法改善了目前结直肠癌筛查主要依靠影像学检查技术和CEA或CA19-9检测存在的不足,降低了结直肠癌的漏检率,尤其适合用于早期结直肠癌的检测。
使用本发明的生物标志物组对受试者进行的检测是非侵入性的方法,操作方法简单、成本低廉,并且不会对受试者造成任何危害。
附图说明
图1是实施例1的研究工作流程图。实施例1的研究共招募了514名受试者。进行RNA-seq以比较10个CRC和12个HC样本之间白细胞的整个转录组,以发现与CRC相关的白细胞基因。在最初的95个样本队列中,确定了一个最小的2基因特征,以有力地区分CRC和HC。开发了基于2基因特征的RT-qPCR测定。临床敏感性和特异性首先在314个样本的扩展训练队列中进行评估,其中包括来自初始识别队列的95个样本。随后在一个包含178个样本的独立队列中进行了验证。
图2显示了白细胞中与CRC相关的基因特征及对比。其中,(A)火山图显示10个CRC与12个HC样本中显着差异表达的基因,使用RNA-seq检查。141个显着差异表达的基因在两个上侧象限中显示,绝对倍数变化>2,FDR p值<0.05。(B)使用基于CRC相关基因中表达最高的十个基因的无监督Pearson层次聚类显示不同CRC簇的热图。(C)至(G)点图显示了当使用RT-qPCR进行测量并在95个样本的识别队列中针对HPRT1进行标准化时,与HC个体相比,CRC患者的白细胞中的AREG(C)、CXCL1(D)、CXCL8(E)和IFITM10(F)的转录物表达显着增加,并且ZKSCAN3(G)的转录物表达显着降低。***p<0.001。
图3显示了2基因特征的识别、训练和测试以检测HC中的CRC。(A)ROC曲线,采用RT-qPCR测量并且相对于HPRT1使用ΔCt相对定量进行标准化,该曲线显示了在由47个CRC和48个HC组成的95个样本的识别队列中用于区分CRC和HC的5个候选生物标志物和2-基因特征(AREG和ZKSCAN3组合)。(C)2-基因特征稳定性的自举验证,如校准曲线所示。理想线代表完美校准。明显的线本发明的数据,误差校正代表2-基因特征的自举校正校准,显示非常小的平均绝对误差0.01。(D)ROC曲线显示AREG、ZKSCAN3和AREG&ZKSCAN3组合使用RT-qPCR测定法在178个样本的独立验证队列中区分CRC和HC。为每个分析提供曲线下面积(AUC)、95%置信区间(CI)和p值。
图4显示了3种RNA特征在检测早期、CEA阴性和CA19-9阴性CRC方面具有稳定性。(A)和(B)使用RT-qPCR测量的显示206个CRC和286个HC组成的492个样本的总体队列中AREG(A)和ZKSCAN3(B)表达的点图。(C)显示HIR-CRC得分的点图,其是使用从同一总体队列中AREG和ZKSCAN3表达得出的逻辑回归方程计算的。(D)至(F)显示根据不同肿瘤阶段(D)、CEA状态(E)和CA19-9状态(F)分类的HC和CRC中的HIR-CRC得分的点图。
具体实施方式
为了充分了解本发明的目的、特征及功效,通过下述具体实施方式,对本发明作详细说明。本发明的方法除下述内容外,其余均采用本领域的常规方法或装置。
除非另有说明,否则本发明中涉及的技术和科学术语均具有本领域技术人员通常理解的含义。以下参考文献将向本领域技术人员提供本发明所用许多术语的一般定义:吴乃虎,黄美娟.分子遗传学原理.化学工业出版社,2015;朱圣庚,徐长法.生物化学(第4版).高等教育出版社,2016;丁明孝等.细胞生物学(第5版).高等教育出版社,2020;J.E.克雷布斯著,江松敏译.Lewin基因XII.科学出版社,2021;Robert F.Weaver著,郑用琏等译.分子生物学(原著第五版).科学出版社,2021;B.艾伯茨等著,丁小燕等译.细胞生物学精要(原书第三版).科学出版社,2021。本领域的技术人员将认识到可用于本发明实践的与本文所述的那些方法和材料相似或等效的许多方法和材料。实际上,本发明决不限于所述的方法和材料。
在本发明中,“结直肠癌”或者“结肠直肠癌”(Colorectal Cancer,CRC),是胃肠道中常见的恶性肿瘤,可以发生在结肠或直肠的任何部位,通常以直肠、乙状结肠最为多见,其余依次是盲肠、升结肠、降结肠和横结肠。癌瘤大多数为腺癌,少数为鳞状上皮癌及粘液癌。CRC可以通过淋巴、血液循环及直接蔓延等途径扩散到其他组织和脏器。根据肿瘤侵犯肠壁的深度、是否有淋巴转移以及是否有远处转移,可将CRC分为四期,即I期、II期、III期和IV期,其中,I期、II期是早期,治疗效果较好,III期和IV期晚期,治疗效果差。
生物标志物组
早期CRC有可能治愈,因此CRC监测对于改善CRC患者的预后和生存至关重要。CRC筛查方法通常有两大类。一种策略是通过影像学检查,结肠镜检查是CRC诊断的金标准。然而,结肠镜检查不是一种有效的高侵入性筛查方法。其他常规成像方法,如CT、MRI和PET-CT也正在评估中,但由于其高成本和辐射风险,尚未在临床上推荐。另一种策略是通过筛查CRC相关症状或肿瘤衍生的生物标志物。FIT和FOBT筛查粪便中是否存在血液,但这些方法对CRC(25-38%)和晚期腺瘤(16-31%)的敏感性较差。CEA和CA19-9是用于CRC筛查的血液生物标志物的代表性例子。但是,经过发明人的研究,CEA和CA19-9对检测CRC的敏感性分别为39%和21%。CEA和CA19-9在检测早期CRC方面尤其差,灵敏度分别为33%和9%(如表3所示)。这与之前的报道一致,即I期和II期CRC的CEA阳性率为6.3%-33%,CA19-9阳性率为7.4%-11%。其他新的生物标志物,如DNA突变、DNA甲基化、非编码RNA以及粪便和血液中的外泌体蛋白还有待在临床环境中进行大规模评估。基于肿瘤衍生生物标志物的筛查方法的主要问题是这些生物标志物在早期CRC中的丰度低,导致对CEA和CA19-9等常规检测的敏感性低,或者,诸如粪便样本准备与测序的复杂检测过程的成本高昂。因此,值得探索新的筛查策略,以便在可能的治疗选择的早期阶段实现安全、简单和稳健的CRC检测。
人体免疫细胞执行免疫识别和监视功能,它们代表了新的潜在生物标志物,用于监测人类健康。最近的研究表明,诸如外周血单核细胞或组织巨噬细胞的免疫细胞内的特异性表达变化与诸如癌症和传染病的疾病有关。在本发明中,发明人进行了全转录组RNA-seq以鉴定血液白细胞中与CRC相关的差异基因表达。经过研究,发明人最终确定了一个最小的两基因特征,以将CRC与健康对照区分开来。
第一方面,本发明提供了一种检测结直肠癌的生物标志物组,包括AREG基因和ZKSCAN3基因。
在本发明中,AREG基因是表皮生长因子(EGF)家族的成员,它是一种重要的自分泌生长因子,也是星形胶质细胞、雪旺细胞和成纤维细胞的有丝分裂原。它是表皮生长因子(EGF)的配体,与转化生长因子α(TGF-α)有关。这种蛋白质与表皮生长因子受体(EGFR)相互作用以促进正常上皮细胞的生长。人源AREG的基因代码是314,mRNA编码是NM_001657.4,序列为SEQ ID NO:7,如下:
>NM_001657.4 Homo sapiens amphiregulin(AREG),mRNA
AGACGTTCGCACACCTGGGTGCCAGCGCCCCAGAGGTCCCGGGACAGCCCGAGGCGCCGCGCCCGCCGCCCCGAGCTCCCCAAGCCTTCGAGAGCGGCGCACACTCCCGGTCTCCACTCGCTCTTCCAACACCCGCTCGTTTTGGCGGCAGCTCGTGTCCCAGAGACCGAGTTGCCCCAGAGACCGAGACGCCGCCGCTGCGAAGGACCAATGAGAGCCCCGCTGCTACCGCCGGCGCCGGTGGTGCTGTCGCTCTTGATACTCGGCTCAGGCCATTATGCTGCTGGATTGGACCTCAATGACACCTACTCTGGGAAGCGTGAACCATTTTCTGGGGACCACAGTGCTGATGGATTTGAGGTTACCTCAAGAAGTGAGATGTCTTCAGGGAGTGAGATTTCCCCTGTGAGTGAAATGCCTTCTAGTAGTGAACCGTCCTCGGGAGCCGACTATGACTACTCAGAAGAGTATGATAACGAACCACAAATACCTGGCTATATTGTCGATGATTCAGTCAGAGTTGAACAGGTAGTTAAGCCCCCCCAAAACAAGACGGAAAGTGAAAATACTTCAGATAAACCCAAAAGAAAGAAAAAGGGAGGCAAAAATGGAAAAAATAGAAGAAACAGAAAGAAGAAAAATCCATGTAATGCAGAATTTCAAAATTTCTGCATTCACGGAGAATGCAAATATATAGAGCACCTGGAAGCAGTAACATGCAAATGTCAGCAAGAATATTTCGGTGAACGGTGTGGGGAAAAGTCCATGAAAACTCACAGCATGATTGACAGTAGTTTATCAAAAATTGCATTAGCAGCCATAGCTGCCTTTATGTCTGCTGTGATCCTCACAGCTGTTGCTGTTATTACAGTCCAGCTTAGAAGACAATACGTCAGGAAATATGAAGGAGAAGCTGAGGAACGAAAGAAACTTCGACAAGAGAATGGAAATGTACATGCTATAGCATAACTGAAGATAAAATTACAGGATATCACATTGGAGTCACTGCCAAGTCATAGCCATAAATGATGAGTCGGTCCTCTTTCCAGTGGATCATAAGACAATGGACCCTTTTTGTTATGATGGTTTTAAACTTTCAATTGTCACTTTTTATGCTATTTCTGTATATAAAGGTGCACGAAGGTAAAAAGTATTTTTTCAAGTTGTAAATAATTTATTTAATATTTAATGGAAGTGTATTTATTTTACAGCTCATTAAACTTTTTTAACCAAA
应当说明的是,在本发明中,“AREG基因”包括AREG基因以及AREG基因的任何功能等同物的多核苷酸,例如,包括:(1)如SEQ ID NO:7所示的核苷酸序列,(2)在严格条件下与SEQ ID NO:7所示的核苷酸序列杂交且编码相同功能蛋白质的核苷酸序列,(3)与(1)或(2)中限定的核苷酸序列具有至少70%、优选至少80%、更优选至少90%且最优选至少95%以上同源性并且编码相同功能蛋白质的核苷酸序列。
在本发明中,ZKSCAN3基因是具有KRAB和SCAN域的锌指3基因,具有启用DNA结合转录抑制活性,RNA聚合酶II特异性;RNA聚合酶II顺式调节区序列特异性DNA结合活性;和染色质结合活性。参与多个过程,包括自噬的负调控;细胞衰老的负调控;和转录调控,以DNA为模板。位于细胞质和核质中。人源ZKSCAN3的基因代码是80317,mRNA编码是NM_001242894.2,序列为SEQ ID NO:8,如下:
>NM_001242894.2 Homo sapiens zinc finger with KRAB and SCAN domains 3(ZKSCAN3),transcript variant 1,mRNA
GCTAGTTTCAAGCACTTTGTGAGTATGGGGTGAATCGGCGTCGGCCTTCCACTGTGGGGTTAAATCTCATCCCGCGGCTCTCCTCCTGTCGGTCCTGCAGTTCTTTTGTCCCCGGGTAGAGGGCCGTTACCGAGTGTCCGGGTCGGTTCTTGAGGGTATTTGGAGACGGGATGCATGGGTCACATAGACAAGCCTCGAGAATGGGAGCCGTTACATTTTTGCACTGCCTGGTAACAAGGGATCTTCTGCAGAAATAGCGCTGGAAGCTAGAGTGAGGCCTGAGTACTGCCTTGGCCTAGGATGGCTAGAGAATTAAGTGAAAGCACAGCCCTGGATGCCCAGTCTACAGAAGACCAGATGGAGCTTCTGGTCATAAAGGTGGAGGAAGAAGAAGCCGGTTTTCCCAGTAGCCCAGATCTGGGTTCTGAGGGCTCCCGCGAGCGCTTCCGAGGCTTCCGCTACCCGGAGGCTGCAGGCCCCCGCGAGGCGCTGAGTCGGCTCCGAGAGCTCTGCCGACAGTGGCTGCAGCCTGAGATGCACAGCAAGGAGCAGATCCTGGAGCTGCTGGTGCTGGAGCAGTTCCTGACCATCCTGCCGGGGAATCTGCAGAGCTGGGTGCGGGAGCAGCATCCAGAGAGCGGGGAGGAGGTGGTGGTGCTATTGGAGTATTTGGAGAGGCAGCTGGATGAGCCGGCGCCGCAGGTTTCAGGTGTTGACCAGGGGCAAGAACTGCTCTGTTGCAAGATGGCACTATTGACACCAGCCCCAGGGTCACAAAGTAGCCAATTTCAGCTAATGAAGGCTCTGCTCAAGCATGAATCTGTGGGATCCCAGCCTTTACAAGATAGAGTTCTCCAGGTCCCCGTGCTTGCCCATGGAGGATGCTGCAGAGAAGATAAAGTGGTAGCTTCTAGGCTTACTCCAGAGTCCCAGGGGTTGTTGAAAGTGGAAGATGTGGCCCTGACCCTCACCCCTGAATGGACACAGCAGGATTCATCTCAGGGGAATCTCTGTAGAGATGAAAAGCAGGAGAACCATGGCAGCCTGGTCTCCCTGGGTGATGAAAAACAGACTAAGAGCAGGGACTTGCCTCCAGCTGAGGAGCTTCCAGAAAAGGAGCATGGGAAGATATCGTGCCACCTGAGAGAAGACATTGCCCAGATTCCTACATGTGCAGAAGCTGGTGAACAGGAGGGCAGGCTACAAAGAAAGCAGAAAAATGCCACAGGAGGGAGGCGGCACATCTGCCATGAATGTGGAAAGAGTTTTGCTCAAAGCTCAGGCCTGAGTAAACACAGGAGAATCCACACTGGTGAGAAACCCTACGAATGTGAAGAGTGTGGCAAAGCCTTCATTGGGAGCTCTGCCCTTGTCATTCATCAGAGAGTCCACACTGGTGAGAAGCCATATGAGTGTGAAGAATGTGGTAAGGCCTTCAGTCATAGCTCAGACCTTATCAAGCATCAGAGAACCCACACTGGGGAGAAGCCCTATGAGTGTGATGACTGTGGGAAGACCTTCAGCCAGAGCTGCAGCCTCCTTGAACATCACAGAATCCACACTGGGGAGAAGCCGTATCAGTGCAGTATGTGTGGCAAAGCCTTTAGGCGAAGTTCACATCTCCTGAGACATCAGAGGATCCATACTGGGGATAAAAATGTTCAGGAACCTGAGCAGGGAGAGGCCTGGAAAAGTAGGATGGAAAGCCAGTTGGAAAATGTTGAAACTCCCATGTCTTATAAATGTAATGAGTGTGAAAGAAGTTTCACTCAGAATACAGGCCTCATTGAACATCAAAAAATCCACACTGGTGAGAAACCCTATCAGTGTAATGCGTGTGGAAAAGGCTTCACCCGAATTTCATACCTTGTTCAACATCAGAGAAGCCATGTAGGGAAAAACATCCTATCACAGTGACCCATGCCATACATGCCAGAGTTGGTGCTCATTTGTCACTGATCTGAAGCCACTCCCCCTGGAGTCTCAACTATAGAAATTGTGGGCTGGGCTTTATTTACCACTACACATTATCAGGTGTTAGAAAATGTAGACTGGGTTAGACAAATTATCTTCTAAGTTCTAGAAGGGGTTTGTAATCAAAACATATTTGATAGGAGGCTACGGGAGAGTTGTCTAGAAGAGGTAAGACCTGAAACTGTTTGTTCTCTCCCACTAGAATTAAATGGATGTTTAGACTGGCTACTTGCCCTAAACCAGCACTTGGTGATGTCTACTGGGTGGATGGTTGTGATTTGGGGGCTGCTTCTCTGACCATTCTTTTTGACTGTAATGAATCCTCCACAGTTGGTCAGATTCATAAAGTCTTATATCCCCCTCTGTGCCTTTTCTGCAGGTGCTAATAAATGTTTATTGAATGTACCAGTGAGATTACCTTCATAGATCTGAAAATCTGATGTTATCCAGGTTTCTGAAGAACTTCTCGCCAAGGCCATTTGTGCTTGTGTCCAATTCTCTGACCTAGATTGTGACTCAATCTAGTGTGTTTCTTACCAAGTACATAGGCAGAGCAGGGTTACTGTGATTGAAAGAATCCATTTTTTTTTTGGAGACGTAGTCTTGCTCTGTCGCCCAGGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAACCTCCACCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGATTACAGGTGTGTGCCACCATGCCCGGCTAATTTTTTATGTTTTTAGTAGAGACGGGATTTTACCGTGTTAGCCAGGATGGTCTCGATCTCCTAACCTCATGATCCTCCTGCCTCAGCCTACCAAAGTGCTGGGATTACAGGCATGAGCCACCATGCCCGGCCAAGAATCCATATTTCTTTACCAGACTAGGAATTCTATTCTAGTGCAAATGCCTTAAAAAGCTTATCACTAAATCATTACGAATGTGTGCCATCCGTGGAATTGCTTTTTTTTTTTTTTTTTTGTAAATATGAGGTCTCACTATGTTGCCCAGGCTGGTCTCGAAATCCTGGGCAATCCTCCTGCCTCACCCTCTCAAGTACTGGAATTACAGGCGTGAGCCACCATACCCAGCCCAAATTTCACTCTTTAATGTTTTCCTGTTGCTATTCTTTAAGGAAAAAACTTTCCTATTCAGACAGTGTGAAAATCAGTCATCAAGTCAGAATAAAATGATGAATATTCTAATGCTCAGTATCTTAGTTCTCTCGGGCCTAACCAATGCCTCCTAAAACAATAGATACTATCCTGCCCCACCCTACCACCCAACACACACTGTATAGTAAACTGCATCAAAACTTATTCCTGCTAAGTTCATACTTTCTCCAGCTCAATGGATTCACACCAAATTTTTTTTTTTTTTTTTAGACGGAGTCTTCTCTGTCACCCAGGCTGGAGTGCAGTGGCGCGATCTCGGCTCACTGCAAGCTCCGCCTCCCAGGTTCCTGCCATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGACTATAGGCGTCCGCCTCCACGCCGGGCTATTTTTTTTTTTTATTTTATACTTTAAGTTCTAGGGTACATGTGCACAACGTGCAGGTTTGTTACATATGTATACATGTGCCATGTTGGTGTGCTGCACCCATTAACTCGTCATTTACATTGGGTGTATCTCCTAATGCTTTCCCTCCCCCCACCCCACAACAGGCCCCAGTGTGTGATGTTCCCCTTCCTGTGTCCAAGTGTTCTCCTTATTCAATTCCCACCTATGAGTGAGAATATGCCGTGTTTGATTTTTTGTTCTTGGCGATAGTTTGCTGAGAATGATGAGACGAGGTTTCACTGTGTTAGCCAGGATGCTCTCGATCTCCTGACCTCGTGATCCACCTGTCTCGGCCTCCCAAAATGCTGGGATTACAGGCGTGAGCCACCGCGCCCGGCCCAAGTATCACTTATGGTTTCAGAACGCCATTATTAGTGTCTGACTGTCTTGGTCTTCTTATACATTGATTCCCAAATCACGTGTGGTAACAGCATCTCAATTTTTCATGATGACGGTTTGAACCATTAATTTAATTCCTCAGGCTATCTACTTTTTTGTTAAACATACTGTGTAGACCATCTTTTTTTTTTCCCATCATGATAGTCAAAATTTTAGTCTGTGTATTCAAGTGAGAAAATTTTTAGTCAGCATTATACAAGTAGTATTTATTATGTATACATTCAGTGGAGTTGTTTCTACAAAAGTATTTCGGAATGACTATTCTGCTGCAAACTTTTGTGTAAGCGCTTCACCTTATTCCTACAATAAGGAGAAGTGCACTAACAAAATGAACAATGCAGCAAGGGCTTCAGTCGCAGCTCAGGTCTTATCAAACACCAGAGAACCCTCAATGGGAGAAGCCTTATGAGTGTGACAACTGTGGAAAGACAGTTCCTTTTTTGTTAGTATCACTTCTACTTATTGTAGAAATATGCTTTCATTATTGCATCTACTCACATTTCTCACTCGGTTTCTGGCACCAGCAATCTCTTCCATATTTATAATATCAGTCAAAAACTCTGGAATTCAAATATAACAAGACTTTTCTGGTCACCTTTGATAGTTAATGACTTGGGCATTGTGATATATTATCTCCTGCTGTATGTATTTTGTTTAGTAGAAATTGAATCATTATCCACAATCCTTTATAGAACTATCCAAGTCCCTGTTTTTATGCTAGTTTCCAAGGCTTGGTCCTTCAAGGTTTTCAGGGATCTAGGGGACACAAATCTAACAAATCCTAATGTATATTATTTGTATTATAGTAATAAACCATATGGTTACTTTG
应当说明的是,在本发明中,“ZKSCAN3基因”包括ZKSCAN3基因以及ZKSCAN3基因的任何功能等同物的多核苷酸,例如,包括:(1)如SEQ ID NO:8所示的核苷酸序列,(2)在严格条件下与SEQ ID NO:8所示的核苷酸序列杂交且编码相同功能蛋白质的核苷酸序列,(3)与(1)或(2)中限定的核苷酸序列具有至少70%、优选至少80%、更优选至少90%且最优选至少95%以上同源性并且编码相同功能蛋白质的核苷酸序列。
本发明的生物标志物组可以用于检测各个阶段的结直肠癌,包括I期结直肠癌、II期结直肠癌、III期结直肠癌和IV期结直肠癌。由于本发明的生物标志物组具有灵敏性高、特异性高和准确性高的特点,因此本发明的生物标志物组优选适合于I期结直肠癌和II期结直肠癌的筛查,并且尤其优选适合于I期结直肠癌的筛查。
在本发明中,发明人没有寻找直接源自肿瘤的生物标志物,而是专注于循环血液白细胞,这是人体免疫系统的重要细胞成分。以前的研究表明,各种免疫细胞内基因表达的特定变化可以为疾病提供新的诊断潜力。在本发明中,发明人假设CRC的发生会触发血液白细胞内特定基因的表达变化,而这种基因特征又可以用于检测CRC。为此,发明人比较了CRC与HC样本中血液白细胞的转录组,并确实确定了血细胞内与CRC相关的基因表达特征(如图2所示)。经过深入研究,发明人最终确定,血液白细胞中AREG基因和ZKSCAN3基因的基因特征的改变发生在肿瘤发生的早期阶段,并在肿瘤进展过程中持续存在。
进一步,发明人经过研究之后推测,来自早期恶性肿瘤块的少量CRC细胞可以触发持续的免疫识别并通过血液循环放大。发明人的这一假说与AREG和ZKSCAN3都是在血细胞中起重要作用的免疫相关基因的观察结果一致。AREG过度表达经常在人类癌症的血清和组织中发现,而组织ZKSCAN3则作为自噬的主要转录抑制因子发挥作用。在本发明中,发明人发现血液白细胞中AREG基因和ZKSCAN3基因的差异表达与CRC的发生有关(如图4的(A)和(B)所示)。发明人的研究提供了早期证据,表明血液白细胞中AREG基因和ZKSCAN3基因的基因表达变化是检测CRC且尤其是早期CRC的有用策略。
生物标志物组的应用
第二方面,本发明提供了检测AREG基因和ZKSCAN3基因的表达水平的试剂在制备检测结直肠癌的产品中的应用。
优选地,检测AREG基因和ZKSCAN3基因的表达水平的试剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
更优选地,通过RT-qPCR技术检测上述生物标志物组的试剂包括扩增AREG基因和ZKSCAN3基因的特异性引物。更优选地,通过RT-qPCR技术检测上述生物标志物组的试剂还包括扩增HPRT1基因的特异性引物。
更优选地,检测生物标志物组的试剂是AREG基因和ZKSCAN3基因以及内参基因HPRT1的特异性引物SEQ ID NO:1至SEQ ID NO:6。具体如下:
Figure BDA0003848203460000131
发明人基于AREG基因和ZKSCAN3基因的应用进一步开发了一种简单而可靠的RT-qPCR检测方法,用于检测血液白细胞中AREG基因和ZKSCAN3基因的表达水平,并且,基于血液白细胞中AREG基因和ZKSCAN3基因的表达水平还可以进一步检测结直肠癌。
第三方面,本发明提供了一种检测AREG基因和ZKSCAN3基因的表达水平的方法,包括:
步骤S101:获得受试者的血液白细胞。
具体地,从受试者获得全血样本,例如,静脉外周血全血样本。对全血样本进行处理以获得白细胞,对全血样本进行处理的具体方法可以参考现有技术中的方案实施,例如,可以使用市售的样品制备试剂盒对全血样本进行裂解、离心、沉淀等处理以获得血液白细胞。
步骤S102:测量AREG基因和ZKSCAN3基因在血液白细胞中的标准化转录物表达,计算HIR-CRC得分。
具体地,提取血液白细胞的总RNA,以总RNA合成cDNA,总RNA的提取和cDNA的合成都可以参考现有技术中的方案实施,例如,可以使用市售的试剂盒来完成。
合成cDNA之后,以cDNA为模板进行PCR以获得AREG基因和ZKSCAN3基因相对于HPRT1基因的标准化表达量。具体是,使用比较循环阈值(Ct)方法,将AREG基因和ZKSCAN3基因与细胞内参照基因HPRT1做标准化对比,候选基因的标准化表达-dCt=HPRT1基因的Ct值-候选基因的Ct值。
利用AREG基因和ZKSCAN3基因相对于HPRT1基因的标准化表达量计算HIR-CRC得分,采用的公式为HIR-CRC=1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))计算HIR-CRC得分,其中,AREG表示AREG基因相对于HPRT1基因的标准化表达量,ZKSCAN3表示ZKSCAN3基因相对于HPRT1基因的标准化表达量。其中,“^”后面的表达式位于e的平方处,例如,“e^A”表示“eA”,即e的A次方。
借助于HIR-CRC得分,能够显示出AREG基因和ZKSCAN3基因的表达水平。
第四方面,本发明提供了一种检测结直肠癌的方法,包括:
步骤S201:获得受试者的血液白细胞。
具体地,从受试者获得全血样本,例如,静脉外周血全血样本。对全血样本进行处理以获得白细胞,对全血样本进行处理的具体方法可以参考现有技术中的方案实施,例如,可以使用市售的样品制备试剂盒对全血样本进行裂解、离心、沉淀等处理以获得血液白细胞。
步骤S202:测量AREG基因和ZKSCAN3基因在血液白细胞中的标准化转录物表达,计算HIR-CRC得分。
具体地,提取血液白细胞的总RNA,以总RNA合成cDNA,总RNA的提取和cDNA的合成都可以参考现有技术中的方案实施,例如,可以使用市售的试剂盒来完成。
合成cDNA之后,以cDNA为模板进行PCR以获得AREG基因和ZKSCAN3基因相对于HPRT1基因的标准化表达量。具体是,使用比较循环阈值(Ct)方法,将AREG基因和ZKSCAN3基因与细胞内参照基因HPRT1做标准化对比,候选基因的标准化表达-dCt=HPRT1基因的Ct值-候选基因的Ct值。
利用AREG基因和ZKSCAN3基因相对于HPRT1基因的标准化表达量计算HIR-CRC得分,采用的公式为HIR-CRC=1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))计算HIR-CRC得分,其中,AREG表示AREG基因相对于HPRT1基因的标准化表达量,ZKSCAN3表示ZKSCAN3基因相对于HPRT1基因的标准化表达量。其中,“^”后面的表达式位于e的平方处,例如,“e^A”表示“eA”,即e的A次方。
步骤203:将HIR-CRC得分与截止值进行比较以确定受试者是否患有结直肠癌。
具体地,截止值是0.5。当HIR-CRC得分大于0.5时,表示受试者患有结直肠癌,否则,表示受试者未患有结直肠癌。
按照约登指数(Youden index)方法的建议,选择0.5作为截止值,从而能够最大限度地提高敏感性和特异性的临床表现。
用于检测结直肠癌的产品
第五方面,本发明提供了一种检测结直肠癌的产品,包括检测AREG基因和ZKSCAN3基因的表达水平的试剂。检测结直肠癌的产品可以是试剂盒、药物、基因芯片或检测试纸。
其中,试剂盒是基因检测试剂盒,包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
其中,药物可以是具有如下特点的制剂:该制剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂,并且,该制剂能够用于检测AREG基因和ZKSCAN3基因的表达水平。
其中,基因芯片包括:i)固相载体,ii)探针,该探针固定于固相载体并能够与AREG基因和ZKSCAN3基因的核酸序列杂交。
其中,检测试纸包括:i)试纸载体,ii)固定在试纸载体上的核酸,该核酸能够检测AREG基因和ZKSCAN3基因的表达水平。
在一种优选的具体实施方式中,检测结直肠癌的产品是试剂盒,包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
优选地,采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂包括扩增AREG基因和ZKSCAN3基因的特异性引物。更优选地,采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂还包括扩增HPRT1基因的特异性引物。
更优选地,检测AREG基因和ZKSCAN3基因的试剂是AREG基因和ZKSCAN3基因以及内参基因HPRT1的特异性引物SEQ ID NO:1至SEQ ID NO:6。具体如下:
Figure BDA0003848203460000161
可选地,本发明的试剂盒还可以包括阴性对照和阳性对照。其中,阴性对照可以是无核酸酶水,阳性对照可以是人工配制的截止值大于0.5的人造样本。
应当说明的是,本发明的试剂盒还可以包括其它适用组分,例如,测量工具、稀释剂、缓冲剂、酶、药学上可接受的载体、注射器或将易于由本领域技术人员认识到的其它适用附件,本领域技术人员能够根据预定目的进行合理选择和配制。可选地,本发明的试剂盒还包括使用说明书。“使用说明书”通常包括描述在使用试剂盒的组分来实现所需结果时采用的技术的明确表述,所需结果例如是检测AREG基因和ZKSCAN3基因的表达水平。
实施例
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
实施例1:用于检测结直肠癌的生物标志物的筛选
1.样本来源
研究对象分为健康对照(HC)组和原发性结直肠癌(CRC患者)组,从这些研究对象的全血样本中通过红血细胞裂解法得到有核的白血细胞。
健康对照组的全血样本收集自绍兴市上虞人民医院体检中心进行例行年度体检的志愿者,检验结果无严重疾病并没有肠病史。
原发性结直肠癌患者(治疗前)的血液样本分别收集自青岛大学附属医院、杭州师范大学附属医院和湖南省肿瘤医院。所有CRC病例均通过术后或活检组织样本的病理学检测证实。
所有样本均按照相关机构审查委员会批准的方案采集,采集样本前需征得所有受试者的知情同意。
2.方法
按照图1所示的流程进行如下操作:
2.1在最初的发现阶段,有22个(10个CRC,12个HC)样本用来筛选区别HC和CRC患者的生物标志物。
血样收集和循环免疫细胞的纯化
在医院由专业护士抽取2ml静脉血,装在EDTA-K2采血管中(三力EDTAK2,湘械注准20152220045),并马上颠倒混匀,在4℃保存。全血采血后需在4小时内使用样本预处理试剂盒(积准生物,浙绍械备20210096)进行预处理。取1ml EDTA-K2处理过的全血与10毫升试剂A充分混匀,室温静置10分钟。室温离心300g,5分钟,沉淀循环免疫细胞。加10毫升冷藏试剂B,移液枪反复吹打5次,使沉淀充分混匀。再次室温离心300g,5分钟,沉淀循环免疫细胞。弃上清,把循环免疫细胞沉淀用700微升的试剂C充分溶解,负80度冰箱保存至RNA提取。
RNA提取,制库和RNA-seq二代测序
循环免疫细胞的总RNA通过
Figure BDA0003848203460000171
肠癌早筛试剂盒进行提取。提取后的RNA通过ND1000 nanodrop分光分度仪(Thermo Scientific,USA)定量,并通过AgilentBioanalyzer 2100(Agilent,USA)对RNA的完整度(RIN)进行评估。浓度大于100纳克/微升和RIN评估大于8的RNA样本通过
Figure BDA0003848203460000172
Single Cell/Low Input RNA Library PrepKit for Illumina制备转录组文库,在illumina Novaseq测序仪上得到每个样本大于12Gb的转录组测序(RNA-Seq)数据。原始fastq数据通过Partek Flow(Partek,USA)的STAR分析流程,得到全转录组内的基因RNA表达的量化数据。通过ANOVA对CRC和HC的外周血内白血细胞RNA表达的分析,得到针对CRC的特异的RNA水平的生物标志物。候选基因(即候选生物标志物)要满足以下条件:CRC与HC样本的对比中,上调基因的倍数要大于2,下调基因的倍数要小于-2,p值小于0.01。最终有10个基因被选择进行RT-qPCR验证。
2.2在95个(47个CRC,48个HC)样本中识别2-基因特征
为了评估这5个基因的诊断价值,发明人对一组95个(47个CRC和48个HC)的识别组样本做了RT-qPCR,并以HPRT1作为内参计算-dCt的标准化表达值。并进行单因素ROC分析和多因素二元逻辑回归分析。
2.3在314例(134例CRC和180例HC)样本的训练组中建立了一种基于RT-qPCR技术的检测方法,建立HIR-肠癌诊断方法(HIR即人类免疫应答(Human Immune Response));
通过RT-qPCR方法对于RNA-Seq所发现的候选生物标志物进行验证。
用于RT-qPCR验证的引物序列如下:
Figure BDA0003848203460000181
200纳克的总RNA通过
Figure BDA0003848203460000182
肠癌早筛试剂盒逆转录成cDNA,并对1/50的逆转录cDNA产物进行检测。使用比较循环阈值(Ct)方法,将候选基因的表达与细胞内参照基因(HPRT1)做标准化对比,在后续分析中应用-dCt作为候选基因的标准化表达量。候选基因的标准化表达,-dCt=HPRT1基因的Ct值-候选基因的Ct值。
从134例CRC和180例HC样本中得到的每个候选基因对比参照基因的相对于内参HPRT1的标准化表达量的RT-qPCR数据,通过SPSS软件生成受试者工作特征(ROC)曲线。ROC曲线的线下面积(AUC)作为评价单一候选基因作为分别CRC的生物标志物。通过倒退逐步法逻辑回归构建模型,计算多个候选基因的联合区别CRC的ROC曲线,从而得到一个最小集的HIR-肠癌诊断的概率值(0-1)。模型中包括AREG基因和ZKSCAN3基因。HIR-肠癌诊断的概率算法为1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3))),其中AREG和ZKSCAN3分别代表基因HPRT1标准化表达的-dCt值。
根据约登指数(Youden index)方法的建议,选择0.5为截止值来最优化应用于临床检测时的敏感性和特异性。HIR-肠癌诊断可能概率大于0.5表明该样本可以认为是CRC。
2.4在178例(72例CRC和106例HC)样本的独立验证组中用该RT-qPCR方法进行了回顾性检测。
通过2.3所述方法,获得AREG基因和ZKSCAN3基因在循环免疫细胞中的标准化表达量,并通过1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))算出HIR-肠癌检测的概率值。以0.5为截止值,计算灵敏度和特异性。
2.5 CEA和CA19-9检测
作为对比,对上述训练组和验证组的CRC患者进行了CEA和CA19-9检测,分别使用癌胚抗原定量测定试剂盒和糖类抗原19-9定量测定试剂盒(上海透景生命科技股份有限公司)检测受检血清中的CEA和CA19-9浓度。血清CEA浓度大于5ng/ml被定义为CEA阳性样本,血清CEA浓度低于5ng/ml被定义为CEA阴性样本。血清CA19-9浓度大于35U/ml被定义为CA19-9阳性样本,血清CA19-9浓度低于35U/ml被定义为CA19-9阴性样本。
3.统计分析
采用事后检验(post hoc)配对Bonferroni校正t检验的方差分析(ANOVA)分析,分析HC组和CRC组之间样本均值差异的显著性。
使用单变量二元逻辑回归分析确定单个生物标志物的预测准确性。各独立生物标志物的p值由Wald卡方检验确定,截止值为p<0.05。ROC分析还显示了每个生物标志物的区分能力。采用逐步正演的多因素二元逻辑回归方法,确定生物标志物联合使用时的预测精度。
表1实施例1采用的样本的具体信息
发现组 识别组 训练组 验证组
健康对照
n 12 48 180 106
年龄,中间值(范围) 50(40-69) 59(42-69) 58(40-79) 59(40-71)
性别,n(%)
6(50%) 20(42%) 73(41%) 44(42%)
6(50%) 28(58%) 107(59%) 62(58%)
结直肠癌患者
n 10 47 134 72
年龄,中间值(范围) 63(56-70) 63(54-79) 64(48-80) 63(52-76)
性别,n(%)
2(20%) 19(40%) 48(36%) 28(39%)
8(80%) 28(60%) 86(64%) 44(61%)
肿瘤分期,n(%)
I 3(30%) 7(15%) 40(30%) 24(33%)
II 5(50%) 21(45%) 46(34%) 25(45%)
III 2(20%) 17(36%) 41(31%) 20(28%)
IV 0(0%) 2(4%) 7(5%) 3(4%)
淋巴结转移,n(%)
5(50%) 27(57%) 69(51%) 32(44%)
5(50%) 20(43%) 65(49%) 40(56%)
远端转移,n(%)
1(10%) 8(17%) 19(14%) 11(15%)
9(90%) 39(83%) 115(86%) 61(85%)
CEA,n(%)
<5ng/ml 6(60%) 24(51%) 82(61%) 43(60%)
≥5ng/ml 4(40%) 23(49%) 52(39%) 29(40%)
CA19-9,n(%)
<35U/ml 7(70%) 38(81%) 106(79%) 57(79%)
≥35U/ml 3(30%) 9(19%) 28(21%) 15(21%)
采用Fisher精确检验,p<0.05,针对CRC和HC之间的样本分布或者不同组之间的样本分布,未发现统计学意义上的显著性差异
4.结果
4.1循环免疫细胞识别结直肠癌的HIR-肠癌诊断分子标志物的鉴定
为了筛选出循环免疫细胞来源的生物标志物,发明人对22人循环免疫细胞样本(其中10名CRC患者、12名HC)进行了全转录组RNA测序(RNA-Seq),比较他们的转录组差异以期找出能区分HC和CRC的RNA标志物。
图2显示了主成分分析表明循环免疫细胞内具有识别结直肠癌的特异性RNA表达。由图2可以看出,主成份分析显示HC和CRC两组循环免疫细胞样本转录产物差别很大。使用逆转录定量PCR(RT-qPCR)对这些转录产物进行定量,5个转录产物,即AREG基因、CXCL1基因、CXCL8基因,IFITM10基因,和ZKSCAN3基因,被证明在CRC和HC循环免疫细胞样本之间具有差异表达(p<0.05)。
4.2 HIR-结直肠癌诊断分子标志物在识别组准确分别CRC样本
为了评估这5个基因的诊断价值,发明人对一组95例(47例CRC和48例HC)的识别组样本做了RT-qPCR,并以HPRT1作为内参计算-dCt的标准化表达值。
如图3的(A)所示,单因素ROC分析显示,对于每个单独的生物标志物在ROC曲线中的AUC分别是:AREG基因(AUC=0.79)、CXCL1基因(AUC=0.84)、CXCL8基因(AUC=0.89),IFITM10基因(AUC=0.87)和ZKSCAN3基因(AUC=0.22)。
然后,对上述检测样本进行多因素二元逻辑回归分析,分析这5个基因随机组合对区分HC和CRC的诊断准确性。结合图3的(A),结果发现,在这组95人的识别组中,AREG基因和ZKSCAN3基因所组成的HIR-肠癌诊断标志物,具有更高的AUC为0.93(CI:0.89-0.98),明显优于单独的5个基因中的任何一个。
在此基础上本发明人在一组314例样本(134例CRC和180例HC)的训练组中,建立HIR-肠癌的定量RT-qPCR检测方法。HIR-肠癌诊断的概率算法为1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3))),其中AREG和ZKSCAN3分别代表基因HPRT1标准化表达的-dCt值。根据约登指数(Youden index)方法的建议,选择0.5为截止值来最优化应用于临床检测时的敏感性和特异性。CRC可能概率大于0.5表明该样本可以认为有结直肠癌。
如图3的(B)所示,在0.5的截止点处,基于HIR-肝癌检测方法在该训练组中区分CRC的敏感性为80%、特异性为81%。
在178例独立验证组中验证了该HIR-肠癌检测方法和逻辑方程的有效性,其中包括106例HC和72例CRC。如图3的(D)所示,基于HIR-肠癌检测获得的AUC为0.93(CI:0.89-0.97)。如表2所示,以0.5为截止值,HIR-肠癌诊断方法检测在该组的灵敏度为82%,特异性为78%。
表2单个或联合生物标志物检测CRC的诊断性能
Figure BDA0003848203460000221
Figure BDA0003848203460000231
CRC,结直肠癌;HC,健康对照;HIR-CRC是基于包括AREG和ZKSCAN3的2-基因特征计算的风险分;早期CRC,I期和II期CRC;晚期CRC,III期和IV期CRC;CEA阴性,血清癌胚抗原<5ng/ml;CEA阳性,血清CEA>5ng/ml;CA19-9阴性,血清碳水化合物抗原19-9<35U/ml;CA19-9阳性,CA19-9>35U/ml;SE,灵敏性;SP,特异性NPV,阴性预测值;PPV,阳性预测值。
4.3评估HIR-肠癌诊断标志物对不同亚组CRC患者的检测性能
随后对来自训练组和验证组的492例样本进行汇总为206 CRC和286 HC组成的病例组,通过HIR-肠癌诊断1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))所得到的肠癌概率,对HIR-肠癌诊断标志物在其中不同亚组CRC患者的检测性能进行评估。结果如图4和表3所示。
如表3所示,HIR-肠癌诊断标志物在该组合组中达到灵敏性为80%,CEA的灵敏度为39%,CA19-9的灵敏度为21%。在早期CRC中,HIR-肠癌的灵敏度为82%,CEA的灵敏度为33%,CA19-9的灵敏度为9%。HIR-肠癌在CEA阴性样本中的灵敏度为76%,CA19-9的灵敏度为15%。HIR-肠癌在CA19-9阴性样本中的灵敏度为80%,CEA的灵敏度为31%。
表3:CEA、CA19-9和HIR-CRC识别不同CRC亚组的临床灵敏性
Figure BDA0003848203460000232
实施例2:用于检测结直肠癌的试剂盒
用于检测结直肠癌的早筛试剂盒包括如下预混液
编号 成分 22个测试/试剂盒
1 BAN提取试剂 110微升
2 逆转录缓冲预混液 132微升
3 逆转录酶 22微升
4 荧光定量PCR预混液 110微升
5 AREG引物 11微升
6 ZKSCAN3引物 11微升
7 HPRT1引物 11微升
8 无酶水 1200微升
9 阳性对照 10微升
上述阳性对照为HIR-肠癌检测阈值为大于0.5的人造样本,其制作方法为通过把检测基因PCR的扩增子克隆在T-easy vector,然后根据结直肠癌病人样本检测基因分布的90%percentile(百分位)的拷贝值,在阳性对照样本中用扩增子的克隆制备出相对应的拷贝数。阳性对照样本得到的HIR-肠癌检测阈值是通过本文中所描述的RT-qPCR方法来确定的。
待测基因的定量PCR预混液的组成成分/22个测试的试剂盒为
2x定量PCR主预混液 110ul
待测基因的正向引物10uM 11ul
待测基因的反向引物10uM 11ul
无核酸酶水 880ul
总量 220ul
上述各引物由IDT公司(Integrated DNA Technologies,Inc.)合成,PCR主预混液购买自KAPA Biosystems公司。
实施例3:结直肠癌的检测
1.血样收集和循环免疫细胞的纯化
在医院由专业护士抽取2ml静脉血,装在EDTA-K2采血管中(三力EDTAK2,湘械注准20152220045),并马上颠倒混匀,在4℃保存。全血采血后需在4小时内使用样本预处理试剂盒(积准生物,浙绍械备20210096)进行预处理。取1ml EDTA-K2处理过的全血与10毫升试剂A充分混匀,室温静置10分钟。室温离心300g,5分钟,沉淀循环免疫细胞。加10毫升冷藏试剂B,移液枪反复吹打5次,使沉淀充分混匀。再次室温离心300g,5分钟,沉淀循环免疫细胞。弃上清,把循环免疫细胞沉淀用700微升的试剂C充分溶解,负80度冰箱保存至RNA提取。
2.RNA提取
循环免疫细胞的总RNA通过
Figure BDA0003848203460000251
肠癌早筛试剂盒进行提取。提取后的RNA通过ND1000 nanodrop分光分度仪(Thermo Scientific,USA)定量,
3.逆转录
200ng总RNA通过实施例2的早筛试剂盒逆转录成cDNA。
逆转录反应体系:
组分 体积
200ng总RNA 2.0ul
逆转录预混液 5.0μL
MultiScribeTM逆转录酶 1.0μL
无核酸酶水 12.0μL
反应总体积 20.0μL
逆转录反应条件:
设置 步骤1 步骤2 步骤3 步骤4
温度 25℃ 37℃ 85℃ 4℃
时间 10分钟 120分钟 5分钟
4.检测
采用实施例2的肠癌早筛试剂盒进行检测,5倍稀释的逆转录反应产物作为试剂盒的待测输入样本。
每个基因的定量PCR反应设置是:
基因特异性定量PCR预混液 8ul
5x稀释的逆转录产物 2ul
每个基因的定量PCR反应条件是:
Figure BDA0003848203460000261
通过ABI Q6实时定量PCR仪,在荧光量达到0.05时的时候确定Ct值。通过-dCt的方法获得每个基因的标准化表达。并通过1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))算出肠癌风险的概率值。以0.5为截止值,计算灵敏度和特异性。结果与实施例1中的结果一致。
上述实施例为本发明较佳的实施方式,但本方面的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的替代、修饰、组合、改变、简化等,均应为等效的置换方式,都包含在本发明的保护范围之内。
参考文献:
1.Jemal,A.等人,癌症统计,2009。CA Cancer J Clin,2009。59(4):p.225-49。
2.Torre,LA等人,全球癌症统计,2012年。CA Cancer J Clin,2015年。65(2):p.87-108。
3.Sung,JJ等人,亚洲结直肠癌发病率增加:筛查的意义。Lancet Oncol,2005.6(11):p.871-6。
4.Miller,KD等人,癌症治疗和生存统计,2019年。CA Cancer J Clin,2019年。69(5):p。363-385。
5.Siegel、RL、KD Miller和A.Jemal,癌症统计,2016年。CA Cancer J Clin,2016年。66(1):p。7-30。
6.ASoP等委员会,内窥镜检查在结直肠癌分期和管理中的作用。GastrointestEndosc,2013.78(1):p.8-12。
7.Sung,H.等人,2020年全球癌症统计:全球185个国家36种癌症的全球发病率和死亡率估计值。CA Cancer J Clin,2021.71(3):p.209-249。
8.Loeve,F.等人,内窥镜结直肠癌筛查:成本节约分析。J Natl Cancer Inst,2000.92(7):p.557-63。
9.Knudsen,AB等人,结直肠癌筛查策略的收益、负担和危害估计:美国预防服务工作组的建模研究。美国医学会杂志,2016.315(23):p.2595-609。
10.Carroll、MR、HE Seaman和SP Halloran,结直肠癌筛查的测试和调查。临床生化,2014.47(10-11):p.921-39。
11.Garborg,K.等人,结直肠癌筛查的现状。Ann Oncol,2013.24(8):p.1963-72年。
12.Duffy,MJ等人,生化标志物在结直肠癌中的临床应用:欧洲肿瘤标志物组织(EGTM)指南。Eur J Cancer,2003.39(6):p.718-27。
13.Gao,Y.等人,血清CEA、CA19-9、CA72-4、CA125和铁蛋白作为结直肠癌诊断标志物和临床参数因素的评估。科学代表,2018。8(1):p。2732.
14.Imperiale、TF、DF Ransohoff和SH Itzkowitz,用于结肠直肠癌筛查的多靶点粪便DNA检测。N Engl J Med,2014.371(2):p.187-8。
15.Han,YD,et al.,基于粪便DNA中甲基化syndecan-2(SDC2)存在的结直肠癌早期检测。临床表观遗传学,2019.11(1):p.51。

Claims (10)

1.一种检测结直肠癌的生物标志物组,其特征在于,包括AREG基因和ZKSCAN3基因。
2.检测AREG基因和ZKSCAN3基因的表达水平的试剂在制备检测结直肠癌的产品中的应用。
3.根据权利要求2所述的应用,其特征在于,所述结直肠癌是I期结直肠癌、II期结直肠癌、III期结直肠癌或IV期结直肠癌;优选地,所述结直肠癌是I期结直肠癌或II期结直肠癌;更优选地,所述结直肠癌是I期结直肠癌。
4.根据权利要求2所述的应用,其特征在于,所述试剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
5.根据权利要求4所述的应用,其特征在于,所述试剂包括AREG基因和ZKSCAN3基因的特异性引物;可选地,还包括HPRT1基因的特异性引物。
6.根据权利要求5所述的应用,其特征在于,AREG基因的特异性引物包括SEQ ID NO:1和SEQ ID NO:2的序列;ZKSCAN3基因的特异性引物包括SEQ ID NO:3和SEQ ID NO:4的序列;HPRT1基因的特异性引物包括SEQ ID NO:5和SEQ ID NO:6的序列。
7.根据权利要求2至6任一项所述的应用,其特征在于,检测结直肠癌的方法包括:
获得受试者的血液白细胞;
测量AREG基因和ZKSCAN3基因在血液白细胞中的标准化转录物表达,根据公式HIR-CRC=1/(1+e^(-(-3.216+0.721×AREG-0.826×ZKSCAN3)))计算HIR-CRC得分,其中,AREG表示AREG基因相对于HPRT1基因的标准化表达量,ZKSCAN3表示ZKSCAN3基因相对于HPRT1基因的标准化表达量;
将HIR-CRC得分与截止值进行比较以确定受试者是否患有结直肠癌;其中,所述截止值是0.5;当HIR-CRC得分大于0.5时,确定受试者患有结直肠癌。
8.一种检测结直肠癌的产品,其特征在于,包括检测AREG基因和ZKSCAN3基因的表达水平的试剂;
优选地,所述产品是试剂盒、药物、基因芯片或检测试纸;更优选地,所述产品是试剂盒。
9.根据权利要求8所述的检测结直肠癌的产品,其特征在于,所述试剂包括采用RT-qPCR技术检测AREG基因和ZKSCAN3基因的表达水平的试剂。
10.根据权利要求9所述的检测结直肠癌的产品,其特征在于,所述试剂包括AREG基因和ZKSCAN3基因的特异性引物;可选地,还包括HPRT1基因的特异性引物;
优选地,AREG基因的特异性引物包括SEQ ID NO:1和SEQ ID NO:2的序列;ZKSCAN3基因的特异性引物包括SEQ ID NO:3和SEQ ID NO:4的序列;HPRT1基因的特异性引物包括SEQID NO:5和SEQ ID NO:6的序列。
CN202211123798.XA 2022-09-15 2022-09-15 检测结直肠癌的生物标志物组及其应用 Pending CN116219007A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211123798.XA CN116219007A (zh) 2022-09-15 2022-09-15 检测结直肠癌的生物标志物组及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211123798.XA CN116219007A (zh) 2022-09-15 2022-09-15 检测结直肠癌的生物标志物组及其应用

Publications (1)

Publication Number Publication Date
CN116219007A true CN116219007A (zh) 2023-06-06

Family

ID=86571894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211123798.XA Pending CN116219007A (zh) 2022-09-15 2022-09-15 检测结直肠癌的生物标志物组及其应用

Country Status (1)

Country Link
CN (1) CN116219007A (zh)

Similar Documents

Publication Publication Date Title
US20200370127A1 (en) Biomarkers in Peripheral Blood Mononuclear Cells for Diagnosing or Detecting Lung Cancers
US20230366034A1 (en) Compositions and methods for diagnosing lung cancers using gene expression profiles
WO2016115354A1 (en) Methods for cancer diagnosis and prognosis
CN111139300B (zh) 一组结肠癌预后相关基因的应用
JP7182317B2 (ja) 婦人科新生物の診断方法
WO2011014697A1 (en) Methods of assessing a risk of cancer progression
CN110229899B (zh) 用于结直肠癌早期诊断或预后预测的血浆标记物组合
WO2020178315A1 (en) Methylation status of gasdermin e gene as cancer biomarker
KR102492149B1 (ko) 난소암 진단 또는 감별진단을 위한 마이크로rna-1246 및 이의 용도
AU2015246009B2 (en) Methods and kits for identifying pre-cancerous colorectal polyps and colorectal cancer
KR102096499B1 (ko) 대장암 진단 또는 재발 예측을 위한 마이크로rna-3960 및 이의 용도
US20210079479A1 (en) Compostions and methods for diagnosing lung cancers using gene expression profiles
US20240093306A1 (en) Micro rna liver cancer markers and uses thereof
CN111763736B (zh) 用于诊断甲状腺乳头状癌淋巴结转移的液体活检试剂盒
CN116219007A (zh) 检测结直肠癌的生物标志物组及其应用
KR20220131083A (ko) 갑상선암 진단을 위한 microRNA 바이오마커 및 이의 용도
WO2019095541A1 (zh) 一种诊断预示乳腺癌骨转移的组合物及诊断预示方法
US20240327927A1 (en) Active surveillance and risk stratification for prostate cancer
CN116287252B (zh) 长链非编码rna apcdd1l-dt在制备检测胰腺癌的产品中的应用
CN112176060B (zh) 一组血浆非编码rna及检测其表达水平的引物组与结直肠癌检测试剂盒
Chen et al. Fecal miRNAs as potential biomarkers for early detection of colorectal cancer: An updated review
CN116083583A (zh) miRNA-483-5p在制备胰腺癌肝转移诊断试剂盒中的应用
KR20210125442A (ko) GLRB 유전자의 CpG 메틸화 변화를 이용한 대장암, 직장암 또는 대장 선종 진단용 조성물 및 이의 용도
CN117947161A (zh) 一种诊断、检测、监测、预测肝癌预后的计算机系统和试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination