CN117887856A - 一种结直肠癌的诊断生物标志物及检测方法 - Google Patents
一种结直肠癌的诊断生物标志物及检测方法 Download PDFInfo
- Publication number
- CN117887856A CN117887856A CN202410220354.0A CN202410220354A CN117887856A CN 117887856 A CN117887856 A CN 117887856A CN 202410220354 A CN202410220354 A CN 202410220354A CN 117887856 A CN117887856 A CN 117887856A
- Authority
- CN
- China
- Prior art keywords
- colorectal cancer
- expression level
- nucleic acid
- acid encoding
- diagnostic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010009944 Colon cancer Diseases 0.000 title claims abstract description 126
- 208000001333 Colorectal Neoplasms Diseases 0.000 title claims abstract description 120
- 238000003745 diagnosis Methods 0.000 title claims abstract description 36
- 239000000090 biomarker Substances 0.000 title claims abstract description 26
- 238000001514 detection method Methods 0.000 title claims abstract description 15
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 29
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 29
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 29
- 210000002966 serum Anatomy 0.000 claims abstract description 19
- 102000018651 Epithelial Cell Adhesion Molecule Human genes 0.000 claims abstract description 16
- 108010066687 Epithelial Cell Adhesion Molecule Proteins 0.000 claims abstract description 16
- 238000012360 testing method Methods 0.000 claims abstract description 16
- 102100038095 Protein-glutamine gamma-glutamyltransferase 2 Human genes 0.000 claims abstract description 13
- 102000003850 Dipeptidase 1 Human genes 0.000 claims abstract description 11
- 108090000204 Dipeptidase 1 Proteins 0.000 claims abstract description 11
- 108700039882 Protein Glutamine gamma Glutamyltransferase 2 Proteins 0.000 claims abstract description 11
- 101001011906 Homo sapiens Matrix metalloproteinase-14 Proteins 0.000 claims abstract description 6
- 102100030216 Matrix metalloproteinase-14 Human genes 0.000 claims abstract description 6
- 230000014509 gene expression Effects 0.000 claims description 47
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 claims description 29
- 102000012406 Carcinoembryonic Antigen Human genes 0.000 claims description 28
- 108010022366 Carcinoembryonic Antigen Proteins 0.000 claims description 28
- 108020004999 messenger RNA Proteins 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 22
- 210000005259 peripheral blood Anatomy 0.000 claims description 19
- 239000011886 peripheral blood Substances 0.000 claims description 19
- 239000000523 sample Substances 0.000 claims description 19
- 239000011324 bead Substances 0.000 claims description 14
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 claims description 14
- 239000002299 complementary DNA Substances 0.000 claims description 12
- 239000003153 chemical reaction reagent Substances 0.000 claims description 11
- 238000003066 decision tree Methods 0.000 claims description 9
- 102000001301 EGF receptor Human genes 0.000 claims description 7
- 108060006698 EGF receptor Proteins 0.000 claims description 7
- 108010076557 Matrix Metalloproteinase 14 Proteins 0.000 claims description 6
- 102000011716 Matrix Metalloproteinase 14 Human genes 0.000 claims description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 5
- 238000009007 Diagnostic Kit Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 239000012472 biological sample Substances 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000036541 health Effects 0.000 claims description 2
- 239000000104 diagnostic biomarker Substances 0.000 claims 1
- 238000012216 screening Methods 0.000 abstract description 9
- 230000035945 sensitivity Effects 0.000 abstract description 7
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 239000000107 tumor biomarker Substances 0.000 abstract 1
- 108090000623 proteins and genes Proteins 0.000 description 25
- 201000002758 colorectal adenoma Diseases 0.000 description 14
- 210000004369 blood Anatomy 0.000 description 11
- 239000008280 blood Substances 0.000 description 11
- 238000012549 training Methods 0.000 description 8
- 208000003200 Adenoma Diseases 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 6
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 6
- 239000000439 tumor marker Substances 0.000 description 6
- 206010001233 Adenoma benign Diseases 0.000 description 5
- 230000017531 blood circulation Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- XFCMNSHQOZQILR-UHFFFAOYSA-N 2-[2-(2-methylprop-2-enoyloxy)ethoxy]ethyl 2-methylprop-2-enoate Chemical compound CC(=C)C(=O)OCCOCCOC(=O)C(C)=C XFCMNSHQOZQILR-UHFFFAOYSA-N 0.000 description 3
- 108010000684 Matrix Metalloproteinases Proteins 0.000 description 3
- 102000002274 Matrix Metalloproteinases Human genes 0.000 description 3
- 101100224410 Solanum tuberosum DPEP gene Proteins 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 201000010989 colorectal carcinoma Diseases 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 210000002919 epithelial cell Anatomy 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 239000000377 silicon dioxide Substances 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 210000004881 tumor cell Anatomy 0.000 description 3
- 102000016289 Cell Adhesion Molecules Human genes 0.000 description 2
- 108010067225 Cell Adhesion Molecules Proteins 0.000 description 2
- 102100020743 Dipeptidase 1 Human genes 0.000 description 2
- 101150084967 EPCAM gene Proteins 0.000 description 2
- 102100039578 ETS translocation variant 4 Human genes 0.000 description 2
- 101000932213 Homo sapiens Dipeptidase 1 Proteins 0.000 description 2
- 101000813747 Homo sapiens ETS translocation variant 4 Proteins 0.000 description 2
- 101000666171 Homo sapiens Protein-glutamine gamma-glutamyltransferase 2 Proteins 0.000 description 2
- CERQOIWHTDAKMF-UHFFFAOYSA-M Methacrylate Chemical compound CC(=C)C([O-])=O CERQOIWHTDAKMF-UHFFFAOYSA-M 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 210000000601 blood cell Anatomy 0.000 description 2
- 239000006285 cell suspension Substances 0.000 description 2
- 238000002052 colonoscopy Methods 0.000 description 2
- 238000007847 digital PCR Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 230000036210 malignancy Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 206010061289 metastatic neoplasm Diseases 0.000 description 2
- 239000013049 sediment Substances 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 102000008096 B7-H1 Antigen Human genes 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 206010018910 Haemolysis Diseases 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 206010062237 Renal impairment Diseases 0.000 description 1
- -1 TM4SF1 Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 230000010100 anticoagulation Effects 0.000 description 1
- 238000004500 asepsis Methods 0.000 description 1
- 230000023555 blood coagulation Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 230000008588 hemolysis Effects 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000005977 kidney dysfunction Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000101 novel biomarker Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种结直肠癌的诊断生物标志物及检测方法。所述结直肠癌生物标志物包括转谷氨酰胺酶2、上皮细胞黏附分子,二肽酶1、基质金属肽酶14和跨膜4L超家族成员1的组合,和/或,转谷氨酰胺酶2的编码核酸、上皮细胞黏附分子的编码核酸、二肽酶1的编码核酸、基质金属肽酶14的编码核酸和跨膜4L超家族成员1的编码核酸的组合。本发明以所述生物标志物为特征构建CRC Score诊断模型,在测试组患者的诊断准确率为88%,灵敏度和特异度分别为86%和92%,相比于现有血清指标能更早发现结直肠癌,有利于结直肠癌的早期筛查。
Description
技术领域
本发明属于分子生物学技术领域,发明了一种结直肠癌的诊断生物标志物及检测方法,涉及一种与结直肠癌相关的生物标志物的检测,尤其涉及一种基于循环肿瘤细胞mRNA组合的结直肠癌诊断生物标志物用于结直肠癌的诊断。
背景技术
结直肠癌(CRC)已成为全球发病率第三的实体恶性肿瘤。结直肠癌是为数不多的采用适当筛查方法可以发现癌前病变或早期肿瘤,从而通过适宜临床干预降低发病率和病死率的恶性疾病。结直肠癌的发生发展大多遵循“腺瘤-癌”序列,从癌前病变进展到癌一般需要5~10年的时间,为疾病的早期诊断和临床干预提供了重要时间窗口。CRC通过早期发现和治疗,如结肠镜检查和外科检查,患者的5年生存率可提高至90%。肠镜为公认的筛查金标准,但由于侵入性、肠道准备和高成本等因素,依从性低,无法成为大规模筛查手段。粪便免疫化学检测(FIT)是无创和经济的,但FIT在检测结直肠腺瘤(AA)方面的准确性较低,且只有约5%的接受结肠镜检查的个体会发现有重要的病变(CRC或AA)。因此,亟需开发一种高灵敏、高特异地非侵入性结直肠癌结直肠癌诊断方法。
循环肿瘤细胞(CTCs)是指来源于原发或转移肿瘤、脱落进入外周血液循环中的肿瘤细胞。由于其携带原发性或转移性病灶的重要信息,并且能够通过血液循环播散至全身其他组织器官,因此CTCs被视为一种具有前景的非侵入性癌症诊断标志物。通过纯化外周血样本中的CTCs,并分析其内的特征性分子,如蛋白质、mRNA、lncRNA等,有望实现无创、连续、实时的动态监测,这为结直肠癌的及时诊断提供了新的方向,如CN111521800A公开通过外周血循环肿瘤细胞检测结直肠癌患者PD-L1基因表达的免疫荧光试剂盒。
综上所述,开发新型的与结直肠癌相关的生物标志物以及相应检测方法,扩充结直肠癌的诊断、腺瘤进展监测的技术手段,对于发现早期结直肠癌具有重要意义。
发明内容
针对现有技术的不足和实际需求,本发明提供一种与结直肠癌相关的生物标志物及其应用,为结直肠癌的诊断提供新方法、新思路。
为达上述目的,本发明采用以下技术方案:
第一方面,本发明提供与结直肠癌相关的生物标志物及其检测试剂在制备检测结直肠癌的产品中的应用;所述与结直肠癌相关的生物标志物包括转谷氨酰胺酶2(TGM2)、上皮细胞黏附分子(EpCAM)、二肽酶1(DPEP1),基质金属肽酶14(MMP14)和跨膜4L超家族成员1(TM4SF1)的组合,和/或,转谷氨酰胺酶2的编码核酸、上皮细胞黏附分子的编码核酸、二肽酶1的编码核酸、基质金属肽酶14的编码核酸和跨膜4L超家族成员1的编码核酸的组合;所述编码核酸包括mRNA或cDNA。
本发明首次发现结直肠血液循环肿瘤细胞中的转谷氨酰胺酶2(TGM2)、上皮细胞黏附分子(EpCAM),二肽酶1(DPEP1),基质金属肽酶14(MMP14),跨膜4L超家族成员1(TM4SF1)及其编码核酸与结直肠癌发展相关,其在结直肠癌患者中过表达、但在正常结直肠组织和结直肠腺瘤组织中低表达或无表达,可有效应用于结直肠癌的诊断、腺瘤进展监测等。
优选地,所述检测试剂包括检测所述与结直肠癌相关的生物标志物的存在或表达水平的试剂。
优选地,所述试剂包括与结直肠癌相关的生物标志物的PCR引物和/或探针。
第二方面,本发明提供一种与结直肠癌相关的生物标志物的诊断试剂盒,所述诊断试剂盒包括捕获抗体及第一方面中所述的检测试剂;所述捕获抗体包括上皮黏附分子的抗体和表皮生长因子受体的抗体(用于修饰捕获结直肠癌循环肿瘤细胞的免疫磁珠)。
第三方面,本发明提供第二方面所述的诊断试剂盒的使用方法,所述使用方法的步骤包括:
利用第方面所述捕获抗体修饰的免疫磁珠从受试者的生物样本中分离纯化结直肠癌循环肿瘤细胞;
将结直肠癌循环肿瘤细胞裂解后提取RNA,并将其反转录成cDNA;
利用PCR进行定量检测cDNA,计算权利要求1中所述与结直肠癌相关的生物标志物的cDNA对应的mRNA的表达水平;
检测受试者血清癌胚抗原的表达水平;
以所述mRNA的表达水平和血清癌胚抗原的表达水平为特征,利用构建的结直肠癌诊断模型获取受试者CRC诊断评分,用于诊断结果。
优选地,所述分离纯化结直肠癌循环肿瘤细胞的方法包括:离心分离受试者外周血单核细胞,将外周血单核细胞与所述捕获抗体和免疫磁珠混合,收集免疫磁珠。
优选地,所述免疫磁珠,包括二氧化硅外壳,所述二氧化硅外壳上依次修饰有抗粘附层和链霉亲和素,所述抗粘附层的成分为聚磺酰氨基甲基丙烯酸酯(pSBMA),能够降低外周血单核细胞等非特异性黏附,以提高CTCs的捕获效率。
优选地,所述捕获抗体包括上皮黏附分子(EpCAM)的抗体、表皮生长因子受体(EGFR)的抗体。
优选地,所述生物样品包括外周血。
第四方面,本发明提供第三方面所述的结直肠癌诊断模型构建方法,所述方法包括:基于第一方面血清癌胚抗原的表达水平和所述与结直肠癌相关的生物标志物的表达水平和,利用极致梯度提升决策树(Xgboost)建立诊断模型。
优选地,所述诊断模型的输入变量包括受试者的第一方面所述的与结直肠癌相关的生物标志物表达水平,以及血清癌胚抗原(CEA)的表达水平,所述诊断模型的输出变量为受试者的评分CRC Score,所述CRC Score极致梯度提升决策树(Xgboost)模型构建所用超参数如下:
输入数据为:A1,A2,A3,A4,A5和A6,树的列采样率为0.8,树的最大深度为3,构建决策树的数量为150,子样本比例为0.8,学习率为0.01;
其中,A1表示转谷氨酰胺酶2(TGM2)或其编码核酸的表达水平,A2表示上皮细胞黏附分子(EpCAM)或其编码核酸的表达水平,A3表示二肽酶1(DPEP1)或其编码核酸的表达水平,A4表示基质金属肽酶14(MMP14)或其编码核酸的表达水平,A5表示跨膜4L超家族成员1(TM4SF1)或其编码核酸的表达水平,A6表示血清癌胚抗原(CEA)的表达水平。
优选地,结直肠癌阳性的判断标准为:CRC Score>0.488。
第五方面,本发明提供一种结直肠癌的诊断标志物的检测方法,所述检测方法包括信息获取模块、计算模块和诊断模块。
所述信息获取模块用于执行包括:
获取受试者检测信息的操作,所述检测信息包括第一方面所述与结直肠癌相关的生物标志物和血清癌胚抗原的表达水平信息。
所述计算模块用于执行包括:
将所述生物标志物和血清癌胚抗原的表达水平信息代入第四方面所述的结直肠癌的诊断模型,计算CRC Score值;
所述诊断模块用于执行包括:
根据所述CRC Score值判断所述受试者的健康状况的操作,结直肠癌阳性的判断标准为:CRC Score>0.488。
本发明中,在样本来源上,可通过捕获外周血中的CTCs能够有效获取CRC癌灶部位的生物信息进行诊断,可以无损地动态监测肿瘤状态。
本发明中,用EpCAM、EGFR抗体靶向结直肠癌特异的CTCs,并利用修饰的免疫磁珠对外周血中的CRC来源CTCs进行特异性捕获,其中免疫磁珠包括二氧化硅外壳、抗粘附层和链霉亲和素,抗粘附层成分为聚磺酰氨基甲基丙烯酸酯(pSBMA),能够降低外周血单核细胞等非特异性黏附,以提高CTCs的捕获效率。抗体可先与循环肿瘤细胞样本混合后再与免疫磁珠混合,也可先与免疫磁珠混合再与循环肿瘤细胞样本混合。
本发明中,所述诊断模型和装置可应用于辅助结直肠癌诊断。
与现有技术相比,本发明具有以下有益效果:
本发明首次发现转谷氨酰胺酶2、上皮细胞黏附分子,二肽酶1,基质金属肽酶14,跨膜4L超家族成员1及其编码核酸与结直肠癌发生及发展相关,对其mRNA水平进行检测,同时联用受试者临床血清肿瘤标志物癌胚抗原(CEA)的表达水平,利用极致梯度提升决策树(Xgboost)模型建立CRC诊断模型,具备的诊断性能优于临床上常用血清肿瘤标志物CEA,在训练集上准确率可达91%,灵敏度和特异度分别可达93%和89%,在测试集上准确率可达88%,灵敏度和特异度分别可达85%和92%,说明该诊断模型对于CRC具有极佳的诊断能力。此外,本发明建立的CRC诊断模型能够更早发现腺瘤向结直肠癌进展的预警信号。
附图说明
图1为建立诊断模型流程示意图。
图2为CRC特征性mRNA基因的筛选流程图。
图3A为训练集中结直肠腺瘤患者外周血PBMCs中CRC特征性mRNA基因表达量热图。
图3B为训练集中结直肠癌患者外周血PBMCs中CRC特征性mRNA基因表达量热图。
图3C为测试集中结直肠腺瘤患者外周血PBMCs中CRC特征性mRNA基因表达量热图。
图3D为测试集中结直肠癌患者外周血PBMCs中CRC特征性mRNA基因表达量热图。
图4为单个目标基因在区分结直肠腺瘤患者与结直肠癌患者时的ROC曲线图。
图5为结直肠腺瘤患者、结直肠癌患者的CRC Score结果图。
图6为CEA(Cut off=5ng/mL)区分CRC与结直肠腺瘤的ROC曲线图。
图7为训练集中CRC Score区分CRC与结直肠腺瘤的ROC曲线图。
图8为测试集中CRC Score区分CRC与结直肠腺瘤的ROC曲线图。
具体实施方式
为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道购买获得的常规产品。
本发明具体实施例中,如图1所示,基于多抗体(EpCAM/EGFR)修饰磁珠来捕获外周血中的CRC来源CTCs,通过微滴式数字PCR(ddPCR)技术对CTCs内的特征性mRNAs表达量进行检测,从而判断受试者是否患有CRC;并利用极致梯度提升决策树(Xgboost)建立的CRC诊断模型对受试者CTC mRNA的检测结果和血清癌胚抗原CEA的表达水平进行评分。
实施例1
本实施例进行基于CTCs特征性mRNA的CRC诊断模型构建及评估。
共招募135名受试者,包括结直肠腺瘤患者和结直肠癌患者,上述受试者均于2022年1月至2023年11月纳入研究,其中包括78例Ⅰ-Ⅳ期结直肠癌和57例结直肠腺瘤,共采集外周血血样135例。
研究对象纳入标准如下:1)初诊时尚未接受手术、放疗、化疗等抗肿瘤治疗者;2)理解并同意参与本次研究,已签署知情同意书者;3)无血液系统疾病。研究对象及血液样本排除标准如下:1)既往有其他恶性肿瘤史的患者;2)伴严重感染或心、肺、肾功能不全者;3)血液标本采集结束后,出现血量不足、凝血或溶血者。本研究已通过苏州大学附属第二医院伦理审查委员会的批准(批准号#JD-LK2023052-I01),所有受试者对本研究均知情同意。
步骤一,CRC特征性mRNA基因筛选
筛选流程如图2所示,首先,利用基因表达综合数据集(Gene ExpressionOmnibus,GEO)中的GSE41657,GSE41258,GSE4183,GSE37364芯片数据,通过R语言中的limma包筛选出在CRC组织中过表达、但在正常结直肠组织和结直肠腺瘤组织中低表达或无表达的差异表达基因作为候选基因。筛选标准设定为logFC≥1且P<0.05。随后,利用人类蛋白数据库(Human ProteinAtlas,HPA)中的免疫细胞分库(HPAimmune cell dataset),对候选基因再次进行筛选,以排除在免疫细胞中呈现高表达的基因,最终筛选得到5个在CRC中特异性高表达的目标基因mRNA,即TGM2(转谷氨酰胺酶2)、ETV4(ETS变体转录因子4)、DPEP1(二肽酶1)、MMP14(基质金属肽酶14)和TM4SF1(跨膜4L超家族成员1),同时上皮细胞黏附分子(EpCAM)作为上皮性标志物也被纳入基因队列。
步骤二,临床患者血液样本CTCs分离和RNA提取
采集所有受试者5mL外周静脉血于EDTA真空抗凝采血管中,采样完毕后,上下颠倒采样管5次,4℃低温运输,24h内处理使用。为避免上皮细胞污染,所有血液标本均为非第一管外周血。将采血管置于常温水平式离心机中以300g离心15min得到血浆及下层血细胞沉淀;吸取上层血浆后,在血细胞沉淀中加入1×PBS溶液稀释至10mL(即初始外周血体积的2倍),吹打均匀;利用SepMateTM离心管分离外周血单核细胞层(PBMCs),清洗后,加入500μL(即初始外周血体积的0.1倍)1×PBS溶液以重悬PBMCs;将其中200μLPBMCs细胞悬液(对应2mL初始外周血体积)与0.1mg多抗体(EpCAM/EGFR,抗体购买来源信息详见表1)修饰磁珠25℃孵育30min以捕获结直肠癌CTCs,剩余PBMCs细胞悬液加入700μL QIAzol裂解液后冻存于-20℃备用;清洗CTC样本后,加入700μL QIAzol裂解液,利用Direct-zolTM RNAMicroprep试剂盒(ZYMO RESEARCH)提取RNA并通过逆转录试剂盒(Takara)逆转录为cDNA模板,冻存于-20℃备用。
表1
步骤三,利用ddPCR对CTCs特征性mRNA基因进行定量
根据步骤一中筛选的目标基因mRNA编码基因序列,订购目标基因引物及探针(Thermo Fisher);通过QX200AutoDG微滴式数字PCR(Droplet Digital PCR,ddPCR)系统对样本中的目标基因mRNA分子进行检测,以获取每2mL外周血样本中所捕获到的CRC CTCs目标基因的mRNA表达量。ddPCR检测体系体积为20μL,由CTCs目标基因cDNA模板、ddPCR探针预混液(无dUTP)、无菌无酶水、目标基因引物及探针构成。经PCR扩增目标基因cDNA模板后,通过微滴读取仪(QX200 Droplet Reader)定量检测样品中目标基因mRNAs对应的cDNA浓度(transcripts/μL),计算得到每2mL外周血样本中所捕获到的CRC CTCs目标基因的mRNA表达量,以44名结直肠腺瘤、57名结直肠癌患者为训练集,以13名结直肠腺瘤、21名结直肠癌患者为测试集,训练集检测结果如图3A、图3B所示,测试集检测结果如图3C和图3D所示。
步骤四,结直肠癌诊断模型的构建和诊断效能评估
针对步骤三中获取的CRC患者术前血样及腺瘤患者术前血样中mRNA表达量,进行ROC分析计算曲线下面积(AUC),评估单个目标基因的诊断效能(图4),根据单基因的p值(p<0.05)筛选出基因作为建模特征,即TGM2、MMP14、TM4SF1、EpCAM和DPEP1(图4);
利用极致梯度提升决策树(Xgboost)建立CRC诊断模型,本实例中所述多层感知机模型构建所用超参数如下,树的列采样率为0.8,树的最大深度为3,构建决策树的数量为150,子样本比例为0.8,学习率为0.01;将样本中的建模特征基因表达量以及病人临床血清肿瘤标志物癌胚抗原(CEA)的表达水平代入模型中,即可得到每个受试者样本的CRC Score(图5)。
采用ROC曲线对CRC诊断模型进行诊断效果的评价,结果显示该模型在最优情况下对训练组患者诊断的灵敏度和特异度分别为93%和89%,诊断准确率达到了91%,AUC达到了0.978(图7)。在独立的测试组患者中,诊断灵敏度和特异度分别为85%和92%,诊断准确率达到了88%,AUC达到了0.905(图8)。为了比较CRC诊断模型与传统结直肠癌标志物CEA的诊断能力,在临床认可截断值为5ng/mL的情况下,只使用CEA建模诊断的灵敏度和特异度分别是37%和98%,诊断准确率为63%,AUC为0.677(图6)。由此可见,本发明建立的CRC诊断模型对CRC的诊断性能优于临床常用血清肿瘤标志物CEA。
综上所述,本发明挖掘结与直肠癌相关的生物标志物,并进一步开发诊断模型,基于本发明的CRC诊断模型,可以从良性对照中准确诊断出CRC,该诊断模型对CRC具有优于临床血清肿瘤标志物CEA的诊断效果,其受试者工作特征曲线(ROC)的曲线下面积(AUC)在训练集中为0.978,在测试集中为0.905,均显著高于CEA的0.677,差异具有统计学意义(P<0.0001),诊断特异性、敏感度和准确率均高于CEA。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。
Claims (9)
1.一种与结直肠癌相关的生物标志物及其检测试剂在诊断结直肠癌的产品中的应用;
所述与结直肠癌相关的生物标志物包括转谷氨酰胺酶2、上皮细胞黏附分子、二肽酶1、基质金属肽酶14和跨膜4L超家族成员1的组合,和/或,
转谷氨酰胺酶2的编码核酸、上皮细胞黏附分子的编码核酸、二肽酶1的编码核酸、基质金属肽酶14的编码核酸和跨膜4L超家族成员1的编码核酸的组合;所述编码核酸包括mRNA或cDNA。
2.根据权利要求1所述的应用,其特征在于,所述检测试剂包括检测所述与结直肠癌相关的生物标志物的存在或表达水平的试剂。
3.根据权利要求2所述的应用,其特征在于,所述试剂包括与结直肠癌相关的生物标志物的PCR引物和/或探针。
4.一种结直肠癌的诊断试剂盒,其特征在于,所述诊断试剂盒包括捕获抗体及权利要求1-3任一项中所述的检测试剂。
5.根据权利要求4所述的结直肠癌的诊断试剂盒,其特征在于,所述捕获抗体包括上皮黏附分子的抗体和表皮生长因子受体的抗体。
6.权利要求4或5所述的诊断试剂盒的使用方法,其特征在于,所述使用方法的步骤包括:
利用权利要求3中所述捕获抗体修饰的免疫磁珠从受试者的生物样本中分离纯化循环肿瘤细胞;
将结直肠癌循环肿瘤细胞裂解后提取RNA,并将其反转录成cDNA;
利用PCR进行定量检测cDNA,计算权利要求1中所述与结直肠癌相关的生物标志物的cDNA对应的mRNA的表达水平;
检测受试者血清癌胚抗原的表达水平;
以所述mRNA的表达水平和血清癌胚抗原的表达水平为特征,利用构建的结直肠癌诊断模型获取受试者CRC诊断评分,用于诊断结果。
7.根据权利要求6所述的使用方法,其特征在于,所述分离纯化结直肠癌循环肿瘤细胞的方法包括:
离心分离受试者外周血中外周血单核细胞,将外周血单核细胞与所述捕获抗体和免疫磁珠混合,收集免疫磁珠。
8.根据权利要求6所述的使用方法,其特征在于,所述结直肠癌诊断模型的输入变量包括所述mRNA的表达水平和血清癌胚抗原的表达水平;
所述诊断模型为极致梯度提升决策树模型,输出变量为受试者的评分CRC Score,所述模型输入数据为:A1,A2,A3,A4,A5和A6,树的列采样率为0.8,树的最大深度为3,构建决策树的数量为150,子样本比例为0.8,学习率为0.01;
其中,A1表示转谷氨酰胺酶2或其编码核酸的表达水平,A2表示上皮细胞黏附分子或其编码核酸的表达水平,A3表示二肽酶1或其编码核酸的表达水平,A4表示基质金属肽酶14或其编码核酸的表达水平,A5表示跨膜4L超家族成员1或其编码核酸的表达水平,A6表示血清癌胚抗原的表达水平;
优选地,结直肠癌阳性的判断标准为:CRC Score>0.488。
9.一种结直肠癌的诊断生物标志物的检测方法,其特征在于,所述检测方法的应用包括信息获取模块、计算模块和诊断模块;
所述信息获取模块用于执行包括:
获取受试者检测信息的操作,所述检测信息包括血清癌胚抗原和权利要求1中所述与结直肠癌相关的生物标志物的表达水平信息;
所述计算模块用于执行包括:
将所述生物标志物和血清癌胚抗原的表达水平信息代入权利要求6中所述的结直肠癌的诊断模型,计算CRC Score值;
所述诊断模块用于执行包括:
根据所述CRC Score值判断所述受试者的健康状况的操作,结直肠癌阳性的判断标准为:CRC Score>0.488。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410220354.0A CN117887856A (zh) | 2024-02-28 | 2024-02-28 | 一种结直肠癌的诊断生物标志物及检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410220354.0A CN117887856A (zh) | 2024-02-28 | 2024-02-28 | 一种结直肠癌的诊断生物标志物及检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117887856A true CN117887856A (zh) | 2024-04-16 |
Family
ID=90651942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410220354.0A Pending CN117887856A (zh) | 2024-02-28 | 2024-02-28 | 一种结直肠癌的诊断生物标志物及检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117887856A (zh) |
-
2024
- 2024-02-28 CN CN202410220354.0A patent/CN117887856A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111172279B (zh) | 外周血甲基化基因及idh1联合检测诊断肺癌模型 | |
CN105219844A (zh) | 一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型 | |
CN112313497A (zh) | 使用微流式细胞术诊断疾病的方法 | |
WO2017202185A1 (zh) | 甄别肺部微小结节良恶性的外周血基因标志物及其用途 | |
CN114277143B (zh) | 外泌体arpc5、cda等在肺癌诊断中的应用 | |
CN111748629A (zh) | 一种用于胰腺癌早期诊断的生物标志物的检测试剂 | |
CN110541030B (zh) | 膀胱癌检测试剂盒及其应用 | |
CN105624166B (zh) | 一种检测人膀胱移行细胞癌细胞的核酸适配体及其在制备检测制剂中的应用 | |
CN111489829A (zh) | 构建体外检测胰腺癌的数学模型的方法及其应用 | |
CN109762898A (zh) | 一种肿瘤标志物ca9和uca1在制备非侵入式检测患膀胱癌的概率的试剂盒中的应用 | |
CN109161597A (zh) | 一种用于前列腺癌早期诊断的外泌体源性基因mRNA标志物组及其应用 | |
CN117887856A (zh) | 一种结直肠癌的诊断生物标志物及检测方法 | |
CN115261476A (zh) | 筛选血清外泌体LncRNA HULC作为肝癌早期标记物的方法及其制备试剂盒的用途 | |
CN115927608A (zh) | 用于预测胰腺癌发生风险的生物标志物、方法和诊断设备 | |
CN113774139A (zh) | 甲胎蛋白与基因标志物联合在肿瘤诊断中的应用 | |
CN113817824A (zh) | 联合癌胚抗原的肿瘤基因诊断标志物及其用途 | |
CN112630433A (zh) | 一种检测胃癌自身抗体的生物标志物组合及其应用 | |
CN111690746A (zh) | 与肺癌相关的血小板rna标志物及其应用 | |
CN110993092A (zh) | 一种基于n-糖指纹图谱和大数据算法鉴别肝硬化及肝癌的方法 | |
CN110257514A (zh) | 一种新的食管癌血液miRNA标志物及其应用 | |
WO2019095541A1 (zh) | 一种诊断预示乳腺癌骨转移的组合物及诊断预示方法 | |
CN111826445B (zh) | miR-1468-5p在评估宫颈癌患者PD-L1表达中应用 | |
CN113549688B (zh) | 一组诊断冠状动脉疾病的分子标志物 | |
CN117604110B (zh) | 用于乳腺癌诊断和预后判断的生物标志物及其应用 | |
Dodda et al. | Biomarkers for Early Detection of Pancreatic Cancer: A Review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |