CN115820855B - Hdc、smpdl3a、irf4和aqp3在制备诊断cml的试剂及试剂盒中的应用 - Google Patents
Hdc、smpdl3a、irf4和aqp3在制备诊断cml的试剂及试剂盒中的应用 Download PDFInfo
- Publication number
- CN115820855B CN115820855B CN202211245379.3A CN202211245379A CN115820855B CN 115820855 B CN115820855 B CN 115820855B CN 202211245379 A CN202211245379 A CN 202211245379A CN 115820855 B CN115820855 B CN 115820855B
- Authority
- CN
- China
- Prior art keywords
- hdc
- aqp3
- smpdl3a
- cml
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000004363 Aquaporin 3 Human genes 0.000 title claims abstract description 51
- 108090000991 Aquaporin 3 Proteins 0.000 title claims abstract description 51
- 108010014095 Histidine decarboxylase Proteins 0.000 title claims abstract description 51
- 102100027485 Acid sphingomyelinase-like phosphodiesterase 3a Human genes 0.000 title claims abstract description 50
- 102100034405 Headcase protein homolog Human genes 0.000 title claims abstract description 50
- 101000936726 Homo sapiens Acid sphingomyelinase-like phosphodiesterase 3a Proteins 0.000 title claims abstract description 50
- 239000003153 chemical reaction reagent Substances 0.000 title claims abstract description 10
- 238000002360 preparation method Methods 0.000 title claims abstract description 6
- 102000043138 IRF family Human genes 0.000 title abstract 3
- 108091054729 IRF family Proteins 0.000 title abstract 3
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 claims abstract description 65
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 claims abstract description 65
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 claims abstract description 62
- 230000014509 gene expression Effects 0.000 claims abstract description 54
- 101001011441 Homo sapiens Interferon regulatory factor 4 Proteins 0.000 claims description 49
- 102100030126 Interferon regulatory factor 4 Human genes 0.000 claims description 49
- 238000011144 upstream manufacturing Methods 0.000 claims description 13
- 239000000090 biomarker Substances 0.000 claims description 9
- 238000009007 Diagnostic Kit Methods 0.000 claims description 3
- 108090000623 proteins and genes Proteins 0.000 abstract description 49
- 238000003745 diagnosis Methods 0.000 abstract description 17
- 238000010801 machine learning Methods 0.000 abstract description 14
- 238000012163 sequencing technique Methods 0.000 abstract description 12
- 238000013211 curve analysis Methods 0.000 abstract description 8
- 210000005259 peripheral blood Anatomy 0.000 abstract description 2
- 239000011886 peripheral blood Substances 0.000 abstract description 2
- 230000001105 regulatory effect Effects 0.000 abstract 2
- 238000000611 regression analysis Methods 0.000 abstract 1
- 230000035945 sensitivity Effects 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000000034 method Methods 0.000 description 11
- 230000003321 amplification Effects 0.000 description 10
- 238000003199 nucleic acid amplification method Methods 0.000 description 10
- 108020004707 nucleic acids Proteins 0.000 description 8
- 150000007523 nucleic acids Chemical class 0.000 description 8
- 102000039446 nucleic acids Human genes 0.000 description 8
- 238000011529 RT qPCR Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 230000008030 elimination Effects 0.000 description 5
- 238000003379 elimination reaction Methods 0.000 description 5
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 5
- 238000007637 random forest analysis Methods 0.000 description 5
- 238000010839 reverse transcription Methods 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- CCEKAJIANROZEO-UHFFFAOYSA-N sulfluramid Chemical group CCNS(=O)(=O)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F CCEKAJIANROZEO-UHFFFAOYSA-N 0.000 description 4
- 229920001917 Ficoll Polymers 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 230000008506 pathogenesis Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 208000004860 Blast Crisis Diseases 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 1
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000104 diagnostic biomarker Substances 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 208000019691 hematopoietic and lymphoid cell neoplasm Diseases 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000101 novel biomarker Substances 0.000 description 1
- 108091008819 oncoproteins Proteins 0.000 description 1
- 102000027450 oncoproteins Human genes 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 210000004214 philadelphia chromosome Anatomy 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 229940121358 tyrosine kinase inhibitor Drugs 0.000 description 1
- 239000005483 tyrosine kinase inhibitor Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于四个基因HDC、SMPDL3A、IRF4、AQP3构建的风险评分模型在制备用于CML诊断的试剂或试剂盒中的应用。本发明基于多组测序数据,通过多种机器学习方法发现相较于正常人,患有慢性髓细胞白血病的患者外周血中HDC的表达显著上调,SMPDL3A、IRF4、AQP3的表达显著下调,ROC曲线分析证实具有较高的诊断价值;本发明联合检测四个基因的表达来进行CML诊断,通过LASSO回归分析构建了四个基因的风险评分模型,风险评分的诊断效能比单个基因的诊断效能更高。本发明具有较高的灵敏度和特异性,可以更简单、准确地对CML患者进行诊断,以便及时采取治疗手段,具有较高的临床应用价值。
Description
技术领域
本发明涉及四个基因(HDC、SMPDL3A、IRF4和AQP3)构建的风险评分模型作为标志物在CML诊断中的应用,以及制备相应的检测试剂和试剂盒中的应用。
背景技术
慢性髓细胞白血病(chronic myeloid leukemia,CML)是一种造血干细胞恶性增殖的血液肿瘤。t(9;22)易位形成的费城染色体与疾病密切相关,重组的BCR-ABL1融合基因编码一种具有强酪氨酸激酶活性的癌蛋白,是导致CML发病的关键因素。随着疾病的进展,CML分为慢性期、加速期和急变期。CML的主要治疗药物是酪氨酸激酶抑制剂,具有良好的治疗效果。然而,部分患者可以达到完全缓解,但依然存在未及时合理治疗、药物反应不佳和复发等情况,导致疾病进展,经短暂加速期后进入急变期,而一旦急变,预后极差。因此,深入探索CML的发病机制并确定新的诊断生物标志物或治疗靶点具有重要意义。
随着下一代测序(next-generation sequencing,NGS)技术的发展,基于基因表达和调控水平的研究揭示了许多疾病的发病机制和恶性表型。将NGS纳入CML患者的诊断、风险分层和治疗评估非常重要。通过系统分析CML样本和正常样本之间基因表达谱的差异,可以确定其他新的生物标志物。然而,目前大多数与CML相关的研究仅限于单一分子或信号通路,缺乏大样本和多维探索,并且,对如何找到一组用于CML诊断的基因组合,以及优化的数学模型用于诊断的研究极少。因此,选用合理的方式筛选出相关基因分子标志物,并建立准确且稳定的数学模型,能够为早期精确诊断CML提供方向。
发明内容
本发明基于多个CML转录组测序队列,通过支持向量机递归特征消除、最小绝对收缩选择算子和随机森林算法三种机器学习方法,确定了4个CML诊断基因(HDC、SMPDL3A、IRF4和AQP3),这些基因构建的风险评分模型诊断效能进一步提高。本发明进一步验证了基于4个基因构建的风险评分模型在临床CML样本中具有高诊断价值。基于HDC、SMPDL3A、IRF4和AQP3构建的风险评分模型可以作为新的生物标志物用于CML患者的诊断。
本发明使用多种机器学习方法鉴别CML诊断基因并构建风险评分模型的具体方法,包括以下步骤:
步骤一:从GEO数据库获取CML患者和正常人血液样本的转录组测序数据,并计算出CML患者和正常人血液样本中差异表达的基因;
步骤二:基于差异表达的基因使用支持向量机递归特征消除、最小绝对收缩选择算子和随机森林三种机器学习算法,获得CML的诊断基因,对三个机器学习算法识别出的诊断基因进行取交集。
步骤三:基于四个诊断基因的表达通过最小绝对收缩选择算子算法进行风险评分模型构建,并得到风险评分的计算公式;
步骤五:临床实际样本验证四个基因及风险评分模型的诊断价值。
进一步的,所述步骤一中包含两个CML样本和正常样本的转录组测序数据集,其中GSE13159包含76个CML样本和74个正常样本,GSE144119包含16个CML样本和6个正常样本;差异表达分析共鉴定出210个差异基因。
进一步的,所述步骤二中三种机器学习算法共识别出四个诊断基因(HDC、SMPDL3A、IRF4和AQP3);
进一步的,所述步骤三中风险评分的计算公式:HDC表达×1.96931556223423+SMPDL3A表达×(-0.881524751781288)+IRF4表达×(-2.18413966166841)+AQP3表达×(-1.44980797069836);
本发明第一方面提供一种用于慢性髓细胞白血病诊断的相关生物标志物组合,所述相关生物标志物组合为:HDC、SMPDL3A、IRF4和AQP3。
本发明第二方面提供了检测HDC、SMPDL3A、IRF4和AQP3相关生物标志物组合表达量在制备用于慢性髓细胞白血病诊断的试剂或试剂盒中的应用。
作为本发明优选的实施方案,所述诊断试剂包含检测HDC、SMPDL3A、IRF4和AQP3或其部分片段表达水平的物质的试剂。
作为本发明优选的实施方案,所述诊断试剂盒包含检测HDC、SMPDL3A、IRF4和AQP3或其部分片段表达水平的物质的试剂。
作为本发明优选的实施方案,所述检测HDC、SMPDL3A、IRF4和AQP3或其部分片段表达水平的物质的试剂包括检测HDC、SMPDL3A、IRF4和AQP3的核酸扩增引物对。
作为本发明优选的实施方案,HDC所述引物对的序列如SEQ ID NO.1和SEQ IDNO.2所示,其引物上游5'-3':ATGCTGATGAGTCCTGCCTAAAT,下游5'-3':TGTCATCCACAGGCAGAAATTTC;SMPDL3A所述引物对的序列如SEQ ID NO.3和SEQ ID NO.4所示,其引物上游5'-3':CACCTCATGTTCCTGTACCTGAA,下游5'-3':ACCTGTGGCCAATAGTCATGATT;IRF4所述引物对的序列如SEQ ID NO.5和SEQ ID NO.6所示,其引物上游5'-3':CAGATCGACAGCGGCAAGTA,下游5'-3':TGTCGATGCCTTCTCGGAAC;AQP3所述引物对的序列如SEQID NO.7和SEQ ID NO.8所示,其引物上游5'-3':CCTTCTTGGGTGCTGGAATAGTT,下游5'-3':GGCCAGCACACACACGATAAG。
本发明第三方面还提供了一种用于慢性髓细胞白血病诊断的HDC、SMPDL3A、IRF4和AQP3荧光定量检测试剂盒,所述诊断试剂盒包括HDC、SMPDL3A、IRF4和AQP3的核酸扩增引物对和/或检测内参基因GAPDH的核酸扩增引物对。
作为本发明优选的实施方案,所述检测HDC的核酸扩增引物对,其引物上游5'-3':ATGCTGATGAGTCCTGCCTAAAT,下游5'-3':TGTCATCCACAGGCAGAAATTTC;所述检测SMPDL3的核酸扩增引物对,其引物上游5'-3':CACCTCATGTTCCTGTACCTGAA,下游5'-3':ACCTGTGGCCAATAGTCATGATT;所述检测IRF4的核酸扩增引物对,其引物上游5'-3':CAGATCGACAGCGGCAAGTA,下游5'-3':TGTCGATGCCTTCTCGGAAC;所述检测AQP3的核酸扩增引物对,其引物上游5'-3':CCTTCTTGGGTGCTGGAATAGTT,下游5'-3':GGCCAGCACACACACGATAAG;所述检测内参基因GAPDH的核酸扩增引物对,如SEQ ID NO.9和SEQ ID NO.10所示,其引物上游5'-3':GACAGTCAGCCGCATCTTCT,下游5'-3':GCGCCCAATACGACCAAATC。
作为本发明优选的实施方案,所述试剂盒还包括逆转录试剂、SYBR Green荧光染料、PCR缓冲液、DEPC水。
本发明第四方面还提供了一种用于慢性髓细胞白血病诊断的风险评分模型,所述风险评分模型中涉及到的生物标志物组合为:HDC、SMPDL3A、IRF4和AQP3;所述风险评分模型采用如下回归方程计算风险评分:风险评分=HDC表达×1.96931556223423+SMPDL3A表达×(-0.881524751781288)+IRF4表达×(-2.18413966166841)+AQP3表达×(-1.44980797069836)。
本发明进一步提供了所述相关生物标志物组合以及风险评分模型在诊断CML上的应用方法,该方法包括至少三个步骤:
(a)测定怀疑处于CML的受试者外周血PBMCs标本中HDC、SMPDL3A、IRF4和AQP3的表达量;和
(b)根据HDC、SMPDL3A、IRF4和AQP3的表达量,计算风险评分,评估该受试者是否患有CML。
作为本发明优选的实施方案,所述评估包括:将根据所测定的HDC、SMPDL3A、IRF4和AQP3的表达量,计算风险评分,评估该受试者是否患有CML;风险评分与预确定的阈值进行比较,风险评分高于阈值,指示该受试者患有CML。
本发明的优点和有益效果:
本发明首次通过多种机器学习方法在公共数据库中发现HDC、SMPDL3A、IRF4和AQP3在CML和正常对照之间具有显著的表达差异和优异的诊断价值,并在临床样本种验证了它们的表达特征,进一步构建的风险评分模型能进一步提高CML的诊断准确性,表明HDC、SMPDL3A、IRF4和AQP3构建的风险评分模型可用作为CML诊断的标志物,可以更简单、准确地进行诊断,从而及时采取治疗手段,具有较高的临床应用价值。
附图说明
图1为GSE13159和GSE144119数据集的基因差异表达图,其中图1A为GSE13159差异表达火山图,图1B为GSE144119差异表达火山图,图1C为合并GSE13159和GSE144119共有的差异表达基因的热图。
图2为机器学习方法鉴别CML的诊断基因图,其中,图2A和图2B为最小绝对收缩选择算子鉴别CML的诊断基因图,图2C和图2D为随机森林算法鉴别CML的诊断基因图,图2E为支持向量机递归特征消除鉴别CML的诊断基因图,图2F为三种机器学习算法鉴别的四个共有诊断基因韦恩图,图2G为GSE13159中四个诊断基因的表达水平箱线图,图2H为GSE144119中四个诊断基因的表达水平箱线图,图2I为风险评分模型中四个诊断基因的系数分布图,图2J为GSE13159中风险评分分布水平箱线图,图2K为GSE144119中风险评分分布水平箱线图。
图3为HDC、SMPDL3A、IRF4和AQP3及风险评分在CML中的诊断价值分析图,其中,图3A为GSE13159中HDC、SMPDL3A、IRF4和AQP3及风险评分的ROC曲线分析图,图3B为GSE144119中HDC、SMPDL3A、IRF4和AQP3及风险评分的ROC曲线分析图。
图4为HDC、SMPDL3A、IRF4和AQP3及风险评分在临床样本中的诊断价值验证图,图4A为临床样本测序数据中四个诊断基因的表达水平箱线图,图4B为临床样本测序数据中风险评分分布水平箱线图,图4C为临床样本测序数据中风险评分的ROC曲线分析图,图4D为临床样本RT-qPCR数据中四个诊断基因的表达水平箱线图,图4E为临床样本RT-qPCR数据中风险评分的ROC曲线分析图,图4F为临床样本RT-qPCR数据中HDC、SMPDL3A、IRF4和AQP3及风险评分的ROC曲线分析图。
具体实施方式
下面结合具体实施例对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。除了特别指明,以下实施例中所使用的技术手段和操作方法为本领域技术人员所熟知的常规手段和方法,所使用原料均为市售商品。
实施例1:CML的转录组数据差异表达分析。
1.分析方法
打开GEO数据库网址,网址为https://www.ncbi.nlm.nih.gov/geo/,下载GSE13159和GSE144119两个CML数据集的测序数据。使用R语言中“limma”软件包进行差异分析,基于P<0.05,|logFC|>1鉴别出差异表达基因。
2.分析结果
结果见图1A-1C,在两个数据集中,共获得了210个与正常对照样本相比,CML样品中具有显著表达差异的基因。其中图1A为GSE13159差异表达火山图,图1B为GSE144119差异表达火山图,图1C为合并GSE13159和GSE144119共有的210个差异表达基因的热图。
实施例2:机器学习方法鉴别CML的诊断基因。
1.分析方法
基于差异表达的基因使用支持向量机递归特征消除、最小绝对收缩选择算子和随机森林三种机器学习算法,获得CML的诊断基因,对三个机器学习算法识别出的诊断基因进行取交集。基于诊断基因的表达通过最小绝对收缩选择算子算法进行风险评分模型构建,并得到风险评分的计算公式。
2.分析结果
结果见图2A-2K,三种机器学习共鉴别到4个诊断基因(HDC、SMPDL3A、IRF4和AQP3),并得到了风险评分的计算公式:HDC表达×1.96931556223423+SMPDL3A表达×(-0.881524751781288)+IRF4表达×(-2.18413966166841)+AQP3表达×(-1.44980797069836);相比于正常对照,HDC的表达在CML中显著增加,SMPDL3A、IRF4和AQP3则显著降低,风险评分也显著增加。其中,图2A和图2B为最小绝对收缩选择算子鉴别CML的诊断基因图,图2C和图2D为随机森林算法鉴别CML的诊断基因图,图2E为支持向量机递归特征消除鉴别CML的诊断基因图,图2F为三种机器学习算法鉴别的四个共有诊断基因韦恩图,图2G为GSE13159中四个诊断基因的表达水平箱线图,图2H为GSE144119中四个诊断基因的表达水平箱线图,图2I为风险评分模型中四个诊断基因的系数分布图,图2J为GSE13159中风险评分分布水平箱线图,图2K为GSE144119中风险评分分布水平箱线图。
实施例3:HDC、SMPDL3A、IRF4和AQP3及风险评分在CML中的诊断价值分析。
1.分析方法
利用ROC曲线分析HDC、SMPDL3A、IRF4和AQP3及风险评分在CML中的诊断价值。
2.分析结果
结果见图3A-3B,图3A为GSE13159中HDC、SMPDL3A、IRF4和AQP3及风险评分的ROC曲线分析图,在GSE13159中,HDC、SMPDL3A、IRF4和AQP3及风险评分在健康对照组和CML中的综合诊断AUC值分别为:0.969(95% CI:0.936-0.993)、0.936(95% CI:0.887-0.973)、0.940(95% CI:0.899-0.971)、0.935(95%CI:0.891-0.970)、1.000(95% CI:1.000-1.000);图3B为GSE144119中HDC、SMPDL3A、IRF4和AQP3及风险评分的ROC曲线分析图,在GSE144119中,HDC、SMPDL3A、IRF4和AQP3及风险评分在健康对照组和CML中的综合诊断AUC值分别为:0.987(95% CI:0.961-1.000)、0.975(95% CI:0.936-1.000)、0.955(95% CI:0.901-0.933)、0.961(95% CI:0.907-1.000)、1.000(95% CI:1.000-1.000)。表明表明检测HDC、SMPDL3A、IRF4和AQP3的表达量对于CML患者的诊断具有较高价值,而且基于四个基因的表达计算的风险评分进一步提高了诊断准确性。
实施例4:HDC、SMPDL3A、IRF4和AQP3及风险评分在临床样本中的诊断价值验证。
1.分析方法
(1)外周血单个核细胞提取。Ficoll密度梯度离心法:①将2.5ml全血置入15ml离心管中,2.5ml PBS溶液稀释,轻轻混匀;②取15ml离心管先加入5ml Ficoll溶液。然后将稀释的血液用移液管轻轻加到Ficoll上层(避免两种溶液混合);③离心2000rpm,20min;④用吸管吸取白色细胞层(即PBMC)放入干净的15ml离心管中;⑤加入PBS至10-15ml,1500rpm,10min离心后去掉上清,加入Trizol混匀。-80℃保存备用。
(2)总RNA提取。TRIzol法:①加入0.5ml TRIzol/5×106个PBMC,放置无核酶EP管中反复吹打后,室温静置5min;②加入0.1ml氯仿/1mlTRIzol,剧烈震荡15s,室温静置2-3min;③4℃,12000rpm,离心15min,最上层的无色水相层(约50%)为RNA层(可见三层,轻拿轻放,避免三层液体混合);④轻轻吸取上层水相至新的EP管中(避免吸到中间层),加入0.25ml异丙醇/1mlTRIzol,颠倒混匀,4℃放置20min;⑤4℃,12000rpm,离心10min,弃上清,胶状沉淀可见于EP管侧壁及管底;⑥RNA沉淀用0.5ml的75%乙醇溶液(用无水乙醇和无核酶水现配)吹打混匀洗涤,后4℃、8000rpm,离心5min;⑦弃上清后获RNA沉淀于室温干燥5-10min,加入无核酶水(适量)溶解RNA,-80℃保存备用。
(3)RT-qPCR分析。①通过时实荧光定量PCR方法,对各组间HDC、SMPDL3A、IRF4和AQP3表达量进行定量检测。来自各组样本的总RNA用RQ1 DNase酶除去除DNA。总RNA纯度和浓度测定,备用。②模板DNA即cDNA的合成:按Takara逆转录反应试剂盒说明对制备的总RNA进行反转录,配制反应体系如下:
其中,100ng的总RNA,据RNA浓度可换算所需加入的体积。配制体系需在冰上操作完成,精准加样,避免操作误差。配制好的体系需点动混匀并离心,随后置于PCR扩增仪上逆转录,反应条件为37℃15min、85℃5s和4℃30min,逆转录结束后及时取出扩增产物(即为模板cDNA),-20℃保存备用。③SYBR Green法RT-qPCR检测:①LINC00958引物及内参基因GAPDH引物由华大基因公司合成,分别用无核酶水溶解为20nmol/ml,备用;②按Takara荧光定量试剂盒配制RT-qPCR反应体系如下表:
③反应条件:首先95℃30s,然后按95℃5s、60℃34s的顺序循环40次,最后95℃15s、60℃60s、95℃15s;④为减少试验误差,每例样本进行3次重复试验。⑤分析结果:结合扩增曲线及溶解曲线判断扩增效果,利用2-ΔΔCt法计算目的基因表达量。
(4)分别通过转录组测序分析正常对照组(5例),CML组(10例)和RT-qPCR检测正常对照组(16例),CML组(16例)外周血单个核细胞HDC、SMPDL3A、IRF4和AQP3表达水平,分析外周血单个核细胞中HDC、SMPDL3A、IRF4和AQP3的表达情况,计算风险评分,并进一步利用ROC曲线分析HDC、SMPDL3A、IRF4和AQP3及风险评分的诊断价值。
2.分析结果
结果见图4A-4F,图4A为临床样本测序数据中四个诊断基因的表达水平箱线图,图4B为临床样本测序数据中风险评分分布水平箱线图,图4C为临床样本测序数据中风险评分的ROC曲线分析图,图4D为临床样本RT-qPCR数据中四个诊断基因的表达水平箱线图,图4E为临床样本RT-qPCR数据中风险评分的ROC曲线分析图,图4F为临床样本RT-qPCR数据中HDC、SMPDL3A、IRF4和AQP3及风险评分的ROC曲线分析图。在转录组测序数据和RT-qPCR数据中,相比于正常对照,HDC的表达在CML中显著增加,SMPDL3A、IRF4和AQP3则显著降低,风险评分也显著增加;在测序数据中,HDC、SMPDL3A、IRF4和AQP3及风险评分在正常对照组和CML中的综合诊断AUC值分别为:0.680(95% CI:0.280-1.000);1.000(95% CI:1.000-1.000);1.000(95% CI:1.000-1.000);1.000(95% CI:1.000-1.000);1.000(95% CI:1.000-1.000);在RT-qPCR数据中,HDC、SMPDL3A、IRF4和AQP3及风险评分在健康对照组和CML中的综合诊断AUC值分别为:0.801(95% CI:0.621-0.949)、0.980(95% CI:0.930-1.000)、0.895(95%CI:0.758-0.996)、0.965(95% CI:0.895-1.000)、0.980(95% CI:0.930-1.000)。通过临床数据验证,证实了检测HDC、SMPDL3A、IRF4和AQP3的表达量对于CML患者的诊断价值,并且风险评分进一步提高了诊断准确性和稳定性。
Claims (1)
1.检测生物标志物组合表达量的试剂在制备用于慢性髓细胞白血病诊断试剂盒中的应用,所述相关生物标志物组合为:HDC、SMPDL3A、IRF4和AQP3;
其特征在于,
HDC所述引物对的序列如SEQ ID NO .1和SEQ ID NO .2所示,
其引物上游5'-3':ATGCTGATGAGTCCTGCCTAAAT,下游5'-3':TGTCATCCACAGGCAGAAATTTC;
SMPDL3A所述引物对的序列如SEQ ID NO .3和SEQ ID NO .4所示,其引物上游5'-3':CACCTCATGTTCCTGTACCTGAA,下游5'-3':ACCTGTGGCCAATAGTCATGATT;
IRF4所述引物对的序列如SEQ ID NO .5和SEQ ID NO .6所示,其引物上游5'-3':CAGATCGACAGCGGCAAGTA,下游5'-3':TGTCGATGCCTTCTCGGAAC;
AQP3所述引物对的序列如SEQ ID NO .7和SEQ ID NO .8所示,其引物上游5'-3':CCTTCTTGGGTGCTGGAATAGTT,下游5'-3':GGCCAGCACACACACGATAAG;
所述应用使用以下风险评分模型:
所述风险评分模型中使用的生物标志物组合为:HDC、SMPDL3A、IRF4和AQP3;所述风险评分模型采用如下回归方程计算风险评分:
风险评分= HDC表达×1.96931556223423+ SMPDL3A表达×(-0.881524751781288)+IRF4表达×(-2.18413966166841)+ AQP3表达×(-1.44980797069836)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211245379.3A CN115820855B (zh) | 2022-10-12 | 2022-10-12 | Hdc、smpdl3a、irf4和aqp3在制备诊断cml的试剂及试剂盒中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211245379.3A CN115820855B (zh) | 2022-10-12 | 2022-10-12 | Hdc、smpdl3a、irf4和aqp3在制备诊断cml的试剂及试剂盒中的应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115820855A CN115820855A (zh) | 2023-03-21 |
CN115820855B true CN115820855B (zh) | 2023-07-21 |
Family
ID=85524669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211245379.3A Active CN115820855B (zh) | 2022-10-12 | 2022-10-12 | Hdc、smpdl3a、irf4和aqp3在制备诊断cml的试剂及试剂盒中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115820855B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012163941A2 (en) * | 2011-05-30 | 2012-12-06 | Nebion Ag | Marker for the detection and classification of leukemia from blood samples |
CN112522415A (zh) * | 2020-12-30 | 2021-03-19 | 南昌大学第二附属医院 | 基于lgals3剪接变体诊断慢粒急变期的试剂及试剂盒 |
CN113881674A (zh) * | 2021-10-27 | 2022-01-04 | 南昌大学第二附属医院 | Linc00958在制备诊断及监测慢性髓细胞白血病的试剂及试剂盒中的应用 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100434439C (zh) * | 2002-09-30 | 2008-11-19 | 肿瘤疗法科学股份有限公司 | 与人髓细胞白血病相关的基因和多肽 |
-
2022
- 2022-10-12 CN CN202211245379.3A patent/CN115820855B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012163941A2 (en) * | 2011-05-30 | 2012-12-06 | Nebion Ag | Marker for the detection and classification of leukemia from blood samples |
CN112522415A (zh) * | 2020-12-30 | 2021-03-19 | 南昌大学第二附属医院 | 基于lgals3剪接变体诊断慢粒急变期的试剂及试剂盒 |
CN113881674A (zh) * | 2021-10-27 | 2022-01-04 | 南昌大学第二附属医院 | Linc00958在制备诊断及监测慢性髓细胞白血病的试剂及试剂盒中的应用 |
Also Published As
Publication number | Publication date |
---|---|
CN115820855A (zh) | 2023-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10859573B2 (en) | Nourin molecular biomarkers diagnose angina patients with negative troponin | |
Adamyan et al. | Gene expression signature of endometrial samples from women with and without endometriosis | |
CN114164276B (zh) | 用于肺癌诊断的试剂盒、装置及方法 | |
CN116083574A (zh) | 长链非编码rna nonhsat017321在结肠癌诊断中的应用 | |
CN116092674A (zh) | 外泌体介导的胃癌总体生存率预后模型及构建方法和应用 | |
CN106967719A (zh) | 一种长链非编码rna作为前列腺癌分子标志物的应用 | |
CN115992229A (zh) | 一种胰腺癌预后风险评估的lncRNA标记物、模型及其应用 | |
CN114717305A (zh) | Nr1d1、junb、rorc作为药物性-急性肾损伤的诊断标记应用 | |
CN111763740B (zh) | 基于lncRNA分子模型预测食管鳞癌患者新辅助放化疗的疗效和预后的系统 | |
CN115820855B (zh) | Hdc、smpdl3a、irf4和aqp3在制备诊断cml的试剂及试剂盒中的应用 | |
TW201140051A (en) | Gene group test structure | |
CN111763736B (zh) | 用于诊断甲状腺乳头状癌淋巴结转移的液体活检试剂盒 | |
CN116574807A (zh) | 基于肺腺癌血浆细胞外囊泡来源的cd160的免疫联合化疗疗效预测模型 | |
CN115798703A (zh) | 基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质 | |
CN111748626B (zh) | 用于预测食管鳞癌患者新辅助放化疗的疗效和预后的系统及其应用 | |
Jiao et al. | Bioinformatics analysis and identification of hub genes associated with female acute myocardial infarction patients by using weighted gene co-expression networks | |
CN109880905B (zh) | 一组用于三阴性乳腺癌免疫组化分型的基因及其应用 | |
CN118406766B (zh) | 预测ii期和iii期结直肠癌预后临床结果的生物标志物、引物组及检测试剂盒 | |
CN118291606B (zh) | Rna组合及其在复发性流产诊断标记物中的应用 | |
Bardill et al. | microRNAs in congenital diaphragmatic hernia: insights into prenatal and perinatal biomarkers and altered molecular pathways | |
CN112176060B (zh) | 一组血浆非编码rna及检测其表达水平的引物组与结直肠癌检测试剂盒 | |
CN104630380B (zh) | 碳酸酐酶iv在制备肺腺癌诊断制剂中的应用 | |
CN116377077A (zh) | 一种预测含铂类新辅助治疗对中晚期肿瘤患者适用性的试剂盒及系统 | |
CN108384848A (zh) | 血清中circ_0021132作为深静脉血栓形成诊断标志物的应用 | |
CN115572766A (zh) | 一种预测肿瘤患者二甲双胍辅助治疗获益情况的试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |