CN116904578B - 线粒体差异化表达特征基因在制备重度抑郁症诊断剂中的应用 - Google Patents

线粒体差异化表达特征基因在制备重度抑郁症诊断剂中的应用 Download PDF

Info

Publication number
CN116904578B
CN116904578B CN202310899445.7A CN202310899445A CN116904578B CN 116904578 B CN116904578 B CN 116904578B CN 202310899445 A CN202310899445 A CN 202310899445A CN 116904578 B CN116904578 B CN 116904578B
Authority
CN
China
Prior art keywords
depressive disorder
major depressive
genes
mitochondrial
differential expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310899445.7A
Other languages
English (en)
Other versions
CN116904578A (zh
Inventor
刘小兰
黄卓玮
李明星
梁迎洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Mental Health Center
Original Assignee
Wuhan Mental Health Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Mental Health Center filed Critical Wuhan Mental Health Center
Priority to CN202310899445.7A priority Critical patent/CN116904578B/zh
Publication of CN116904578A publication Critical patent/CN116904578A/zh
Application granted granted Critical
Publication of CN116904578B publication Critical patent/CN116904578B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Public Health (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Evolutionary Biology (AREA)
  • Biochemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Microbiology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及线粒体差异化表达特征基因的表达量检测剂在制备重度抑郁症诊断剂中的应用。所述线粒体差异化表达特征基因选自PMPCB、MRPS28、LYRM2、MGST1、COX20、PTPMT1和STX17中的一种或多种组合。本发明研究了一些线粒体相关基因与重度抑郁症之间的关联,并从中挑选了7个线粒体差异化表达特征基因作为重度抑郁症的生物标志物,在此基础上,本发明进一步对这7个特征基因的表达量进行了相应地赋分,并基于上述赋分构建了重度抑郁症诊断模型,用于预测受试者患有重度抑郁症的风险。该诊断模型具有相对较好的诊断性能和临床应用价值。

Description

线粒体差异化表达特征基因在制备重度抑郁症诊断剂中的 应用
技术领域
本发明属于抑郁症诊断领域,更特别地,涉及线粒体差异化表达特征基因的表达量检测剂在制备重度抑郁症诊断剂中的应用。
背景技术
重度抑郁症(MDD)是一种高发和复发性的精神障碍,其特点是长期情绪低落、兴趣减退、无法体验快乐,并伴有睡眠或食欲紊乱。尽管在了解抑郁症的发病方面做了大量的实验和临床研究工作,如遗传、生物、心理和社会原因,但对MDD的病因学的认识仍然是零散的。由于该疾病的异质性表现和多因素决定因素,MDD的诊断和治疗仍然是一个重大挑战。在过去的几十年里,人们做了许多尝试,以确定诊断MDD的生物标志物。然而,由于特异性和疗效不足,其中只有少数可以应用于临床实践。此外,抗抑郁治疗的疗效不足,大约30%的患者对一线抗抑郁治疗没有充分或满意的反应。因此,迫切需要加强我们对MDD生物学基础的理解,确定新的诊断生物标志物和潜在的治疗目标。
在这项研究中,我们通过梳理Gene Expression Omnibus(GEO)的转录组测序基因数据和从MitoCarta3.0数据库获得的线粒体相关基因列表,确定了MDD患者和健康对照组之间差异表达的线粒体相关基因(DeMRG)。接下来,应用三种机器学习算法来筛选用于MDD诊断的特征基因。基于从31个DeMRGs中发现的7个特征基因,我们构建了一个诊断模型,并评估了多变量模型的诊断能力。随后,通过免疫分析评估了MDD患者和对照组之间免疫细胞浸润的免疫景观。利用一致性聚类分析,我们进一步将MDD患者根据七个特征性DeMRGs表达模式分为两个集群。最后,我们进一步分析了两个集群之间免疫细胞浸润的变化,以及这些特征性DeMRGs和免疫细胞浸润之间的相关性。我们关于线粒体功能障碍及其与MDD中免疫学浸润相关性的发现,为更好地理解MDD发病的潜在分子机制提供了一个新的视角,并有助于确定有前景的生物标志物以及治疗靶点。
发明内容
为解决以上问题,本发明提供了线粒体差异化表达特征基因的表达量检测剂在制备重度抑郁症诊断剂中的应用。
在一个具体实施方案中,所述线粒体差异化表达特征基因选自PMPCB、MRPS28、LYRM2、MGST1、COX20、PTPMT1和STX17中的一种或多种组合。
本发明研究了一些线粒体相关基因与重度抑郁症之间的关联,并从中挑选了7个线粒体差异化表达特征基因作为重度抑郁症的生物标志物,在此基础上,本发明进一步对这7个特征基因的表达量进行了相应地赋分,并基于上述赋分构建了重度抑郁症诊断模型,用于预测受试者患有重度抑郁症的风险。该诊断模型具有相对较好的诊断性能和在临床应用价值。
附图说明
图1为数据集GSE98793中差异表达的线粒体相关基因的热图。
图2为基因PMPCB、MRPS28、LYRM2、MGST1、COX20、PTPMT1和STX17构建的评估重度抑郁症风险的列线图(A)及该列线图模型的校准曲线(B)。
图3为上述重度抑郁症风险评估模型数据集GSE98793中的验证结果,其中A-G为7个特征基因在MDD和对照样本中的表达差异对比图,H为7个特征基因的ROC曲线分析,I为重度抑郁症风险评估模型的ROC曲线分析。
图4为免疫细胞浸润分析的结果,其中A和B分别为描述MDD组和对照组之间免疫浸润差异的叠加条形图和小提琴图,C为22种免疫细胞比例的相关矩阵。
图5为基于线粒体相关特征基因的MDD亚型分类结果,其中A-D显示MDD样本被分为两个亚组是最佳的聚类数目,E为MDD集群A和集群B之间的免疫细胞含量的差异,F为7个线粒体相关特征基因与免疫细胞浸润之间的相关性。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
1.数据收集和预处理
MDD患者和健康对照组的RNA芯片数据是从GEO数据集(https://www.ncbi.nlm.nih.gov/geo/)中获取的。利用表达谱数据集GSE98793(包含128名MDD患者和64名健康对照者)作为训练集,以确定与MDD相关的枢纽基因并构建诊断模型。
结果如图1所示,共发现31个线粒体相关基因的差异表达,其中MDD样本上调基因6个,下调基因25个,并且大部分差异表达的线粒体相关基因都是相互关联的,并表现出较强的、明显的关联程度。进一步地研究显示,这些基因与线粒体内膜、线粒体基质、含线粒体蛋白复合物等重要的细胞成分相关。
2.生物标志物的筛选和模型的构建
结合选择算子的逻辑回归(LASSO)、支持向量机递归特征消除(SVM-RFE)和随机森林(RF)来筛选用于最终构建MDD诊断模型的特征生物标志物。通过LASSO逻辑回归算法确定了18个基因作为潜在的MDD相关生物标志物,SVM-RFE算法确定了26个基因,RF算法确定了17个基因。我们在这三个算法的基础上取交集,确定了七个重叠基因,包括PMPCB、MRPS28、LYRM2、MGST1、COX20、PTPMT1和STX17。
在NCBI中,这些基因序列获取号如下:
PMPCB的获取号为mRNA NCBI reference(Gene accession number):NM_004279.3;
MRPS28的获取号为mRNA NCBI reference(Gene accession number):NM_014018.3;
LYRM2的获取号为mRNA NCBI reference(Gene accession number):NM_020466.5;
MGST1的获取号为mRNA NCBI reference(Gene accession number):NM_001260511.2;
COX20的获取号为mRNA NCBI reference(Gene accession number):NM_001312871.1
PTPMT1的获取号为mRNA NCBI reference(Gene accession number):NM_001143984.2。
STX17的获取号为mRNA NCBI reference(Gene accession number):NM_017919.3。
然后,我们结合上述七个特征基因构建了一个列线图来预测疾病的风险(图2A)。利用校准图来显示列线图的性能,结果如图2B所示,校准图证实了我们模型的性能。
3.模型的验证
在GSE98793中对七个特征基因的表达水平进行了验证。如图3A-G所示,MGST1的表达水平在MDD中明显高于对照组;COX20、LYRM2、MRPS28、PMPCB、PTPMT1和STX17的表达水平在MDD患者中明显降低。此外,还绘制了ROC曲线,并计算了AUC来区分MDD和对照组。7个特征基因的诊断能力显示了良好的诊断价值,COX20和STX17的AUC为0.665,PMPCB的AUC为0.649,MGST1的AUC为0.635,MRPS28的AUC为0.620,PTPMT1的AUC为0.619,LYRM2的AUC为0.614(图3H)。我们进一步通过多变量逻辑回归分析将多个特征生物标志物的测量结果结合起来,以提高诊断效率。我们通过将每个基因的基因表达值与其对应的系数相乘来构建了一种新的诊断风险评分,该系数是通过多元逻辑回归分析获得的。诊断评分如下所示:Z=(-0.3594*PMPCB基因表达水平)+(-0.9036*MRPS28基因表达水平)+(-1.1714*LYRM2基因表达水平)+(1.5690*MGST1基因表达水平)+(-0.9499*COX20基因表达水平)+(-1.1624*PTPMT1基因表达水平)+(-1.3670*STX17基因表达水平)。最佳诊断风险模型=1/(1+e^-Z)。区分MDD和对照组的多变量模型的诊断能力显示出良好的诊断价值,AUC为0.772(95%CI=0.702-0.842),明显高于七个特征基因的最高AUC(图3I)。
4.免疫细胞浸润分析
为了进一步探索MDD组和对照组的免疫细胞组成,我们通过使用CIBERSORT算法调查了训练集每个样本中22个免疫细胞浸润的比例(图4A)。然后我们构建了一个小提琴图来比较两组之间免疫细胞浸润的差异。如图4B所示,与对照组样本相比,MDD样本中T细胞CD8(p=0.022)和T细胞γδ(p=0.006)的比例明显降低,而MDD组中NK细胞静止期(p=0.007)、巨噬细胞M0(p=0.015)和中性粒细胞(p=0.043)的比例明显高于对照组的比例。因此,这些类型的免疫细胞可能是与MDD有关的潜在核心免疫细胞。此外,各免疫细胞之间的相关热图显示,B细胞记忆与树突状细胞静止期(Cor=0.46)、巨噬细胞M2(Cor=0.43)和T细胞CD4记忆静止期(Cor=0.43)呈正相关关系。相反,T细胞CD8与中性粒细胞(Cor=-0.66)和静止的T细胞CD4记忆(Cor=-0.56)呈负相关(图4C)。综上所述,上述研究结果显示,MDD和对照组样本之间的免疫细胞浸润特征存在很大差异。
5.聚类分析确定了基于线粒体相关特征基因的两种MDD亚型
最后,基于MDD组中7个线粒体相关特征基因的表达水平,我们通过无监督聚类方法对128个样本进行聚类,以进一步阐明亚组之间的生物学差异。如图5A和5B所示,K=2是最佳的聚类数目,组内相关性最高,组间干扰最小。因此,MDD样本被分为两个亚组:A组(n=35)和B组(n=93),群组间7个线粒体相关特征基因的表达水平存在差异(图5C),PCA图所示集群A和集群B之间的基因表达模式是不同的(图5D)。进一步进行ssGSEA来评估MDD簇和免疫细胞浸润水平之间的关系,结果显示,B群中的几种免疫细胞明显较高,表明B群患者的免疫浸润更大(图5E)。通过对7个线粒体相关特征基因与浸润免疫细胞的相关性分析,发现线粒体相关特征基因与免疫细胞浸润之间存在着密切而全面的联系,它们之间相互作用,影响MDD的免疫特征。
以上验证结果表明,本研究中选择的基于多种生物标志物的风险评分对MDD患者表现出很高的诊断价值。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.线粒体差异化表达特征基因的表达量检测剂在制备重度抑郁症诊断剂中的应用,所述线粒体差异化表达特征基因为PMPCB、MRPS28、LYRM2、MGST1、COX20、PTPMT1和STX17的组合,利用所述线粒体差异化表达特征基因的表达水平来构建重度抑郁症的诊断风险模型;
所述线粒体差异化表达特征基因的诊断评分如下:Z= (-0.3594 × PMPCB基因表达水平) + (-0.9036 ×MRPS28基因表达水平) + (-1.1714 × LYRM2基因表达水平) +(1.5690 × MGST1基因表达水平) + (-0.9499× COX20基因表达水平) + (-1.1624 ×PTPMT1基因表达水平) + (-1.3670 × STX17基因表达水平);
所述诊断风险模型=1/(1+e^-Z)。
CN202310899445.7A 2023-07-21 2023-07-21 线粒体差异化表达特征基因在制备重度抑郁症诊断剂中的应用 Active CN116904578B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310899445.7A CN116904578B (zh) 2023-07-21 2023-07-21 线粒体差异化表达特征基因在制备重度抑郁症诊断剂中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310899445.7A CN116904578B (zh) 2023-07-21 2023-07-21 线粒体差异化表达特征基因在制备重度抑郁症诊断剂中的应用

Publications (2)

Publication Number Publication Date
CN116904578A CN116904578A (zh) 2023-10-20
CN116904578B true CN116904578B (zh) 2024-03-15

Family

ID=88362613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310899445.7A Active CN116904578B (zh) 2023-07-21 2023-07-21 线粒体差异化表达特征基因在制备重度抑郁症诊断剂中的应用

Country Status (1)

Country Link
CN (1) CN116904578B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112553328A (zh) * 2020-12-30 2021-03-26 浙江大学 检测基因表达水平的产品及其在制备重度抑郁症诊断工具中的应用
CN115029427A (zh) * 2022-05-09 2022-09-09 武汉儿童医院 基于焦亡基因表达的重度抑郁症筛查试剂、系统及应用
WO2022203372A1 (ko) * 2021-03-25 2022-09-29 고려대학교 산학협력단 우울증 진단용 바이오마커 조성물 및 이의 용도

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE551432T1 (de) * 2004-06-21 2012-04-15 Univ Leland Stanford Junior Bei manisch-depressiver erkrankung und/oder schwerer depressiver erkrankung unterschiedlich exprimierte gene und wege
US20140257708A1 (en) * 2008-03-04 2014-09-11 Ridge Diagnostics, Inc. Diagnosing and monitoring depression disorders
US20140303031A1 (en) * 2011-10-31 2014-10-09 Children's Medical Center Corporation Methods and compositions for characterizing autism spectrum disorder based on gene expression patterns
KR102302682B1 (ko) * 2021-04-23 2021-09-16 을지대학교 산학협력단 우울증 진단용 바이오마커 및 이의 용도

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112553328A (zh) * 2020-12-30 2021-03-26 浙江大学 检测基因表达水平的产品及其在制备重度抑郁症诊断工具中的应用
WO2022203372A1 (ko) * 2021-03-25 2022-09-29 고려대학교 산학협력단 우울증 진단용 바이오마커 조성물 및 이의 용도
CN115029427A (zh) * 2022-05-09 2022-09-09 武汉儿童医院 基于焦亡基因表达的重度抑郁症筛查试剂、系统及应用

Also Published As

Publication number Publication date
CN116904578A (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
Esmail et al. Complement pathway gene activation and rising circulating immune complexes characterize early disease in HIV-associated tuberculosis
Janssens et al. Predictive testing for complex diseases using multiple genes: fact or fiction?
Eddy et al. Identifying tightly regulated and variably expressed networks by Differential Rank Conservation (DIRAC)
Allison et al. Microarray data analysis: from disarray to consolidation and consensus
Brasier et al. Predicting intermediate phenotypes in asthma using bronchoalveolar lavage‐derived cytokines
Castagné et al. Biological marks of early-life socioeconomic experience is detected in the adult inflammatory transcriptome
Danielsson et al. MethPed: a DNA methylation classifier tool for the identification of pediatric brain tumor subtypes
CN102301234B (zh) 针对重度抑郁疾病的代谢综合症状及hpa轴生物标志物
Mostafaei et al. Identification of novel genes in human airway epithelial cells associated with chronic obstructive pulmonary disease (COPD) using machine-based learning algorithms
CN111505288A (zh) 一种新的抑郁症生物标志物及其应用
CN114317532B (zh) 用于预测白血病预后的评估基因集、试剂盒、系统及应用
CN105243296A (zh) 联合mRNA和microRNA表达谱芯片的肿瘤特征基因选择方法
Simon Analysis of DNA microarray expression data
Simon Microarray-based expression profiling and informatics
Clark et al. Prognostic factors: rationale and methods of analysis and integration
CN110010204B (zh) 基于融合网络和多打分策略的预后生物标志物识别方法
CN116904578B (zh) 线粒体差异化表达特征基因在制备重度抑郁症诊断剂中的应用
Rauschenberger et al. Sparse classification with paired covariates
Baumgartner et al. Biomarker discovery, disease classification, and similarity query processing on high-throughput MS/MS data of inborn errors of metabolism
Zhang et al. A four-genes based diagnostic signature for osteoarthritis
CN116312800A (zh) 一种基于血浆中循环rna全转录组测序的肺癌特征识别方法、装置和存储介质
CN110942808A (zh) 一种基于基因大数据的预后预测方法及预测系统
CN116344055A (zh) 一种心衰风险预测和神经网络模型的构建方法
Baek et al. Decreasing patterns of depression in living alone across middle-aged and older men and women using a longitudinal mixed-effects model
Janes et al. Identifying target populations for screening or not screening using logic regression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant