CN116798518B - 构建代谢物衰老分数及代谢衰老速率的方法及其应用 - Google Patents

构建代谢物衰老分数及代谢衰老速率的方法及其应用 Download PDF

Info

Publication number
CN116798518B
CN116798518B CN202310655912.1A CN202310655912A CN116798518B CN 116798518 B CN116798518 B CN 116798518B CN 202310655912 A CN202310655912 A CN 202310655912A CN 116798518 B CN116798518 B CN 116798518B
Authority
CN
China
Prior art keywords
aging
metabolite
senescence
metabolic
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310655912.1A
Other languages
English (en)
Other versions
CN116798518A (zh
Inventor
李滨
李津臣
张世雨
王峥
赵贵虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiangya Hospital of Central South University
Original Assignee
Xiangya Hospital of Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiangya Hospital of Central South University filed Critical Xiangya Hospital of Central South University
Priority to CN202310655912.1A priority Critical patent/CN116798518B/zh
Publication of CN116798518A publication Critical patent/CN116798518A/zh
Application granted granted Critical
Publication of CN116798518B publication Critical patent/CN116798518B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种构建代谢物衰老分数及代谢衰老速率的方法及其应用,包括以下步骤:S1、从研究对象的代谢组学数据中筛选和识别出老化相关的代谢生物标志物;S2、将研究对象的死亡设定为终点事件,起点时间定义为研究对象首次参与评估的时间,终点时间定位为:去世者在国家死亡登记处记录的死亡日期;存活者则是评估的截尾日期;S3、将研究对象的代谢生物标志物通过控制模型进行系数惩罚选中n个代谢生物标志物,代谢物衰老分数=,其中为代谢标志物指标加1再取自然对数之后的数值,为该代谢标志物在模型中分配到的系数。

Description

构建代谢物衰老分数及代谢衰老速率的方法及其应用
技术领域
本申请涉及生物学衰老变化领域,具体而言,涉及一种构建代谢物衰老分数及代谢衰老速率的方法及其应用。
背景技术
衰老是一个涉及到众多复杂生物学变化的过程。目前随着各个组学研究的推进和兴起,衰老研究也步入了全盛的组学时代。基于各个组学的生物学衰老指标的构建也收获了很大的进展,比如基于表观遗传组的“甲基化时钟”、基于转录组的“转录组时钟”、基于蛋白组的“蛋白质时钟”、基于代谢组的“代谢物时钟”……作为连接基因和表型、内部生物学因素和外部环境因素的桥梁,代谢组学相比其他组学,在衡量个体生物学衰老进展中,具有独特的优势,如:代谢组处于基因组、转录组、蛋白组等组学的下游,代谢组的改变能够更加直观的解释背后的生物学机制;代谢组对于内外环境的变化更加敏感,对衰老“信号”的反应更加灵敏;高通量,低成本的代谢组学检测使其具备临床上的应用性,有助于个体的衰老进程监测及个性化调控。
目前,惩罚线性回归模型被广泛应用于衰老分数的构建中,这类模型通过引入惩罚项来调控各变量系数,从而有效处理高维数据集各个变量之间的高度共线性。采用惩罚线性回归模型,构建年龄(chronological age)的预测模型并筛选出与之相关的衰老标志物,已经成为生物学衰老分数的构建中,广泛使用的方法。基于这一模型构建的“第一代衰老分数”,在各个组学中都有涉及,其中“DNA甲基化时钟”对于年龄的预测效力最优,也最具代表性。
然而,基于对年龄(chronological age)的预测而构建出来的衰老分数,常常存在因过度拟合而失真的问题。在一味追求对年龄预测的高度准确性的过程中,模型常常会捕捉到大量“噪声“。此前有研究报道,随着模型对年龄预测准确度的提升,其对衰老相关的生物学表型的预测能力反而降低,证明了模型中存在的过度拟合而失真的问题。基于第一代衰老分数以年龄预测为基础而存在的一系列问题,诞生了第二代衰老分数,即以衰老相关的生物学表型为基础的预测模型。其中,死亡率(mortality)是应用最为广泛的衡量衰老分数是否真实反应衰老情况的指标。
基于衰老相关表型的第二代衰老分数普遍优于第一代衰老分数,因此也在各个组学领域得到了发展。然而,相比其他组学,代谢组学中仅有针对年龄预测而提出的第一代衰老分数,并没有更优的基于衰老表型的第二代分数。同时,基于代谢组学的衰老研究,样本量普遍较小,代谢物的覆盖面较窄,同时也缺乏大规模的纵向研究。考虑到代谢组学相比其他组学在衰老领域的优势,如何克服这些局限性从而进一步推进基于代谢组学的衰老研究,极具研究前景和研究意义。
发明内容
本申请的主要目的在于提供一种构建代谢物衰老分数及代谢衰老速率的方法及其应用,保持了代谢组学本身的优势,灵敏而精确地实现衰老、早衰信号的捕捉,对死亡率的预测效力优异,能够应用于临床上对衰老疾病的预测中,实现个性化的健康监测以及疾病早期的风险分层。
为了实现上述目的,本申请提供了一种构建代谢物衰老分数的方法。
根据本申请的构建代谢物衰老分数的方法,包括以下步骤:
S1、从研究对象的代谢组学数据中筛选和识别出老化相关的代谢生物标志物,所述研究对象排除明确死因、死于先天畸形、染色体异常的个体;
S2、将研究对象的死亡设定为终点事件,起点时间定义为研究对象首次参与评估的时间,终点时间定位为:去世者在国家死亡登记处记录的死亡日期;存活者则是评估的截尾日期,随访过程中因意外事故导致失去随访的参与者被截尾;
S3、通过对控制模型执行交叉验证找出惩罚复杂度的最优参数λ,而后将研究对象的代谢生物标志物通过控制模型进行系数惩罚选中n个代谢生物标志物,基于上述n个代谢生物标志物构建代谢物衰老分数:其中Ci为代谢标志物指标加1再取自然对数之后的数值,βi为该代谢标志物在模型中分配到的系数。
进一步改进的是,所述控制模型为LASSOCox回归模型。
进一步改进的是,通过对控制模型执行10倍交叉验证,所述最优参数λ=0.0008362293,所述n=49。
进一步改进的是,所述研究对象的代谢组学数据为UK Biobank 11万人的249个代谢标志物的核磁数据。
为了实现上述目的,本申请提供了一种构建的代谢衰老速率的方法。
根据本申请的构建的代谢衰老速率的方法,代谢衰老速率=代谢物衰老分数/随访时间,其中所述代谢衰老分数为上述的代谢物衰老分数,所述随访时间为随访中研究对象的起始时间至终点时间,起点时间定义为研究对象首次参与评估的时间,终点时间定位为:去世者在国家死亡登记处记录的死亡日期;存活者则是评估的截尾日期,随访过程中因意外事故导致失去随访的参与者被截尾。
为了实现上述目的,本申请提供了一种代谢物衰老分数在于衰老和早衰信号捕捉中的应用。
根据本申请的代谢物衰老分数在于衰老和早衰信号捕捉中的应用,针对常见的老年疾病,根据新发患者中最小的10%的发病年龄设定为早发年龄,并以此划分各个疾病的早发患者,在早发年龄之后发病的患者定义为迟发患者,未患病的参与者划分为非患者,校正参与者的基线年龄,使用方差分析比较各组在基线时平均代谢物衰老分数的差异,并用Benjamini-Hochberg方法对p值进行校正。
进一步改进的是,所述常见的老年疾病包括二型糖尿病、痴呆、高血压、冠心病、慢性阻塞性肺疾病、胃食管返流病、肾衰竭、骨质疏松。
为了实现上述目的,本申请提供了一种代谢物衰老分数在疾病风险预测中的应用。
根据本申请的代谢物衰老分数在疾病风险预测中的应用,包括首先将各个衰老指标作为单因素对新发患者进行预测,比较各个衰老指标的AUC;其次纳入常见疾病风险因素,与所述衰老指标整合,提出多个全面的疾病风险预测模型,并量化加入代谢物衰老分数之后模型预测效力的提升。
进一步改进的是,所述衰老指标包括代谢物衰老分数、年龄、脆弱指数、端粒长度;所述常见疾病风险因素包括性别、Townsend剥夺指数、BMI、吸烟状态、饮酒频率、疾病遗传风险因素。
为了实现上述目的,本申请提供了一种代谢衰老速率在死亡风险预测中的应用。
根据本申请的代谢物衰老分数在疾病风险预测中的应用,基于个体的代谢衰老速率,将速率为正值的个体标记为老化组,速率为负值的个体标记为年轻化组;同时,划分了不同的衰老速率组:快速组、适中组、慢速组;比较各个组之间的死亡率情况并计算各组的死亡风险比,在个体水平上,计算每个代谢标志物的前后改变值并统一到同一个数量级,对得到的代谢物变化×个体矩阵进行聚类,使用双侧t检验比较老化组和年轻化组的平均代谢物变化差异并用BH方法校正p值,使用部分最小二乘鉴别分析得分图展示基于两组人代谢标志物改变的差异对群体的聚类结果。
本发明提供的构建代谢物衰老分数及代谢衰老速率的方法及其应用,与现有技术相比,其有益效果为:本项研究基于UK Biobank队列约11万人的249个代谢生物标志物的核磁数据(NMR),样本量大,代谢物覆盖全面,同时包含有横断面和纵向数据,旨在提供一个全面的衰老代谢图谱,并基于死亡这一衰老的结局构建代谢组学中首个第二代生物学衰老分数---代谢物衰老分数(Metabolic Aging Score)。这一分数保持了代谢组学本身的优势,灵敏而精确地实现衰老、早衰信号的捕捉,对死亡率的预测效力优异,能够应用于临床上对衰老疾病的预测中,实现个性化的健康监测以及疾病早期的风险分层。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是构建代谢物衰老分数模型的原理框图;
图2是构建代谢衰老速率的原理框图;
图3是死亡率预测时各衰老指标在ROC曲线中的对比图;
图4是使用Cox比例风险模型比较了各个组相对于中间组的死亡风险比;
图5是基线水平的代谢物衰老分数在各组存在显著差异图;
图6是代谢衰老分数以及脆弱指数随着随访时间增加的改变对比图;
图7是代谢物衰老分数的变化对于死亡风险概率预测的Kaplan-Meier曲线;
图8是各组的生存曲线图;
图9是四个衰老指标分别作为单因素预测因子时对疾病新发患者的区分情况;
图10是相对较高的特异度区间代谢物衰老分数与年龄预测效力对比图;
图11是代谢物衰老分数在多变量预测模型中的对比图;
图12是代谢物衰老分数模型预测效率对比图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
另外,术语“多个”的含义应为两个以及两个以上。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
1.如图1-图2所示,衰老相关代谢生物标志物的筛选及“代谢物衰老分数”的构建:
为了在高维度、高度共线性的代谢组学数据中筛选和识别出老化相关的标志物,我们采用了“LASSOCox回归模型”,这一模型是LASSO惩罚线性回归在COX生存分析模型中的应用。LASSO回归通过惩罚残差平方和,执行L1正则化和变量选择,它能够将与结局相关性不强的变量系数收缩至0,从而实现最小化误差平方和并选出重要变量。在研究对象的纳入中,我们排除了没有ICD-10编号指示其明确死因的个体以及死于先天畸形、染色体异常的个体,最后纳入107,392名参与者。其中99,252名参与者来自20个UK Biobank在英格兰的评估中心,8,140名参与者来自2个UK Biobank在苏格兰的评估中心。
模型的构建仅在来自20个英格兰评估中心的99,252名参与者中完成。我们将死亡设定为终点事件,起点时间定义为参与者首次在评估中心参与评估的时间,终点时间定义为:去世者在国家死亡登记处记录的死亡日期;存活者则是UK Biobank提供的截尾日期。随访过程中,因意外事故导致失去随访的参与者被截尾。最后,在99,252名参与者中,中位随访时间为12.7年,总人年为1,327,111人年。
在模型的参数调整中,执行10倍交叉验证,以找出控制模型中惩罚复杂度的最优参数λ。其中λ=0.0008362293时,模型整体交叉验证均方误差最小。在这一λ确定后,249个代谢生物标志物中有49个被算法选中并进行系数的惩罚。基于这49个代谢物的系数和水平,我们构建了“代谢物衰老分数”: 其中Ci为代谢标志物指标加1再取自然对数之后的数值,βi为该代谢标志物在模型中分配到的系数。
2.衰老相关代谢物与衰老相关表型的相关性分析
1)49个衰老代谢物与49个“脆弱表型”的相关性
“脆弱表型”被定义为老年人中常见的身体健康缺陷,是反应个体衰老状态的重要指标。通过逻辑回归,我们分析了49个衰老代谢物跟49个“脆弱表型”的相关性。
2)衰老代谢物跟8个常见衰老疾病的因果关联
我们进行了两样本多变量孟德尔随机化,以明确49个衰老相关代谢标志物跟8种常见老年疾病之间的潜在因果关联。首先,我们将49个代谢标志物分类为12个亚组,包括:支链氨基酸、芳香族氨基酸、其他氨基酸、糖酵解相关代谢物、酮体、体液平衡相关代谢物、胆固醇酯、游离胆固醇、甘油三酯、磷脂、脂肪酸、总脂质。对于49个衰老标志物中,23个比值形式的标志物,我们纳入其分子、分母上的代谢物而非比值项本身。最后,一共纳入61个代谢物分别与8个疾病(二型糖尿病、痴呆、高血压、冠心病、慢性阻塞性肺疾病、胃食管返流病、肾衰竭、骨质疏松)进行孟德尔随机化分析。
3.“代谢物衰老分数”与其他衰老指标的比较和评估
我们针对不同衰老指标(年龄,脆弱指数,端粒长度)对死亡风险的预测在招募自苏格兰评估中心的8,140名参与者中进行了评估和比较。受试者工作特征曲线(ROC)下面积(AUC)作为各个指标预测能力的衡量参数。考虑到死亡率在群体中相对较低,样本存在不平衡,我们重点关注了ROC曲线在高特异度(0.8-1)这一区间的预测表现。不同衰老指标的AUC经由DeLong检验,p值小于0.05被认为具有统计学上的显著差异。
进一步的,基于不同的衰老指标,我们将群体划分为“年轻”(前25%)、“居中”(中间50%)、“衰老”(后25%)三种衰老状态。使用log-rank检验比较不同衰老状态组的14.5年存活概率。针对“代谢物衰老分数”、脆弱指数、端粒长度这三个指标的分组,我们进一步校正了参与者的基线年龄对存活率的影响。同时,各“年轻”组以及“衰老”组相对于“居中”组的风险比值(Hazard Ratio)由Cox比例风险模型计算得出。
4.针对“代谢物衰老分数”对衰老/早衰“信号”的反应进行评估
针对上述8种常见的老年疾病,我们根据新发患者中最小的10%的发病年龄设定为“早发”年龄并以此划分各个疾病的“早发”患者,在“早发”年龄之后发病的患者定义为“迟发”患者,未患疾病的参与者划分为“非患者”。我们校正了参与者的基线年龄,使用方差分析比较了各组在基线时平均“代谢物衰老分数”的差异,并用“Benjamini-Hochberg”(BH)方法对p值进行校正。
通过利用随访的代谢组数据和表型数据,我们在1,198参与者中计算了随访的“代谢物衰老分数”以及随访的脆弱指数,探究了这两个指标的改变与随访时间的关系,并进一步探究了两个指标的改变是否与死亡率相关,以此来比较两个指标对与衰老的反应是否敏感和准确。
5.基于“代谢物衰老分数”衍生的衰老速率以及个性化的纵向代谢层面衰老轨
根据参与者的基线与随访“代谢物衰老分数”以及随访时间,我们定义了一个全新的代谢层面的衰老速率:基于个体的“代谢衰老速率”,将速率为正值的个体标记为“老化组”,速率为负值的个体标记为“年轻化组”;同时,划分了不同的衰老速率组:“快速组”(速率前25%)、“适中组”(速率中间50%)、“慢速组”(速率后25%);比较了各个组之间的死亡率情况并计算各组的HR。
在个体水平上,我们计算了每个代谢标志物的前后改变值并统一到同一个数量级,以便代谢标志物之间的比较。对得到的“代谢物变化×个体”矩阵进行聚类。使用双侧t检验比较“老化组”和“年轻化组”的平均代谢物变化差异并用BH方法校正p值。使用部分最小二乘鉴别分析(PLS-DA)得分图展示基于两组人代谢标志物改变的差异对群体的聚类结果。
6.“代谢物衰老分数”在疾病发病风险预测中的应用
针对上述8种常见老年疾病,我们评估了“代谢物衰老分数”在其风险预测中的应用。首先是将各个衰老指标(“代谢物衰老分数”、“年龄”、“脆弱指数”、“端粒长度”)作为单因素对新发患者进行预测,比较各个指标的AUC;其次,纳入多方面的常见疾病风险因素,包括:性别、Townsend剥夺指数、BMI、吸烟状态、饮酒频率、疾病遗传风险因素(ApoE基因型、多基因风险评分)等,与不同的衰老指标整合,提出多个全面的疾病风险预测模型,并量化加入“代谢物衰老分数”之后模型预测效力的提升:模型1:常见疾病风险因素+年龄;模型2:常见疾病风险因素+年龄+“代谢物衰老分数”;模型3:常见疾病风险因素+年龄+脆弱指数;模型4:常见疾病风险因素+年龄+脆弱指数+“代谢物衰老分数”。各个模型的预测效力用Harrell’s C-index量化,并比较各个模型的预测效力差异。其中,加入“代谢物衰老分数”带来的预测效力的提升,通过决策曲线分析探究其是否能带来临床上的应用收益。
在应用过程中:
“代谢物衰老分数”对死亡率的预测优于其他衰老指标
我们比较了基线时,各个衰老指标对死亡率的预测在8,140名苏格兰招募的参与者中的情况(如图3左所示)。
结果表明,“代谢物衰老分数”(Met)(AUC=0.7069,95%CI:0.6854-0.7284)在死亡率的预测表现上显著优于脆弱指数(Fra)(AUC=0.6427,95%CI:0.6211-0.6644)和端粒长度(LTL)(AUC=0.5584,95%CI:0.5351-0.5816)
(DeLong检验:Met vs Fra,p=4.83E-07;Met vs LTL:p<2.2E-16),并与年龄(AUC=0.7244,95%CI:0.7053-0.7434)的预测表现相当,无显著差异(p=0.813)。
在图3中,我们注意到年龄和“代谢物衰老分数”的ROC曲线在相对较高的特异度区间相交。考虑到因死亡率在群体中水平较低,数据存在不平衡,此时ROC曲线在高特异度部分的表现更具临床可接受性,因此我们在特异度为0.8-1的区间进行了部分ROC分析(图3右所示)。
在这一相对较高的特异度区间,“代谢物衰老分数”相比于其他三个衰老指标,具有最优的表现(部分AUC=0.6202,95%CI:0.6033-0.6372),年龄次之(部分AUC=0.5970,95%CI:0.5806-0.6135),脆弱指数居第三位(部分AUC=0.5617,95%CI:0.5467-0.5772),而端粒长度的预测表现最差(部分AUC=0.5314,95%CI:0.5185-0.5441)(Met vs Age,p=0.04653;Met vs Fra,p=1.15E-09;Met vs LTL,p<2.2E-16)。
基于Cox比例风险模型对14.5年生存率的分析表明,这4个衰老指标都与死亡风险密切相关,其中以“代谢物衰老分数”的相关性最为显著(HR s.d.=1.97,95%CI:1.86-2.10,p=8.79E-111)。若同时将这四个衰老指标放入同一个Cox模型,校正彼此之间的影响之后,“代谢物衰老分数”仍然最显著(HR s.d.=1.65,95%CI:1.54-1.77,p=8.10E-45),然而此时端粒长度不再与死亡风险相关(HR s.d.=0.96,95%CI:0.88-1.04,p=0.267)。考虑到这四个衰老指标都与死亡风险显著相关,我们因此进一步比较了每个指标所反映的衰老状态是否真实体现了个体的生物学衰老情况。基于各个指标,我们将8,140位参与者划分为“衰老组”(前25%)、“中间组”(中间50%)、“年轻组”(后25%),使用Cox比例风险模型比较了各个组相对于“中间组”的死亡风险比(HR),结果图4所示,我们发现,由“代谢物衰老分数”而确定的“衰老组”,与其他衰老组相比有最高的死亡风险(HR=3.13,95%CI:2.66-3.68,p<0.001)。同时,在由“代谢物衰老分数”、“脆弱指数”(Frailty Index)、“端粒长度”(LTL)所划分的各组中,校正基线年龄之后,结论基本一致,如图4所示。
代谢物衰老分数”对于衰老“信号”的变化更加灵敏与准确
相同年龄的两个个体会因为遗传、环境等因素而有着不同的生物学年龄。通常来说,在较早的年龄就患有老年疾病的个体,相比其同龄人而言具有更老的生物学年龄。但是,“年龄”本身不能捕捉到这一生物学“早衰”信号。因此,我们进一步探究了“代谢物衰老分数”对于衰老和早衰信号的监测跟反映情况。我们发现,在8种常见的老年疾病的早发患者(诊断年龄最年轻的10%)、晚发患者(其他新发病例)、未患病的参与者中,校正个体的基线年龄之后,基线水平的“代谢物衰老分数”在各组存在显著差异,如图5所示,:早发患者组的平均基线“代谢物衰老分数”高于晚发组(BH校正后p<0.01)、晚发组进一步高于“未患病组“(BH校正后p<0.0001)。由此我们发现,“代谢物衰老分数”精准的反映出个体生物学衰老的真实情况,考虑到代谢组学处于基因组学、转录组学、蛋白组学的下游,联系基因型和表型,我们进一步探究了基于代谢组学的“代谢物衰老分数”与基于衰老表型的“脆弱指数”相比,是否对衰老的变化更加灵敏。我们发现,随着随访时间的增加,“代谢物衰老分数”的改变逐渐增加(相关系数:0.11/年;BH校正后p=0.00125),然而“脆弱指数”的改变并不显著(相关系数:0.025/年,BH校正后p=0.46),如图6所示。在分别校正个体的基线“代谢物衰老分数”、“脆弱指数”后,结论基本一致(“代谢物衰老分数”BH校正后p=0.000264;“脆弱指数”BH校正后p=0.1804)。
我们进一步探究了这两个衰老指标的变化能否准确的反映个体衰老状态的改变。我们发现,“脆弱指数”的改变与死亡风险无关(HR s.d.=1.13,95%CI:0.87-1.48,p=0.365),然而“代谢物衰老分数”的改变是死亡的显著风险因素(HR s.d.=1.45,95%CI:1.13-1.87,p=0.00347)。在分别校正基线“代谢物衰老分数”、基线“脆弱指数”后,结论基本一致(校正后:“代谢物衰老分数”的变化,HR s.d.=1.56,95%CI:1.28-1.90,p=1.37E-05;“脆弱指数”的变化,HR s.d.=1.23,95%CI:0.96-1.56,p=0.100)。Kaplan-Meier曲线也展示出了“代谢物衰老分数”的变化对于死亡风险概率更加灵敏,如图7所示。
基于“代谢物衰老分数”构建的“代谢物衰老速率”与死亡率密切相关
基于个体的基线、随访“代谢物衰老分数”差异以及随访时间,我们首次定义了一个全新的衰老速率概念,即“代谢物衰老速率”: 在校正基线时的”代谢物衰老分数“后发现,这一速率跟死亡风险显著相关(HR s.d.=1.54,95%CI:1.25-1.90,p=4.62E-05)。基于这一速率,我们将1,198名同时具有基线、随访”代谢物衰老分数“的个体进行分组:”年轻化组“(速率为负值)、”老化组“(速率为正值);”快速组“(速率前25%)、”居中组“(中间50%)、”缓慢组“(速率后25%)。在Cox比例风险模型中,”年轻化组“相对于”老化组“的死亡风险比仅为0.34(95%CI HR:0.17-0.68)。同时,“快速组”相比于“居中组”的风险比为1.94(95%CI HR:1.06-3.54),而“慢速组”相比于“居中组”的风险比仅为0.48(95%CI HR:0.22-1.04)。各组的生存曲线(已校正基线“代谢物衰老分数”),如图8所示。
代谢物衰老分数”在常见老年疾病发病风险预测中的应用
在上述8种常见的老年疾病中,我们比较了四个衰老指标分别作为单因素预测因子时对疾病新发患者的区分情况,如图9所示。我们发现,各个衰老指标的疾病风险预测表现具有疾病依赖性,具体而言,“代谢物衰老分数”在二型糖尿病(AUC=0.7647,95%CI:0.7588-0.7707)、肾衰竭(AUC=0.8429,95%CI:0.8150-0.8708)这类代谢紊乱相关的疾病中预测效力最好;其次对于心血管疾病,在相对较高的特异度区间,如高血压(特异度:0.9-1)、冠心病(特异度:0.75-1)预测效力超过了年龄(高血压,p=0.034;冠心病,p=0.00031),如图10所示,同时,将“代谢物衰老分数”作为一项衰老指标,加入到疾病的多变量预测模型中,能够在常见疾病风险因素、其他衰老指标的基础之上,显著提升模型的预测效力,如图11所示,并且决策曲线分析表明,由“代谢物衰老分数带来的模型预测效力的提升,应用到临床决策上,将在一个广泛的风险区间带来临床价值和收益,如图12所示。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (7)

1.一种构建代谢物衰老分数的方法,其特征在于,包括以下步骤:
S1、从研究对象的代谢组学数据中筛选和识别出老化相关的代谢生物标志物,所述研究对象排除明确死因、死于先天畸形、染色体异常的个体;
S2、将研究对象的死亡设定为终点事件,起点时间定义为研究对象首次参与评估的时间,终点时间定位为:去世者在国家死亡登记处记录的死亡日期;存活者则是评估的截尾日期,随访过程中因意外事故导致失去随访的参与者被截尾;
S3、通过对控制模型执行交叉验证找出惩罚复杂度的最优参数λ,而后将研究对象的代谢生物标志物通过控制模型进行系数惩罚选中n个代谢生物标志物,基于上述n个代谢生物标志物构建代谢物衰老分数:其中Ci为代谢标志物指标加1再取自然对数之后的数值,βi为该代谢标志物在模型中分配到的系数,所述控制模型为LASSOCox回归模型。
2.如权利要求1所述构建代谢物衰老分数的方法,其特征在于,通过对控制模型执行10倍交叉验证,所述最优参数λ=0.0008362293,所述n=49。
3.如权利要求1所述构建代谢物衰老分数的方法,其特征在于,所述研究对象的代谢组学数据为UK Biobank 11万人的249个代谢标志物的核磁数据。
4.一种构建的代谢衰老速率的方法,其特征在于,代谢衰老速率=代谢物衰老分数/随访时间,其中所述代谢衰老分数为如权利要1-3中任意项权利要求所述的代谢物衰老分数,所述随访时间为随访中研究对象的起始时间至终点时间,起点时间定义为研究对象首次参与评估的时间,终点时间定位为:去世者在国家死亡登记处记录的死亡日期;存活者则是评估的截尾日期,随访过程中因意外事故导致失去随访的参与者被截尾。
5.代谢物衰老分数在于衰老和早衰信号捕捉中的应用,其特征在于,针对常见的老年疾病,根据新发患者中最小的10%的发病年龄设定为早发年龄,并以此划分各个疾病的早发患者,在早发年龄之后发病的患者定义为迟发患者,未患病的参与者划分为非患者,校正参与者的基线年龄,使用方差分析比较各组在基线时平均代谢物衰老分数的差异,并用Benjamini-Hochberg方法对p值进行校正,其中所述代谢衰老分数为如权利要1-3中任意项权利要求所述的代谢物衰老分数,所述常见的老年疾病包括二型糖尿病、痴呆、高血压、冠心病、慢性阻塞性肺疾病、胃食管返流病、肾衰竭、骨质疏松。
6.代谢物衰老分数在疾病风险预测中的应用,其特征在于,包括首先将各个衰老指标作为单因素对新发患者进行预测,比较各个衰老指标的AUC;其次纳入常见疾病风险因素,与所述衰老指标整合,提出多个全面的疾病风险预测模型,并量化加入代谢物衰老分数之后模型预测效力的提升,其中所述代谢衰老分数为如权利要1-3中任意项权利要求所述的代谢物衰老分数,所述衰老指标包括代谢物衰老分数、年龄、脆弱指数、端粒长度;所述常见疾病风险因素包括性别、Townsend剥夺指数、BMI、吸烟状态、饮酒频率、疾病遗传风险因素。
7.代谢衰老速率在死亡风险预测中的应用,其特征在于,基于个体的代谢衰老速率,将速率为正值的个体标记为老化组,速率为负值的个体标记为年轻化组;同时,划分了不同的衰老速率组:快速组、适中组、慢速组;比较各个组之间的死亡率情况并计算各组的死亡风险比,在个体水平上,计算每个代谢标志物的前后改变值并统一到同一个数量级,对得到的代谢物变化乘以个体矩阵进行聚类,使用双侧t检验比较老化组和年轻化组的平均代谢物变化差异并用BH方法校正p值,使用部分最小二乘鉴别分析得分图展示基于两组人代谢标志物改变的差异对群体的聚类结果,其中所述代谢衰老速率为如权利要求4所述的代谢衰老速率。
CN202310655912.1A 2023-06-05 2023-06-05 构建代谢物衰老分数及代谢衰老速率的方法及其应用 Active CN116798518B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310655912.1A CN116798518B (zh) 2023-06-05 2023-06-05 构建代谢物衰老分数及代谢衰老速率的方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310655912.1A CN116798518B (zh) 2023-06-05 2023-06-05 构建代谢物衰老分数及代谢衰老速率的方法及其应用

Publications (2)

Publication Number Publication Date
CN116798518A CN116798518A (zh) 2023-09-22
CN116798518B true CN116798518B (zh) 2024-03-08

Family

ID=88037719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310655912.1A Active CN116798518B (zh) 2023-06-05 2023-06-05 构建代谢物衰老分数及代谢衰老速率的方法及其应用

Country Status (1)

Country Link
CN (1) CN116798518B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160135434A (ko) * 2015-05-18 2016-11-28 (주)에이엔티랩스 트립토판 대사체 농도 측정을 통한 노화 진단 방법
CN110632289A (zh) * 2019-09-26 2019-12-31 浙江海洋大学 一种曼氏无针乌贼衰老过程中的代谢生物标志物
CN111144362A (zh) * 2019-12-31 2020-05-12 上海数深智能科技有限公司 一种旋转设备振动故障特征库定期优化算法
CN112101174A (zh) * 2020-09-09 2020-12-18 洛阳师范学院 一种基于LOF-Kurtogram的机械故障诊断方法
CN112466402A (zh) * 2020-11-16 2021-03-09 天津奇云诺德生物医学有限公司 一种使用血液标志物预测年龄的方法
KR20210099307A (ko) * 2020-02-04 2021-08-12 연세대학교 원주산학협력단 대사 증후군 점수 추정 방법과 이를 이용한 표시 방법
CN114787374A (zh) * 2019-10-29 2022-07-22 斯坦福大学托管董事会 基于对治疗的分子反应的治疗方法
CN115235613A (zh) * 2022-09-21 2022-10-25 江苏泰恩特环境技术有限公司 一种风机盘管的质量检测方法
WO2023057434A1 (en) * 2021-10-04 2023-04-13 University Of Malta Method and flight data analyzer for identifying anomalous flight data and method of maintaining an aircraft
CN116183746A (zh) * 2022-12-14 2023-05-30 贵州医科大学 一种基于检测尿液中代谢物含量评估机体衰老程度的方法及其应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2089539B1 (en) * 2006-10-13 2011-12-07 Metabolon, Inc. Biomarkers related to metabolic age and methods using the same
JP2021525249A (ja) * 2018-05-23 2021-09-24 エピトラッカー インコーポレイテッドEpitracker, Inc. 加齢及び長期性の質に関連する状態の診断及び治療のための組成物及び方法
US20200190568A1 (en) * 2018-12-10 2020-06-18 OneSkin Technologies, Inc. Methods for detecting the age of biological samples using methylation markers

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160135434A (ko) * 2015-05-18 2016-11-28 (주)에이엔티랩스 트립토판 대사체 농도 측정을 통한 노화 진단 방법
CN110632289A (zh) * 2019-09-26 2019-12-31 浙江海洋大学 一种曼氏无针乌贼衰老过程中的代谢生物标志物
CN114787374A (zh) * 2019-10-29 2022-07-22 斯坦福大学托管董事会 基于对治疗的分子反应的治疗方法
EP4051805A1 (en) * 2019-10-29 2022-09-07 The Board of Trustees of the Leland Stanford Junior University Methods of treatments based upon molecular response to treatment
CN111144362A (zh) * 2019-12-31 2020-05-12 上海数深智能科技有限公司 一种旋转设备振动故障特征库定期优化算法
KR20210099307A (ko) * 2020-02-04 2021-08-12 연세대학교 원주산학협력단 대사 증후군 점수 추정 방법과 이를 이용한 표시 방법
CN112101174A (zh) * 2020-09-09 2020-12-18 洛阳师范学院 一种基于LOF-Kurtogram的机械故障诊断方法
CN112466402A (zh) * 2020-11-16 2021-03-09 天津奇云诺德生物医学有限公司 一种使用血液标志物预测年龄的方法
WO2023057434A1 (en) * 2021-10-04 2023-04-13 University Of Malta Method and flight data analyzer for identifying anomalous flight data and method of maintaining an aircraft
CN115235613A (zh) * 2022-09-21 2022-10-25 江苏泰恩特环境技术有限公司 一种风机盘管的质量检测方法
CN116183746A (zh) * 2022-12-14 2023-05-30 贵州医科大学 一种基于检测尿液中代谢物含量评估机体衰老程度的方法及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Plasma metabolomics provides new insights into the relationship between metabolites and outcomes and left ventricular remodeling of coronary artery disease;Zhu Q等;《Cell & bioscience》;第12卷(第1期);第1-18页 *
基于肠道菌群的生物学年龄预测及其在衰老评估中的应用;陈宇涛;《中国优秀博硕士论文全文数据库(硕士)医药卫生科技辑》;第1-42页 *

Also Published As

Publication number Publication date
CN116798518A (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
JP6550124B2 (ja) 自閉症スペクトラム障害のリスクを決定するための方法およびシステム
Vasan Biomarkers of cardiovascular disease: molecular basis and practical considerations
Wolfe et al. Increase in cardiovascular and cerebrovascular disease prevalence in rheumatoid arthritis.
Sündermann et al. One-year follow-up of patients undergoing elective cardiac surgery assessed with the Comprehensive Assessment of Frailty test and its simplified form
Piran et al. Where genome meets phenome: rationale for integrating genetic and protein biomarkers in the diagnosis and management of dilated cardiomyopathy and heart failure
DK2922967T3 (en) PROCEDURE FOR VIEWING A PRESENCE OR NON-PRESENCE OF AGGRESSIVE PROSTATANCES
CN102016907A (zh) 用于监测抑郁症的炎性生物标志物
Qu et al. Correlation analysis of hemoglobin-to-red blood cell distribution width ratio and frailty in elderly patients with coronary heart disease
Lista et al. Application of systems theory in longitudinal studies on the origin and progression of Alzheimer’s disease
Ye et al. Building and verifying a severity prediction model of acute pancreatitis (AP) based on BISAP, MEWS and routine test indexes
Graca et al. Mid-infrared (MIR) metabolic fingerprinting of amniotic fluid: a possible avenue for early diagnosis of prenatal disorders?
CN104769132A (zh) 肝脏相关的炎性疾病的基因标记
Guo et al. Clinical research on prognostic evaluation of subjects with IPF by peripheral blood biomarkers, quantitative imaging characteristics and pulmonary function parameters
Pavanello et al. Higher number of night shifts associates with good perception of work capacity and optimal lung function but correlates with increased oxidative damage and telomere attrition
Chan et al. Commercialisation of biomarker tests for mental illnesses: advances and obstacles
Tremblay et al. Biomarkers of vascular complications in type 2 diabetes
Brenowitz et al. Extension of mendelian randomization to identify earliest manifestations of Alzheimer disease: association of genetic risk score for Alzheimer disease with lower body mass index by age 50 years
Chao et al. Towards proteome standards: the use of absolute quantitation in high-throughput biomarker discovery
Tapia et al. Prediction of type 1 diabetes at birth: cord blood metabolites vs genetic risk score in the Norwegian Mother, Father, and Child Cohort
CN116798518B (zh) 构建代谢物衰老分数及代谢衰老速率的方法及其应用
Dong et al. Association of serum growth differentiation factor 15 level with acute ischemic stroke in a Chinese population
Buczyńska et al. Novel Approaches to an Integrated Route for Trisomy 21 Evaluation
CN102906568A (zh) 作为先兆子痫早期阶段标志物的HbF和A1M
Rudolf et al. ST2 predicts mortality and length of stay in a critically ill noncardiac intensive care unit population
Achiron et al. Zinc-ion binding and cytokine activity regulation pathways predicts outcome in relapsing–remitting multiple sclerosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant