CN116052892A - 一种肌萎缩侧索硬化疾病进展分类系统和方法 - Google Patents
一种肌萎缩侧索硬化疾病进展分类系统和方法 Download PDFInfo
- Publication number
- CN116052892A CN116052892A CN202310265522.3A CN202310265522A CN116052892A CN 116052892 A CN116052892 A CN 116052892A CN 202310265522 A CN202310265522 A CN 202310265522A CN 116052892 A CN116052892 A CN 116052892A
- Authority
- CN
- China
- Prior art keywords
- track
- patient
- als
- patients
- alsfrs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 title claims abstract description 101
- 238000000034 method Methods 0.000 title claims abstract description 70
- 206010061818 Disease progression Diseases 0.000 title claims abstract description 21
- 230000005750 disease progression Effects 0.000 title claims abstract description 21
- 238000012795 verification Methods 0.000 claims abstract description 36
- 238000012952 Resampling Methods 0.000 claims abstract description 12
- 238000011156 evaluation Methods 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims abstract description 7
- 238000009960 carding Methods 0.000 claims abstract description 4
- 230000008859 change Effects 0.000 claims description 22
- 238000003745 diagnosis Methods 0.000 claims description 20
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 19
- 201000010099 disease Diseases 0.000 claims description 18
- 238000011282 treatment Methods 0.000 claims description 16
- 239000008280 blood Substances 0.000 claims description 14
- 210000004369 blood Anatomy 0.000 claims description 14
- 238000010972 statistical evaluation Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000007619 statistical method Methods 0.000 claims description 7
- 238000000546 chi-square test Methods 0.000 claims description 6
- 239000000356 contaminant Substances 0.000 claims description 6
- 229940079593 drug Drugs 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 230000007613 environmental effect Effects 0.000 claims description 6
- 238000009533 lab test Methods 0.000 claims description 6
- 230000004199 lung function Effects 0.000 claims description 6
- 229940036051 sojourn Drugs 0.000 claims description 6
- 238000011269 treatment regimen Methods 0.000 claims description 6
- 238000007476 Maximum Likelihood Methods 0.000 claims description 5
- 238000007689 inspection Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000013459 approach Methods 0.000 claims description 4
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 11
- 238000004393 prognosis Methods 0.000 description 9
- 208000032319 Primary lateral sclerosis Diseases 0.000 description 3
- 206010046298 Upper motor neurone lesion Diseases 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 208000023072 brachial amyotrophic diplegia Diseases 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 201000010901 lateral sclerosis Diseases 0.000 description 3
- 208000005264 motor neuron disease Diseases 0.000 description 3
- 238000010876 biochemical test Methods 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 201000008752 progressive muscular atrophy Diseases 0.000 description 2
- 238000009666 routine test Methods 0.000 description 2
- 208000002320 spinal muscular atrophy Diseases 0.000 description 2
- 206010028289 Muscle atrophy Diseases 0.000 description 1
- 208000035977 Rare disease Diseases 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000020763 muscle atrophy Effects 0.000 description 1
- 201000000585 muscular atrophy Diseases 0.000 description 1
- 230000000626 neurodegenerative effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004202 respiratory function Effects 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及一种肌萎缩侧索硬化疾病进展分类系统和方法,该系统包括梳理单元、轨迹拟合单元、差异评估单元、内部验证单元和外部验证单元;梳理单元用于梳理肌萎缩侧索硬化患者在随访过程中多个时点的ALS功能评分量表得分;轨迹拟合单元用于利用群组化轨迹建模方法对ALS患者多时点ALS功能评分量表得分进行轨迹拟合;差异评估单元用于评估不同的轨迹组在临床特征、实验室检查指标和终点事件发生风险上的差异,从侧面评估分类方法的有效性和合理性;内部验证单元用于利用Bootstrap重抽样方法进行内部验证;外部验证单元用于利用外部数据库拟合功能评分轨迹分组,从侧面验证分类方法的可靠性。
Description
技术领域
本发明涉及医学数据处理技术领域,具体涉及一种基于多时点功能状态变化轨迹的肌萎缩侧索硬化疾病进展分类系统和方法。
背景技术
肌萎缩侧索硬化(Amyotrophic lateral sclerosis,ALS)是一种严重的神经系统退行性罕见病。ALS病因复杂、疾病发生发展具有较大异质性,所以患者诊疗、照护等各方面需要有较强的针对性。
多方面因素被认为与ALS的发生发展和预后具有相关性,如:性别、年龄、诊断延迟时间、起病部位、呼吸功能、体质指数等。目前,已有很多研究者开始探索预测ALS患者预后,试图通过传统统计方法或机器学习方法构建包含多因素的预测模型。
但现有技术中已有的模型大多存在方法学局限、表现不佳。既有预测模型也大多没有开发出用户友好的使用工具,并常涉及检验检查信息,所以其使用复杂,不便于临床医生的实际应用。此外,已有预测模型考虑的因素均为基线情况,并没有考虑患者的动态变化状况。所以临床上更需要一种相对简便易行并考虑患者动态变化状况的方式来评估患者预后、指导临床诊疗。其中,制定合适的ALS患者分类方法便是一种较好的选择。
现有技术中已有的ALS分类方法及其缺点主要包括以下几方面:
(1)已有分类方法包括根据起病部位、疾病表型等维度的划分,这些划分方式虽然便于区分不同类型患者的特征,但这些因素与患者预后情况很难构成对应关系,难以更有效地指导临床实践。
(2)使用基线信息对患者进行分类是既往方法主要采取的措施,但基线情况相同的患者其长期疾病发展也可能存在较大差异,所以仅仅依靠基线信息来对患者加以分类虽然简单易操作,但实用性还有待进一步提高。
(3)虽然已有研究者探索根据ALS功能状态进展状况来对患者进行分类,但是已有研究仅仅只考虑了患者前后两个时点的功能状态差异。因为ALS患者存在较大异质性,且疾病情况复杂,患者功能状态变化往往不是简单的随时间呈线性变化趋势,所以需要考虑更多中间时点的变化情况。
发明内容
本发明旨在提供一种基于多时点功能状态变化轨迹的肌萎缩侧索硬化疾病进展分类系统和方法,所要解决的技术问题至少包括如何获得一种更合理的ALS分类方式,从而更好地评估患者预后和指导患者诊疗。
为了实现上述目的,本发明提供一种基于多时点功能状态变化轨迹的肌萎缩侧索硬化疾病进展分类系统,包括梳理单元、轨迹拟合单元、差异评估单元、内部验证单元和外部验证单元;所述的梳理单元用于梳理ALS患者在随访过程中多个时点的ALS功能评分量表(ALS Functional Rating Scale,ALSFRS)得分;所述的轨迹拟合单元用于利用群组化轨迹建模(group-based trajectory modeling,GBTM)方法对ALS患者多时点ALSFRS得分进行轨迹拟合,获得ALS群体中潜在的多个功能状态变化轨迹;所述的差异评估单元用于评估不同的轨迹组在临床特征、实验室检查指标和终点事件发生风险上的差异,以从侧面评估分类方法的有效性和合理性;所述的内部验证单元用于利用Bootstrap重抽样方法进行内部验证;所述的外部验证单元用于利用外部数据库通过同样方式拟合功能评分轨迹分组,进一步从侧面验证分类方法的可靠性。
优选地,所述的梳理单元使用预设时间段内就诊患者的基线和随访信息;患者初次就诊时,由两名擅长ALS诊疗的神经内科医师依据修订版El Escorial诊断标准对患者进行诊断,并根据发病部位和临床特征将患者分为5种表型;若两名神经内科医师的意见不一致,则咨询更高年资的医师;确诊为ALS的患者将会被纳入队列之中,并完成一份包含人口学特征、就诊史、药物使用、职业史、旅居史、生活方式和环境污染物暴露信息的病例报告表,同时完成血样采集;随后医生每3个月通过电话对患者进行随访,随访内容包括ALSFRS评分、体重、治疗方案、肺功能和是否发生终点事件;当出现终点事件或失访时,终止后续随访;多次住院患者会有多次住院期间实验室检查记录;通过STATA 16.0对数据进行清理,并将患者各项基本信息、检验检查信息、随访时间和多次测量的ALSFRS得分整理成“宽型数据”格式,即每个患者一行记录。
优选地,所述的5种表型包括肢体起病型ALS、延髓起病型ALS、连枷臂综合征、原发性侧索硬化和进行性肌萎缩。
优选地,所述的终点事件包括死亡或气管切开。
优选地,所述的失访是指每次随访在不同时点拨打3次电话,连续两次随访均无人接听电话或拒绝随访。
优选地,所述的GBTM方法是能准确评估ALSFRS得分随时间变化轨迹的统计方法;假设患者群体的ALSFRS得分在随时间变化上存在异质性,能够分为潜在多个亚组,每组变化轨迹对应不同方程;不预先设定亚组数,而是通过联合极大似然函数及其模型拟合规则得到亚组数最优估计,属于某轨迹组成员的概率用广义的logit模型建模,在建立的模型中加入非时间依赖性协变量,公式如下:;
其中, 为患者在t时点的ALSFRS得分取值; 是如果患者属于组t时的的概率;是在协变量的情况下,患者属于组的概率。
优选地,所述的GBTM方法假设之间是相互独立的,即满足以下公式:;
结合ALS诊疗专家经验和统计学评价指标来确定各特征的轨迹组数及各组轨迹方程。
优选地,所述的统计学评价指标包括:①贝叶斯信息准则绝对值尽量小;②各组后验概率均值>0.7;以及③各组人数>5%。
优选地,所述的差异评估单元进一步用于比较不同轨迹组患者在临床特征和实验室检查指标上的差异性;呈正态分布的连续型变量使用单因素方差分析、非正态分布的连续型变量使用秩和检验、分类变量使用卡方检验;比较不同轨迹组患者终点事件发生风险上的差异。
优选地,所述的临床特征包括性别、年龄、发病年龄和起病部位。
优选地,所述的实验室检查指标包括血生化检查指标、脑脊液检查指标和血常规检查指标。
优选地,所述的Bootstrap重抽样方法是通过从原始数据集中随机抽样,以获得与原始数据集具有相同样本量的数据集;重复1000次以获得1000个Bootstrap数据集,接着对1000个Bootstrap数据集分别应用GBTM,最后使用所有轨迹参数值的中位数来构建轨迹;通过Bootstrap内部验证提示GBTM所得ALSFRS轨迹分组的可靠性。
优选地,所述的外部验证单元使用PRO-ACT(Pooled Resource Open-Access ALSClinical Trials)公开数据库中的数据对患者多时点功能量表得分进行轨迹拟合,通过外部验证提示GBTM所得ALSFRS轨迹分组的可靠性。
本发明还提供一种基于多时点功能状态变化轨迹的肌萎缩侧索硬化疾病进展分类方法,包括以下步骤:
A1. 梳理ALS患者在随访过程中多个时点的ALS功能评分量表得分:
使用就诊患者的基线和随访信息;通过纳入就诊的ALS患者并定期随访搭建ALS队列;患者初次就诊时,由两名擅长ALS诊疗的神经内科医师依据修订版El Escorial诊断标准对患者进行诊断,并根据发病部位和临床特征将患者分为5种表型;确诊为ALS的患者将会被纳入队列之中,并完成一份包含人口学特征、就诊史、药物使用、职业史、旅居史、生活方式和环境污染物暴露信息的病例报告表,同时完成血样采集;随后医生每3个月通过电话对患者进行随访,随访内容包括ALSFRS评分、体重、治疗方案、肺功能和是否发生终点事件;当出现终点事件或失访时,将终止后续随访;多次住院患者会有多次住院期间实验室检查记录;
通过STATA 16.0对数据进行清理,并将患者各项基本信息、检验检查信息、随访时间和多次测量的ALSFRS得分整理成“宽型数据”格式;
A2. 利用GBTM方法对ALS患者多时点ALSFRS得分进行轨迹拟合,获得ALS群体中潜在的多个功能状态变化轨迹:
GBTM方法是能准确评估ALSFRS得分随时间变化轨迹的统计方法;GBTM方法的前提是假设患者群体的ALSFRS得分在随时间变化上存在异质性,能够分为潜在多个亚组,每组变化轨迹对应不同方程;不预先设定亚组数,而是通过联合极大似然函数及其模型拟合规则得到亚组数最优估计,属于某轨迹组成员的概率用广义的logit模型建模,在建立的模型中加入非时间依赖性协变量,公式如下:;
其中,为患者在t时点的ALSFRS得分取值;是如果患者属于组j时的的概率; 是在协变量的情况下,患者属于组的概率;
此外,GBTM方法假设之间是相互独立的,即满足以下公式:
;
结合ALS诊疗专家经验和统计学评价指标来确定各特征的轨迹组数及各组轨迹方程;
A3. 评估各个轨迹组在临床特征、实验室检查和终点事件发生风险上的差异,以从侧面评估分类方法的有效性和合理性:
A3.1. 比较不同轨迹组患者在临床特征和实验室检查指标上的差异性;呈正态分布的连续型变量使用单因素方差分析、非正态分布的连续型变量使用秩和检验、分类变量使用卡方检验;
A3.2. 比较不同轨迹组患者终点事件发生风险上的差异;
A4. 利用Bootstrap重抽样方法进行内部验证:
Bootstrap重抽样方法是通过从原始数据集中随机抽样,以获得与原始数据集具有相同样本量的数据集;重复1000次以获得1000个Bootstrap数据集,接着对1000个Bootstrap数据集分别应用GBTM,最后使用所有轨迹参数值的中位数来构建轨迹; 通过Bootstrap内部验证提示GBTM所得ALSFRS轨迹分组的可靠性;
A5. 利用外部数据库通过同样方式拟合功能评分轨迹分组,进一步从侧面验证分类方法的可靠性:
使用PRO-ACT公开数据库中的数据,对患者多时点功能量表得分进行轨迹拟合,得到的轨迹图;通过外部验证提示GBTM所得ALSFRS轨迹分组的可靠性。
有益效果
与现有技术相比,本发明的有益效果是:
本发明提供了一种基于多时点功能状态变化轨迹对ALS疾病进展进行分类的新方法。该方法首次考虑了ALS患者多时点的疾病进展状况,以更贴近实际的方式评估患者长期功能状态变化情况,克服了以往研究仅考虑根据患者基线指标或前后两个时点指标差值来评估患者疾病状况的缺陷。本发明对ALS患者预后评估、个性化治疗和临床试验中的患者选择都具有重要作用,也可为解释ALS发生发展机制提供重要线索。
本发明提供的技术方案也为其他疾病构建基于多时点指标的分类方法,乃至临床研究中合理充分使用患者多时点数据提供了方法指导,如:分析患者某暴露因素多时点变化情况与患者结局的相关性、分析某暴露因素与患者某结局多时点变化情况的相关性、分析某暴露因素多时点变化情况与患者某结局多时点变化情况的相关性、在疾病预测模型中纳入此类多时点动态变化因素等等。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的具体实施方式一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1是本发明所述的肌萎缩侧索硬化疾病进展分类方法的流程框图。
图2是本发明所用的部分患者数据整理格式示意图。
图3是本发明所述的4组ALS患者ALSFRS变化轨迹形状示意图。
图4是不同轨迹组患者终点事件(死亡或气管切开)发生风险上的差异示意图。
图5是使用PRO-ACT公开数据库中的数据对患者多时点功能量表得分进行轨迹拟合得到的轨迹图。
具体实施方式
在下文中更详细地描述了本发明以有助于对本发明的理解。
本发明所述的肌萎缩侧索硬化疾病进展分类系统包括梳理单元、轨迹拟合单元、差异评估单元、内部验证单元和外部验证单元;所述的梳理单元用于梳理ALS患者在随访过程中多个时点的ALSFRS得分;所述的轨迹拟合单元用于利用GBTM方法对ALS患者多时点ALSFRS得分进行轨迹拟合,获得ALS群体中潜在的多个功能状态变化轨迹;所述的差异评估单元用于评估不同的轨迹组在临床特征、实验室检查和终点事件发生风险上的差异,以从侧面评估分类方法的有效性和合理性;所述的内部验证单元用于利用Bootstrap重抽样方法进行内部验证;所述的外部验证单元用于利用外部数据库通过同样方式拟合功能评分轨迹分组,进一步从侧面验证分类方法的可靠性。
优选地,所述的梳理单元使用预设时间段内就诊患者的基线和随访信息;患者初次就诊时,由两名擅长ALS诊疗的神经内科医师依据修订版El Escorial诊断标准对患者进行诊断,并根据发病部位和临床特征将患者分为5种表型;若两名神经内科医师的意见不一致,则咨询更高年资的医师;确诊为ALS的患者将会被纳入队列之中,并完成一份包含人口学特征、就诊史、药物使用、职业史、旅居史、生活方式和环境污染物暴露信息的病例报告表,同时完成血样采集;随后医生每3个月通过电话对患者进行随访,随访内容包括ALSFRS评分、体重、治疗方案、肺功能和是否发生终点事件;当出现终点事件或失访时,终止后续随访;多次住院患者会有多次住院期间实验室检查记录;通过STATA 16.0对数据进行清理,并将患者各项基本信息、检验检查信息、随访时间和多次基线测量的ALSFRS得分整理成“宽型数据”格式,即每个患者一行记录。
优选地,所述的5种表型包括肢体起病型ALS、延髓起病型ALS、连枷臂综合征、原发性侧索硬化和进行性肌萎缩。
优选地,所述的终点事件包括死亡或气管切开。
优选地,所述的失访是指每次随访在不同时点拨打3次电话,连续两次随访均无人接听电话或拒绝随访。
优选地,所述的GBTM方法是能准确评估ALSFRS得分随时间变化轨迹的统计方法;假设患者群体的ALSFRS得分在随时间变化上存在异质性,能够分为潜在多个亚组,每组变化轨迹对应不同方程;不预先设定亚组数,而是通过联合极大似然函数及其模型拟合规则得到亚组数最优估计,属于某轨迹组成员的概率用广义的logit模型建模,在建立的模型中加入非时间依赖性协变量,公式如下: ;
其中,为患者在t时点的ALSFRS得分取值;是如果患者属于组j时的的概率;是在协变量的情况下,患者属于组的概率。
优选地,所述的GBTM方法假设之间是相互独立的,即满足以下公式:
;
结合ALS诊疗专家经验和统计学评价指标来确定各特征的轨迹组数及各组轨迹方程。
优选地,所述的统计学评价指标包括:①贝叶斯信息准则绝对值尽量小;②各组后验概率均值>0.7;以及③各组人数>5%。
优选地,所述的差异评估单元进一步用于比较不同轨迹组患者在临床特征和实验室检查指标上的差异性;呈正态分布的连续型变量使用单因素方差分析、非正态分布的连续型变量使用秩和检验、分类变量使用卡方检验;比较不同轨迹组患者终点事件发生风险上的差异。
优选地,所述的临床特征包括性别、年龄、发病年龄和起病部位。
优选地,所述的实验室检查指标包括血生化检查指标、脑脊液检查指标和血常规检查指标。
优选地,所述的Bootstrap重抽样方法是通过从原始数据集中随机抽样,以获得与原始数据集具有相同样本量的数据集;重复1000次以获得1000个Bootstrap数据集,接着对1000个Bootstrap数据集分别应用GBTM,最后使用所有轨迹参数值的中位数来构建轨迹;通过Bootstrap内部验证提示GBTM所得ALSFRS轨迹分组的可靠性。
优选地,所述的外部验证单元使用PRO-ACT公开数据库中的数据对患者多时点功能量表得分进行轨迹拟合,通过外部验证提示GBTM所得ALSFRS轨迹分组的可靠性。
图1是本发明的研究流程图。图1中,ALS=Amyotrophic lateral sclerosis,肌萎缩侧索硬化;ALSFRS=ALS Functional Rating Scale,ALS功能评分量表;GBTM=Group-based trajectory modeling,群组化轨迹建模。
如图1所示的流程,本发明所述的基于多时点ALSFRS变化轨迹形成ALS疾病进展分类新方法的过程具体包括如下操作:
A1. 梳理ALS患者在随访过程中多个时点的ALS功能评分量表(ALS FunctionalRating Scale,ALSFRS)得分:
使用2005年1月~2021年5月期间,来北京大学第三医院ALS中心就诊患者的基线和随访信息。北京大学第三医院ALS中心从2003年起,通过纳入全国来院就诊的ALS患者并定期随访搭建ALS队列。患者初次就诊时,将会由两名擅长ALS诊疗的神经内科医师依据修订版El Escorial诊断标准对患者进行诊断,并根据发病部位和临床特征将患者分为5种表型(肢体起病型ALS、延髓起病型ALS、连枷臂综合征、原发性侧索硬化和进行性肌萎缩)。若两人意见不一致,则咨询更高年资医师。确诊为ALS的患者将会被纳入队列之中,并完成一份包含人口学特征、就诊史、药物使用、职业史、旅居史、生活方式和环境污染物暴露等信息的病例报告表,同时完成血样采集。随后该中心医生每3个月会通过电话对患者进行随访,随访内容包括ALSFRS评分、体重、治疗方案、肺功能和是否发生终点事件(死亡或气管切开)等。当出现终点事件(死亡或气管切开)或失访(每次随访在不同时点拨打3次电话,连续两次随访均无人接听电话或拒绝随访)时,将终止后续随访。多次住院患者会有多次住院期间实验室检查记录。
通过STATA 16.0对数据进行清理,并将患者各项基本信息、检验检查信息,随访时间和各次随访的ALSFRS得分(包括基线测量)整理成“宽型数据”格式(即每个患者一行记录)。本发明所用部分患者数据整理格式示意图见图2。
A2. 利用GBTM方法对ALS患者多时点ALSFRS得分进行轨迹拟合,获得ALS群体中潜在的多个功能状态变化轨迹:
GBTM是能准确评估ALSFRS得分随时间变化轨迹的统计方法。GBTM的前提是假设患者群体的ALSFRS得分在随时间变化上存在异质性,可分为潜在多个亚组,每组变化轨迹对应不同方程。该方法不预先设定亚组数,而是通过联合极大似然函数及其模型拟合规则得到亚组数最优估计,属于某轨迹组成员的概率用广义的logit模型建模,在这个模型中可加入非时间依赖性协变量,公式如下:;
为患者在时点的ALSFRS得分取值。是如果患者属于组时的的概率。是在协变量的情况下,患者属于组的概率。
此外,GBTM假设之间是相互独立的,即满足以下公式。
轨迹组数和各组轨迹模型参数的设置将结合ALS诊疗专家经验和统计学评价指标(① 贝叶斯信息准则绝对值尽量小;② 各组后验概率均值>0.7;③ 各组人数>5%)来确定各特征的轨迹组数及各组轨迹方程。最后结合专业知识给予各亚组较为实际的含义。
通过上述过程,最终得到了4组ALS患者ALSFRS变化轨迹,各组轨迹模型参数见表1。各组轨迹形状可见图3。
表1 、4组ALS患者ALSFRS变化轨迹模型参数
A3. 评估4个轨迹组在临床特征、实验室检查和终点事件(死亡或气管切开)发生风险上的差异等多方面因素上的差异,以从侧面评估本发明所提出的分类方法的有效性和合理性:
A3.1. 比较不同轨迹组患者在临床特征(性别、年龄、发病年龄、起病部位等)和实验室检查指标(血生化检查指标、脑脊液检查指标和血常规检查等)上的差异性;呈正态分布的连续型变量使用单因素方差分析、非正态分布的连续型变量使用秩和检验、分类变量使用卡方检验。对基线临床特征和实验室检查指标的比较分别见表2和表3。可见四组患者在多个既往所提到的预后相关因素上具有显著性差异,符合临床实际情况。
表2、 4个轨迹组患者临床特征差异
表3、 4个轨迹组患者实验室检查指标差异
A3.2. 比较不同轨迹组患者终点事件(死亡或气管切开)发生风险上的差异(表4和图4)。四组患者轨迹情况与终点事件发生风险能一一对应,较好地吻合。
表4、 4个轨迹组患者终点事件发生风险上的差异
A4. 利用Bootstrap重抽样方法进行内部验证。
Bootstrap是通过从原始数据集中随机抽样,以获得与原始数据集具有相同样本量的数据集。重复此工作1000次以获得1000个Bootstrap数据集,接着对1000个Bootstrap数据集分别应用GBTM,最后使用所有轨迹参数值的中位数来构建轨迹。所得轨迹参数见表5。与原始数据库所得四组轨迹较为接近,Bootstrap内部验证可以提示GBTM所得ALSFRS轨迹分组的可靠性。
表5、 Bootstrap内部验证所得各组轨迹模型参数
A5. 利用外部数据库通过同样方式拟合功能评分轨迹分组,进一步从侧面验证方法的可靠性:
使用PRO-ACT公开数据库中的数据,按照在北京大学第三医院ALS数据中相同的方式对患者多时点功能量表得分进行轨迹拟合,得到的轨迹图见图5。轨迹分组情况与基于北京大学第三医院ALS数据所得轨迹分组情况相近,外部验证也可提示GBTM所得ALSFRS轨迹分组的可靠性。
本发明所述的基于多时点功能状态变化轨迹的肌萎缩侧索硬化疾病进展分类系统和方法有助于患者治疗选择、临床试验患者选择和预测患者预后,有助于发现ALS患者群体潜在的多个功能状态变化亚组,为解释ALS发生发展机制提供线索。因为ALS治疗药物或器械相关临床试验常需要严格设定患者病情程度,所以本申请所述的方法可以为临床试验中的更精准的患者选择提供有效依据。
本发明针对ALS患者分类问题,利用与以往仅考虑基线信息或患者前后两时点差异不同的策略,通过考虑ALS患者病程中多个时点的功能状态,将患者多时点功能状态评分拟合成多个潜在轨迹组,然后评估多个轨迹组在临床特征、实验室检查和预后等多方面因素上的差异,以从侧面评估本发明所提出的分类方法的有效性和合理性。多时点轨迹拟合充分利用了患者疾病过程中多时点的功能状态数据,可以更细致地挖掘ALS患者的疾病进展模式。
以上描述了本发明优选实施方式,然其并非用以限定本发明。本领域技术人员对在此公开的实施方案可进行并不偏离本发明范畴和精神的改进和变化。
Claims (10)
1.一种基于多时点功能状态变化轨迹的肌萎缩侧索硬化疾病进展分类系统,其特征在于,所述的肌萎缩侧索硬化疾病进展分类系统包括梳理单元、轨迹拟合单元、差异评估单元、内部验证单元和外部验证单元;所述的梳理单元用于梳理肌萎缩侧索硬化患者在随访过程中多个时点的ALS功能评分量表得分;所述的轨迹拟合单元用于利用群组化轨迹建模方法对ALS患者多时点ALS功能评分量表得分进行轨迹拟合,获得ALS群体中潜在的多个功能状态变化轨迹;所述的差异评估单元用于评估不同的轨迹组在临床特征、实验室检查指标和终点事件发生风险上的差异,以从侧面评估分类方法的有效性和合理性;所述的内部验证单元用于利用Bootstrap重抽样方法进行内部验证;所述的外部验证单元用于利用外部数据库通过同样方式拟合功能评分轨迹分组,进一步从侧面验证分类方法的可靠性。
2.根据权利要求1所述的肌萎缩侧索硬化疾病进展分类系统,其特征在于,所述的梳理单元使用预设时间段内就诊患者的基线和随访信息;患者初次就诊时,由两名擅长ALS诊疗的神经内科医师依据修订版El Escorial诊断标准对患者进行诊断,并根据发病部位和临床特征将患者分为5种表型;若两名神经内科医师的意见不一致,则咨询更高年资的医师;确诊为ALS的患者将会被纳入队列之中,并完成一份包含人口学特征、就诊史、药物使用、职业史、旅居史、生活方式和环境污染物暴露信息的病例报告表,同时完成血样采集;随后医生每3个月通过电话对患者进行随访,随访内容包括ALSFRS评分、体重、治疗方案、肺功能和是否发生终点事件;当出现终点事件或失访时,终止后续随访;多次住院患者会有多次住院期间实验室检查记录;通过STATA 16.0对数据进行清理,并将患者各项基本信息、检验检查信息、随访时间和多次测量的ALSFRS得分整理成“宽型数据”格式,即每个患者一行记录。
3.根据权利要求1所述的肌萎缩侧索硬化疾病进展分类系统,其特征在于,所述的GBTM方法是能准确评估ALSFRS得分随时间变化轨迹的统计方法;假设患者群体的ALSFRS得分在随时间变化上存在异质性,能够分为潜在多个亚组,每组变化轨迹对应不同方程;不预先设定亚组数,而是通过联合极大似然函数及其模型拟合规则得到亚组数最优估计,属于某轨迹组成员的概率用广义的logit模型建模,在建立的模型中加入非时间依赖性协变量,公式如下:
;
其中,为患者在时点的ALSFRS得分取值;是如果患者属于组时的的概率;是在协变量的情况下,患者属于组的概率。
4.根据权利要求1所述的肌萎缩侧索硬化疾病进展分类系统,其特征在于,所述的GBTM方法假设之间是相互独立的,即满足以下公式;
结合ALS诊疗专家经验和统计学评价指标来确定各特征的轨迹组数及各组轨迹方程。
5.根据权利要求4所述的肌萎缩侧索硬化疾病进展分类系统,其特征在于,所述的统计学评价指标包括:①贝叶斯信息准则绝对值尽量小;②各组后验概率均值>0.7;以及③各组人数>5%。
6.根据权利要求1所述的肌萎缩侧索硬化疾病进展分类系统,其特征在于,所述的差异评估单元进一步用于比较不同轨迹组患者在临床特征和实验室检查指标上的差异性;呈正态分布的连续型变量使用单因素方差分析、非正态分布的连续型变量使用秩和检验、分类变量使用卡方检验;比较不同轨迹组患者终点事件发生风险上的差异。
7.根据权利要求6所述的肌萎缩侧索硬化疾病进展分类系统,其特征在于,所述的临床特征包括性别、年龄、发病年龄和起病部位;所述的实验室检查指标包括血生化检查指标、脑脊液检查指标和血常规检查指标。
8.根据权利要求1所述的肌萎缩侧索硬化疾病进展分类系统,其特征在于,所述的Bootstrap重抽样方法是通过从原始数据集中随机抽样,以获得与原始数据集具有相同样本量的数据集;重复1000次以获得1000个Bootstrap数据集,接着对1000个Bootstrap数据集分别应用GBTM,最后使用所有轨迹参数值的中位数来构建轨迹;通过Bootstrap内部验证提示GBTM所得ALSFRS轨迹分组的可靠性。
9.根据权利要求1所述的肌萎缩侧索硬化疾病进展分类系统,其特征在于,所述的外部验证单元使用PRO-ACT公开数据库中的数据对患者多时点功能量表得分进行轨迹拟合,通过外部验证提示GBTM所得ALSFRS轨迹分组的可靠性。
10.根据权利要求1至9任一项所述的肌萎缩侧索硬化疾病进展分类系统的分类方法,其特征在于,包括以下步骤:
A1. 梳理ALS患者在随访过程中多个时点的ALS功能评分量表得分:
使用就诊患者的基线和随访信息;通过纳入就诊的ALS患者并定期随访搭建ALS队列;患者初次就诊时,由两名擅长ALS诊疗的神经内科医师依据修订版El Escorial诊断标准对患者进行诊断,并根据发病部位和临床特征将患者分为5种表型;确诊为ALS的患者将会被纳入队列之中,并完成一份包含人口学特征、就诊史、药物使用、职业史、旅居史、生活方式和环境污染物暴露信息的病例报告表,同时完成血样采集;随后医生每3个月通过电话对患者进行随访,随访内容包括ALSFRS评分、体重、治疗方案、肺功能和是否发生终点事件;当出现终点事件或失访时,将终止后续随访;多次住院患者会有多次住院期间实验室检查记录;
通过STATA 16.0对数据进行清理,并将患者各项基本信息、检验检查信息、随访时间和多次测量的ALSFRS得分整理成“宽型数据”格式;
A2. 利用GBTM方法对ALS患者多时点ALSFRS得分进行轨迹拟合,获得ALS群体中潜在的多个功能状态变化轨迹:
GBTM方法是能准确评估ALSFRS得分随时间变化轨迹的统计方法;GBTM方法的前提是假设患者群体的ALSFRS得分在随时间变化上存在异质性,能够分为潜在多个亚组,每组变化轨迹对应不同方程;不预先设定亚组数,而是通过联合极大似然函数及其模型拟合规则得到亚组数最优估计,属于某轨迹组成员的概率用广义的logit模型建模,在建立的模型中加入非时间依赖性协变量,公式如下:
;
其中,为患者在时点的ALSFRS得分取值;是如果患者属于组时的的概率;是在协变量的情况下,患者属于组的概率;
此外,GBTM方法假设之间是相互独立的,即满足以下公式:;
结合ALS诊疗专家经验和统计学评价指标来确定各特征的轨迹组数及各组轨迹方程;
A3. 评估各个轨迹组在临床特征、实验室检查和终点事件发生风险上的差异,以从侧面评估分类方法的有效性和合理性:
A3.1. 比较不同轨迹组患者在临床特征和实验室检查指标上的差异性;呈正态分布的连续型变量使用单因素方差分析、非正态分布的连续型变量使用秩和检验、分类变量使用卡方检验;
A3.2. 比较不同轨迹组患者终点事件发生风险上的差异;
A4. 利用Bootstrap重抽样方法进行内部验证:
Bootstrap重抽样方法是通过从原始数据集中随机抽样,以获得与原始数据集具有相同样本量的数据集;重复1000次以获得1000个Bootstrap数据集,接着对1000个Bootstrap数据集分别应用GBTM,最后使用所有轨迹参数值的中位数来构建轨迹; 通过Bootstrap内部验证提示GBTM所得ALSFRS轨迹分组的可靠性;
A5. 利用外部数据库通过同样方式拟合功能评分轨迹分组,进一步从侧面验证分类方法的可靠性:
使用PRO-ACT公开数据库中的数据,对患者多时点功能量表得分进行轨迹拟合,得到的轨迹图;通过外部验证提示GBTM所得ALSFRS轨迹分组的可靠性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310265522.3A CN116052892B (zh) | 2023-03-20 | 2023-03-20 | 一种肌萎缩侧索硬化疾病进展分类系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310265522.3A CN116052892B (zh) | 2023-03-20 | 2023-03-20 | 一种肌萎缩侧索硬化疾病进展分类系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116052892A true CN116052892A (zh) | 2023-05-02 |
CN116052892B CN116052892B (zh) | 2023-06-16 |
Family
ID=86133438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310265522.3A Active CN116052892B (zh) | 2023-03-20 | 2023-03-20 | 一种肌萎缩侧索硬化疾病进展分类系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116052892B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005039388A2 (en) * | 2003-10-23 | 2005-05-06 | Pfizer Products, Inc. | Method for predicting the onset or change of a medical condition |
WO2012076734A1 (es) * | 2010-12-09 | 2012-06-14 | Universidad De Zaragoza | Método para el diagnóstico. pronóstico y seguimiento de la degeneración muscular |
CN108778121A (zh) * | 2016-02-12 | 2018-11-09 | Als治疗发展研究所 | 基于动力学数据评估als病情进展 |
CN111341452A (zh) * | 2020-04-01 | 2020-06-26 | 四川大学华西医院 | 多系统萎缩失能预测方法、模型建立方法、装置及设备 |
WO2022018771A1 (en) * | 2020-07-22 | 2022-01-27 | Universita' Degli Studi Di Padova | Method for determining a disease progression and survival prognosis for patients with amyotrophic lateral sclerosis |
CN115346674A (zh) * | 2022-08-31 | 2022-11-15 | 河北医科大学第二医院 | 一种肌萎缩侧索硬化患者便秘风险预测模型及其应用 |
-
2023
- 2023-03-20 CN CN202310265522.3A patent/CN116052892B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005039388A2 (en) * | 2003-10-23 | 2005-05-06 | Pfizer Products, Inc. | Method for predicting the onset or change of a medical condition |
WO2012076734A1 (es) * | 2010-12-09 | 2012-06-14 | Universidad De Zaragoza | Método para el diagnóstico. pronóstico y seguimiento de la degeneración muscular |
CN108778121A (zh) * | 2016-02-12 | 2018-11-09 | Als治疗发展研究所 | 基于动力学数据评估als病情进展 |
CN111341452A (zh) * | 2020-04-01 | 2020-06-26 | 四川大学华西医院 | 多系统萎缩失能预测方法、模型建立方法、装置及设备 |
WO2022018771A1 (en) * | 2020-07-22 | 2022-01-27 | Universita' Degli Studi Di Padova | Method for determining a disease progression and survival prognosis for patients with amyotrophic lateral sclerosis |
CN115346674A (zh) * | 2022-08-31 | 2022-11-15 | 河北医科大学第二医院 | 一种肌萎缩侧索硬化患者便秘风险预测模型及其应用 |
Non-Patent Citations (2)
Title |
---|
CDSREPORT: "首个完全基于真实世界数据的模型 预测ALS疾病进展全轨迹", Retrieved from the Internet <URL:https://www.ofweek.com/medical/2022-04/ART-11157-8420-30556490.html> * |
ERICA TAVAZZI等: "《Predicting functional impairment trajectories in amyotrophic lateral sclerosis: a probabilistic, multifactorial model of disease progression》", 《SPRINGERLINK HTTPS://DOI.ORG/10.1007/S00415-022-11022-0》, pages 3858 - 3878 * |
Also Published As
Publication number | Publication date |
---|---|
CN116052892B (zh) | 2023-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109920508B (zh) | 处方审核方法及系统 | |
Dorfman et al. | AAEM minimonograph# 47: normative data in electrodiagnostic medicine | |
US9589104B2 (en) | Self-improving method of using online communities to predict health-related outcomes | |
US7418399B2 (en) | Methods and kits for managing diagnosis and therapeutics of bacterial infections | |
Chawla et al. | Premenstrual dysphoric disorder: is there an economic burden of illness? | |
EP3409201A1 (en) | System and method to manage diabetes based on glucose median, glucose variability, and hypoglycemic risk | |
US8458610B2 (en) | Medical information generation and recordation methods and apparatus | |
Seid et al. | The impact of realized access to care on health-related quality of life: a two-year prospective cohort study of children in the California State Children’s Health Insurance Program | |
Ahmed et al. | Using latent trajectory analysis of residuals to detect response shift in general health among patients with multiple sclerosis article | |
Ho et al. | Imputation-enhanced prediction of septic shock in ICU patients | |
CN114727761A (zh) | 患有运动障碍的患者的个性化保健的改善 | |
Ben-Assuli | Measuring the cost-effectiveness of using telehealth for diabetes management: a narrative review of methods and findings | |
Aichele et al. | Illness and intelligence are comparatively strong predictors of individual differences in depressive symptoms following middle age | |
CN112151174A (zh) | 一种基于体检数据的用户健康信息分析方法、系统 | |
van Unnik et al. | Remote monitoring of amyotrophic lateral sclerosis using wearable sensors detects differences in disease progression and survival: a prospective cohort study | |
CN116052892B (zh) | 一种肌萎缩侧索硬化疾病进展分类系统和方法 | |
Jin et al. | Use of patient-reported data to match depression screening intervals with depression risk profiles in primary care patients with diabetes: development and validation of prediction models for major depression | |
Carroll et al. | Measuring the impact of advanced practice nursing on achieving cost-quality outcomes: Issues and challenges | |
CN114999647A (zh) | 一种基于大数据的智慧健康监测方法及系统 | |
Madkour et al. | Lifetime alcohol use trajectories and health status among persons living with HIV (PLWH) | |
CN111403013B (zh) | 用于能力评定的方法及装置 | |
Motl et al. | Naturally occurring change in Multiple Sclerosis Walking Scale-12 scores over time in multiple sclerosis | |
CN110675930A (zh) | 一种针对非小细胞肺癌的决策方法、系统及装置 | |
Samiian et al. | PND78 Real-World Burden of Comorbidities Along with Drug Utilization in United States Patients with Essential Tremors | |
Noé et al. | When, How, and to What Extent Are Individuals with Unresponsive Wakefulness Syndrome Able to Progress? Neurobehavioral Progress. Brain Sci. 2021, 11, 126 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |