CN117476220A

CN117476220A - 一种痴呆水平评估模块及系统

Info

Publication number: CN117476220A
Application number: CN202211612476.1A
Authority: CN
Inventors: 方焯; 刘釜均; 邓嘉乐; 蔡啸
Original assignee: Shanghai Youming Autometric Medical Technology Co ltd; Tianjin Aotian Medical Technology Co ltd; Suzhou Yaoming Zekang Biotechnology Co ltd
Current assignee: Shanghai Youming Autometric Medical Technology Co ltd; Tianjin Aotian Medical Technology Co ltd; Suzhou Yaoming Zekang Biotechnology Co ltd
Priority date: 2022-07-27
Filing date: 2022-07-27
Publication date: 2024-01-30
Also published as: CN114999656B; CN114999656A

Abstract

本发明公开了一种痴呆水平评估模块及系统。痴呆水平评估模块基于病人的待评估数据通过逻辑回归模型得到病人的痴呆水平评估结果，痴呆水平评估结果将病人划分为正常组、主观认知障碍组、中度认知受损组和痴呆组；逻辑回归模型采用分类分析的方法计算病人在正常组、主观认知障碍组、中度认知受损组和痴呆组中的概率，四个组的概率之和为100％，概率最高的组为病人的痴呆水平评估结果所在组。阿尔兹海默病风险评估系统包括痴呆水平评估模块、正电子发射断层扫描阴阳性风险评估模块和结果输出模块。采用本发明的模块及系统显著提高了阿尔兹海默病早期诊断准确率。

Description

一种痴呆水平评估模块及系统

技术领域

本发明属于体外诊断技术领域，具体涉及一种痴呆水平评估模块及系统。

本案是针对母案“CN202210895670.9，一种阿尔兹海默病风险评估系统及模块”的分案申请文本。

背景技术

阿尔兹海默病(Alzheimer's Disease，AD)是一种主要表现为进行性、不可逆的认知功能损害的神经退行性疾病，其病理学特征是细胞外β-淀粉样斑块(β-amyloidplaque，Aβ)构成的老年斑和细胞内过度磷酸化tau(Phosphorylatedtau，P-tau)构成的神经原纤维缠结的形成。作为危害人类大脑发病率最高的神经退行性疾病，AD给患者本身造成了极大的痛苦，同时，也给家庭和社会带来了沉重的负担。然而我们现在仍然缺乏有效的AD治疗药物或能够延缓AD发展进程的手段，其主要原因之一就是早期有效诊断手段的缺乏，无法对AD实施早期精准诊断，导致AD患者经常在临床痴呆阶段才被引起重视，而该阶段往往已经出现不可逆的神经功能损伤，难以通过治疗逆转病程。

为了实现早期AD的精准诊断，许多研究者致力于寻找可利用的有效的AD生物标志物。目前针对该病有两种早期检测方法，即正电子发射断层扫描(positron emissiontomography，PET)和脑脊液(Cerebrospinal fluid，CSF)检查。PET扫描可以观察到Aβ和tau蛋白缠结，并可以对其进行定量分析，Aβ特异性PET显像阳性出现在AD病程的早期，tau特异性PET显像阳性则提示出现神经元的病理改变，虽然PET检查在AD的诊断和病程评估方面具有重要的参考价值，但由于其费用昂贵、具有放射性等原因限制了其临床广泛应用。脑脊液的关键生物标志物包括Aβ42、Aβ40、总tau蛋白(Total tau，T-tau)和磷酸化tau蛋白。诊断时综合考虑多个脑脊液生物标志物Aβ42、Aβ42/Aβ40、T-tau和P-tau181至关重要。目前指南指出如果3个CSF生物标志物都异常，高度提示CSF的改变是由AD引起的。联合应用Aβ42和tau预测MCI患者转换为AD的准确性已经达到80％以上。当然，在临床工作中还可能出现很多非典型的情况，如CSF仅表现为Aβ1-42减低和(或)低比值Aβ42/Aβ40，而T-tau和P-taul81是正常的，这种结果提示处于AD病理进程中间阶段的可能性。当3个关键生物标志物的CSF浓度都在正常范围内时，基本可以暂时排除AD。但由于脑脊液采样的有创性，且不同中心在采样水平和检测能力上的差异，难以大规模适用于临床诊断。

因此，亟需寻找一种侵入性小、成本效益高且易于获得的能够早期诊断AD的方法。

发明内容

本发明提供了一种痴呆水平评估模块及系统。采用本发明的技术方案，能够方便、高效、精准地对阿尔兹海默病进行评估、筛查和/或诊断，并能够对现有检测金标准结果进行精准预测，降低相关检测成本，显著提高了阿尔兹海默病早期诊断准确率，实现了无创精准诊断。

为实现本发明的目的，本发明的技术方案为：

本发明提供了一种阿尔兹海默病风险评估系统，包括数据输入模块、痴呆水平评估模块、正电子发射断层扫描阴阳性风险评估模块和结果输出模块；其中，

所述数据输入模块用于输入病人的待评估数据；

所述痴呆水平评估模块基于病人的待评估数据通过逻辑回归模型得到病人的痴呆水平评估结果，痴呆水平评估结果将病人划分为正常组、主观认知障碍组、中度认知受损组和痴呆组；

所述正电子发射断层扫描阴阳性风险评估模块基于病人的痴呆水平评估结果通过决策树分析得到病人的正电子发射断层扫描阴阳性风险评估结果；

所述结果输出模块用于输出阿尔兹海默病风险评估结果。

具体地，病人的待评估数据包括临床数据、神经心理学评估数据、血液标志物数据和/或基因数据。

具体地，在正电子发射断层扫描阴阳性风险评估模块中，决策树包括与正常组、主观认知障碍组、中度认知受损组和痴呆组相对应的决策树，在正常组中采用正常组相对应的决策树进行分析，在主观认知障碍组中采用主观认知障碍组相应对的决策树进行分析，在中度认知受损组中采用中度认知受损组相对应的决策树进行分析，在痴呆组中采用痴呆组相对应的决策树进行分析。

本发明提供了一种痴呆水平评估模块，所述痴呆水平评估模块基于病人的待评估数据通过逻辑回归模型得到病人的痴呆水平评估结果，痴呆水平评估结果将病人划分为正常组、主观认知障碍组、中度认知受损组和痴呆组；逻辑回归模型采用分类分析的方法计算病人在正常组、主观认知障碍组、中度认知受损组和痴呆组中的概率，四个组的概率之和为100％，概率最高的组为病人的痴呆水平评估结果所在组。

具体地，分类分析采用的组合为痴呆组vs.(中度认知受损组+主观认知障碍组+正常组)、中度认知受损组vs.(主观认知障碍组+正常组)、主观认知障碍组vs.正常组。

具体地，痴呆水平评估模块的构建方法包括以下步骤：采用变量筛选模块应用机器学习算法进行变量筛选，以正常组、主观认知障碍组、中度认知受损组和痴呆组诊断为结局变量，以经过变量筛选模块筛选的变量为自变量，使用Sigmoid函数映射建立逻辑回归模型。

本发明提供了一种正电子发射断层扫描阴阳性风险评估模块，所述正电子发射断层扫描阴阳性风险评估模块基于病人的痴呆水平通过决策树分析得到病人的正电子发射断层扫描阴阳性风险评估结果；病人的痴呆水平包括正常组、主观认知障碍组、中度认知受损组和痴呆组，决策树包括与正常组、主观认知障碍组、中度认知受损组和痴呆组相对应的决策树，在正常组中采用正常组相对应的决策树进行分析，在主观认知障碍组中采用主观认知障碍组相应对的决策树进行分析，在中度认知受损组中采用中度认知受损组相对应的决策树进行分析，在痴呆组中采用痴呆组相对应的决策树进行分析。

具体地，正常组相对应的决策树的自变量包括P-tau181、NfL、Aβ42:Aβ40；和/或，主观认知障碍组相应对的决策树的自变量包括P-tau181、教育年限；和/或，中度认知受损组相对应的决策树的自变量包括P-tau181、Aβ42:Aβ40、年龄；和/或，痴呆组相对应的决策树的自变量包括P-tau181、Aβ42:Aβ40、年龄、教育年限。

具体地，正电子发射断层扫描阴阳性风险评估模块的决策树通过二元分类模型判断病人的正电子发射断层扫描阴阳性风险评估结果。

具体地，正电子发射断层扫描阴阳性风险评估模块的构建方法包括以下步骤：采用信息增益对正电子发射断层扫描阴阳性风险评估模块的自变量进行筛选，根据信息增益的值分割节点并建立决策树。

本发明基于logistic regression算法和决策树人工智能算法，自主研发建立的阿尔兹海默病风险评估系统，通过对临床数据、神经心理学评估数据、血液标志物数据、基因数据等的整合，最终形成整合诊断模型，对疑似阿尔兹海默病的患者进行科学有效的辅助评估，在降低其误诊率和漏诊率的同时，显著提高了阿尔兹海默病早期诊断准确率，实现了无创精准诊断，使患者在发病早期可以获得有效的干预，从而为阿尔兹海默病的治疗提供可能性。

与现有技术相比，本发明提供的基于logistic regression算法和决策树的阿尔兹海默病风险评估系统，整合多指标鉴别诊断AD，与当前临床诊断方式，PET-CT、MRI及脑脊液检测单个生物标志物相比，本评估系统使得AD的诊断性能得到显著性提升。

本发明创新的基于logistic regression算法和决策树的阿尔兹海默病风险评估系统的准确率达到95％以上，相较于目前临床中对于前期阿尔兹海默病极低的准确度，给医生提供了一个值得信任的侵入性小、成本效益高且易于获得的辅助诊断方式，可大大避免漏诊误诊，降低检测成本。

附图说明

图1为本发明正常组(NC)相对应的决策树示意图；

图2为本发明主观认知障碍组(SCD)相对应的决策树示意图；

图3为本发明中度认知受损组(MCI)相对应的决策树示意图；

图4为本发明痴呆组(Dementia)相对应的决策树示意图。

具体实施方式

下面将对本发明的技术方案进行清楚、完整的描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明具体实施方式一方面提供了一种阿尔兹海默病风险评估系统，包括数据输入模块、痴呆水平评估模块、正电子发射断层扫描阴阳性风险评估模块和结果输出模块。

1、数据输入模块

所述数据输入模块用于输入病人的待评估数据。

临床数据包括年龄、教育年限、性别、身高、体重，和/或BMI。

神经心理学评估数据包括ACE-III、MMSE、MoCA_B、AVLT、BNT、AFT、STT、ADL，和/或FAQ。

血液标志物数据包括Aβ40、Aβ42、Aβ42:Aβ40、T-tau、P-tau181，和/或NfL。血液标志物数据采用Simoa技术测定。

基因数据包括APOE。基因数据采用荧光PCR发光技术测定。

在一种实施方式下，输入的病人的待评估数据包括1-6项临床数据、1-9项神经心理学评估数据、1-6项血液标志物数据。

在一种实施方式下，输入的病人的待评估数据包括3-6项临床数据、4-9项神经心理学评估数据、3-6项血液标志物数据和基因数据APOE。

在一种实施方式下，输入的病人的待评估数据包括年龄、教育年限、BMI、Aβ42:Aβ40、P-tau181、NfL、APOE。

在一种实施方式下，输入的病人的待评估数据包括年龄、教育年限、性别、身高、体重、BMI、ACE-III、MMSE、MoCA_B、AVLT、BNT、AFT、STT、ADL、FAQ、Aβ40、Aβ42、Aβ42:Aβ40、T-tau、P-tau181、NfL、APOE。

在一种实施方式下，输入的病人的待评估数据包括年龄、教育年限、BMI、ACE-III、MMSE、MoCA_B、Aβ40、Aβ42、Aβ42:Aβ40、T-tau、P-tau181、NfL、APOE。

在一种实施方式下，设置数据处理模块对采集的临床数据、神经心理学评估数据、血液标志物数据和/或基因数据进行数据清理。

2、痴呆水平评估模块

所述痴呆水平评估模块基于病人的待评估数据通过逻辑回归模型(logisticregression)得到病人的痴呆水平评估结果，痴呆水平评估结果将病人划分为正常组(NC)、主观认知障碍组(SCD)、中度认知受损组(MCI)和痴呆组(Dementia)。

本发明逻辑回归模型采用分类分析的方法计算病人在正常组、主观认知障碍组、中度认知受损组和痴呆组中的概率，四个组的概率之和为100％，概率最高的组为病人的痴呆水平评估结果所在组。

具体地，分类分析采用的组合为痴呆组Dementia vs.(中度认知受损组MCI+主观认知障碍组SCD+正常组NC)、中度认知受损组MCI vs.(主观认知障碍组SCD+正常组NC)、主观认知障碍组SCD vs.正常组NC。

本发明痴呆水平评估模块的构建方法包括以下步骤：采用变量筛选模块应用机器学习算法进行变量筛选，以正常组、主观认知障碍组、中度认知受损组和痴呆组诊断为结局变量，以经过变量筛选模块筛选的变量为自变量，使用Sigmoid函数映射建立逻辑回归模型。

具体地，通过数据处理模块对采集的临床数据、神经心理学评估数据、血液标志物数据及基因数据进行数据清理，根据医生临床诊断分为正常组(NC)样本、主观认知障碍组(SCD)样本、中度认知受损组(MCI)样本和痴呆组(Dementia)样本。本发明痴呆组(Dementia)样本在临床诊断中被医生诊断为患有痴呆病，其中包括了阿尔兹海默病和其他类的痴呆病。

对于样本中，缺少诊断结果、临床数据、神经心理学评估数据、血液标志物数据、基因数据或PET扫描结果的样本进行删除。

样本中的异常值进行删除处理。使用四分位距(IQR)，下四分位(Q1)，上四分位(Q3)作为评判标准筛选异常值，对小于Q1–1.5IQR或大于Q3+1.5IQR的异常值进行删除处理。

数据处理模块输出的数据集使用随机函数分为训练组数据集及验证组数据集。优选地，训练组数据集与验证组数据集的比例为1:1～7:1。

变量筛选模块利用数据处理模块输出的训练组数据集进行初步模型训练。

变量筛选模块应用机器学习算法LASSO，通过留一交叉验证法(LOOCV)调整模型稳定程度。进行了1000次交叉验证，模型预测表现得到充分验证，减少结果偏差。对比简单分成训练集和验证集显著减少随机性带来的误差。

优选地，变量筛选模块从22项数据处理模块输出的变量筛选出3-11个使残差平方和最小化的自变量。

所述22项数据处理模块输出的变量包括6项临床数据、9项神经心理学评估数据、6项血液标志物数据和1项基因数据。

6项临床数据包括年龄、教育年限、性别、身高、体重和BMI。

9项神经心理学评估数据包括ACE-III、MMSE、MoCA_B、AVLT、BNT、AFT、STT、ADL和FAQ。

6项血液标志物数据包括Aβ40、Aβ42、Aβ42：Aβ40、T-tau、P-tau181和NfL。

1项基因数据APOE。

通过AIC(赤池信息准则)衡量统计模型拟合优良性及其复杂度。通过测试所有变量的组合情况，计算其对应AIC数值，并对所有生成的变量组合模型根据AIC进行排序。AIC数值最小的模型在拟合优良性及复杂度的取舍中得到最优解。

在一种实施方式下，变量筛选模块筛选出的变量包括Aβ42：Aβ40、P-tau181、APOE、NfL、年龄、教育年限、BMI。

在一种实施方式下，变量筛选模块筛选出的变量包括Aβ42：Aβ40、P-tau181、T-tau、APOE、NfL、年龄、教育年限、性别、BMI。

在一种实施方式下，变量筛选模块筛选出的变量包括Aβ42、Aβ40、Aβ42：Aβ40、P-tau181、NfL、APOE、教育年限、年龄、BMI、MMSE、ACEIII。

逻辑回归模型中采用如下公式：

Fit(v)＝w₁×v₁+w₂×v₂+...+w_n×v_n确定整合诊断模型准确性。

其中Fit(v)代表风险评估函数，vi(i＝1，2...n)代表筛选出的显著变量，wi(i＝1，2...n+1)代表各项自变量在评估函数中的权重。

逻辑回归模型首先计算病人在痴呆组、中度认知受损组和主观认知障碍组中的分数，然后通过病人在痴呆组、中度认知受损组和主观认知障碍组中的分数进一步计算病人在痴呆组、中度认知受损组、主观认知障碍组和正常组中的概率。

优选地，计算病人在痴呆组(Dementia)中的分数和/或概率时，自变量包括P-tau181、NfL、APOE、教育年限。

优选地，计算病人在中度认知受损组(MCI)中的分数和/或概率时，自变量包括Aβ42：Aβ40、P-tau181、NfL、APOE、教育年限、BMI。

优选地，计算病人在主观认知障碍组(SCD)中的分数和/或概率时，自变量包括NfL、年龄、教育年限、BMI。

计算病人在正常组(NC)中的概率时，采用1减去病人在痴呆组(Dementia)、中度认知受损组(MCI)和主观认知障碍组(SCD)概率的方式进行计算。

在一种实施方式下，

病人在痴呆组(Dementia)中的分数(S_Dementia)＝(0～2)*P-tau181+(-1～1)*NfL+(0.2～3)*APOE+(-2～1)*教育年限；

病人在中度认知受损组(MCI)中的分数(S_MCI)＝(15～30)*Aβ42:Aβ40+(0～2.3)P-tau181+(-1～1)*NfL+(0～1.5)*APOE+(-2～0)*教育年限+(-1～0)*BMI；

病人在主观认知障碍组(SCD)中的分数(S_SCD)＝(-1～1)*NfL+(0～1)*年龄+(-1～0)*教育年限+(-2～0)*BMI；

以上三组的分数经由公式：(该病人实际分数-所有病人中最小分数)/(所有病人中最大分数-所有病人中最小分数)转化为概率。

每一组的概率分别为：

病人在痴呆组(Dementia)中的概率

病人在中度认知受损组(MCI)中的概率

病人在主观认知障碍组(SCD)中的概率

病人在正常组(NC)中的概率(P_NC)＝(1-P_Dementia-P_MCI-P_SCD)。

在一种实施方式下，病人在痴呆组(Dementia)中的分数＝0.85*P-tau181+0.020*NfL+1.11*APOE-0.27*教育年限；

病人在中度认知受损组(MCI)中的分数＝17.57*Aβ42:Aβ40+0.30*P-tau181+0.017*NfL+0.50*APOE-0.178*教育年限-0.085*BMI；

病人在主观认知障碍组(SCD)中的分数＝-0.049*NfL+0.12*年龄-0.09*教育年限-0.06*BMI；

以上三组的分数经由公式：(该病人实际分数-所有病人中最小分数)/(所有病人中最大分数-所有病人中最小分数)转化为概率后，每一组的概率分别为：

病人在痴呆组(Dementia)中的概率

病人在中度认知受损组(MCI)中的概率

病人在主观认知障碍组(SCD)中的概率

病人在正常组(NC)中的概率(P_NC)＝(1-P_Dementia-P_MCI-P_SCD)。

本发明逻辑回归模型中自变量的截断值通过阈值计算模块计算。阈值计算模块联合所有病人相关信息计算出截断值。优选地，阈值计算模块用于根据ROC曲线使用完整数据集验证逻辑回归模型阈值。计算AUC采用的分数截断值为-30至30。

本发明痴呆水平评估模块优选采用的自变量可以对病人的痴呆阶段进行客观的判断，避免了患者在量表判断时的一些主观影响，例如测试时心情、精神状态等。

3、正电子发射断层扫描阴阳性风险评估模块

本发明正电子发射断层扫描阴阳性风险评估模块基于病人的痴呆水平通过决策树分析得到病人的正电子发射断层扫描阴阳性风险评估结果。

病人的痴呆水平可以为痴呆水平评估模块得到的病人的痴呆水平评估结果，也可以为已知的病人痴呆水平诊断。

病人的痴呆水平包括正常组、主观认知障碍组、中度认知受损组和痴呆组。

本发明将病人的痴呆水平进行上述分组并对不同分组采用不同的决策树的评估方式，相比现有技术中全人群或者两个分组的方式，在判断病人的正电子发射断层扫描阴阳性风险结果的准确率方面具有明显的提升。

本发明正电子发射断层扫描阴阳性风险评估模块的构建方法包括以下步骤：采用信息增益(Information Gain，IG)对正电子发射断层扫描阴阳性风险评估模块的自变量进行筛选，信息增益计算出一个特征为决策树提供了多少关于一个类别的信息，根据信息增益的值分割节点并建立决策树。采用信息增益可以简化模型、避免过拟合。

在正常组样本、主观认知障碍组样本、中度认知受损组样本和痴呆组样本中，分别以病人的待评估数据为自变量，以正电子发射断层扫描(PET)阴阳性结果为结局变量，对决策树进行训练。

决策树算法试图使信息增益值最大化，具有最高信息增益的节点或属性首先被分割。它可以用下面的公式来计算。

IG＝E(S)-[(加权平均值)*E(每个特征)]。

熵(E)是衡量一个给定属性的不确定性的指标。它规定了数据的随机性。熵可以通过以下公式计算：

E＝-P(符合节点条件)log2 P(符合节点条件)-P(不符合节点条件)log2 P(不符合节点条件)。

P为概率。

根据信息增益的大小排序决定决策树各节点用于判定时出现的顺序。

为防止模型过拟合，使用错误率降低剪枝法(REP)对决策树进行修剪。使用随机函数将数据集随机分成训练组以及验证组作为模型修正使用。

优选地，训练组为60-90％，验证组为10-40％。

该剪枝方法考虑将树上的每个节点作为修剪的候选对象。决定是否修剪这个结点有如下步骤组成：

1：删除以此结点为根的子树；

2：使其成为叶子结点；

3：赋予该结点关联的训练数据的最常见分类；

4：当修剪后的树对于验证集合的性能不会比原来的树差时，才真正删除该结点。

因为训练集合的过拟合，使得验证集合数据能够对其进行修正，反复进行上面的操作，从底向上的处理结点，删除那些能够最大限度的提高验证集合的精度的结点，直到进一步修剪有害为止(有害是指修剪会减低验证集合的精度)。

本发明中，正常组、主观认知障碍组、中度认知受损组和痴呆组分别相对应的决策树在自变量的类型和自变量在节点出现的顺序均不相同。

在一种实施方式下，正常组相对应的决策树的自变量包括P-tau181、NfL、Aβ42:Aβ40；和/或，主观认知障碍组相应对的决策树的自变量包括P-tau181、教育年限；和/或，中度认知受损组相对应的决策树的自变量包括P-tau181、Aβ42:Aβ40、年龄；和/或，痴呆组相对应的决策树的自变量包括P-tau181、Aβ42:Aβ40、年龄、教育年限。

在一种实施方式下，正常组相对应的决策树的自变量包括P-tau181、BMI、NfL、ACEIII、T-tau、Aβ42:Aβ40；和/或，主观认知障碍组相应对的决策树的自变量包括P-tau181、T-tau、教育年限；和/或，中度认知受损组相对应的决策树的自变量包括P-tau181、Aβ42:Aβ40、年龄；和/或，痴呆组相对应的决策树的自变量包括P-tau181、Aβ42:Aβ40、年龄、教育年限。

优选地，本发明中，P-tau181在正常组、主观认知障碍组、中度认知受损组和/或痴呆组相对应的决策树中为最先判断的自变量。

具体地，正电子发射断层扫描阴阳性风险评估模块的决策树根据阈值计算模块计算出的截断值，通过二元分类模型判断病人的正电子发射断层扫描阴阳性风险评估结果。

在一种实施方式下，正常组(NC)相对应的决策树中，自变量包括P-tau181、BMI、NfL、ACEIII、T-tau、Aβ42:Aβ40。判断顺序如图1所示，根据节点从上到下顺序进行判断，若符合节点条件则下一步向左方节点，若不符合则向右方节点。每个节点皆根据条件判断一次，到达最终枝叶节点判断正电子发射断层扫描阴阳性风险(阴阳性)。

具体地，在正常组(NC)相对应的决策树中，包括以下判断步骤：

S1，判断P-tau181是否大于等于截断值，优选地，截断值为1-2，若是，则进入步骤S2，若否，则进入步骤S3；

S2，判断BMI是否大于等于截断值，优选地，截断值为20-25，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S4；

S3，判断NfL是否小于截断值，优选地，截断值为10-15，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性；

S4，判断ACEIII是否大于等于截断值，优选地，截断值为75-85，若是，则进入步骤S5，若否，则进入步骤S6；

S5，判断P-tau181是否小于截断值，优选地，截断值为2-4，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S7；

S6，判断T-tau是否小于截断值，优选地，截断值为1-3，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性；

S7，判断Aβ42:Aβ40是否大于等于截断值，优选地，截断值为0.01-0.07，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性。

进一步优选地，在正常组(NC)相对应的决策树中，包括以下判断步骤：

S1，判断P-tau181是否大于等于截断值1.17，若是，则进入步骤S2，若否，则进入步骤S3；

S2，判断BMI是否大于等于截断值22.8，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S4；

S3，判断NFL是否小于截断值13.7，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性；

S4，判断ACEIII是否大于等于截断值79.5，若是，则进入步骤S5，若否，则进入步骤S6；

S5，判断P-tau181是否小于截断值2.47，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S7；

S6，判断T-tau是否小于截断值1.76，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性；

S7，判断Aβ42:Aβ40是否大于等于截断值0.043，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性。

在一种实施方式下，主观认知障碍组(SCD)相对应的决策树中，自变量包括P-tau181、T-tau、教育年限。判断顺序如图2所示，根据节点从上到下顺序进行判断，若符合节点条件则下一步向左方节点，若不符合则向右方节点。每个节点皆根据条件判断一次，到达最终枝叶节点判断正电子发射断层扫描阴阳性风险(阴阳性)。

具体地，在主观认知障碍组(SCD)相对应的决策树中，包括以下判断步骤：

S1，判断P-tau181是否大于等于截断值，优选地，截断值为1-1.8，若是，则进入步骤S2，若否，则判断正电子发射断层扫描结果为阳性；

S2，判断P-tau181是否小于截断值，优选地，截断值为2-5，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S3；

S3，判断T-tau是否小于截断值，优选地，截断值为2-4，若是，则进入步骤S4，若否，则判断正电子发射断层扫描结果为阳性；

S4，判断教育年限是否大于等于截断值，优选地，截断值为5-12，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性。

进一步优选地，在主观认知障碍组(SCD)相对应的决策树中，包括以下判断步骤：

S1，判断P-tau181是否大于等于截断值1.17，若是，则进入步骤S2，若否，则判断正电子发射断层扫描结果为阳性；

S2，判断P-tau181是否小于截断值2.27，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S3；

S3，判断T-tau是否小于截断值2.85，若是，则进入步骤S4，若否，则判断正电子发射断层扫描结果为阳性；

S4，判断教育年限是否大于等于截断值10，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性。

在一种实施方式下，中度认知受损组(MCI)相对应的决策树中，自变量包括P-tau181、Aβ42:Aβ40、年龄。判断顺序如图3所示，根据节点从上到下顺序进行判断，若符合节点条件则下一步向左方节点，若不符合则向右方节点。每个节点皆根据条件判断一次，到达最终枝叶节点判断正电子发射断层扫描阴阳性风险(阴阳性)。

具体地，在中度认知受损组(MCI)相对应的决策树中，包括以下判断步骤：

S1，判断P-tau181是否小于截断值，优选地，截断值为2-4，若是，则进入步骤S2，若否，则判断正电子发射断层扫描结果为阳性；

S2，判断Aβ42:Aβ40是否大于等于截断值，优选地，截断值为0.03-0.052，若是，则进入步骤S3，若否，则进入步骤S4；

S3，判断Aβ42:Aβ40是否大于等于截断值，优选地，截断值为0.063-0.1，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S5；

S4，判断P-tau181是否大于等于截断值，优选地，截断值为0.5-1.7，若是，则进入步骤S6，若否，则判断正电子发射断层扫描结果为阳性；

S5，判断Aβ42:Aβ40是否小于截断值，优选地，截断值为0.052-0.063，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性；

S6，判断年龄是否小于截断值，优选地，截断值为50-70，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S7；

S7，判断P-tau181是否小于截断值，优选地，截断值为1.8-3.5，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性。

进一步优选地，在中度认知受损组(MCI)相对应的决策树中，包括以下判断步骤：

S1，判断P-tau181是否小于截断值3.78，若是，则进入步骤S2，若否，则判断正电子发射断层扫描结果为阳性；

S2，判断Aβ42:Aβ40是否大于等于截断值0.051，若是，则进入步骤S3，若否，则进入步骤S4；

S3，判断Aβ42:Aβ40是否大于等于截断值0.064，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S5；

S4，判断P-tau181是否大于等于截断值1.47，若是，则进入步骤S6，若否，则判断正电子发射断层扫描结果为阳性；

S5，判断Aβ42:Aβ40是否小于截断值0.062，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性；

S6，判断年龄是否小于截断值61，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S7；

S7，判断P-tau181是否小于截断值1.83，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性。

在一种实施方式下，痴呆患者组(Dementia)相对应的决策树中，自变量包括P-tau181，Aβ42:Aβ40，年龄，教育年限。判断顺序如图4所示，根据节点从上到下顺序进行判断，若符合节点条件则下一步向左方节点，若不符合则向右方节点。每个节点皆根据条件判断一次，到达最终枝叶节点判断正电子发射断层扫描阴阳性风险(阴阳性)。

具体地，在痴呆患者组(Dementia)相对应的决策树中，包括以下判断步骤：

S1，判断P-tau181是否小于截断值，优选地，截断值为1-2，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S2；

S2，判断Aβ42:Aβ40是否大于等于截断值，优选地，截断值为0.03-0.07，若是，则进入步骤S3，若否，则判断正电子发射断层扫描结果为阳性；

S3，判断P-tau181是否小于截断值，优选地，截断值为2.1-5，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S4；

S4，判断年龄是否大于等于截断值，优选地，截断值为50-70，若是，则进入步骤S5，若否，则判断正电子发射断层扫描结果为阳性；

S5，判断教育年限是否大于等于截断值，优选地，截断值为5-13，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性。

进一步优选地，在痴呆患者组(Dementia)相对应的决策树中，包括以下判断步骤：

S1，判断P-tau181是否小于截断值1.58，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S2；

S2，判断Aβ42:Aβ40是否大于等于截断值0.049，若是，则进入步骤S3，若否，则判断正电子发射断层扫描结果为阳性；

S3，判断P-tau181是否小于截断值2.8，若是，则判断正电子发射断层扫描结果为阴性，若否，则进入步骤S4；

S4，判断年龄是否大于等于截断值60，若是，则进入步骤S5，若否，则判断正电子发射断层扫描结果为阳性；

S5，判断教育年限是否大于等于截断值9，若是，则判断正电子发射断层扫描结果为阴性，若否，则判断正电子发射断层扫描结果为阳性。

采用本发明正常组(NC)、主观认知障碍组(SCD)、中度认知受损组(MCI)和痴呆组(Dementia)相对应的决策树的自变量和判断步骤，可以快速有效地判断出病人的正电子发射断层扫描阴阳性风险，避免了由于生物标志物在疾病不同阶段的波动导致的偏差，在每个认知分组中分别进行正电子发射断层扫描阴阳性风险的判读，有效提高了预测准确率。

4、结果输出模块

所述结果输出模块用于输出阿尔兹海默病风险评估结果。

正电子发射断层扫描阴阳性是临床诊断阿尔兹海默病的金标准。本发明根据正电子发射断层扫描阴阳性风险评估结论将检测对象分为阿尔兹海默病高风险组和低风险组，其中高风险组提示有必要进行进一步临床诊断以确定检测对象是否处于阿尔兹海默症病程中。

实施例一：构建阿尔兹海默病风险评估系统

采集607份阿尔兹海默病相关患者的临床数据、神经心理学评估数据、血液标志物数据及基因数据，其中240例正常组(NC)样本，123例主观认知障碍组(SCD)样本，140例中度认知受损组(MCI)样本，104例痴呆组(Dementia)样本。通过数据处理模块对所有采集的临床数据(年龄、教育年限、性别、身高、体重，和BMI)、神经心理学评估数据(ACE-III、MMSE、MoCA_B、AVLT、BNT、AFT、STT、ADL和FAQ)、血液标志物数据(Aβ40、Aβ42、Aβ42:Aβ40、T-tau、P-tau181和NfL)以及基因数据(APOE)进行数据清理。对不能明确诊断结果的样本进行删除处理。同时，对于缺少任意一项血液标志物数据、临床数据、神经心理学评估数据、基因数据，或正电子发射断层扫描PET结果的样本进行删除。

使用四分位距(IQR)，下四分位(Q1)，上四分位(Q3)作为评判标准筛选异常值，对小于Q1–1.5IQR或大于Q3+1.5IQR的异常值进行删除处理。

使用随机函数将数据集随机分成70％与30％作为逻辑回归模型的训练组以及验证组。

利用上述数据处理模块输出的训练组数据集进行初步模型训练，应用机器学习算法LASSO，通过留一交叉验证法(LOOCV)调整模型稳定程度，初步从22项数据处理模块输出的变量筛选出10个使残差平方和最小化的自变量。公式如下：

β为需要优化的系数；X＝[x1，x2…xn]，这里把每个数据点xi当作列向量；y＝(y1，y2，…，yn)；n为样本数量；λ为选择的最优模型压缩系数。

作为最优模型，变量筛选模块筛选出的变量为Aβ42：Aβ40、P-tau181、T-tau、APOE、NfL、MMSE、年龄、教育年限、性别、BMI。

在一种实施方式下，以正常组、主观认知障碍组、中度认知受损组和痴呆组诊断为结局变量，以Aβ42：Aβ40、P-tau181、T-tau、APOE、NfL、年龄、教育年限、性别、BMI为自变量，使用Sigmoid函数(非线形)映射建立逻辑回归模型。

逻辑回归模型中采用如下公式：

Fit(v)＝w₁×v₁+w₂×v₂+...+w_n×v_n确定整合诊断模型准确性。

采用阈值计算模块根据ROC曲线使用完整数据集验证逻辑回归模型阈值。

模型建立完成后，使用验证组数据集对模型进行评估，验证其对病人风险评估的准确度、灵敏度、特异度、阳性预测值、阴性预测值及AUC，如下表所示。

AUC(95％CI)

灵敏度

特异度

阳性预测值

阴性预测值

准确度

AD vs.(MCI+SCD+NC)

0.931(0.898-0.964)

84.3％

91.2％

78.1％

93.9％

89.3％

MCI vs(SCD+NC)

0.916(0.877-0.955)

84.3％

85.9％

79.8％

89.2％

85.3％

SCD vs.NC

0.738(0.684-0.791)

51.7％

85.3％

63.5％

78.1％

74.2％

在正常组(NC)患者、主观认知障碍组(SCD)患者、中度认知受损组(MCI)患者和痴呆组(Dementia)患者中，分别以患者的临床数据、神经心理学评估数据、血液标志物数据及基因数据为自变量，以PET扫描阴阳性为结局变量，对于决策树进行训练。

对于所有自变量采用信息增益(Information Gain，IG)对自变量进行筛选，它计算出一个特征为决策树提供了多少关于一个类别的信息。根据信息增益的值分割节点并建立决策树。决策树算法总是试图使信息增益值最大化，具有最高信息增益的节点或属性首先被分割。

根据信息增益的大小排序决定决策树各节点用于判定时出现的顺序，为防止模型过拟合，使用错误率降低剪枝法(REP)对决策树进行修剪。使用随机函数将数据集随机分成80％与20％作为风险评估模型的训练组以及验证组作为模型修正使用。

该剪枝方法考虑将树上的每个节点作为修剪的候选对象，决定是否修剪这个结点有如下步骤组成：

1：删除以此结点为根的子树

2：使其成为叶子结点

3：赋予该结点关联的训练数据的最常见分类

4：当修剪后的树对于验证集合的性能不会比原来的树差时，才真正删除该结点

阈值计算模块联合所有病人相关信息计算出截断值。

模型建立完成后，使用cross-validation对模型进行评估，验证其对病人风险评估的准确度、灵敏度、特异度、阳性预测值、阴性预测值及AUC。

AUC(95％CI)

灵敏度

特异度

阳性预测值

阴性预测值

准确度

CN

0.957(0.916-0.997)

89.1％

96.4％

85.4％

97.4％

95.0％

SCD

0.933(0.875–0.991)

86.1％

95.1％

88.6％

94.0％

92.5％

MCI

0.967(0.939-0.995)

94.3％

92.7％

89.3％

96.2％

93.3％

Dementia

0.971(0.948-0.995)

89.9％

93.1％

97.6％

75.0％

90.7％

本整合诊断模型诊断患有阿尔兹海默病风险的准确率，准确度达到95.0％，AUC达到97.1％，敏感度达到94.3％，特异度达到96.4％，皆高于单生物指标诊断模型(敏感度74.5％，特异度68.2％)以及量表评估诊断模型(敏感度84％，特异度88％)。

本发明阿兹尔海默风险评估系统诊断阿兹尔海默病的准确率达到了95％以上，极高的准确度给医生提供了一个值得信任的无创精准诊断阿兹尔海默病的方式，大大避免了漏诊误诊，显著提高了疾病早期的风险评估准确度，提早了未来可能的治疗窗口。

实施例二：阿尔兹海默病风险评估

将病人的待评估数据输入数据输入模块。在痴呆水平评估模块中，病人痴呆水平根据逻辑回归(logistic regression)模型预测的结果分为正常组(NC)、主观认知障碍组(SCD)、中度认知受损组(MCI)和痴呆组(Dementia)四个分组。

逻辑回归模型的变量为Aβ42:Aβ40、P-tau181、T-tau、APOE、NfL、年龄、教育年限、性别、BMI。通过以下组合对Dementi vs.MCI+SCD+NC，MCI vs.SCD+NC，SCD vs.NC进行分类分析，对概率进行整合，得到病人在对应分组的概率，四个分组的概率之和为100％。

首先计算病人在痴呆组、中度认知受损组和主观认知障碍组中的分数，然后通过病人在痴呆组、中度认知受损组和主观认知障碍组中的分数进一步计算病人在痴呆组、中度认知受损组、主观认知障碍组和正常组中的概率。

采用以下方式计算分数：

病人在痴呆组(Dementia)中的分数＝0.85*P-tau181+0.020*NfL+1.11*APOE-0.27*教育年限；

病人在中度认知受损组(MCI)中的分数＝17.57*Aβ42：Aβ40+0.30*P-tau181+0.017*NfL+0.50*APOE-0.178*教育年限-0.085*BMI；

病人在主观认知障碍组(SCD)中的分数＝-0.049*NfL+0.12*年龄-0.09*教育年限-0.06*BMI。

转化为概率的公式为(该病人实际分数-所有病人中最小分数)/(所有病人中最大分数-所有病人中最小分数)。

本实施例中痴呆组(Dementia)最高分数为11.10，最低分数为-3.37；中度认知受损组(MCI)最高分数为3.60，最低分数为-3.91；主观认知障碍组(SCD)最高分数为7.36，最低分数为-2.21。

病人在痴呆组(Dementia)中的概率

病人在中度认知受损组(MCI)中的概率

病人在主观认知障碍组(SCD)中的概率

病人在正常组(NC)中的概率(P_NC)＝(1-P_Dementia-P_MCI-P_SCD)。

结果如下表所示：

根据痴呆水平评估结果，样本01为正常组(NC)，样本02为主观认知障碍组(SCD)，样本03为中度认知受损组(MCI)，样本04为痴呆组(Dementia)。

对于样本01，采用正常组(NC)相对应的决策树进行风险预测分析。

本实施例中，正常组(NC)相对应的决策树中，包括以下判断步骤：

对于样本02，采用主观认知障碍组(SCD)相对应的决策树进行风险预测分析，

本实施例中，主观认知障碍组(SCD)相对应的决策树中，包括以下判断步骤：

对于样本03，采用中度认知受损组(MCI)相对应的决策树进行风险预测分析。

本实施例中，中度认知受损组(MCI)相对应的决策树中，包括以下判断步骤：

对于样本04，采用痴呆组(Dementia)相对应的决策树进行风险预测分析。

本实施例中，在痴呆患者组(Dementia)相对应的决策树中，包括以下判断步骤：

经决策树分析，样本01-04的正电子发射断层扫描阴阳性风险结果如下表所示。

根据评估结论将检测对象分为高风险组和低风险组，其中高风险组提示有必要进行进一步临床诊断以确定检测对象是否处于AD病程中。

综上所述，上述各实施例仅为本发明的较佳实施例而已，并不用以限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，皆应包含在本发明的保护范围内。

Claims

1.一种痴呆水平评估模块，其特征在于：所述痴呆水平评估模块基于病人的待评估数据通过逻辑回归模型得到病人的痴呆水平评估结果，痴呆水平评估结果将病人划分为正常组、主观认知障碍组、中度认知受损组和痴呆组；逻辑回归模型采用分类分析的方法计算病人在正常组、主观认知障碍组、中度认知受损组和痴呆组中的概率，四个组的概率之和为100％，概率最高的组为病人的痴呆水平评估结果所在组；

分类分析采用的组合为痴呆组vs.(中度认知受损组+主观认知障碍组+正常组)、中度认知受损组vs.(主观认知障碍组+正常组)、主观认知障碍组vs.正常组；

2.根据权利要求1所述的一种痴呆水平评估模块，其特征在于：

计算病人在痴呆组中的分数和/或概率时，自变量包括P-tau181、神经丝轻链蛋白、APOE、教育年限；

计算病人在中度认知受损组中的分数和/或概率时，自变量包括Aβ42:Aβ40、P-tau181、神经丝轻链蛋白、APOE、教育年限、BMI；

计算病人在主观认知障碍组中的分数和/或概率时，自变量包括神经丝轻链蛋白、年龄、教育年限、BMI；

计算病人在正常组中的概率时，采用1减去病人在痴呆组、中度认知受损组和主观认知障碍组概率的方式进行计算。

3.根据权利要求2所述的一种痴呆水平评估模块，其特征在于：

病人在痴呆组中的概率

病人在中度认知受损组中的概率

病人在主观认知障碍组中的概率

病人在正常组中的概率P_NC＝(1-P_Dementia-P_MCI-P_SCD)；

其中，病人在痴呆组中的分数为S_Dementi、病人在中度认知受损组中的分数为S_MCI、病人在主观认知障碍组中的分数为S_SCD。

4.一种痴呆水平评估模块，其特征在于：痴呆水平评估模块的构建方法包括以下步骤：采用变量筛选模块应用机器学习算法进行变量筛选，以正常组、主观认知障碍组、中度认知受损组和痴呆组诊断为结局变量，以经过变量筛选模块筛选的变量为自变量，使用Sigmoid函数映射建立逻辑回归模型；变量筛选模块筛选出的变量包括Aβ42:Aβ40、P-tau181、APOE、NfL、年龄、教育年限、BMI。

5.根据权利要求4所述的一种痴呆水平评估模块，其特征在于：

逻辑回归模型中采用如下公式：

Fit(v)＝w₁×v₁+w₂+v₂+...+w_n×v_n确定整合诊断模型准确性；

其中Fit(v)代表风险评估函数，vi(i＝1,2…n)代表筛选出的显著变量，wi(i＝1,2…n+1)代表各项自变量在评估函数中的权重。

6.根据权利要求4所述的一种痴呆水平评估模块，其特征在于：痴呆水平评估模块通过逻辑回归模型得到病人的痴呆水平评估结果，痴呆水平评估结果将病人划分为正常组、主观认知障碍组、中度认知受损组和痴呆组。

7.一种阿尔兹海默病风险评估系统，其特征在于：包括权利要求1-6任一项所述的痴呆水平评估模块。

8.一种阿尔兹海默病风险评估系统，其特征在于：包括痴呆水平评估模块、正电子发射断层扫描阴阳性风险评估模块和结果输出模块；

其中，所述痴呆水平评估模块基于病人的待评估数据通过逻辑回归模型得到病人的痴呆水平评估结果，痴呆水平评估结果将病人划分为正常组、主观认知障碍组、中度认知受损组和痴呆组；

所述结果输出模块用于输出阿尔兹海默病风险评估结果；

所述逻辑回归模型采用分类分析的方法计算病人在正常组、主观认知障碍组、中度认知受损组和痴呆组中的概率，四个组的概率之和为100％，概率最高的组为病人的痴呆水平评估结果所在组；

在正电子发射断层扫描阴阳性风险评估模块中，决策树包括与正常组、主观认知障碍组、中度认知受损组和痴呆组相对应的决策树，在正常组中采用正常组相对应的决策树进行分析，在主观认知障碍组中采用主观认知障碍组相应对的决策树进行分析，在中度认知受损组中采用中度认知受损组相对应的决策树进行分析，在痴呆组中采用痴呆组相对应的决策树进行分析。

9.根据权利要求8所述的一种阿尔兹海默病风险评估系统，其特征在于：正常组、主观认知障碍组、中度认知受损组和痴呆组分别相对应的决策树在自变量的类型和自变量在节点出现的顺序均不相同。

10.根据权利要求8所述的一种阿尔兹海默病风险评估系统，其特征在于：P-tau181在正常组、主观认知障碍组、中度认知受损组和/或痴呆组相对应的决策树中为最先判断的自变量。