CN113057585A

CN113057585A - 一种认知障碍检测模型及其训练方法

Info

Publication number: CN113057585A
Application number: CN202110274276.9A
Authority: CN
Inventors: 陈益强; 张宇欣; �谷洋; 高晨龙
Original assignee: Institute of Computing Technology of CAS
Current assignee: Institute of Computing Technology of CAS
Priority date: 2021-03-15
Filing date: 2021-03-15
Publication date: 2021-07-02
Anticipated expiration: 2041-03-15
Also published as: CN113057585B

Abstract

本发明提供一种认知障碍检测模型及其训练方法，所述认知障碍检测模型包括多模态信息表征模块、多模态信息融合模块、无监督深度聚类模块。所述多模态信息表征模块包括眼底图像数据表征网络、多模态生理信号数据表征网络。所述多模态信息融合模块与所述多模态信息表征模块相连接，用于将所述眼底图像数据的特征与多模态生理信号的特征进行融合，得到融合后的特征；所述无监督深度聚类模块与所述多模态信息融合模块相连接，用于根据所述融合后的特征基于无监督聚类模型进行认知障碍检测。

Description

一种认知障碍检测模型及其训练方法

技术领域

本发明涉及普适计算领域，具体涉及认知障碍诊断领域，特别涉及一种认知障碍检测模型及其训练方法。

背景技术

随着我国步入老龄化社会，患有认知障碍的老年人日益增多，对家庭和社会造成了沉重的负担。目前常见的老年人认知障碍主要包括阿尔茨海默症(AD)和轻度认知障碍(MCI)等。目前尚没有可以完全治愈阿尔茨海默症的方法，早期识别与干预可以延缓认知障碍病程进展，并有助于患者和家庭提前做好规划。

早期的认知功能评估使用量表的方法，比如简易精神状态评价量表(MMSE)、蒙特利尔认知评估量表(MoCA)、Mattis痴呆评定量表(DRS)等，但由于我国基层全科医生相关专业培训不够完善、现行量表内容冗长、测试费时等原因，漏诊率较高。

因此，研究者们希望通过其他手段进行认知障碍的评估和预警。例如，诊断阿尔茨海默病最准确可靠的方法是让患者接受脑部数字正电子发射断层成像(PET)扫描，该方法属于神经成像方法，其缺点是脑图像测量检查费高昂且检查时间长，所以不适合以多个被检者为对象的筛选检查。

也有研究通过可穿戴设备去检测帕金森氏症和阿尔茨海默症等认知障碍的早期迹象。可穿戴设备中的传感器包括运动传感器和生理传感器。研究者利用运动传感器中的加速度、陀螺仪信号捕捉老年人的微动作特征，利用生理传感器中的热传感、肌电信号、汗液、血液蛋白质含量来确定老年人的健康状态。这种方法的缺点在于，通过可穿戴设备中的传感器获得的数据是多元时间序列信号数据，存在冗余性和大量噪声，当噪声严重时，会大大降低检测模型的泛化能力，使得检测精度较差。

此外，还有一种利用视网膜成像(眼底成像)来筛查和检测阿尔茨海默病的方法。该方法基于由美国国立卫生研究院(NIH)资助的一项研究的成果，该研究的论文发表在《神经病理学学报》(Acta Neuropologica)上。该论文描述了三种与阿尔茨海默病相关的视网膜(眼球后部的感光组织)的变化过程：1)周细胞的丧失，周细胞可调节微小血管中的血流，帮助形成血视网膜屏障，保护视网膜免受有害物质通过血流进入；2)血小板衍生生长因子受体β(PDGFRβ)减少信号传导，PDGFRβ是一种为组织维护和修复提供指导的蛋白质；3)在视网膜周细胞和血管中沉积了淀粉样蛋白。

在上述研究中，研究人员将那些死于阿尔茨海默病或轻度认知障碍(MCI)的人的眼睛样本与那些认知正常的人的眼睛样本进行了比较。研究人员研究了62个捐赠者的眼睛样本以及一部分捐赠者的大脑样本。研究人员用免疫荧光染色技术和透射电子显微镜对每一个眼睛样本的视网膜血管结构进行了研究。研究人员发现，与认知正常的供体相比，阿尔茨海默病或MCI患者的视网膜周细胞丢失更多，PDGFRβ信号传导减弱，淀粉样蛋白沉积更多。由此，研究人员认为，视网膜的变化与阿尔茨海默病和认知能力下降相关的大脑变化相关。

与神经成像方法相比，眼底成像方法只需通过眼底成像设备获取双眼的眼底数据，因此，该方法比神经成像方法成本低、侵入性小。

由于深度学习在医疗辅助诊断上发挥着越来越重要的作用，可将深度学习用于通过眼底数据来辅助诊断认知障碍。现有深度学习的诊断方法主要采用有监督学习方法，训练数据中需要提供数据标签。然而现有的深度学习方法在辅助诊断的过程中,常常会遇到数据标签不足的问题，从而影响了检测效果。例如，由于数据采集的成本高和不规范等多方面原因,标记过的认知障碍病例很少,严重影响了深度学习模型在该病例上的训练学习，所训练的模型精度低，鲁棒性差。

综上，现有的认知障碍检测方法存在诸多问题，因此，需要提供一种更加普适化、成本低、精度高的方法来进行老年人认知障碍检测。

发明内容

为解决上述现有技术中存在的问题，本发明提供一种认知障碍检测模型，包括多模态信息表征模块、多模态信息融合模块、无监督深度聚类模块，其中，

所述多模态信息表征模块包括眼底图像数据表征网络、多模态生理信号数据表征网络，所述眼底图像数据表征网络用于提取正常人群的眼底图像数据的特征，所述多模态生理信号数据表征网络用于提取多模态生理信号数据的特征；

所述多模态信息融合模块与所述多模态信息表征模块相连接，用于将所述眼底图像数据的特征与多模态生理信号的特征进行融合，得到融合后的特征；

所述无监督深度聚类模块与所述多模态信息融合模块相连接，用于根据所述融合后的特征基于无监督聚类模型进行认知障碍检测；

所述认知障碍检测模型在训练阶段，使用反向传播的梯度下降法最小化目标函数，迭代更新所述多模态信息表征模块、所述多模态信息融合模块、所述无监督深度聚类模块的网络参数。

优选的，所述眼底图像数据表征网络采用Mobilenet网络，所述多模态生理信号数据表征网络采用浅层卷积网络；

所述无监督深度聚类模块包括编码器、解码器和深度聚类模型，其中，所述编码器由卷积层和池化层组成，解码器由卷积层和反池化层组成；所述编码器的输出送入所述解码器和所述深度聚类模型；所述深度聚类模型用于对输入数据进行无监督分类。

优选的，采用以下公式融合眼底图像数据的特征与多模态生理信号数据的特征，

O＝f(λ₁*Z¹+λ₂*Z²)

其中，O表示输出，f(·)表示全连接网络层，Z¹表示提取的眼底图像数据的特征，Z²表示提取的多模态生理信号数据的特征，λ₁＞＞λ₂，λ₁+λ₂＝1，0<λ₁<1，0<λ₂<1。

优选的，所述目标函数为

其中，θ表示网络参数，q_ij为软分配，p_ij为辅助分布，i表示第i个样本，j表示第j个聚类中心，N表示一次迭代中所需的数据总量，O_i表示第i个样本的多模态数据融合后得到的输出，O′_i表示与O_i有着相同结构的重构值，L(O_i,O′_i)为重构误差，

表示为l₂范数。

本发明提供一种用于上述认知障碍检测模型的训练方法，包括：

步骤1，使用所述多模态信息表征模块提取正常人群的眼底图像数据的特征以及多模态生理信号数据的特征；

步骤2，使用所述多模态信息融合模块将眼底图像数据的特征与多模态生理信号数据的特征进行融合，得到融合后的特征；

步骤3，将所述融合后的特征输入无监督深度聚类模块进行无监督分类，获取网络重构误差；

步骤4，采用反向传播的梯度下降法最小化目标函数，迭代更新所述多模态信息表征模块、所述多模态信息融合模块、所述无监督深度聚类模块的网络参数；

步骤5，重复步骤1到步骤4直到模型收敛，将包含正常人群数据的验证集输入训练后的模型，获取用于认知障碍检测的阈值。

优选的，所述多模态信息表征模块包括眼底图像数据表征网络、多模态生理信号数据表征网络，所诉眼底图像数据表征网络采用Mobilenet网络，所述多模态生理信号数据表征网络采用浅层卷积网络；采用以下公式融合眼底图像数据的特征与多模态生理信号的特征，

O＝f(λ₁*Z¹+λ₂*Z²)

优选的，所述无监督深度聚类模块包括编码器、解码器和深度聚类模型，其中，

所述编码器由卷积层和池化层组成，解码器由卷积层和反池化层组成；所述编码器的输出送入所述解码器和所述深度聚类模型；

所述深度聚类模型对输入数据进行无监督分类；

所述认知障碍检测模型的目标函数为

表示为l₂范数。

本发明提供一种基于上述认知障碍检测模型的认知障碍检测方法，包括：

步骤1，通过所述多模态信息表征模块提取待检测对象的眼底图像数据的特征以及多模态生理信号数据的特征；

步骤2，通过所述多模态信息融合模块将眼底图像数据的特征和可穿戴设备采集的多模态生理信号数据的特征进行融合；

步骤3，将所述融合后的特征输入到无监督深度聚类模块所生成的模型获取重构误差；

步骤4，将重构误差与认知障碍检测阈值比较获取检测结果。

本发明提供一种计算机可读存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现上述方法的步骤。

本发明提供一种计算机设备，包括存储器和处理器，在所述存储器上存储有能够在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述方法的步骤。

本发明具有如下特点和有益效果：本发明充分利用了眼底设备采集的眼底图像数据以及可穿戴设备(智能手环、脑电设备、智能鞋)所产生的多模态生理信号数据，其多模态信息能够解决单一模态精确度不高的问题。本发明实现了自动对数据进行融合表征的表征学习方法，基于整体模型的检测表现实时对表征学习模型的参数进行调整，为后续的认知障碍检测模型训练提供最优的特征数据输入。优势在于减少了人工干预，增加了认知障碍检测系统对于多模态数据的普适性。本发明实现了无监督的模型训练方法，运用基于深度聚类和重构的深度学习技术进行特征数据训练，实现对正常数据的泛化模式的建模，设计端到端学习框架以实现对表征模型和训练模型的共同优化，并设计异常度量策略以实现对正常和认知障碍两种状态下数据的准确识别。由于模型在构建过程中不基于任何老年人认知障碍下的先验知识，因此相较于同类模型，此模型检测认知障碍的能力更强。

附图说明

图1示出了根据本发明一个实施例的认知障碍检测系统。

图2示出了根据本发明一个实施例的深度聚类模块。

图3示出了根据本发明一个实施例的多模态信息表征模块的眼底图片数据表征网络结构。

图4示出了根据本发明一个实施例的多模态信息表征模块的多模态生理信号数据表征网络结构。

具体实施方式

下面结合附图和具体实施例对本发明加以说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

基于前述对背景技术的分析，发明人认识到，现有的认知障碍检测方法存在单一设备检测精度低、数据标签不足、方法泛化能力差等诸多问题，因此，需要提供一种更加普适化、成本低、精度高的方法来进行认知障碍检测。

发明人意图基于深度聚类的无监督方法，将眼底数据和多元传感器信号数据相融合，眼底数据为主要数据，多元传感器信号数据作为辅助信息，进行认知障碍检测，从而解决现有技术中存在的问题。

根据本发明的一个实施例，如图1所示，本发明提供一种认知障碍检测系统100，该系统包括数据采集及预处理模块101、认知障碍检测模块102、阈值计算模块103，认知障碍预警模块104。

其中，数据采集及预处理模块101用于读取眼底设备采集的眼底图像数据以及可穿戴设备所产生的多模态生理信号数据，并对多模态生理数据进行预处理，所述预处理包括插值和滤波操作。

认知障碍检测模块102与数据采集及预处理模块101相连接，用于根据从数据采集及预处理模块101输入的正常人群数据训练检测模型，以及根据从数据采集及预处理模块101输入的待检测数据计算重构误差。

阈值计算模块103与认知障碍检测模块102相连接，接收认知障碍检测模块输出的重构误差，与阈值比较后输出检测结果。

认知障碍预警模块104与阈值计算模块103相连接，接收认阈值计算模块输出的检测结果，并将所述检测结果通过声音、语音、视觉、打印报告等方式输出。

以下对认知障碍检测系统100的模块逐一详细说明。

一、数据采集及预处理模块

数据采集及预处理模块用于读取眼底设备采集的眼底图像数据以及可穿戴设备所产生的多模态生理信号数据。根据本发明的一个实施例，所述可穿戴设备包括智能手环、脑电设备、智能鞋中的至少一种。根据本发明的一个实施例，所述眼底图像数据的图像格式为jpg格式、png格式、bmp格式等常见图像格式中的一种。根据本发明的一个实施例，智能手环数据包括加速度3轴数据、陀螺仪3轴数据、心率1维数据、血压2维数据中的至少一种。根据本发明的一个实施例，脑电数据为8组数据，每组数据具有相同的采样率。根据本发明的一个实施例，智能鞋数据为智能鞋中的压力片数据，为8组数据，每组数据有相同的采样率。

这些原始采集数据还不能直接用于学习训练。根据本发明的一个实施例，数据采集及预处理模块还要对数据进行预处理。在数据预处理阶段，对可穿戴设备的数据进行插值、滤波两步操作。原因如下：由于可穿戴设备的多模态传感器采样率一般并不相同，在同一个时间段内，采样值的个数并不相同。为了统一处理数据，要进行数据对齐，采用插值操作，使得同一时间段内，在每个采集时刻都有对应的采集数据。另外，由于传感器的高灵敏性，原始的采集数据中还含有噪声，因此还要进行滤波操作。

根据本发明的一个实施例，采用最近邻插值法将所有的数据对齐，便于之后数据的融合，采用Savitzky-Golay滤波器和三阶一维中值滤波器消除信号的峰值，采用移动平均滤波消除噪声。

其中，Savitzky-Golay滤波器是一种在时域内基于局域多项式最小二乘法拟合的滤波方法，将移动窗口进行加权平均，但加权系数不是简单的常数窗口，而是通过在滑动窗口内对给定高阶多项式的最小二乘拟合得出。

中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术，它的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替，让周围的像素值接近真实值，从而消除孤立的噪声点。

移动平均滤波是基于统计规律，将连续的采样数据看成一个长度固定为N的队列，在新的一次测量后，上述队列的首数据去掉，其余N-1个数据依次前移，并将新的采样数据插入，作为新队列的尾；然后对这个队列进行算术运算，并将其结果做为本次测量的结果。

二、认知障碍检测模块

根据本发明的一个实施例，如图1所示，认知障碍检测模块102包含三个模块，分别是多模态信息表征模块1021、多模态信息融合模块1022、无监督深度聚类模块1023。

其中，多模态信息表征模块1021，利用不同的网络提取图片及多元时间序列信号的特征，实现了自动对数据进行统一表征的学习方法，其中提取图片特征提取使用的是现有经典网络结构Mobilenet，多元时间序列信号特征提取使用的一个浅层的卷积神经网络CNN。该模块减少了人工干预提取特征，增加了认知障碍检测系统对于多模数据的普适性。。

多模态信息融合模块1022，结合多元时间序列信号的时空信息生成具有时空关联性的图特征，将该特征作为辅助特征与通过眼底设备得到的图像特征进行融合，其融合的特征能够更好地表征数据的泛化模式，有利于模型更准确地区分正常人与认知障碍人群。

无监督深度聚类模块1023，该模块接收融合后的特征用于认知障碍检测，实现了无监督的模型训练方法，运用基于深度聚类和自动编码器两个深度学习技术进行特征数据训练。该模型在训练过程中无需老年人在认知障碍状态下的异常数据，因此模型对于未知数据样本分布有更好的鲁棒性和泛化能力。

以下具体说明认知检测模块102中所包含的三个模块。

1、多模态信息表征模块1021

由于眼底数据具有空间依赖性、可穿戴设备的传感器信号数据具有时间和空间依赖性，因此需要构建不同的网络对数据进行表征。多模态信息表征模块包括眼底图片数据表征网络和多模态生理信号数据表征网络，分别用于提取眼底图片数据的特征和多模态生理信号数据的特征。

(1)眼底图片数据表征网络

眼底图片数据表征网络用于根据数据采集及预处理模块输入的左右眼的眼底图片提取眼底图片数据的特征。根据本发明的一个实施例，该表征网络使用MobileNet网络。MobileNet是谷歌公司提出的一个轻量级的神经网络结构，是专用于移动和嵌入式视觉应用的卷积神经网络，它使用深度可分离的卷积来构建轻量级的深层神经网络。通过引入两个简单的全局超参数，即宽度因子(width multiplier)和分辨率因子(resolutionmultiplier)，MobileNet在延迟度和准确度之间有效地进行平衡。MobileNet将传统卷积分解成了两个步骤，第一个步骤是深度可分离卷积(Depthwise Convolution)，它只有M个3×3的卷积核，起到了提取特征的作用，第二个步骤是逐点卷积(Pointwise Convolution)，实际上就是传统的卷积，只是所有的卷积核都是1×1，起到了融合已提取特征的作用。

图3示出了根据本发明一个实施例的眼底图片数据表征网络，其采用MobileNet网络，其由输入至输出依次包括：

1个Conv2d，即二维卷积层，包括32个3×3的卷积核，步长为2；

1个Bottleneck，包括PW层：1×1的卷积核，DW层：3×3的卷积核，PW层：1×1的卷积核，个数都是16，步长等于1；其中，PW层代表逐点卷积；DW层代表深度可分离卷积层；

1个Bottleneck，包括PW层：1×1的卷积核，DW层：3×3的卷积核，PW层：1×1的卷积核，个数都是24，步长等于1；

1个Bottleneck，包括PW层：1×1的卷积核，DW层：3×3的卷积核，PW层：1×1的卷积核，个数都是32，步长等于1；

1个Bottleneck，包括PW层：1×1的卷积核，DW层：3×3的卷积核，PW层：1×1的卷积核，个数都是64，步长等于1；

1个Bottleneck，包括PW层：1×1的卷积核，DW层：3×3的卷积核，PW层：1×1的卷积核，个数都是96，步长等于1；

1个Bottleneck，包括PW层：1×1的卷积核，DW层：3×3的卷积核，PW层：1×1的卷积核，个数都是160，步长等于1；

1个Bottleneck，包括PW层：1×1的卷积核，DW层：3×3的卷积核，PW层：1×1的卷积核，个数都是320，步长等于1；

1个Conv2d，包括1280个1×1的卷积核，步长等于1；

1个Avg Pooling，即平均池化层，尺寸为7×7；

1个FC，即全连接层，512个神经元；

1个FC，100个神经元。

图片数据以128x128x2的维度输入到眼底图片数据表征网络中，其中128x128是图像大小，2代表左眼和右眼两幅图片，经过如图3所示的Mobilenet网络后，得到100维的特征(d＝100)。根据本发明的一个实施例，为了减少模型训练次数，使得模型在较少的迭代次数内快速达到收敛，本发明在MobileNet的使用过程中预先加入ImageNet数据集预训练过的权重，也就是说，使用已经在数据集上训练过的模型来执行不同但相关的机器学习任务。模型得到的最终输出为

d表示输出特征的维度。

(2)多模态生理信号数据表征网络

本发明还采集了多种可穿戴设备的传感器数据作为辅助特征进一步提升模型精度，这些数据包括智能手环数据(加速度、陀螺仪、心率、血压)，脑电数据，智能鞋数据。这些数据具有多模态性及时序性，同一种数据的当前信息往往与其一段时间内的历史信息具有相关性；不同模态间的信息也可能具有潜在的相关性。因此，多模态数据可以整体被当作高维流数据加以预处理，处理流程如下：1)首先基于应用场景设定流数据的采样周期，并将同一周期内的数据作为批量数据整合为一个高维矩阵；2)将整个矩阵输入多模态生理信号数据表征网络以进行表征学习。

多模态生理信号数据表征网络由多层卷积层和池化层堆叠，在同一时间输入的数据生成的矩阵将进行逐级的卷积操作，使得不同模态间的数据仍然具有关联性并经由多个卷积层加以抽象化描述。深度表征网络包括卷积层、池化层，其中将卷积层描述为以下表达式：

其中，h^k表示当前层的第k个特征映射的表征，σ(·)为线性整流函数(ReLU)，它是激活函数的一种，公式表达为σ(·)＝max(0,x)，x^l表示前一层的L个特征映射中的第l个特征映射，*为2D卷积运算，w^k和b^k为当前层的第k个特征映射的卷积核和偏差值。池化层使用最大池化，将输入数据进行下采样，每次选取区域中的最大值代替这一个区域的值。根据本发明的一个实施例，使用两层的卷积层和池化层具有更好的效果。

经过多模态信息表征层后得到最终的输出

d表示输出特征的维度。该输出将用于后续的多模态信息融合模块。值得注意的是，眼底图片数据表征和多模态生理信号数据表征得到输出维度一致。

图4示出了根据本发明一个实施例的多模态生理数据信号表征网络，其由输入至输出，依次包括：

1个Conv.&RelU，MXP，其中Conv.表示卷积层、ReLU表示激活函数层，MXP表示最大池化层，卷积层包括64个3×3的卷积核，池化层的尺寸为2×2；

1个Conv.&RelU，MXP，卷积层包括32个3×3的卷积核，池化层的尺寸为2×2；

1个FC，包括1024个神经元；

1个FC，包括100个神经元。

智能手环、脑电数据、智能鞋数据经过预处理后以128x25维输入到多模态生理信号数据表征网络中，其中128为时间窗口，25为多模态的信号数量，经过了如图4所示的浅层卷积神经网络后得到100维的特征(d＝100)。

2、多模态信息融合模块

该模块需要将眼底图片数据表征网络得到的特征和多模态生理信号数据表征网络得到的特征进行有效融合，其采用以下变换：

O＝f(λ₁*Z¹+λ₂*Z²)

其中，其中Z¹表示通过眼底图片数据表征网络得到的特征，Z²表示通过多模态生理信号数据表征网络得到的特征，λ₁和λ₂作为权重参数，控制两类特征对整体模型的重要程度，一般来说，眼底数据作为主体特征，对检测过程起到更大的作用，其他生理特征作为辅助特征，因此λ₁＞＞λ₂，且λ₁+λ₂＝1，0<λ₁<1，0<λ₂<1。f(·)表示全连接网络层。O表示在经过融合模块得到的最终输出，该输出将被送入无监督深度聚类模块。

3、无监督深度聚类模块

卷积自动编码器是卷积神经网络的一种，它们的主要不同在于前者被训练用于学习滤波器并结合特征对输入数据进行分类，后者通常被训练学习滤波器用于重构输入数据，卷积自动编码器由编码器和解码器组成，旨在计算低维表达z_f和重构误差z_r。

z_f＝Encoder(O)

O′＝Decoder(z_f)

z_r＝||O′-O||

其中，Encoder表示编码器，由卷积层和池化层组成，Decoder表示解码器，由卷积层和反池化层组成，O表示由多模态信息融合模块得到的输出，O′表示与O有着相同结构的重构值。池化层使用最大池化，将输入数据进行下采样，每次选取区域中的最大值代替这一个区域的值。反池化层通过记录池化过程中最大激活值的坐标位置，在反池化时，将池化过程中最大激活值所在的位置坐标的值激活，其他的值置为0。

由于训练数据中正常人群也包含很多个性化特征，即数据分布存在多样性，仅只用自动编码器很容易导致模型出现过拟合，因此在此基础上，如图2所示，将z_f同时送入解码器和深度聚类模型中，深度聚类模型能够根据数据分布对输入数据进行无监督分类，提升了整体模型的泛化能力。首先，为了提升聚类的效果，在特征送入深度聚类模型之前，先对其进行L2标准化，具体方法如下式：

考虑将n个样本的特征聚类成k个集群的问题，每个集群被不同中心μ_j,j＝1,…,k表示，首先对数据进行非线性映射，f_θ：z′_f→z″_f，即通过卷积神经网络学习潜在特征空间。为了避免扭曲维度，z″_f的维度要比z′_f小的多。

聚类过程使用在两个步骤之间交替的无监督算法来进行。在第一步中，需要计算嵌入点和集群质心之间的软分配。在第二步中，更新深度映射f_θ并通过使用辅助目标分布从当前高置信度分配中学习来优化聚类质心。重复这个过程直到满足收敛条件。

具体来说，对于第一步软分配，先假设初始化K个聚类中心，然后数据距离中心的距离满足t-分布，可以用下面的公式表示降维后第i个点

和第j类的中心μ_j之间的相似度：

其中i表示第i个样本，j表示第j个聚类中心，α为t-分布的自由度，控制分布曲线形态，α作为模型超参数，根据本发明的一个实施例，设置为α＝1，q_ij表示样本i属于聚类j的概率，j′是求和变量，μ_j′表示第j′类的中心。

第二步，通过在辅助目标分布的帮助下，从他们的高置信度分配中学习，来迭代地细化聚类。具体而言，模型通过将软分配与目标分布进行匹配来进行训练。为此，本发明将目标定义为软分配q_ij和辅助分布p_ij之间的KL散度损失L，公式如下：

其中辅助分布p_ij是原始潜在目标分布中样本i属于聚类j的概率，这里选择delta分布来表示。

重复上述两个步骤的过程中，每次都需要更新

和μ_j参数，具体公式式如下：

模型构建完成后，使用反向传播的梯度下降法最小化目标函数J(θ)，即网络的重构误差与KL散度之和，如下式：

其中i表示第i个样本，N表示一次迭代中所需的数据总量，L(O_i,O′_i)为无监督深度聚类网络的重构误差，

表示为l₂范数。O_i表示第i个样本由多模态信息融合模块得到的输出，O′_i表示与O_i有着相同结构的重构值。如果重构误差较低，则说明低维表达z_f能够更好地保留输入样本的关键信息。

三、阈值计算模块

模型训练完成后，将仅包含有正常人群数据的验证集输入到模型中计算重构误差Error(O_i)＝L(o_i,o′_i)，其中i表示第i个样本，阈值计算方式如下所示：

其中Error(O_i)表示O_i的重构误差，N为所有数据总和，μ表示所有验证集中的正常数据的Error(O_i)的平均值。

在阈值计算模块中，决策规则为当Error(O_i)>threshold时，序列中的样本被定义为认知障碍状态，否则为正常状态。基于计算好的阈值threshold，我们可以在实际应用场景中进行测试，如果输入的数据得到的重构误差大于该阈值，则被认为是认知障碍，反之则为正常。

四、认知障碍预警模块

认知障碍预警模块与认知障碍检测模块相连接。认知障碍检测模块将检测结果发送到认知障碍预警模块，认知预警模块通过声音、语音、视觉、打印报告等呈现方式输出检测结果。根据本发明的一个实施例，认知障碍预警模块还通过短信、微信、邮件、电话等通信方式将检测结果通知医生、患者、家属或看护等相关人员。

本发明还提供一种用于上述认知障碍检测模型的训练方法，所述认知障碍检测模型包括多模态信息表征模块、多模态信息融合模块、无监督深度聚类模块：

本发明还提供一种基于上述认知障碍检测模型的认知障碍检测方法，包括：

步骤4，将重构误差与认知障碍检测阈值比较获取检测结果。

经实验测试，本发明的认知障碍的检测方法的精度达到了85％，比现有方法提高5％-10％。

总体来说，针对现有老年人认知障碍检测方法中存在单一设备检测精度低、数据标签不足、方法泛化能力差的问题，本发明结合眼底设备和可穿戴设备构建老年人认知障碍检测模型。针对传统认知障碍方法由于未知数据分布导致的准确率低，泛化能力差的问题，提出了一种认知障碍检测模型及其训练方法。本发明利用不同的网络提取图片及多元时间序列信号的特征，实现了自动对数据进行统一表征的学习方法。本发明结合可穿戴设备的多元时间序列信号的时空信息生成具有时空关联性的图特征，将该特征作为辅助特征与通过眼底设备得到的图像特征进行融合，融合后的特征被用于老年人认知障碍检测，实现了无监督的模型训练方法，运用基于深度聚类和重构的深度学习技术进行特征数据训练。

本发明在训练过程中仅使用正常人群的多模态数据，由于模型在构建过程中不基于任何老年人认知障碍下的先验知识，因此相较于同类模型，此模型检测认知障碍的能力更强。本发明的认知障碍检测系统有效地解决了传统认知障碍检测方法无法应对未知数据分布的问题，能够提取和融合有效的多模态特征，增加模型的泛化能力。此外，本发明系统稳定，能够在全新数据的测试中保持较高的识别精度，具有强鲁棒性。

应该注意到并理解，在不脱离后附的权利要求所要求的本发明的精神和范围的情况下，能够对上述详细描述的本发明做出各种修改和改进。因此，要求保护的技术方案的范围不受所给出的任何特定示范教导的限制。

Claims

1.一种认知障碍检测模型，包括多模态信息表征模块、多模态信息融合模块、无监督深度聚类模块，其中，

2.根据权利要求1所述的认知障碍检测模型，所述眼底图像数据表征网络采用Mobilenet网络，所述多模态生理信号数据表征网络采用浅层卷积网络；

3.根据权利要求1或2所述的认知障碍检测模型，采用以下公式融合眼底图像数据的特征与多模态生理信号数据的特征，

O＝f(λ₁*Z¹+λ₂*Z²)

其中，O表示输出，f(·)表示全连接网络层，Z¹表示提取的眼底图像数据的特征，Z²表示提取的多模态生理信号数据的特征，λ₁＞＞λ₂，λ₁+λ₂＝1，0＜λ₁＜1，0＜λ₂＜1。

4.根据权利要求1或2所述的认知障碍检测模型，所述目标函数为

其中，θ表示网络参数，q_ij为软分配，p_ij为辅助分布，i表示第i个样本，j表示第j个聚类中心，N表示一次迭代中所需的数据总量，O_i表示第i个样本的多模态数据融合后得到的输出，O′_i表示与O_i有着相同结构的重构值，L(O_i，O′_i)为重构误差，

表示为l₂范数。

5.一种用于权利要求1-4之一的认知障碍检测模型的训练方法，包括：

6.根据权利要求5所述的训练方法，所述多模态信息表征模块包括眼底图像数据表征网络、多模态生理信号数据表征网络，所诉眼底图像数据表征网络采用Mobilenet网络，所述多模态生理信号数据表征网络采用浅层卷积网络；采用以下公式融合眼底图像数据的特征与多模态生理信号的特征，

O＝f(λ₁*Z¹+λ₂*Z²)

7.根据权利要求5所述的训练方法，所述无监督深度聚类模块包括编码器、解码器和深度聚类模型，其中，

所述深度聚类模型对输入数据进行无监督分类；

所述认知障碍检测模型的目标函数为

表示为l₂范数。

8.一种基于权利要求5-7之一的方法生成的认知障碍检测模型的认知障碍检测方法，包括：

步骤4，将重构误差与认知障碍检测阈值比较获取检测结果。

9.一种计算机可读存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现根据权利要求5-8任一项方法的步骤。

10.一种计算机设备，包括存储器和处理器，在所述存储器上存储有能够在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求5-8任一项方法的步骤。