CN116386845A

CN116386845A - 基于卷积神经网络和面部动态视频的精神分裂症诊断系统

Info

Publication number: CN116386845A
Application number: CN202310108561.2A
Authority: CN
Inventors: 黄杰; 谭淑平; 屈威
Original assignee: Beijing Huilongguan Hospital (beijing Psychological Crisis Research And Intervention Center)
Current assignee: Beijing Huilongguan Hospital (beijing Psychological Crisis Research And Intervention Center)
Priority date: 2023-06-06
Filing date: 2023-06-06
Publication date: 2023-07-04

Abstract

本发明公开了一种基于卷积神经网络和面部动态视频的精神分裂症诊断系统，包括视频数据采集单元：用于采集被试者在情绪刺激任务下的面部视频；视频数据预处理单元：将采集的原始视频数据处理为能够输入到卷积神经网络的数据形式；卷积神经网络单元：提取面部视频数据的时空特征，经由全连接层进行分类，输出分类结果；可视化单元：输出卷积神经网络单元的可视化特征图和类激活图。本发明通过情绪刺激下的面部视频对精神分裂症患者和健康对照进行分类，从而对精神分裂症进行快速诊断，与其他精神分裂症的检测方法相比，具有简便快速高效的优点。

Description

基于卷积神经网络和面部动态视频的精神分裂症诊断系统

技术领域

本发明涉及的是精神医学和人工智能领域，具体涉及一种基于卷积神经网络和面部动态视频的精神分裂症诊断系统。

背景技术

目前临床上精神分裂症的诊断和监测评估主要有以下方式：(1)临床量表；(2)脑影像学(3)；脑电信号。大多数诊断方式都集中在医学数据上，然而，这些数据采集方法既昂贵又复杂。量表评估花费的时间较长，精神分裂症患者受情绪影响，填写的量表，可信度不高。核磁共振成像花费高昂，且不能用于幽闭恐怖症患者。EEG采集步骤繁琐，信号易受干扰。

研究表明，精神分裂症患者不仅生理功能受损，而且社会功能受损。他们通常表现出情绪和言语表达障碍，这在他们的面部行为中可以观察到(Trémeau,2006；Bishay etal.,2018)。通过定义动作单元(AUs)激活的动态和强度特征，(Tron etal.,2015)发现了患者情感迟钝和积极情绪表达减少的证据。在(Tron et al.,2016)的另一项研究中，面部活动以七个面部簇的典型性、丰富性和分布为特征，并发现患者的面部活动主要以中性面部表情为特征。使用定义的面部特征，分类准确率为85％。面部行为分析一般分为面部情绪分析和面部AUs分析。根据(Jiang et al.,2022)，只有少数关于精神分裂症的研究使用面部行为分析，其中大多数是描述性的，而不是预测性的。在这些研究中，所有研究都是面部表情和面部活动分析，极少有研究直接使用面部动态视频来分析和预测精神分裂症。深度学习模型提供端到端的预测分析。因此，本发明提出的面部动态视频和深度学习技术相结合，可能提供一种更简单、更快的精神分裂症预测方法。本发明旨在通过直接使用面部视频对精神分裂症患者和健康人进行分类。

发明内容

针对现有技术上存在的不足，本发明目的是在于提供一种基于卷积神经网络和面部动态视频的精神分裂症诊断系统，通过情绪刺激下的面部视频对精神分裂症患者和健康对照进行分类，从而对精神分裂症进行快速诊断，与其他精神分裂症的检测方法相比，具有简便快速高效的优点。

为了实现上述目的，本发明是通过如下的技术方案来实现：基于卷积神经网络和面部动态视频的精神分裂症诊断系统，包括

视频数据采集单元：用于采集被试者在情绪刺激任务下的面部视频；

视频数据预处理单元：将采集的原始视频数据处理为能够输入到卷积神经网络的数据形式；

卷积神经网络单元：提取面部视频数据的时空特征，经由全连接层进行分类，输出分类结果；

可视化单元：输出卷积神经网络单元的可视化特征图和类激活图。

基于卷积神经网络和面部动态视频的精神分裂症预测方法，包括以下步骤：

1、采集在情绪刺激任务下受试者的面部视频,得到视频数据；2、面部视频预处理；

3、将输入视频以及经过精神科医师校验确认的视频标签组合为数据集，将数据集拆分为训练集和测试集；

4、神经网络模型构建与训练；

5、利用训练好的神经网络模型对测试集进行分类检测，从而实现对精神分裂症患者与健康对照组的自动诊断；6、输出分类结果后，输出卷积神经网络特征图和类激活图。所述的步骤2具体包括：

2.1、根据时间记录裁剪视频实验部分；

2.2、通过面孔检测判断每一帧是否存在人脸，存在人脸则裁剪人脸并对齐，不存在人脸则丢弃该帧；

2.3、调整帧大小并保存为新的视频；

2.4、新的视频根据神经网络的输入格式均匀抽取特定帧数作为输入。

本发明的有益效果：本发明将面部动态视频和深度学习技术相结合，提供一种更简单、更快的精神分裂症预测方法，能够通过直接使用面部视频对精神分裂症患者和健康人进行分类，效率更高，准确性更高。

附图说明

下面结合附图和具体实施方式来详细说明本发明；

图1为本发明的情绪刺激任务流程图；

图2为本发明的面部视频预处理流程图；

图3为本发明实施例的中间层特征图；

图4为本发明实施例的类激活图。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体实施方式，进一步阐述本发明。参照图1和图2，本具体实施方式采用以下技术方案：基于卷积神经网络和面部动态视频的精神分裂症诊断系统，包括视频数据采集单元：用于采集被试者在情绪刺激任务下的面部视频；

1、采集在情绪刺激任务下受试者的面部视频,得到视频数据，情绪刺激任务流程如图1所示；

2、面部视频预处理。流程如图2所示：

2.1、根据时间记录裁剪视频实验部分；

2.3、调整帧大小并保存为新的视频；

2.4、新的视频根据神经网络的输入格式均匀抽取特定帧数作为输入；

4、神经网络模型构建与训练；

5、利用训练好的神经网络模型对测试集进行分类检测，从而实现对精神分裂症患者与健康对照组的自动诊断；6、输出分类结果后，输出卷积神经网络特征图和类激活图。实施例1：根据本发明阐述的数据采集方式，招募125名精神分裂症患者和75名健康对照，两组人群在人口学信息上无显著性差异。以这200个面部视频为例，介绍本发明。

1、数据获取

观看情绪刺激视频短片，每个约90s，经过正性、中性、负性情绪刺激任务得到200个面部视频。

2、面部视频预处理

根据实验记录的时间戳对每个视频进行时间维度裁剪，仅仅保留观看视频短片下的视频帧。对任务期间的视频帧使用Dlib工具包检测人脸，Dlib工具包会生成人脸锚定框和特征点坐标，检测到人脸则该帧为有效帧，如果没有检测到人脸则视为无效帧并舍弃。有效帧根据人脸鼻尖位置为基准点，锚定框最大边长加上50个像素为裁剪框，裁剪人脸，并调整尺寸为500像素，保存裁剪后的有效帧为新的视频。为了适应输入和降低计算量，对新的视频进行均匀采样100帧，保存为输入视频。

3、数据集制作

将精神分裂症患者的视频标记为“1”，健康对照的视频标记为“0”。分层抽样20％的视频作为测试集评估泛化性能，剩余作为训练验证集。使用十折交叉验证将训练验证集分层划分为十份训练-验证集。

4、卷积神经网络模型构建与训练

本实施例中构建的模型是基于Resnet18结构的三维卷积神经网络，使用三维卷积层和三维池化层替换二维卷积层和二维池化层，调整全连接层以适应输出。

5、模型测试

根据十折交叉验证得到的十个模型分别对测试集进行测试。

得到的结果如下所示。

Fold	Accuracy	Precision	Recall	F1 score	AUC
						1	92.50％	89.29％	100.00％	94.34％	0.9680
2	92.50％	92.31％	96.00％	94.12％	0.9467
						3	92.50％	89.29％	100.00％	94.34％	0.9493
4	90.00％	86.21％	100.00％	92.59％	0.9253
						5	90.00％	88.89％	96.00％	92.31％	0.9467
6	87.50％	85.71％	96.00％	90.57％	0.9440
						7	82.50％	80.00％	96.00％	87.27％	0.9360
8	87.50％	83.33％	100.00％	90.91％	0.9413
						9	85.00％	85.19％	92.00％	88.46％	0.9120
10	90.00％	92.00％	92.00％	92.00％	0.9280
						mean	89.00％	87.22％	96.80％	91.69％	0.9397

6、可视化

使用grad-cam技术生成中间层特征图和类激活图，其部分采样图如图3和图4所示。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.基于卷积神经网络和面部动态视频的精神分裂症诊断系统，其特征在于，包括：

2.基于卷积神经网络和面部动态视频的精神分裂症预测方法，其特征在于，包括以下步骤：

(1)、采集在情绪刺激任务下受试者的面部视频,得到视频数据；

(2)、面部视频预处理；

(3)、将输入视频以及经过精神科医师校验确认的视频标签组合为数据集，将数据集拆分为训练集和测试集；

(4)、神经网络模型构建与训练；

(5)、利用训练好的神经网络模型对测试集进行分类检测，从而实现对精神分裂症患者与健康对照组的自动诊断；

(6)、输出分类结果后，输出卷积神经网络特征图和类激活图。

3.根据权利要求2所述的基于卷积神经网络和面部动态视频的精神分裂症预测方法，其特征在于，所述的步骤(2)具体包括：

(2.1)、根据时间记录裁剪视频实验部分；

(2.2)、通过面孔检测判断每一帧是否存在人脸，存在人脸则裁剪人脸并对齐，不存在人脸则丢弃该帧；

(2.3)、调整帧大小并保存为新的视频；

(2.4)、新的视频根据神经网络的输入格式均匀抽取特定帧数作为输入。