CN113808734A

CN113808734A - 一种基于深度学习的因果医疗诊断方法

Info

Publication number: CN113808734A
Application number: CN202111046470.8A
Authority: CN
Inventors: 孙洁
Original assignee: Ningbo University of Technology
Current assignee: Ningbo University of Technology
Priority date: 2021-09-08
Filing date: 2021-09-08
Publication date: 2021-12-17

Abstract

本发明公开一种基于深度学习的因果医疗诊断方法，该方法包括基于深度神经网络的诊疗模型，和带知识正则化处理的因果性学习模块。基于深度神经网络的诊疗模型利用深度神经网络的高效非线性学习能力，获取复杂生理信号的深度特征，因果性学习模块结合知识正则化进行因果发现。该方法的有益效果在于：1）利用深度神经网络获取深度特征，再将特征与疾病形成变量对，以进一步挖掘疾病表征的因果关系；2）带知识正则化处理的因果性学习模块利用神经网络实现，可嵌入到当前任意一个自动诊疗模型中，且整体方法可用梯度下降方法进行学习和优化；3）采用了基于知识的正则化技术，结合公理和领域知识改良神经网络分类结果，使得因果发现更加稳健。

Description

一种基于深度学习的因果医疗诊断方法

技术领域

本发明涉及机器学习的技术领域，更具体地，涉及一种结合了深度学习和知识正则化的医疗事件因果发现方法。

背景技术

来自电子医疗记录、重症监护室数据流和患者生成的健康数据等健康数据正变得越来越广泛，并有可能被用来发现疾病的原因。但从生理学数据中发现疾病面临很大挑战，因为人类生理学是复杂和非线性的，多种疾病往往具备类似的症状和生理表现，例如，急性呼吸窘迫综合征（ARDS）的根本原因是呼吸系统的急性衰竭，但可能表现出循环系统或者神经系统症状。如果不对这种复杂性进行建模和分析，也就无法真正挖掘疾病与症状之间的本质与规律。

近年来，随着以深度学习为主的人工智能技术能够对从输入至输出的复杂关系进行建模，在多个应用领域取得了巨大的成功，但有时容易过度拟合数据中与问题无关的其他特性，过度关注从原因到结果的次要联系，甚至偶然的无关联系，从而削减了对问题本质关系的拟合。因此，各行业也对人工智能技术提出了新的要求，希望从数据中挖掘出复杂事物更加本质的规律。

为此，介绍了一种通过使用深度学习结合知识正则化技术，进行深度诊疗的方法，利用了深度神经网络的高效非线性学习能力，并通过知识正则化的结果，进一步发现疾病和症状之间真正的依赖关系。

发明内容

本发明所要解决的技术问题是，提供一种结合了深度学习模型和知识正则化技术的疾病推理模型。

为达到上述目的，本发明创造的技术方案是这样实现的：本方法包括两个组件：基于深度神经网络的诊疗模型1，和带知识正则化处理的因果性学习模块2。

所述基于深度神经网络的诊疗模型1，包括特征分类模型11和嵌入层12。

所述特征分类模型11为一个K类分类模型，输入为多维生理信号

，t= 1,…T，T为时间步。其中

，其中D为生理信号的数量，而d为每个生理信号的维度（截取固定维数）。则每个输入X ^t为一个D×d的二维矩阵。输出为根据输入信号所诊断的属于某类疾病的概率，疾病类型C=(C ₁,…, C _K)，其中K为可辨识的疾病类别数量。同时，通过分类神经网络11获取到特征向量f= (f ₁,…, f _T)。

所述嵌入层网络12，将特征分类神经网络11的输出结果，形式转换为适合因果性学习模块2处理的输入形式，具体方法如下：

令

，构造数据集

，

，其中， f _i →c _j 表示特征 f _i与疾病c _j 呈正相关关系，甚至是导致疾病c _j的直接因子；

表示特征 f _i 与疾病c _j互不相干， f _i ← c _j 表示特征 f _i的出现与疾病c _j呈反相关关系，即特征f _i 的出现导致疾病c _j的预测概率下降。

所述带正则化处理的因果性学习模块2，包括因果分类模型21，和正则化学习模块22。

所述因果分类模型21，是一个神经网络，包括五个卷积块和三个全连接层，最后是一个SoftMax层。输入训练数据集D _i=

，输出为一个三元预测向量，分别用于表示数据对（f _i,c _j）之间的关系：（f _i→c _j, f _i

c _j , f _i ← c _j）。

所述正则化学习模块22，用于采用正则化规则，进一步改良因果分类模型21的输出结果，包括正则化规则库22a，和正则化学习模块22b。

所述正则化规则库22a，用于定义建立因果关系规则，用于惩罚在因果发现中违背这些规则的学习过程。正则化规则库用R表示，来源由应用领域决定，可以是公理，也可以来自领域知识。规则用概率软逻辑（Probabilistic Soft Logic，PSL）定义，规则形式定义为：

。

所述正则化学习模块22b，用于实现基于正则化的因果分类，其输入为组合分类模型21的三组不同变量的因果方向输出，其输出为修正后的因果方向结果。

损失函数的定义为：

，其中

为因果分类模型21的损失函数，

为正则化模块22b的损失函数，

为正则化项的系数。

用交叉熵定义为：

。其中

=1，如果数据对i属于类j。

为因果分类模型21输出的变量对（x _i,y _j）属于不同因果关系类的预测概率。

定义为：

其中

是正则化规则库中被输入样本匹配的规则集合，I是输入样本集合，

表示二者的实例基准距离（grounding distance）。

二者联合训练的目标函数是令损失函数达到最小。

与现有技术相比，本申请提供的一种结合深度学习的因果发现方法的有益效果在于：1）利用深度学习方法，利用深度神经网络获取深度特征，再将特征与疾病形成变量对，以进一步挖掘疾病表征所隐藏的本质规律；2）因果发现模块利用神经网络实现，可嵌入到当前任意一个自动诊疗模型中，且整体方法可用梯度下降方法进行学习和优化；3）采用了基于知识的正则化技术，结合公理和领域知识改良神经网络分类结果，使得因果发现更加稳健。

附图说明

图1 为本发明实施例提供的一种结合深度学习和因果发现正则化技术的疾病推理诊断模型；

图2 为本发明实施例提供的因果分类模型。

具体实施方式

以下是本发明的具体实施例，输入数据为12导联心电时序信号，输出是深度特征与具体疾病之间的病理依赖关系。结合附图，对本发明的技术方案作进一步的描述。需要注意的是，这里所使用的输入数据和输出目标，仅是为了结合特定实例以便描述具体算法；所采用的神经网络类型，是根据特定输入实例所采用的，而非意图限制根据本发明给公开的示例性实施方式。其中所使用的技术或者术语，例如卷积神经网络（CNN），均为现有技术中的定义，这里不再赘述。

图1是本实施例提供的一种结合深度学习和因果发现正则化技术的疾病推理诊断模型，包括两个组件：诊疗模型1，带正则化处理的因果性学习模块2。

所述诊疗模型1，用于通过深度神经网络，获取深度特征；

其中特征分类模型11，输入12导联心电信号X={X ₁, X ₂, …, X ₁₂}，输出为疾病C={c ₁, c ₂, …, c ₉}。

由于本实例使用的是多维时序信号，故分类模型采用二维卷积神经网络，共包括10个卷积块和1个分类层。分类层包括一个全局平均池化(Global Average Pooling，GAP)层和SoftMax层。在SoftMax层之前的特征向量为f={f ₁, f ₂, …, f ₁₀}。

所述嵌入层网络，用于将获取的深度特征与疾病形成数据对，构造训练数据集D _l=

。

因果分类模型21如图2所示，包括五个卷积块、三个全连接层和一个SoftMax层。每个卷积块包括2个卷积层和一个全局最大层，其中，卷积核大小为16，每个卷积层的卷积核数量为32×2^k，每2个卷积层k递增1（k从0开始）。每次输入三对数据样本，输出为三元组p=[p ₁, p ₂, p ₃]，分别对应的是一对变量(x _i,y _i)的三种关系的概率。形如：数据对(x ₁,x ₂)预测的三种关系概率分别为：p _(x1,x2)=[0.9, 0.02, 0.08]；数据对(x ₁,x ₃)预测的三种关系概率分别为：p _(x1,x3)=[0.1, 0.2, 0.7]；数据对(x ₂,x ₃)预测的三种关系概率分别为：p _(x2,x3)=[0.8, 0.1, 0.1]。

正则化学习模块22包括正则化规则库22a和正则化学习22b两个模块。

所述正则化规则库22a定义如下：

（1）可传递性：

(x → y) ∧(y → z)

(x → z)

(x← y) ∧(y ← z)

(x ← z)

(x

y) ∧ (y

z)

( x

z)

（2）不对称性：

(x → y)

¬ (x← y);

(x→ y)

¬ (x

y)；

(x ← y)

¬(x → y)；

(x ← y)

¬(x

y)；

(x

y)

¬(x → y)；

(x

y)

¬(x ← y)；

所述正则化学习模块22b，输入为因果分类模型21的输出，对每一条可传递性规则，用样本代入规则头，并计算PSL规则的匹配距离。具体方法如下：

S1：规则的实例代入（grounding）和匹配距离定义：

其中，每个规则的实例代入过程，指用实例取代所有变量的过程。用Łukasiewiczt-norm来将规则匹配为实值，其中I是通过t-norm将谓词或者从句匹配为一个真值的过程。基本逻辑操作为：

.

则在一个解释I下满足一条规则r(表示为

)的所有实例基准距离（grounding distance）定义为：

S2：对每一条传递性规则，代入样本空间，计算其实例基准距离：

p(x ₁→x ₂) = 0.9, p(x ₂→x ₃) = 0.8

则应用规则(x → y) ∧(y → z)

(x →z)

计算该规则的规则头的软真值为：I(body) =max{(0.9+0.8)-1, 0}=0.7。其中p(x ₁→x ₃) =0.1，则d(r) = max {0.7-0.1, 0} = 0.6。

则在这个解释I下满足这条规则的基准距离为：0.7-0.6=0.1.即

步骤S3：带正则化处理的因果性学习模块2的整体损失函数为

，通过令该损失函数最小，多批次训练直至网络收敛。