CN112435751A - 基于变分推断和深度学习的腹膜透析模式辅助推荐系统 - Google Patents

基于变分推断和深度学习的腹膜透析模式辅助推荐系统 Download PDF

Info

Publication number
CN112435751A
CN112435751A CN202011247101.0A CN202011247101A CN112435751A CN 112435751 A CN112435751 A CN 112435751A CN 202011247101 A CN202011247101 A CN 202011247101A CN 112435751 A CN112435751 A CN 112435751A
Authority
CN
China
Prior art keywords
variation
peritoneal dialysis
lower bound
inference
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011247101.0A
Other languages
English (en)
Other versions
CN112435751B (zh
Inventor
洪草根
郝玉哲
李伟
陈大鹏
董张慧雅
王兆瑞
郭小青
李敬东
韩天利
梁钊铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Peoples Hospital of Lianyungang
716th Research Institute of CSIC
Jiangsu Jari Technology Group Co Ltd
Original Assignee
First Peoples Hospital of Lianyungang
716th Research Institute of CSIC
Jiangsu Jari Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Peoples Hospital of Lianyungang, 716th Research Institute of CSIC, Jiangsu Jari Technology Group Co Ltd filed Critical First Peoples Hospital of Lianyungang
Priority to CN202011247101.0A priority Critical patent/CN112435751B/zh
Publication of CN112435751A publication Critical patent/CN112435751A/zh
Application granted granted Critical
Publication of CN112435751B publication Critical patent/CN112435751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Epidemiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • External Artificial Organs (AREA)

Abstract

本发明公开了一种变分推断和深度学习的腹膜透析治疗效果预测系统,包括信息获取模块、计算处理模块、辅助推荐模块和、自学习模块,其中计算处理模块中采用基于变分推断和深度学习的预测模型,包括:获取回顾性实验数据集;推导得到变分下界,将最大化似然函数转化为最大化变分下界;构建对应模型,以最大化变分下界为优化目标;使用超参数搜索,挑选出最佳超参数组合;在测试集上测试采取最佳超参数训练的模型。该模型能够在给定个体特征的情况下,预测对该个体采用自动腹膜透析和手动腹膜透析的预期治疗效果差异,并且通过变分推断方法解耦隐变量,减少选择偏误对预测的影响,获得更准确的预测性能,能够更好地辅助决策者对治疗模式的选择。

Description

基于变分推断和深度学习的腹膜透析模式辅助推荐系统
技术领域
本发明涉及腹膜透析人工智能领域,特别是一种基于变分推断和深度学习的腹膜透析模式辅助推荐系统。
背景技术
腹膜透析和血液透析、肾移植是目前中末期肾脏病病人的三种主要治疗手段。由于肾源短缺导致肾移植的病人渐少,而各级血液透析中心的病人渐趋饱和,腹膜透析正被越来越多的病人所采用。腹膜透析又分为手动腹膜透析和自动腹膜透析,近几年来,随着科技的发展和人们生活水平的不断提高,自动腹膜透析的占比逐年增加,然而自动腹膜透析相较于手动腹膜透析是否有更好的治疗效果尚未可知。
“接受/不接受某种干预措施,该患者的病情会改善吗?”是临床医生普遍关心的问题。实际上,这是一个关于个体化干预效果(Individualized Treatment Effects,ITE)的典型问题。ITE被定义为在给定患者状况的情况下,采取和不采取某种干预措施的预期结果之间的差异。对ITE的估计是精准医学领域的一项重要任务,可帮助临床医生选择合适的治疗方法。更一般地,ITE估计在需要进行行为决策的其他场景中也很有用,例如政府判断谁将从就业培训补贴中受益最多,老师决定哪个学习项目对某个特定的学生最有利等。ITE估计的常用方法主要可分为前瞻性研究和回顾性研究,前瞻性研究一般是设置临床随机对照试验(randomized controlled trials,RCTs),回顾性研究一般根据以往记录的真实世界数据来估计干预效果。
RCT是将患者随机分配到不同的干预组中,观察不同干预组中患者的干预效果差异。然而RCT研究花费的时间长,费用高,甚至在一些情况下由于医学伦理因素不能进行。
回顾性研究则直接根据利用既往数据估计干预效果。由于数据相对易于获取,回顾性研究受到越来越广泛的关注。然而从既往数据估计个体干预效果也面临两个主要挑战:反事实结果缺失和选择偏误。由于在同一时间一位患者只能接受一种干预方案,所以我们无从得知未采取的方案(即反事实)的结果。为此解决这一问题,一些传统的ITE估计方法通过回归模型来拟合患者特征与潜在干预结果之间的关联,从而估计反事实结果,比如普通最小二乘法(Ordinary least squares,OLS)回归;还有研究采用基于最近邻匹配的方法,在采取相反干预措施的样本中搜索特征最为相似的训练样本,以此估计反事实结果,比如倾向性评分匹配(Propensity score matching,PSM)。然而,由于既往数据中干预措施的选择并不受控,其可能受到患者特征的影响,从而导致选择偏误。例如,在是否进行手术的决策上,老年人更倾向于选择保守治疗而拒绝手术,年轻人则更倾向于手术。在这种情况下,不同干预方案的组别之间本身就存在分布上的差异,在通过上述方法估计ITE时会将这种差异引入,从而造成ITE估计的不正确。
发明内容
本发明的目的在于提供一种基于变分推断和深度学习的腹膜透析模式辅助推荐系统。
实现本发明目的的技术解决方案为:一种基于变分推断和深度学习的腹膜透析模式辅助推荐系统,包含:
信息获取模块,用于获取腹膜透析患者的基本信息;
计算处理模块,用于预测手动或自动腹膜透析模式下的治疗效果;
辅助推荐模块,用于决策者根据预测的治疗效果选择合适的治疗模式;
自学习模块,用于将实际治疗结果与预测的治疗效果相比较,并将实际结果输入到计算处理模块中,优化其算法;
其中,计算处理模块中采用基于变分推断和深度学习的预测模型,该模块包括:
数据划分模块,用于获取回顾性实验数据集,即腹膜透析患者的基本信息、采用的治疗模式及相关参数、腹膜透析充分性,将其按比例划分为训练集、验证集和测试集;
变分下界转化模块,通过变分推断,推导得到变分下界,将最大化似然函数转化为最大化变分下界;
深度神经网络模型构建模块,根据变分下界,利用深度神经网络构建对应模型,并以最大化变分下界为优化目标;
最佳超参数确定模块,使用超参数搜索,采用不同的超参数组合在训练集上训练,并在验证集上验证其性能,挑选出最佳超参数组合;
治疗效果预测模块,在测试集上测试采取最佳超参数训练的模型,得到预测的治疗效果。
进一步的,所述回顾性数据集
Figure BDA0002770373190000021
包含D个样本;其中每个样本
Figure BDA0002770373190000022
Figure BDA0002770373190000023
由特征向量xi、采取的干预措施ti以及对应观察到的干预结果
Figure BDA0002770373190000024
组成;
Figure BDA0002770373190000025
其中k是特征数量,即向量的维度;t∈{0,1},0代表未采取该干预措施,1为采取该干预措施;
Figure BDA0002770373190000026
为连续值标量。
数据样本中,首先假设特征x包含相互独立的三部分隐变量:1)只影响干预结果的隐变量zy;2)只影响治理措施选择的隐变量zt;3)同时影响干预结果和干预措施选择的隐变量zc。通过变分推断方法,对其进行解耦并获得变分下界,推导过程如下:
Figure BDA0002770373190000027
Figure BDA0002770373190000031
Figure BDA0002770373190000041
最终得到:
Figure BDA0002770373190000042
不等式左侧,log Pθ(t,y|x)为给定x下,t和y联合概率分布的对数似然函数,不等式右侧即其下界。模型的优化目标即最大化对数似然函数,可通过最大化其下界实现。
其中,Pθ为在给定x或zy、zt、zc下的t或y的干预先验分布,
Figure BDA0002770373190000043
为在给定x下的zy、zt、zc的结局预测先验分布,qφ为在给定x及y或t下zy、zt、zc的结局预测后验分布;log Pθ(t,y|x)为给定x下,t和y联合概率分布的对数似然函数,
Figure BDA0002770373190000044
为给定zt、zc下t的概率分布的对数的期望,
Figure BDA0002770373190000045
为给定zt、zc、t下y的概率分布的对数的期望。
假设各隐变量的条件概率分布
Figure BDA0002770373190000046
qφ(zc|y,t,x),qφ(zt|t,x),qφ(zy|y,x)为多元正态分布,使用深度神经网络拟合分布的参数,即均值向量μ和标准差向量σ,并通过正态分布的参数计算两个分布之间的KL距离。两个正态分布间的KL距离为:
Figure BDA0002770373190000047
最大化变分下界对应于最大化取反的三组KL距离,即最小化
Figure BDA0002770373190000048
Figure BDA0002770373190000049
Figure BDA00027703731900000410
对变分下界中的期望
Figure BDA00027703731900000411
利用深度神经网络拟合zt,zc与t的映射关系,以zt,zc为输入,预测t。最大化变分下界对应于最大化该期望,最大化该期望最终等价于最小化预测t的交叉熵。
Figure BDA0002770373190000051
其中N为样本数,ti为真实值,
Figure BDA0002770373190000052
为预测值。
类似地,对变分下界中的期望
Figure BDA0002770373190000053
利用深度神经网络拟合zy、zc、t与y的映射关系,以zy,zc,t为输入,预测y。最大化变分下界对应于最大化该期望,最大化该期望最终等价于最小化预测y的均方误差。
Figure BDA0002770373190000054
其中yi为真实值,
Figure BDA0002770373190000055
为预测值。
此步骤中,拟合多元正态分布参数、预测干预措施和预测干预结果都通过深度神经网络来实现。涉及到的深度神经网络均由多个全连接层组成,
Hi=δ(Wi·Hi-1+bi),
Hi表示第i个全连接层的输出,i={1,2,3,…,m},m为该神经网络的层数。特别地,我们定义H0为神经网络的输入向量。Wi和bi为第i个全连接层的权重矩阵和偏置向量。δ为激活函数。各个神经网络的层数以及各层的节点数通过超参数搜索确定。
最终,模型的损失函数为:
Figure BDA0002770373190000056
模型通过Adam优化器在训练集上最小化该损失函数进行训练。
与现有技术相比,本发明的显著优点为:(1)常用于ITE预测的回归算法和基于最近邻匹配的算法会将不同干预方案的组别之间数据分布上的差异引入,导致ITE预测不正确;而利用变分推断和深度学习技术,可以解耦隐变量,减少选择偏误和数据分布差异对算法的影响,提升了ITE预测的精准性,为腹膜透析模式辅助推荐提供支持;(2)该系统能够通过人工智能算法模型可视化地提供两种不同腹膜透析治疗方式的效果预测,从而提升腹膜透析的个性化、精准化治疗。
附图说明
图1是本发明的腹膜透析模式辅助推荐系统图。
图2是本发明的基于变分推断和深度学习的效果预测模型的示意图。
具体实施方式
为解决现有技术存在的问题,需要解耦出影响干预选择的部分患者特征,在预测潜在干预结果的过程中消除其影响,从而消除选择偏误。为此,本发明假设患者特征包含相互独立的三部分隐变量:1)只影响干预结果的隐变量,2)只影响治理措施选择的隐变量;3)同时影响干预结果和干预措施选择的隐变量,并对通过变分推断对三部分隐变量进行解耦,排除第2类隐变量的影响。本发明中的干预措施为是否选用自动腹膜透析治疗方式治疗。
下面结合附图对本发明进行详细说明。
本发明提供一种基于变分推断和深度学习的腹膜透析模式辅助推荐系统,如图1,包括:
信息获取模块,用于获取腹膜透析患者的基本信息,包括但不仅限于腹膜透析患者的身高、体重、性别、腹膜透析治疗模式、处方参数、治疗结果、化验信息等与患者治疗效果相关的参数;
计算处理模块,用于预测手动或自动腹膜透析模式下的治疗效果,包括但不仅限于腹膜透析充分性、容量负荷等;
辅助推荐模块,用于决策者根据预测的治疗效果选择合适的治疗模式,如自动腹膜透析和手动腹膜透析;
自学习模块,用于将实际治疗结果与预测的治疗效果相比较,并将实际结果输入到计算处理模块中,继续优化其算法,提升预测的精准性。
其中,计算处理模块采用基于变分推断和深度学习的预测模型,包含如下模块:
数据划分模块,用于获取回顾性实验数据集,即腹膜透析患者的基本信息、采用的治疗模式及相关参数、腹膜透析充分性,将其按比例划分为训练集、验证集和测试集;
变分下界转化模块,通过变分推断,推导得到变分下界,将最大化似然函数转化为最大化变分下界;
深度神经网络模型构建模块,根据变分下界,利用深度神经网络构建对应模型,并以最大化变分下界为优化目标;
最佳超参数确定模块,使用超参数搜索,采用不同的超参数组合在训练集上训练,并在验证集上验证其性能,挑选出最佳超参数组合;
治疗效果预测模块,在测试集上测试采取最佳超参数训练的模型,得到预测的治疗效果。
如图2所示,下面对该系统的自学习过程进行说明:
S101:获取训练数据集。回顾性数据集
Figure BDA0002770373190000061
包含D个样本。其中每个样本
Figure BDA0002770373190000062
由特征向量xi、采取的干预措施ti以及对应观察到的干预结果
Figure BDA0002770373190000063
组成。
Figure BDA0002770373190000064
其中k是特征数量,即向量的维度;t∈{0,1},0代表未采取该干预措施,1为采取该干预措施;
Figure BDA0002770373190000071
为连续值标量。
S102:通过变分推断,推导得到变分下界,将最大化似然函数转化为最大化变分下界。根据推导得到的变分下界构建模型,并确定模型优化目标。
S1021:假设特征x包含相互独立的三部分隐变量:1)只影响干预结果的隐变量zy;2)只影响治理措施选择的隐变量zt;3)同时影响干预结果和干预措施选择的隐变量zc。通过变分推断方法,对其进行解耦并获得变分下界,得到:
Figure BDA0002770373190000072
不等式右侧即为变分下界,将其最大化即可使不等式左侧的对数似然函数最大化。
S1022:对于变分下界中的三个KL距离中涉及到的6个分布,即
Figure BDA0002770373190000073
Figure BDA0002770373190000074
qφ(zc|y,t,x),qφ(zt|t,x),qφ(zy|y,x),假设其为多元正态分布,并利用深度神经网络拟合其分布参数,包括均值向量μ和标准差向量σ。由于标准差非负,实际程序实现中,为简化模型,以logσ2代替。
两个正态分布间的KL距离可以通过其分布参数直接计算:
Figure BDA0002770373190000075
S1023:对于变分下界中的期望
Figure BDA0002770373190000076
利用深度神经网络拟合zt,zc与t的映射关系,以zt,zc为输入,预测t。最大化变分下界对应于最大化该期望,最大化该期望最终等价于最小化预测t的交叉熵。
Figure BDA0002770373190000077
交叉熵Lt为衡量预测分布与真实分布相似度的一种方法,是预测值
Figure BDA0002770373190000078
的损失函数。其中N为样本数,ti为真实值,
Figure BDA0002770373190000079
为预测值。
对变分下界中的期望
Figure BDA00027703731900000710
利用深度神经网络拟合zy,zc,t与y的映射关系,以zy,zc,t为输入,预测y。最大化变分下界对应于最大化该期望,最大化该期望最终等价于最小化预测y的均方误差。
Figure BDA0002770373190000081
均方误差Ly是衡量真实分布与预测分布相似度的一种方法,也是一种损失函数。其中yi为真实值,
Figure BDA0002770373190000082
为预测值。
zy,zc,zt需要从分布中采样得到,但采样过程不可导,将导致训练过程中梯度无法传递,无法优化对分布的拟合。为解决该问题,在实际程序实现中,需要采样重参数化技巧,从标准正态分布中采样,再乘以对应分布的标准差并加上其均值,达到与从对应非标准正态分布中采样等同的效果,同时保证梯度能够通过分布参数传递。
S1024:上述所有深度神经网络均由多个全连接层组成,
Hi=δ(Wi·Hi-1+bi),
Hi表示第i个全连接层的输出,i={1,2,3,…,m},m为该神经网络的层数。特别地,我们定义H0为神经网络的输入向量。Wi和bi为第i个全连接层的权重矩阵和偏置向量。δ为激活函数。各个神经网络的层数以及各层的节点数通过超参数搜索确定。其中除t和y的预测输出层外,所有激活函数均采用ELU(exponential linear unit,ELU)函数,
Figure BDA0002770373190000083
t的预测输出层采用sigmoid函数作为激活函数;y的预测输出层不使用激活函数。
S1025:根据变分下界,得到模型的损失函数为:
Figure BDA0002770373190000084
S103:使用基于python的机器学习框架TensorFlow实现模型。
S104:将数据集按照一定比例划分为训练集、测试集和验证集。以不同的超参数组合构建模型,并输入训练集样本,通过Adam优化器最小化损失函数进行训练,将训练得到的模型分别在验证集上验证性能。在验证集上筛选出最优超参数组合后,将对应的模型在测试集上检验性能,最终得到该方法的性能。
S1041:具体地,本发明中按照63:27:10的比例划分训练集、验证集和测试集。
S1042:将训练集样本中的y,t,x输入模型,通过对分布qφ(zc|y,t,x),qφ(zt|t,x),qφ(zy|y,x)采样得到zc,zt,zy。再通过Pθ(t|zt,zc),Pθ(y|zy,zc,t)映射得到预测的
Figure BDA0002770373190000085
Figure BDA0002770373190000086
并结合真实的t和y计算Lt和Ly。在对L最小化的过程中,Lt和Ly最小化,其梯度反向传播,更新深度神经网络参数,使其更好地拟合qφ(zc|y,t,x),qφ(zt|t,x),qφ(zy|y,x)三个分布以及Pθ(t|zt,zc),Pθ(y|zy,zc,t)两个分别预测t和y的映射。在此过程中,隐变量zc,zt,zy得以解耦,并且在对
Figure BDA0002770373190000091
的计算过程中,排除了zt,达到了削弱选择偏误的目的。
另外,在对L最小化的过程中,
Figure BDA0002770373190000092
Figure BDA0002770373190000093
最小化,拟合
Figure BDA0002770373190000094
的深度神经网络参数得到更新,使其分布分别向qφ(zc|y,t,x),qφ(zt|t,x),qφ(zy|y,x)接近。
S1043:由于实际应用场景中y,t应为未知,模型验证过程中,在预测得到
Figure BDA0002770373190000095
的过程中仅有x作为输入,通过对分布
Figure BDA0002770373190000096
采样得到zc,zt,zy,再通过Pθ(y|zy,zc,t)映射得到预测的
Figure BDA0002770373190000097
其中,当t=0时得到的预测值为不采取干预措施时预测的潜在结果,记作
Figure BDA0002770373190000098
t=1时得到的预测值为采取干预措施时预测的潜在结果,记作
Figure BDA0002770373190000099
对一个个体,真实的干预效果ITE=y(1)-y(0),模型对其估计的个体干预效果
Figure BDA00027703731900000910
S1044:以收集的腹膜透析数据集,分别采用本发明的方法以及现有的倾向性评分匹配(PSM)方法和普通最小二乘法(OLS)回归方法进行对比。
对于个体化治疗效果预测的评估,数据集存在真实结果,所以用平均干预效应绝对误差(absolute error in average treatment effect,∈ATE)和异质效应估算精度误差(error in precision in the estimation of heterogeneous effect,∈PEHE)来作为评估指标,ATE和PEHE越小就说明预测结果越准确。两者计算公式如下:
Figure BDA00027703731900000911
Figure BDA00027703731900000912
其中,y(1)表示采取干预下的真实的潜在结果,y(0)表示无治疗干预下的真实的潜在结果。
经对比,本发明在ATE和PEHE方面均优于PSM和OLS方法。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

Claims (9)

1.一种基于变分推断和深度学习的腹膜透析模式辅助推荐系统,其特征在于,包括:
信息获取模块,用于获取腹膜透析患者的基本信息;
计算处理模块,用于预测手动或自动腹膜透析模式下的治疗效果;
辅助推荐模块,用于向决策者推荐合适的腹膜透析模式;
自学习模块,用于将实际治疗结果与预测的治疗效果相比较,并将实际结果输入到计算处理模块中,优化其算法;
其中,计算处理模块中采用基于变分推断和深度学习的预测模型,该模块包括:
数据划分模块,用于获取回顾性实验数据集,即腹膜透析患者的基本信息、采用的治疗模式及相关参数、腹膜透析充分性,将其按比例划分为训练集、验证集和测试集;
变分下界转化模块,通过变分推断,推导得到变分下界,将最大化似然函数转化为最大化变分下界;
深度神经网络模型构建模块,根据变分下界,利用深度神经网络构建对应模型,并以最大化变分下界为优化目标;
最佳超参数确定模块,使用超参数搜索,采用不同的超参数组合在训练集上训练,并在验证集上验证其性能,挑选出最佳超参数组合;
治疗效果预测模块,在测试集上测试采取最佳超参数训练的模型,得到预测的治疗效果。
2.根据权利要求1所述的基于变分推断和深度学习的腹膜透析模式辅助推荐系统,其特征在于,所述回顾性实验数据集
Figure FDA0002770373180000011
包含D个样本;其中每个样本
Figure FDA0002770373180000012
由特征向量xi、采取的干预措施ti以及对应观察到的干预结果
Figure FDA0002770373180000013
组成;
Figure FDA0002770373180000014
其中k是特征数量,即向量的维度;t∈{0,1},0代表未采取该干预措施,1为采取该干预措施;
Figure FDA0002770373180000015
为连续值标量。
3.根据权利要求2所述的基于变分推断和深度学习的腹膜透析模式辅助推荐系统,其特征在于,数据样本中,假设特征x包含相互独立的三部分隐变量:1)只影响干预结果的隐变量zy;2)只影响治理措施选择的隐变量zt;3)同时影响干预结果和干预措施选择的隐变量zc
4.根据权利要求3所述的基于变分推断和深度学习的腹膜透析模式辅助推荐系统,其特征在于,通过变分推断方法,将三部分隐变量解耦并获得变分下界,所述变分下界公式推导如下:
Figure FDA0002770373180000016
Figure FDA0002770373180000021
Figure FDA0002770373180000031
其中,Pθ为在给定x或zy、zt、zc下的t或y的干预先验分布,
Figure FDA0002770373180000032
为在给定x下的zy、zt、zc的结局预测先验分布,qφ为在给定x及y或t下zy、zt、zc的结局预测后验分布;log Pθ(t,y|x)为给定x下,t和y联合概率分布的对数似然函数,
Figure FDA0002770373180000033
为给定zt、zc下t的概率分布的对数的期望,
Figure FDA0002770373180000034
为给定zt、zc、t下y的概率分布的对数的期望。
5.根据权利要求4所述的基于变分推断和深度学习的腹膜透析模式辅助推荐系统,其特征在于,假设各隐变量的条件概率分布
Figure FDA0002770373180000035
qφ(zc|y,t,x),qφ(zt|t,x),qφ(zy|y,x)为多元正态分布,使用深度神经网络拟合分布的参数,即均值向量μ和标准差向量σ,并通过正态分布的参数计算两个分布之间的KL距离;两个正态分布间的KL距离为:
Figure FDA0002770373180000036
其中,σ为标准向量,μ为均值向量;
最大化变分下界对应于最大化取反的三组KL距离,即最小化
Figure FDA0002770373180000037
Figure FDA0002770373180000038
Figure FDA0002770373180000039
6.根据权利要求4所述的基于变分推断和深度学习的腹膜透析模式辅助推荐系统,其特征在于,对变分下界中的期望
Figure FDA00027703731800000310
利用深度神经网络拟合zt,zc与t的映射关系,以zt,zc为输入,预测t;最大化变分下界对应于最大化该期望,最大化该期望最终等价于最小化预测t的交叉熵:
Figure FDA00027703731800000311
其中N为样本数,ti为真实值,
Figure FDA00027703731800000312
为预测值。
7.根据权利要求6所述的基于变分推断和深度学习的腹膜透析模式辅助推荐系统,其特征在于,对变分下界中的期望
Figure FDA0002770373180000041
利用深度神经网络拟合zy,zc,t与y的映射关系,以zy,zc,t为输入,预测y;最大化变分下界对应于最大化该期望,最大化该期望最终等价于最小化预测y的均方误差:
Figure FDA0002770373180000042
其中yi为真实值,
Figure FDA0002770373180000043
为预测值。
8.根据权利要求5、6或7所述的基于变分推断和深度学习的腹膜透析模式辅助推荐系统,其特征在于,利用深度神经网络拟合多元正态分布参数、预测干预措施和预测干预结果,其中,深度神经网络由多个全连接层组成:
Hi=δ(Wi·Hi-1+bi)
Hi表示第i个全连接层的输出,i={1,2,3,…,m},m为该神经网络的层数;定义H0为神经网络的输入向量;Wi和bi为第i个全连接层的权重矩阵和偏置向量,δ为激活函数;神经网络的层数以及各层的节点数通过超参数搜索确定。
9.根据权利要求7所述的基于变分推断和深度学习的腹膜透析模式辅助推荐系统,其特征在于,模型的损失函数为:
Figure FDA0002770373180000044
模型通过Adam优化器最小化该损失函数进行训练。
CN202011247101.0A 2020-11-10 2020-11-10 基于变分推断和深度学习的腹膜透析模式辅助推荐系统 Active CN112435751B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011247101.0A CN112435751B (zh) 2020-11-10 2020-11-10 基于变分推断和深度学习的腹膜透析模式辅助推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011247101.0A CN112435751B (zh) 2020-11-10 2020-11-10 基于变分推断和深度学习的腹膜透析模式辅助推荐系统

Publications (2)

Publication Number Publication Date
CN112435751A true CN112435751A (zh) 2021-03-02
CN112435751B CN112435751B (zh) 2023-01-03

Family

ID=74700758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011247101.0A Active CN112435751B (zh) 2020-11-10 2020-11-10 基于变分推断和深度学习的腹膜透析模式辅助推荐系统

Country Status (1)

Country Link
CN (1) CN112435751B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113539517A (zh) * 2021-08-05 2021-10-22 浙江大学 时序干预效果的预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232480A (zh) * 2019-03-01 2019-09-13 电子科技大学 利用变分的正则化流实现的项目推荐方法及模型训练方法
CN110781401A (zh) * 2019-11-07 2020-02-11 电子科技大学 一种基于协同自回归流实现的Top-n项目推荐方法
CN111899894A (zh) * 2020-08-03 2020-11-06 东南大学 一种抑郁症患者预后药效评估系统及其评估方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232480A (zh) * 2019-03-01 2019-09-13 电子科技大学 利用变分的正则化流实现的项目推荐方法及模型训练方法
CN110781401A (zh) * 2019-11-07 2020-02-11 电子科技大学 一种基于协同自回归流实现的Top-n项目推荐方法
CN111899894A (zh) * 2020-08-03 2020-11-06 东南大学 一种抑郁症患者预后药效评估系统及其评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
唐雯等: "循环神经网络模型在腹膜透析临床预后预测中的初步应用", 《北京大学学报(医学版)》 *
杨梦月等: "基于反事实学习及混淆因子建模的文章个性化推荐", 《计算机系统应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113539517A (zh) * 2021-08-05 2021-10-22 浙江大学 时序干预效果的预测方法
CN113539517B (zh) * 2021-08-05 2024-04-16 浙江大学 时序干预效果的预测方法

Also Published As

Publication number Publication date
CN112435751B (zh) 2023-01-03

Similar Documents

Publication Publication Date Title
Norouzi et al. Predicting renal failure progression in chronic kidney disease using integrated intelligent fuzzy expert system
CN108198621B (zh) 一种基于神经网络的数据库数据综合诊疗决策方法
CN108511057A (zh) 输血量模型建立及预测方法、装置、设备及其存储介质
CN106462655B (zh) 临床诊断支持网络、系统及方法
CN113012811B (zh) 一种结合深度卷积网络和图神经网络的中医证候诊断和健康评价方法
EP3570288A1 (en) Method for obtaining at least one feature of interest
CN112633601A (zh) 疾病事件发生概率的预测方法、装置、设备及计算机介质
CN117457217B (zh) 一种糖尿病肾病风险评估方法及系统
CN112435751B (zh) 基于变分推断和深度学习的腹膜透析模式辅助推荐系统
CN115064266B (zh) 基于不完整多组学数据的癌症诊断系统、设备及介质
CN113539460A (zh) 用于远程医疗平台的智能导诊方法和装置
CN113160986A (zh) 用于预测全身炎症反应综合征发展的模型构建方法及系统
Nugroho et al. Effective predictive modelling for coronary artery diseases using support vector machine
CN116386856A (zh) 基于医生决策模式识别的多标签疾病辅助诊断系统
Guo et al. Towards efficient federated learning‐based scheme in medical cyber‐physical systems for distributed data
KR20050043869A (ko) 적응 퍼지-뉴럴 네트워크를 이용한 유방암 자동 진단기의개발
CN117765530A (zh) 一种多模态脑网络分类方法、系统、电子设备及介质
Özkan et al. Effect of data preprocessing on ensemble learning for classification in disease diagnosis
CN115565669B (zh) 一种基于gan和多任务学习的癌症生存分析方法
CN117038096A (zh) 一种基于低资源医疗数据与知识挖掘的慢性疾病预测方法
CN113868597B (zh) 一种用于年龄估计的回归公平性度量方法
CN111680798A (zh) 联合学习模型系统和方法、装置和计算机可读存储介质
WO2023025419A1 (en) Method and system for deconvolution of bulk rna-sequencing data
Puga et al. A cost-based multi-layer network approach for the discovery of patient phenotypes
Straszecka Combining knowledge from different sources

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 222001 No.18 Shenghu Road, Lianyungang City, Jiangsu Province

Applicant after: The 716th Research Institute of China Shipbuilding Corp.

Applicant after: JIANGSU JARI TECHNOLOGY GROUP Co.,Ltd.

Applicant after: The First People's Hospital of Lianyungang

Address before: 222001 No.18 Shenghu Road, Lianyungang City, Jiangsu Province

Applicant before: 716TH RESEARCH INSTITUTE OF CHINA SHIPBUILDING INDUSTRY Corp.

Applicant before: JIANGSU JARI TECHNOLOGY GROUP Co.,Ltd.

Applicant before: The First People's Hospital of Lianyungang

GR01 Patent grant
GR01 Patent grant