CN111882066A - 基于深度表征学习的反事实推理设备 - Google Patents
基于深度表征学习的反事实推理设备 Download PDFInfo
- Publication number
- CN111882066A CN111882066A CN202010719276.0A CN202010719276A CN111882066A CN 111882066 A CN111882066 A CN 111882066A CN 202010719276 A CN202010719276 A CN 202010719276A CN 111882066 A CN111882066 A CN 111882066A
- Authority
- CN
- China
- Prior art keywords
- treatment
- module
- strategy
- layer
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012512 characterization method Methods 0.000 title claims abstract description 75
- 238000011269 treatment regimen Methods 0.000 claims abstract description 97
- 238000011282 treatment Methods 0.000 claims abstract description 60
- 230000000694 effects Effects 0.000 claims abstract description 58
- 238000012549 training Methods 0.000 claims abstract description 29
- 230000008485 antagonism Effects 0.000 claims abstract description 23
- 230000006870 function Effects 0.000 claims description 39
- 230000001225 therapeutic effect Effects 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 8
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000002560 therapeutic procedure Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 235000002492 Rungia klossii Nutrition 0.000 claims description 3
- 244000117054 Rungia klossii Species 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims 1
- 238000013488 ordinary least square regression Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000011337 individualized treatment Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/042—Backward inferencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Abstract
本发明公开了一种基于深度表征学习的反事实推理设备,包含:基于深度表征学习的反事实推理模型单元和数据输入单元;反事实推理模型单元包括深度表征学习模块、正交损失模块、治疗策略预测模块、治疗策略预测对抗性模块和治疗效果预测模块;数据输入单元向模型单元输入训练数据集对其进行训练;数据输入单元向训练好的模型单元输入待预测的个体状态以得到预测结果。本发明的基于深度表征学习的反事实推理设备,通过治疗策略预测模块、治疗策略预测对抗性模块和正交损失模块的结合,使得表征学习模块中输出的表征ht,hy分别只与治疗策略和治疗效果相关,去掉了其中的混淆性因素,使基于表征hy的治疗效果预测模块能更加准确和科学地预测治疗效果。
Description
技术领域
本发明涉及一种基于深度表征学习的反事实推理设备。
背景技术
预测行为对个体的影响是许多领域的核心问题。例如医生确定哪种药物对病人的疗效更好;政府判断谁将从就业培训补贴中受益最多;或者老师决定哪个学习项目对某个特定的学生最有利。
在医学领域,个体化治疗效果(individualized treatment effects,ITE)是一种基于患者健康状况来确定特定治疗策略对该患者的治疗效果的方法。ITE被定义为处理结果和控制结果之间的预期差异,也经常在其他领域被用来作为判断处理方法有效性的指标。ITE的常用方法主要可分为前瞻性研究和回顾性研究,前瞻性研究一般是设置临床随机对照试验(randomized controlled trials,RCTs),回顾性研究一般根据真实世界数据来估计治疗效果。
RCT是将患者随机分配到不同的治疗组中,观察不同治疗组中患者的治疗效果差异。然而RCT存在几个严重的局限性:(1)要求严格的纳入和排除标准;(2)RCT研究的结论不能自动应用于其他地区;(3)由于道德原因,RCT可能无法实行。
回顾性研究则直接根据真实世界数据估计治疗效果。由于真实世界数据的易获取,回顾性研究被广泛应用于各个领域。然而从真实世界数据估计个体治疗效果也面临两个主要挑战:反事实结果缺失和治疗选择偏差。由于在同一时间一位患者只能接受一种治疗方案,所以我们无从得知其他治疗(即反事实)的结果。此外,真实世界数据中可能存在某些变量会同时影响治疗策略和治疗结果,从而导致混淆。例如,在不同情况下,人们对于治疗的偏好不同,因此治疗策略在不同人群中可能存在相当大的分布差异,分布差异进一步导致对反事实的不准确估计。
为了克服上述挑战,一些传统的ITE估计方法将治疗作为特征,并训练回归模型来估计反事实结果,比如普通最小二乘法(Ordinary least squares,OLS)回归;还有研究采用基于最近邻匹配的方法来找到相似的训练样本,从而估计反事实结果,比如倾向性评分匹配(Propensity score matching,PSM)。
然而这些传统的方法很少从患者输入特征中提取特定于治疗的表征,使得预测结果仍旧受到治疗选择偏差的影响。
发明内容
本发明提供了一种基于深度表征学习的反事实推理设备,采用如下的技术方案:
一种基于深度表征学习的反事实推理设备,包含:基于深度表征学习的反事实推理模型单元和数据输入单元;
反事实推理模型单元包括:
深度表征学习模块,用于从输入特征中提取仅与治疗策略相关的策略表征ht和仅与治疗效果相关的效果表征hy;
正交损失模块,用于对深度表征学习模块输出的策略表征ht和效果表征hy进行正交化处理,消除同时影响治疗策略和治疗结果的混淆性因素;
治疗策略预测模块,用于对深度表征学习模块输出的策略表征ht进行拟合,确保策略表征ht与治疗策略相关;
治疗策略预测对抗性模块,用于对深度表征学习模块输出的效果表征hy进行拟合,确保效果表征hy与治疗策略无关;
治疗效果预测模块,用于对深度表征学习模块输出的效果表征hy进行处理得到不同治疗策略下个体的治疗效果;
数据输入单元用于向反事实推理模型单元输入训练数据集以对反事实推理模型单元进行训练,数据集包括:描述个体特征的数据的自然状态集Θ={θ1,θ2,…,θn}、对个体可能采取的不同治疗策略的治疗策略集D={d1,d2,…,dm}和治疗效果集O={oij},(i=1,…,n;j=1,…,m),其中oij即个体在真实自然状态θi下采取策略dj时的治疗效果;
数据输入单元还用于向训练好的反事实推理模型单元输入待预测的个体状态以得到预测结果。
进一步地,深度表征学习模块包括两个独立且结构相同的第一多层感知机,其中一个用于提取策略表征ht,另一个用于提取效果表征hy;
第一多层感知机的结构设定为三层,以数据集中的数据作为第一多层感知机的输入层;
设定第一层输出ni1个节点,第二层输出ni2个节点,第三层输出ni3个节点,第一多层感知机通过以下公式进行计算:
h1=σ(W1x+b1),
h2=σ(W2h1+b2),
h3=σ(W3h2+b3),
其中,x表示输入层,x∈R|n|×|x|,W1表示第一层节点的权重矩阵,b1表示第一层的偏置,W2表示第二层节点的权重矩阵,b2表示第二层的偏置,W3表示第三层节点的权重矩阵,b3表示第三层的偏置,h1,h2,h3分别表示第一层、第二层和第三层输出的表征。
进一步地,正交损失模块对策略表征ht和效果表征hy进行正交化的计算公式如下:
进一步地,治疗策略预测模块为第一SoftMax输出层,第一SoftMax输出层的神经元个数为nt,nt为治疗方案集D的方案总数,治疗策略预测模块通过以下公式进行计算:
ti=φ(Wtht+bt)i,(i=1,…,nt),
其中,策略表征ht表示输入层,Wt表示权重矩阵,bt表示偏置,ti表示采用第i个策略的可能性,yt表示预测的治疗策略。
进一步地,治疗策略预测对抗性模块为第二SoftMax输出层,第二SoftMax输出层的神经元个数也为nt,治疗策略预测对抗性模块通过以下公式进行计算:
tanti_ti=φ(Wanti_thy+banti_t)i,(i=1,…,nt),
其中,效果表征hy表示输入层,Wanti_t表示权重矩阵,banti_t表示偏置,tanti_ti表示采用第i个策略的可能性,yanti_t表示预测的治疗策略。
进一步地,治疗效果预测模块由nt个独立且结构相同的第二多层感知机组成;
每个第二多层感知机的结构设定为两层,设定第一层输出no1个节点,第二层输出1个节点,第二多层感知机通过以下公式进行计算;
ho1=σ(Wo1hy+bo1),
ho2=Wo2ho1+bo2,
其中,效果表征hy表示输入层,Wo1表示第一层节点的权重矩阵,bo1代表第一层的偏置,Wo2表示第二层节点的权重矩阵,bo2代表第二层的偏置,ho1,ho2分别表示第一层和第二层的输出。
进一步地,数据输入单元用于向反事实推理模型单元输入训练数据集以对反事实推理模型单元进行训练的具体方法为:
将数据集按照一定比例划分为训练集、测试集和验证集;
将训练集输入反事实推理模型单元对其进行训练;
将测试集和验证集输入反事实推理模型单元对其进行验证。
进一步地,将训练集输入反事实推理模型单元对其进行训练的具体方法为:
选择交叉熵函数作为治疗策略预测模块的损失函数,选择准确率作为治疗策略预测模块的评价指标,其中,
其中,treatment为治疗策略预测模块的损失函数,nt为治疗方案集D的方案总数,nx表示输入样本的数目,Tij表示第j位个体在第i种治疗方案的真实标签数据,tij表示模型预测的第j位个体采用第i个策略的可能性;
选择交叉熵函数的负值作为治疗策略预测对抗性模块的损失函数,选择准确率作为治疗策略预测对抗性模块的评价指标,其中,
其中,anti_treatment为治疗策略预测对抗性模块的损失函数,nt为治疗方案集D的方案总数,nx表示输入样本的数目,Tij表示第j位个体在第i种治疗方案的真实标签数据,anti_tij表示模型预测的第j位个体采用第i个策略的可能性;
选择绝对误差函数作为治疗效果预测模块的损失函数,
将训练集输入反事实推理模型单元;
本发明的有益之处在于所提供的基于深度表征学习的反事实推理设备,通过治疗策略预测模块、治疗策略预测对抗性模块和正交损失模块的结合,使得表征学习模块中输出的表征ht,hy分别只与治疗策略和治疗效果相关,去掉了其中的混淆性因素,因此基于表征hy的治疗效果预测模块能更加准确和科学地预测治疗效果。
附图说明
图1是本发明的反事实推理模型单元的示意图。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
本发明提供一种基于深度表征学习的反事实推理设备,包含:基于深度表征学习的反事实推理模型单元和数据输入单元。
如图1所示,反事实推理模型单元包括:深度表征学习模块、正交损失模块、治疗策略预测模块、治疗策略预测对抗性模块和治疗效果预测模块。输入部分中,深色的代表仅与治疗策略相关特征,稍浅色代表仅与治疗结果相关特征,浅色代表与治疗策略和治疗结果均相关的特征。
数据输入单元用于向反事实推理模型单元输入训练数据集以对反事实推理模型单元进行训练,数据集包括:描述个体特征的数据的自然状态集Θ={θ1,θ2,…,θn}、对个体可能采取的不同治疗策略的治疗策略集D={d1,d2,…,dm}和治疗效果集O={oij},(i=1,…,n;j=1,…,m),其中oij即个体在真实自然状态θi下采取策略dj时的治疗效果。数据输入单元还用于向训练好的反事实推理模型单元输入待预测的个体状态以得到预测结果。
具体而言,深度表征学习模块用于从输入特征中提取仅与治疗策略相关的策略表征ht和仅与治疗效果相关的效果表征hy。深度表征学习模块包括两个独立且结构相同的第一多层感知机,其中一个用于提取策略表征ht,另一个用于提取效果表征hy。第一多层感知机的结构设定为三层,以数据集中的数据作为第一多层感知机的输入层。设定第一层输出ni1个节点,第二层输出ni2个节点,第三层输出ni3个节点,第一多层感知机通过以下公式进行计算:
h1=σ(W1x+b1),
h2=σ(W2h1+b2),
h3=σ(W3h2+b3),
其中,x表示输入层,x∈R|n|×|x|,W1表示第一层节点的权重矩阵,b1表示第一层的偏置,W2表示第二层节点的权重矩阵,b2表示第二层的偏置,W3表示第三层节点的权重矩阵,b3表示第三层的偏置,h1,h2,h3分别表示第一层、第二层和第三层输出的表征。为elu激活函数。两个第一多层感知机最终输出的表征分别为ht和hy。经过训练后,期望ht仅与治疗策略相关,hy仅与治疗效果相关。
正交损失模块用于对深度表征学习模块输出的策略表征ht和效果表征hy进行正交化处理,消除同时影响治疗策略和治疗结果的混淆性因素。具体的,正交损失模块对深度表征学习模块输出的策略表征ht和效果表征hy进行正交化处理,通过对输出的正交化结果最小化,可以去掉会同时影响治疗策略和治疗结果的混淆性因素,从而解决治疗选择偏差问题。正交损失模块对表征ht,hy进行正交化的计算公式如下:
治疗策略预测模块用于对深度表征学习模块输出的策略表征ht进行拟合,确保策略表征ht与治疗策略相关。治疗策略预测模块为第一SoftMax输出层,第一SoftMax输出层的神经元个数为nt,nt为治疗方案集D的方案总数,输出层中数值最大的节点下标即为预测的治疗策略,治疗策略预测模块通过以下公式进行计算:
ti=φ(Wtht+bt)i,(i=1,…,nt),
治疗策略预测对抗性模块用于对深度表征学习模块输出的效果表征hy进行拟合,确保效果表征hy与治疗策略无关。治疗策略预测对抗性模块为第二SoftMax输出层,第二SoftMax输出层的神经元个数也为nt,治疗策略预测对抗性模块通过以下公式进行计算:
tanti_ti=φ(Wanti_t+hy+banti_t)i,(i=1,…,nt),
其中,效果表征hy表示输入层,Wanti_t表示权重矩阵,banti_t表示偏置,tanti_ti表示采用第i个策略的可能性,yanti_t表示预测的治疗策略。表示‘SoftMax’激活函数,argmax表示取向量中最大值的下标。
治疗效果预测模块用于对深度表征学习模块输出的效果表征hy进行处理得到不同治疗策略下个体的治疗效果。治疗效果预测模块由nt个独立且结构相同的第二多层感知机组成。每个第二多层感知机的结构设定为两层,设定第一层输出no1个节点,第二层输出1个节点,第二多层感知机通过以下公式进行计算。
ho1=σ(Wo1hy+bo1),
ho2=Wo2ho1+bo2,
其中,效果表征hy表示输入层,Wo1表示第一层节点的权重矩阵,bo1代表第一层的偏置,Wo2表示第二层节点的权重矩阵,bo2代表第二层的偏置,ho1,ho2分别表示第一层和第二层的输出。为elu激活函数。本模块最终输出nt个ho2值,表示为向量代表不同治疗策略下个体的治疗效果。
结合以上五个模块,完成最终反事实推理模型单元的构建。数据输入单元向模型单元输入训练集,经过基于多层感知机的深度表征学习模块的特征提取分别输出表征ht(与治疗策略相关)和表征hy(与治疗效果相关)。ht和hy通过正交损失模块去掉表征中会同时影响治疗策略和治疗结果的混淆性因素。治疗策略预测模块以ht为输入,治疗策略预测对抗性模块以hy为输入,分别输出对于真实世界治疗策略的预测。同时治疗效果预测模块以hy为输入,输出对于不同治疗策略下治疗效果的预测。
数据输入单元用于向反事实推理模型单元输入训练数据集以对反事实推理模型单元进行训练的具体方法为:
将数据集按照一定比例划分为训练集、测试集和验证集。根据需求将数据集中的数据随机打乱后(自然状态、治疗方案、治疗效果需一一对应),按照a:b:c的比例划分为训练集、测试集和验证集,其中a,b,c为整数。
利用训练集训练基于深度表征学习的反事实推理模型。
通过测试集和验证集对基于深度表征学习的反事实推理模型进行验证。
其中,将所述训练集输入所述反事实推理模型单元对其进行训练的具体方法为:
选择交叉熵函数作为治疗策略预测模块的损失函数,选择准确率作为治疗策略预测模块的评价指标,其中,
其中,treatment为治疗策略预测模块的损失函数,nt为治疗方案集D的方案总数,nx表示输入样本的数目,Tij表示第j位个体在第i种治疗方案的真实标签数据,tij表示模型预测的第j位个体采用第i个策略的可能性,
其中NA是被模块预测正确的标签数据的总数,N是所有标签数据的总数。
选择交叉熵函数的负值作为治疗策略预测对抗性模块的损失函数,选择准确率作为治疗策略预测对抗性模块的评价指标,其中,
其中,anti_treatment为治疗策略预测对抗性模块的损失函数,nt为治疗方案集D的方案总数,nx表示输入样本的数目,Tij表示第j位个体在第i种治疗方案的真实标签数据,anti_tij表示模型预测的第j位个体采用第i个策略的可能性,
其中NA是被模块预测正确的标签数据的总数,N是所有标签数据的总数。
选择绝对误差函数作为治疗效果预测模块的损失函数,
应用时,反事实推理模型单元首先利用深度表征学习模块从真实世界数据中分别提取表征ht和表征hy。表征ht和表征hy通过治疗策略预测模块、治疗策略预测对抗性模块和正交损失模块去掉会同时影响治疗策略和治疗结果的混淆性因素,使得表征ht仅与治疗策略相关,表征hy仅与治疗效果相关。最后治疗效果预测模块以hy为输入,输出对于不同治疗策略下治疗效果的预测。
当完成模型训练后,将预测的个体状态输入训练好的反事实推理模型单元中,模型单元能够根据个体状态输出不同的医疗策略下的医疗结果预测。
以现有的IHDP数据集,分别采用本发明的设备以及现有的倾向性评分匹配(PSM)设备和普通最小二乘法(OLS)回归设备进行对比。IHDP数据集是2011年Hill构建并公开的婴儿健康与发展计划数据集(the Infant Health and Development Program,IHDP),是一项针对低体重早产儿的随机实验,旨在研究专家家访对三岁以下儿童未来认知测验成绩的影响。IHDP数据集包含747个婴儿样本、是否接受家访的标签、其他25个描述孩子及其母亲属性的特征、以及1000次在接受家访和未接受家访时对认知能力的仿真结果。
对于个体化治疗效果预测的评估,IHDP数据集存在仿真结果,所以用平均治疗效应(average treatment effect error,ATE)和异质效应估算精度(Precision in theestimation of heterogeneous effect,PEHE)来作为评估指标,ATE和PEHE越小就说明预测结果越准确。两者计算公式如下:
其中,Y1(xi)表示在治疗干预下的仿真结果,Y0(xi)表示无治疗干预下的仿真结果,y1(xi)表示模型预测的有治疗干预的结果,y0(xi)表示模型预测的无治疗干预的结果。对比结果如下,可见,本发明的设备预测效果更好。
表1IHDP数据集上本发明的预测设备与对比设备的表现
模型 | PEHE(测试集) | ATE(测试集) | PEHE(验证集) | ATE(验证集) |
本发明设备 | 1.420±1.014 | 0.200±0.189 | 1.414±1.053 | 0.245±0.257 |
PSM设备 | 7.188±2.679 | 0.847±0.850 | 7.290±3.389 | 0.821±0.971 |
(OLS)回归设备 | 10.280±3.794 | 0.730±0.410 | 5.245±0.986 | 0.943±0.625 |
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (9)
1.一种基于深度表征学习的反事实推理设备,其特征在于,包含:基于深度表征学习的反事实推理模型单元和数据输入单元;
所述反事实推理模型单元包括:
深度表征学习模块,用于从输入特征中提取仅与治疗策略相关的策略表征ht和仅与治疗效果相关的效果表征hy;
正交损失模块,用于对所述深度表征学习模块输出的所述策略表征ht和所述效果表征hy进行正交化处理,消除同时影响治疗策略和治疗结果的混淆性因素;
治疗策略预测模块,用于对所述深度表征学习模块输出的所述策略表征ht进行拟合,确保所述策略表征ht与治疗策略相关;
治疗策略预测对抗性模块,用于对所述深度表征学习模块输出的所述效果表征hy进行拟合,确保效果表征hy与治疗策略无关;
治疗效果预测模块,用于对所述深度表征学习模块输出的所述效果表征hy进行处理得到不同治疗策略下个体的治疗效果;
所述数据输入单元用于向所述反事实推理模型单元输入训练数据集以对所述反事实推理模型单元进行训练,所述数据集包括:描述个体特征的数据的自然状态集Θ={θ1,θ2,…,θn}、对个体可能采取的不同治疗策略的治疗策略集D={d1,d2,…,dm}和治疗效果集O={oij},(i=1,…,n;j=1,…,m),其中oij即个体在真实自然状态θi下采取策略dj时的治疗效果;
所述数据输入单元还用于向训练好的所述反事实推理模型单元输入待预测的个体状态以得到预测结果。
2.根据权利要求1所述的基于深度表征学习的反事实推理设备,其特征在于,
所述深度表征学习模块包括两个独立且结构相同的第一多层感知机,其中一个用于提取所述策略表征ht,另一个用于提取所述效果表征hy;
所述第一多层感知机的结构设定为三层,以所述数据集中的数据作为所述第一多层感知机的输入层;
设定第一层输出ni1个节点,第二层输出ni2个节点,第三层输出ni3个节点,所述第一多层感知机通过以下公式进行计算:
h1=σ(W1x+b1),
h2=σ(W2h1+b2),
h3=σ(W3h2+b3),
6.根据权利要求5所述的基于深度表征学习的反事实推理设备,其特征在于,
所述治疗效果预测模块由nt个独立且结构相同的第二多层感知机组成;
每个所述第二多层感知机的结构设定为两层,设定第一层输出no1个节点,第二层输出1个节点,所述第二多层感知机通过以下公式进行计算;
ho1=σ(Wo1hy+bo1),
ho2=Wo2ho1+bo2,
其中,所述效果表征hy表示输入层,Wo1表示第一层节点的权重矩阵,bo1代表第一层的偏置,Wo2表示第二层节点的权重矩阵,bo2代表第二层的偏置,ho1,ho2分别表示第一层和第二层的输出。
7.根据权利要求6所述的基于深度表征学习的反事实推理设备,其特征在于,
所述数据输入单元用于向所述反事实推理模型单元输入训练数据集以对所述反事实推理模型单元进行训练的具体方法为:
将所述数据集按照一定比例划分为训练集、测试集和验证集;
将所述训练集输入所述反事实推理模型单元对其进行训练;
将所述测试集和所述验证集输入所述反事实推理模型单元对其进行验证。
8.根据权利要求7所述的基于深度表征学习的反事实推理设备,其特征在于,
将所述训练集输入所述反事实推理模型单元对其进行训练的具体方法为:
选择交叉熵函数作为所述治疗策略预测模块的损失函数,选择准确率作为所述治疗策略预测模块的评价指标,其中,
其中,treatment为所述治疗策略预测模块的损失函数,nt为治疗方案集D的方案总数,nx表示输入样本的数目,Tij表示第j位个体在第i种治疗方案的真实标签数据,tij表示模型预测的第j位个体采用第i个策略的可能性;
选择交叉熵函数的负值作为所述治疗策略预测对抗性模块的损失函数,选择准确率作为所述治疗策略预测对抗性模块的评价指标,其中,
其中,anti_treatment为所述治疗策略预测对抗性模块的损失函数,nt为治疗方案集D的方案总数,nx表示输入样本的数目,Tij表示第j位个体在第i种治疗方案的真实标签数据,anti_tij表示模型预测的第j位个体采用第i个策略的可能性;
选择绝对误差函数作为治疗效果预测模块的损失函数,
将所述训练集输入所述反事实推理模型单元;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010719276.0A CN111882066B (zh) | 2020-07-23 | 2020-07-23 | 基于深度表征学习的反事实推理设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010719276.0A CN111882066B (zh) | 2020-07-23 | 2020-07-23 | 基于深度表征学习的反事实推理设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111882066A true CN111882066A (zh) | 2020-11-03 |
CN111882066B CN111882066B (zh) | 2023-11-14 |
Family
ID=73156170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010719276.0A Active CN111882066B (zh) | 2020-07-23 | 2020-07-23 | 基于深度表征学习的反事实推理设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111882066B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112863622A (zh) * | 2021-01-18 | 2021-05-28 | 北京大学 | 利用历史对照数据的双稳健临床试验数据处理方法及系统 |
CN112988851A (zh) * | 2021-04-27 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 反事实预测模型数据处理方法、装置、设备及存储介质 |
CN113539517A (zh) * | 2021-08-05 | 2021-10-22 | 浙江大学 | 时序干预效果的预测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110383389A (zh) * | 2017-03-01 | 2019-10-25 | 怡素数字健康有限公司 | 心理治疗分类方法 |
CN110515732B (zh) * | 2019-08-23 | 2021-06-18 | 中国人民解放军国防科技大学 | 一种基于资源受限机器人深度学习推理的任务分配方法 |
CN111276187B (zh) * | 2020-01-12 | 2021-09-10 | 湖南大学 | 一种基于自编码器的基因表达谱特征学习方法 |
CN111223577A (zh) * | 2020-01-17 | 2020-06-02 | 江苏大学 | 一种基于深度学习的协同抗肿瘤多药组合效果预测方法 |
-
2020
- 2020-07-23 CN CN202010719276.0A patent/CN111882066B/zh active Active
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112863622A (zh) * | 2021-01-18 | 2021-05-28 | 北京大学 | 利用历史对照数据的双稳健临床试验数据处理方法及系统 |
CN112863622B (zh) * | 2021-01-18 | 2024-03-22 | 北京大学 | 利用历史对照数据的双稳健临床试验数据处理方法及系统 |
CN112988851A (zh) * | 2021-04-27 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 反事实预测模型数据处理方法、装置、设备及存储介质 |
CN112988851B (zh) * | 2021-04-27 | 2021-07-27 | 腾讯科技(深圳)有限公司 | 反事实预测模型数据处理方法、装置、设备及存储介质 |
CN113539517A (zh) * | 2021-08-05 | 2021-10-22 | 浙江大学 | 时序干预效果的预测方法 |
CN113539517B (zh) * | 2021-08-05 | 2024-04-16 | 浙江大学 | 时序干预效果的预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111882066B (zh) | 2023-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wilson et al. | Ten simple rules for the computational modeling of behavioral data | |
CN111882066B (zh) | 基于深度表征学习的反事实推理设备 | |
CN106295186A (zh) | 一种基于智能推理的辅助疾病诊断的方法与系统 | |
KR102285665B1 (ko) | 학습 커리큘럼 제공 방법, 시스템 및 장치 | |
CN110502636A (zh) | 一种面向主客观试题的联合建模及挖掘方法及系统 | |
CN110111885B (zh) | 属性预测方法、装置、计算机设备及计算机可读存储介质 | |
Somoza et al. | A neural-network approach to predicting admission decisions in a psychiatric emergency room | |
Heller et al. | Using the cross-match test to appraise covariate balance in matched pairs | |
CN109935337A (zh) | 一种基于相似性度量的病案查找方法及系统 | |
Intisar et al. | Cluster analysis to estimate the difficulty of programming problems | |
CN111418024A (zh) | 康复状况评估与管理系统及相关方法 | |
Iraji | Prediction of post-operative survival expectancy in thoracic lung cancer surgery with soft computing | |
CN111477337A (zh) | 基于个体自适应传播网络的传染病预警方法、系统及介质 | |
CN112329921B (zh) | 基于深度表征学习和强化学习的利尿剂剂量推理设备 | |
US20160342901A1 (en) | Method of state transition prediction and state improvement of liveware, and an implementation device of the method | |
Nurmaini et al. | Breast cancer classification using deep learning | |
CN113705092A (zh) | 基于机器学习的疾病预测方法及装置 | |
Mumtaz et al. | Evaluation of three neural network models using Wisconsin breast cancer database | |
Chandna et al. | Pattern recognition of vertical strabismus using an artificial neural network (StrabNet©) | |
Vinothini et al. | Heart disease prediction | |
Fancsali | Constructing variables that support causal inference | |
Payá et al. | Development of an artificial neural network for helping to diagnose diseases in urology | |
Setiawan et al. | Software Development to Detecting the use of Mask using Convolutional Neural Networks | |
Stensmo | Adaptive Automated Diagnosis | |
Toledo et al. | Check for updates Data Mining Application for the Generation of User Profiles in Serious Games Aimed at Attention and Memory Training |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |