CN112085252B - 一种关于集合类型决策效果的反事实预测方法 - Google Patents
一种关于集合类型决策效果的反事实预测方法 Download PDFInfo
- Publication number
- CN112085252B CN112085252B CN202010769250.7A CN202010769250A CN112085252B CN 112085252 B CN112085252 B CN 112085252B CN 202010769250 A CN202010769250 A CN 202010769250A CN 112085252 B CN112085252 B CN 112085252B
- Authority
- CN
- China
- Prior art keywords
- variable
- decision
- hidden
- confusion
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000000694 effects Effects 0.000 title claims abstract description 38
- 238000009826 distribution Methods 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000013528 artificial neural network Methods 0.000 claims abstract description 10
- 238000010801 machine learning Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 14
- 238000012512 characterization method Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 4
- 239000002994 raw material Substances 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 238000009776 industrial production Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Pure & Applied Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Optimization (AREA)
- Operations Research (AREA)
- Computational Mathematics (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computer Hardware Design (AREA)
- Development Economics (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Geometry (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种关于集合类型决策效果的反事实预测方法,属于机器学习技术领域。本发明将决策变量与混淆变量去相关问题转化为更低维度的决策变量隐表征和混淆变量去相关问题,采用基于深度神经网络的概率密度比估计方法,将观测数据样本对应的决策变量隐表征和混淆变量的联合分布与决策变量隐表征和混淆变量无关联的联合分布的概率密度比作为决策变量隐表征和混淆变量构成的数据点的权重。采用变分样本重加权方法把决策变量隐表征和混淆变量构成的数据点的权重综合为观测数据中样本的权重,利用加权后的观测数据样本训练反事实预测模型可对个体在特定决策影响下的效果进行反事实预测。本发明提高了反事实预测的准确度,有很高的应用价值。
Description
技术领域
本发明属于机器学习技术领域,特别提出一种关于集合类型决策效果的反事实预测方法。
背景技术
利用大量的观测数据,对异质性个体被施以不同决策后所产生的效果进行反事实预测是一个在许多领域都有重要意义的问题。通过预测不同决策所产生的效果,可以帮助相关领域的技术人员做更准确的决策,例如在工业生产领域中对某一种产品选择一系列加工工序,使得产品的品质达到最理想的情况。
为了预测不同决策所产生的效果,随机对照试验是解决此类反事实预测问题的标准方法,即对研究对象随机地分配决策,并观察其效果。如在工业生产中,尝试利用不同的加工工序,并测试加工后产品的品质(强度、纯度等指标),从而指导选择最优的一系列工序。但是随机对照试验往往代价很高,会消耗大量时间和成本。而现如今大量的观测数据的积累,例如过去的时间里人们根据经验对产品选择工序加工,并测量品质的记录。这些观测数据给出了一种替代方法,就是利用机器学习技术从中学习得到一个对不同决策的效果进行反事实预测的模型。监督学习的方法可以被直接利用于对模型的训练,但是由于在观测数据中,决策的选择往往受到混淆变量的影响。直接使用监督学习的技术,学习从决策到效果的模型可能会错误地把混淆变量对效果的影响归为决策变量的影响。例如观测数据中某类产品原材料的质量条件(混淆变量)不佳,因此采用了一些的加工工序(决策变量)来处理之后,产品品质(结果变量)依然低下,这可能会使预测模型误以为是加工工序引起的低品质。因此为了能准确地评估不同决策变量影响下的效果,需要对观测数据进行去混淆偏差处理,即去除混淆变量与决策变量之间的相关性。在此去除混淆偏差的数据上训练得到的机器学习模型,能够更准确地对不同决策对个体影响的效果进行反事实预测。在工业生产中可以更准确地估计出不同加工工序下的品质,从而选择最优的加工工序。
现有的对不同决策产生的效果的反事实预测技术为了对观测数据进行去混淆偏差处理,采用了以重要度采样权重对样本进行加权的方法,使得加权后的数据中决策变量和混淆变量相关性降低。这类技术的不足之处在于其只解决决策变量为单变量下的反事实预测,应用范围过窄。而实际中很多决策是基于高维度的向量进行的,例如选择的加工方案是若干道工序的集合,如果用现有的对单变量决策的效果的反事实预测方法处理这类问题,可以用二进制编码的方式把高维向量转化为一个单变量的整数。但是这样的做法,会引起复杂度过高的问题。
发明内容
本发明的目的是为克服已有技术的不足之处,提出一种关于集合类型决策效果的反事实预测方法。利用本发明方法训练得到的反事实预测模型,相比于普通的监督学习得到的反事实预测模型,对各个对象个体在施加不同决策下的效果的反事实预测误差会有明显的降低,提高了反事实预测的准确度,有很高的应用价值。
本发明提出一种关于集合类型决策效果的反事实预测方法,其特征在于,包括以下步骤:
1)收集过去设定时间段内的观测数据样本,观测数据样本表示为{(xi,ti,yi)}1≤i≤n,其中,xi为第i个观测数据样本的混淆变量,ti为第i个观测数据样本的决策变量,yi为第i个观测数据样本的效果变量,n为观测数据样本总数;
所有样本的xi组成混淆变量X,所有样本的ti组成决策变量其中p为决策变量的维度,每一维为一个0-1变量,值为1代表该维度在对应的决策集合中,值为0代表该维度不在对应的决策集合中,所有样本的yi组成效果变量y;
2)构建一个变分自编码器学习决策变量的隐表征并进行训练,利用训练完毕的变分自编码器得到决策变量的隐表征;具体步骤如下:
2-1)构建一个变分自编码器,所述变分自编码器包括编码器qφ(z|T)和解码器两部分,其中z代表决策变量对应的隐表征;编码器和解码器的参数训练是通过最大化似然估计的下界得到,似然估计的下界为:
训练的方式采用了分批梯度下降的方式,p(z)是变分自编码器定义的隐表征的先验分布;编码器输出的隐表征的分布qφ(z|T)是一个隐空间上的各维独立的高斯分布,qφ(z|T)=其中,μφ(T)为该高斯分布的中心,σφ(T)为各维的方差;
参数训练收敛后,得到训练完毕的编码器和解码器;
2-2)将每个观测数据样本的决策变量ti输入训练完毕的编码器qφ(z|T)得到该决策变量ti的隐表征的分布;最终,利用训练完毕的编码器得到观测数据样本对应的决策变量隐表征与混淆变量的联合分布中采样得到的数据点{(xi,z)}1≤i≤n,z~qφ(z|ti);决策变量隐表征与混淆变量无关联的联合分布中采样得到的数据点为{(xi,z)}1≤i≤n,z~p(z);
3)利用步骤2-2)得到的数据点计算在决策变量隐表征和混淆变量联合空间上的数据点的权重函数wz(x,z);具体步骤如下:
3-1)为观测数据样本对应的决策变量隐表征与混淆变量的联合分布采样得到的数据点{(xi,z)}1≤i≤n,z~qφ(z|ti)打上正例的标签L=1,为决策变量隐表征与混淆变量无关联的联合分布采样得到的每个数据点{(xi,z)}1≤i≤n,z~p(z)打上负例的标签L=0;
3-2)利用一个基于深度神经网络的二分类器对每个数据点及其对应标签进行训练,训练收敛后,将任一决策变量隐表征与混淆变量构成的数据点(x,z)输入该二分类器,该二分类器计算得到该数据点分别属于正例的概率和负例的概率/>其中,二分类器训练中最小化的目标函数为:
3-3)计算该数据点(x,z)的权重,表达式如下:
4)利用步骤3)的结果,计算每个观测数据样本对应的变分样本重加权VSR权重,其中第i个观测数据样本对应的VSR权重wi计算表达式如下:
其中,从第i个观测数据样本中的决策变量ti对应的隐表征分布qφ(z|ti)采样出m个点z1,z2,...,zm,则
5)为每个观测数据样本赋予步骤4)得到的VSR权重之后,得到对应的加权后的观测数据样本{wi(xi,ti,yi)}1≤i≤n;然后利用所有加权后的观测数据样本训练一个机器学习模型作为预测模型,得到训练完毕的预测模型;
其中,该预测模型为一个深度神经网络其最小化的目标函数为:
其中,为损失函数,/>是以θp为参数的机器学习模型;
6)利用步骤5)训练完毕的预测模型,对于一个混淆变量为X′、决策变量为T′的测试样本,将混淆变量X′与决策变量T′输入步骤5)训练完毕的预测模型,该模型输出 即为对该测试样本效果的反事实预测结果。
本发明的特点及有益效果:
本发明为了降低去除混淆偏差过程的复杂性,假设了集合类型的决策变量具有低维度的隐结构,可以用低维度的隐表征来表示。例如工序的组合选择往往遵循一些的原则。从而将原来的决策变量与混淆变量去相关问题,转化为了更低维度的决策变量隐表征和混淆变量去相关问题。为了计算令决策变量隐表征和混淆变量去相关的权重,本发明采用了基于深度神经网络的概率密度比估计的方法,计算观测数据对应的决策变量隐表征和混淆变量的联合分布与决策变量隐表征和混淆变量无关联联合分布的概率密度比作为决策变量隐表征和混淆变量构成的数据点的权重。由于一个决策变量所对应的隐表征是一个隐空间上的分布,本发明提出了一种变分样本重加权方法把分布中各点的权重综合为样本权重的方法。通过样本加权的方式有效地降低了观测数据中混淆变量与决策变量的相关性,去除了观测数据中的混淆偏差,使得在加权后的数据上训练得到的反事实预测模型可以更准确地对个体在特定决策影响下的效果进行反事实预测。本发明相对于现有方法的优势在于利用了集合类型的决策变量的具有低维隐结构的性质,把原始高维的决策变量转化为了低维的隐表征,并去除决策变量隐表征与混淆变量的相关性,解决了现有方法只去除单变量的决策变量和混淆变量相关性的问题。利用本发明方法训练得到的反事实预测模型,相比于普通的监督学习得到的反事实预测模型,对各个对象个体在施加不同决策下的效果的反事实预测误差会有明显的降低。在生产领域中,本发明可以用于对各种产品在不同加工工序的选择方案下的品质进行反事实预测,具有更小的预测误差,从而能帮助选择使产品品质达到最优的工序选择方案。
附图说明
图1是本发明方法的整体流程图。
具体实施方式
本发明提出一种关于集合类型决策效果的反事实预测方法,下面结合附图和具体实施例详细说明如下。
本发明提出一种关于集合类型决策效果的反事实预测方法,整体流程如图1所示,包括以下步骤:
1)收集过去设定时间段内的观测数据。观测数据包括三个部分,混淆变量X∈x(例如工业生产领域中产品的各项参数指标,例如原材料的质量、成分等。其对后续加工工序选择的决策以及加工后产品品质都有影响),决策变量(例如工业生产领域中工序组成的集合,p为决策变量的维度,每一维代表了某一种工序是否被选择在集合中,值为1代表对应工序在集合中,值为0代表对应工序不在集合中),以及效果变量/>(例如工业生产领域中用所选择的工序加工后的产品品质,如强度、纯度等)。因此,观测数据样本可以表示为{(xi,ti,yi)}1≤i≤n,其中,xi为第i个观测数据样本的混淆变量,ti为第i个观测数据样本的决策变量,yi为第i个观测数据样本的效果变量,n为观测数据样本总数;
2)假设高维度的决策变量往往是由低维的隐表征所产生的,而隐表征和决策变量之间转化的关系往往很复杂,因此本发明使用了变分自编码器学习决策变量的隐表征。具体步骤如下:
2-1)设置变分自编码器包括编码器qφ(z|T)和解码器两部分(z是决策变量对应的隐表征,T是决策变量)。编码器和解码器的构成基于深度神经网络,其参数的训练是通过最大化似然估计的下界得到。似然估计的下界为:
训练的方式采用了分批梯度下降的方式,p(z)是变分自编码器定义的隐表征的先验分布,通常定义为高斯分布编码器输出的隐表征的分布qφ(z|T)是一个隐空间上的各维独立的高斯分布,具体输出结果为高斯分布的中心μφ(T)和各维的方差σφ(T),即
参数训练收敛后,得到训练完毕的编码器和解码器。
2-2)将每个观测数据样本的的决策变量ti输入训练完毕的编码器qφ(z|T),得到该决策变量ti的隐表征的分布;最终利用训练完毕编码器可以得到观测数据样本对应的决策变量隐表征与混淆变量的联合分布中采样得到的数据点{(xi,z)}1≤i≤n,z~qφ(z|ti)。而决策变量隐表征与混淆变量无关联的联合分布中采样得到的数据点为{(xi,z)}1≤i≤n,z~p(z)。
3)利用步骤2-2)得到的两组决策变量隐表征和混淆变量的联合分布中采样得到的数据点计算在决策变量隐表征和混淆变量联合空间上的数据点的权重函数wz(x,z)。具体步骤如下:
3-1)为观测数据样本对应的决策变量隐表征与混淆变量的联合分布中采样得到的每个数据点{(xi,z)}1≤i≤n,z~qφ(z|ti)打上正例的标签L=1,为决策变量隐表征与混淆变量无关联的联合分布中采样得到的每个数据点{(xi,z)}1≤i≤n,z~p(z)打上负例的标签L=0。
3-2)计算定义在决策变量隐表征和混淆变量联合空间上的权重函数wz(x,z)。权重函数wz(x,z)计算为所述两个联合分布的概率密度比。由于概率分布往往很复杂,本发明借助了深度神经网络强大的预测能力来计算概率密度比。具体地,将每个数据点和对应标签放入一个基于深度神经网络的二分类器并训练,训练收敛后,该二分类器可以对给定的决策变量隐表征与混淆变量构成的数据点给出其分别属于正例的概率和负例的概率/>二分类器训练中最小化的目标函数为:
3-3)为了消除决策变量隐表征和混淆变量的相关性。对于决策变量隐表征和混淆变量构成的一个数据点(x,z),其权重定义为上述两个分布的概率密度比,计算方法如下:
4)利用步骤3)得到的权重函数wz(x,z),为每个观测数据样本计算变分样本重加权(VSR)权重。由于一个决策变量ti所对应的隐表征不是一个数据点,而是一个分布,因而要考虑到该分布内所有数据点的权重,为第i个观测数据中的样本(对应混淆变量xi和决策变量ti)计算对应的VSR权重wi。本发明设计的变分样本重加权(VSR)权重算法计算样本权重如下:
具体地,从第i个观测数据样本中的决策变量ti对应的隐表征分布qφ(z|ti)采样出m(m可取50以上的数,每个样本都一致)个点z1,z2,...,zm。可以计算为/>
5)为每个观测数据样本赋予步骤4)中得到的VSR权重之后,混淆变量与决策变量的相关性很大程度上被削弱了。本发明用此加权后的数据{wi(xi,ti,yi)}1≤i≤n,训练出一个机器学习模型作为预测模型用于给定混淆变量和决策变量,预测决策的效果。具体地,考虑到效果与决策变量、混淆变量之间的关系会很复杂,往往不能用简单的线性模型来刻画。因此所用的预测模型为一个深度神经网络其最小化的目标函数为:
是特定任务下的损失函数,对于回归模型来说,可以选择为平方误差。/>是以θp为参数的机器学习模型。
6)利用步骤5)训练完毕的预测模型,对于一个混淆变量为X′的样本个体,反事实预测该个体在被施加决策变量T′下所产生的效果变量y′,需将混淆变量与决策变量一起输入步骤5)中训练完毕的预测模型,得到输出即为对该样本效果的反事实预测结果,在工业生产领域中即得到对应该加工工序的产品品质的预测结果。
Claims (1)
1.一种关于集合类型决策效果的反事实预测方法,用于对产品进行加工工序的选择,其特征在于,包括以下步骤:
1)收集过去设定时间段内的观测数据样本,观测数据样本表示为{(xi,ti,yi)}1≤i≤n,其中,xi为第i个观测数据样本的混淆变量,所述混淆变量为原材料的质量条件,ti为第i个观测数据样本的决策变量,所述决策变量为加工工序,yi为第i个观测数据样本的效果变量,所述效果变量为产品品质,n为观测数据样本总数;
所有样本的xi组成混淆变量X,所有样本的ti组成决策变量其中p为决策变量的维度,每一维为一个0-1变量,值为1代表该维度在对应的决策集合中,值为0代表该维度不在对应的决策集合中,所有样本的yi组成效果变量y;
2)构建一个变分自编码器学习决策变量的隐表征并进行训练,利用训练完毕的变分自编码器得到决策变量的隐表征;具体步骤如下:
2-1)构建一个变分自编码器,所述变分自编码器包括编码器qφ(z|T)和解码器两部分,其中z代表决策变量对应的隐表征;编码器和解码器的参数训练是通过最大化似然估计的下界得到,似然估计的下界为:
训练的方式采用了分批梯度下降的方式,p(z)是变分自编码器定义的隐表征的先验分布;编码器输出的隐表征的分布qφ(z|T)是一个隐空间上的各维独立的高斯分布, 其中,μφ(T)为该高斯分布的中心,σφ(T)为各维的方差;
参数训练收敛后,得到训练完毕的编码器和解码器;
2-2)将每个观测数据样本的决策变量ti输入训练完毕的编码器qφ(z|T)得到该决策变量ti的隐表征的分布;最终,利用训练完毕的编码器得到观测数据样本对应的决策变量隐表征与混淆变量的联合分布中采样得到的数据点{(xi,z)}1≤i≤n,z~qφ(z|ti);决策变量隐表征与混淆变量无关联的联合分布中采样得到的数据点为{(xi,z)}1≤i≤n,z~p(z);
3)利用步骤2-2)得到的数据点计算在决策变量隐表征和混淆变量联合空间上的数据点的权重函数wz(x,z);具体步骤如下:
3-1)为观测数据样本对应的决策变量隐表征与混淆变量的联合分布采样得到的数据点{(xi,z)}1≤i≤n,z~qφ(z|ti)打上正例的标签L=1,为决策变量隐表征与混淆变量无关联的联合分布采样得到的每个数据点{(xi,z)}1≤i≤n,z~p(z)打上负例的标签L=0;
3-2)利用一个基于深度神经网络的二分类器对每个数据点及其对应标签进行训练,训练收敛后,将任一决策变量隐表征与混淆变量构成的数据点(x,z)输入该二分类器,该二分类器计算得到该数据点分别属于正例的概率和负例的概率/>其中,二分类器训练中最小化的目标函数为:
3-3)计算该数据点(x,z)的权重,表达式如下:
4)利用步骤3)的结果,计算每个观测数据样本对应的变分样本重加权VSR权重,其中第i个观测数据样本对应的VSR权重wi计算表达式如下:
其中,从第i个观测数据样本中的决策变量ti对应的隐表征分布qφ(z|ti)采样出m个点z1,z2,...,zm,则
5)为每个观测数据样本赋予步骤4)得到的VSR权重之后,得到对应的加权后的观测数据样本{wi(xi,ti,yi)}1≤i≤n;然后利用所有加权后的观测数据样本训练一个机器学习模型作为预测模型,得到训练完毕的预测模型;
其中,该预测模型为一个深度神经网络其最小化的目标函数为:
其中,为损失函数,/>是以θp为参数的机器学习模型;
6)利用步骤5)训练完毕的预测模型,对于一个混淆变量为X′、决策变量为T′的测试样本,将混淆变量X′与决策变量T′输入步骤5)训练完毕的预测模型,该模型输出 即为对该测试样本效果的反事实预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010769250.7A CN112085252B (zh) | 2020-08-03 | 2020-08-03 | 一种关于集合类型决策效果的反事实预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010769250.7A CN112085252B (zh) | 2020-08-03 | 2020-08-03 | 一种关于集合类型决策效果的反事实预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112085252A CN112085252A (zh) | 2020-12-15 |
CN112085252B true CN112085252B (zh) | 2024-01-05 |
Family
ID=73735504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010769250.7A Active CN112085252B (zh) | 2020-08-03 | 2020-08-03 | 一种关于集合类型决策效果的反事实预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112085252B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2593691B (en) * | 2020-03-30 | 2022-08-24 | Imagination Tech Ltd | Efficient encoding methods |
CN112801305B (zh) * | 2021-03-19 | 2021-07-16 | 腾讯科技(深圳)有限公司 | 应对策略预测处理方法、装置、计算机设备和存储介质 |
CN112988851B (zh) * | 2021-04-27 | 2021-07-27 | 腾讯科技(深圳)有限公司 | 反事实预测模型数据处理方法、装置、设备及存储介质 |
CN113705720B (zh) * | 2021-09-08 | 2024-05-14 | 中国科学院国家天文台 | 机器学习中应用权重修正来减低加权训练偏差的方法 |
CN114239744B (zh) * | 2021-12-21 | 2024-07-02 | 南京邮电大学 | 一种基于变分生成对抗网络的个体处理效应评估方法 |
CN115270634B (zh) * | 2022-08-04 | 2023-10-20 | 南京航空航天大学 | 一种适用于自主空战领域的反事实解释生成方法及系统 |
CN116151485B (zh) * | 2023-04-18 | 2023-07-25 | 中国传媒大学 | 反事实预测和效果评估方法、系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110232480A (zh) * | 2019-03-01 | 2019-09-13 | 电子科技大学 | 利用变分的正则化流实现的项目推荐方法及模型训练方法 |
CN111258992A (zh) * | 2020-01-09 | 2020-06-09 | 电子科技大学 | 一种基于变分自编码器的地震数据扩充方法 |
CN111325598A (zh) * | 2020-01-22 | 2020-06-23 | 深圳大学 | 一种物品推荐方法、装置及终端设备 |
CN111476363A (zh) * | 2020-03-13 | 2020-07-31 | 清华大学 | 区分化变量去相关的稳定学习方法及装置 |
-
2020
- 2020-08-03 CN CN202010769250.7A patent/CN112085252B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110232480A (zh) * | 2019-03-01 | 2019-09-13 | 电子科技大学 | 利用变分的正则化流实现的项目推荐方法及模型训练方法 |
CN111258992A (zh) * | 2020-01-09 | 2020-06-09 | 电子科技大学 | 一种基于变分自编码器的地震数据扩充方法 |
CN111325598A (zh) * | 2020-01-22 | 2020-06-23 | 深圳大学 | 一种物品推荐方法、装置及终端设备 |
CN111476363A (zh) * | 2020-03-13 | 2020-07-31 | 清华大学 | 区分化变量去相关的稳定学习方法及装置 |
Non-Patent Citations (1)
Title |
---|
陈亚瑞 ; 蒋硕然 ; 杨巨成 ; 赵婷婷 ; 张传雷 ; .混合变分自编码.计算机研究与发展.2020,(第01期),138-146. * |
Also Published As
Publication number | Publication date |
---|---|
CN112085252A (zh) | 2020-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112085252B (zh) | 一种关于集合类型决策效果的反事实预测方法 | |
CN109060001B (zh) | 一种基于特征迁移学习的多工况过程软测量建模方法 | |
CN111079836B (zh) | 基于伪标签方法和弱监督学习的过程数据故障分类方法 | |
CN107992976B (zh) | 热点话题早期发展趋势预测系统及预测方法 | |
CN111222290A (zh) | 一种基于多参数特征融合的大型设备剩余使用寿命预测方法 | |
CN108875772B (zh) | 一种基于堆叠稀疏高斯伯努利受限玻尔兹曼机和强化学习的故障分类模型及方法 | |
CN111191726B (zh) | 一种基于弱监督学习多层感知器的故障分类方法 | |
CN110287975B (zh) | 基于nsst形态特征及深度kelm的浮选加药异常检测方法 | |
CN111768000A (zh) | 在线自适应微调深度学习的工业过程数据建模方法 | |
CN115096627B (zh) | 一种液压成形智能装备制造过程故障诊断与运维方法及系统 | |
CN114692677B (zh) | 一种基于多目标特征选择的焊接缺陷识别方法 | |
CN114004346A (zh) | 基于门控堆叠同构自编码器的软测量建模方法及存储介质 | |
CN111709577B (zh) | 基于长程相关性gan-lstm的rul预测方法 | |
CN115511012B (zh) | 一种最大熵约束的类别软标签识别训练方法 | |
CN111079926A (zh) | 基于深度学习的具有自适应学习率的设备故障诊断方法 | |
CN117349595A (zh) | 一种面向工业场景的极端少样本故障诊断方法 | |
CN112001115A (zh) | 一种半监督动态软测量网络的软测量建模方法 | |
CN116662925A (zh) | 一种基于加权稀疏神经网络工业过程软测量方法 | |
CN111814883A (zh) | 一种基于异质集成的标签噪声纠正方法 | |
CN114879628A (zh) | 基于对抗局部最大均值差异的多模态工业过程故障诊断方法 | |
CN117392450A (zh) | 一种基于进化多尺度特征学习的钢铁材料质量解析方法 | |
CN111916204A (zh) | 一种基于自适应稀疏深度神经网络的脑疾病数据评估方法 | |
CN115794805A (zh) | 一种中低压配网量测数据补齐方法 | |
Anirudh et al. | A Hybrid Model for Accurate Prediction of Progression in Parkinson’s Disease | |
CN118395363B (zh) | 基于数据增强的有源配电网异常状态感知方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |