CN116757293A - 模型修正方法、装置、设备和存储介质 - Google Patents
模型修正方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN116757293A CN116757293A CN202310348068.8A CN202310348068A CN116757293A CN 116757293 A CN116757293 A CN 116757293A CN 202310348068 A CN202310348068 A CN 202310348068A CN 116757293 A CN116757293 A CN 116757293A
- Authority
- CN
- China
- Prior art keywords
- variable
- characteristic
- causal
- model
- sample data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012937 correction Methods 0.000 title claims abstract description 38
- 230000001364 causal effect Effects 0.000 claims abstract description 181
- 238000004458 analytical method Methods 0.000 claims abstract description 52
- 238000012360 testing method Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 28
- 230000008569 process Effects 0.000 claims abstract description 25
- 230000000694 effects Effects 0.000 claims abstract description 13
- 238000012795 verification Methods 0.000 claims description 71
- 238000012549 training Methods 0.000 claims description 37
- 238000004891 communication Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 5
- 238000002715 modification method Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 description 8
- 230000009471 action Effects 0.000 description 3
- 235000019580 granularity Nutrition 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013585 weight reducing agent Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种模型修正方法、装置、设备和存储介质。该方法包括:获取M个样本数据;样本数据基于目标模型对预设的多个测试数据进行数据处理获得;根据M个样本数据,构建与N个特征变量一一对应的N个目标因果模型;对于每个特征变量,通过特征变量对应的目标因果模型对M个样本数据进行因果推断,获得特征变量对应的分析结果;基于分析结果,修正目标模型。本实施例在模型修正的过程中,充分考虑到了样本特征之间的因果关系,为模型的修正提供了正确的参考,以此提高了修正后的模型的预测结果的准确性。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种模型修正方法、装置、设备和存储介质。
背景技术
Bad case是指机器学习模型或深度学习模型得到的预测结果中不符合真实值的案例或样本。例如,通过分类模型确定一个样本的分类结果,若该分类结果错误,则确定该样本为Bad case。
在相关技术中,通常对bad case进行特征重要性分析,根据各个特征的重要性修正模型,例如,对特征进行删除、降低权重、重新衍生等处理。
然而,上述对bad case进行特征重要性分析仅考虑到特征之间的相关关系,这容易给模型的修正提供错误的参考,进而导致修正后的模型的预测结果不够准确。
发明内容
本发明实施例的目的在于提供一种模型修正方法、装置、设备和存储介质,解决现有技术中修正后的模型的预测结果不够准确的技术问题。
为了解决上述技术问题,第一方面,本发明实施例提供了一种模型修正方法,所述方法包括:
获取M个样本数据;所述样本数据基于训练得到的目标模型对预设的验证集数据进行数据处理获得,所述样本数据包括标签变量和N个特征变量,所述标签变量用于表征所述样本数据是否为错误样本,所述特征变量用于表征样本特征,M为正整数,N为大于1的正整数;
根据所述M个样本数据,构建与所述N个特征变量一一对应的N个目标因果模型;
对于每个特征变量,通过所述特征变量对应的目标因果模型对所述M个样本数据进行因果推断,获得所述特征变量对应的分析结果;
基于所述分析结果,修正所述目标模型。
可选地,所述对于每个特征变量,通过所述特征变量对应的目标因果模型对所述M个样本数据进行因果推断,获得所述特征变量对应的分析结果,包括:
对于每个特征变量,通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值;K为大于1的正整数;
将所述K个第一因果效应估计值的平均值,确定为所述特征变量的第二因果效应估计值;
根据M个第二因果效应估计值,确定所述特征变量对应的分析结果。
可选地,所述通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值,包括:
对所述M个样本数据进行数据统计,确定所述特征变量对应的K个特征干预值;
通过所述特征变量对应的目标因果模型,依次设置所述特征变量对应的K个特征干预值,对每个样本数据进行K次因果推断,获得K个第一因果效应估计值。
可选地,所述对于每个特征变量,通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值之后,所述方法还包括:
对于每个样本数据,基于所述样本数据包括的每个特征变量对应的K个第一因果效应估计值,确定每个特征变量对应的不同的特征干预值对所述目标模型预测错误的影响程度;
基于所述目标模型的原始值和目标特征干预值,修正所述样本数据,所述目标特征干预值为所述不同的特征干预值中对所述目标模型预测错误的影响程度最强的特征干预值。
可选地,所述根据M个第二因果效应估计值,确定所述特征变量对应的分析结果,包括:
对所述M个第二因果效应估计值进行假设检验统计,获得检验值;
根据所述检验值与预设的置信度数值之间的大小关系,生成所述特征变量对应的分析结果。
可选地,所述获取M个样本数据,包括:
通过训练得到的目标模型对预设的验证集数据进行数据处理,得到每个验证集样本对应的预测结果;所述验证集数据包括M个验证集样本;
基于所述每个验证集样本对应的预测结果以及每个验证集样本预先标注的真实结果,确定每个验证集样本对应的标签变量;
对所述每个验证集样本对应的预测结果、真实结果和标签变量、以及所述M个验证集样本包括的N个特征变量进行组合,获得所述M个样本数据。
可选地,所述根据所述M个样本数据,构建与所述N个特征变量一一对应的N个目标因果模型,包括:
对于每个特征变量,根据所述M个样本数据训练预设的因果模型,获得所述特征变量对应的目标因果模型;
其中,所述因果模型在训练过程中的结果变量为所述M个样本数据包括的标签变量,所述因果模型在训练过程中的干预变量为所述特征变量,所述因果模型在训练过程中的调整变量包括所述M个样本数据包括的N个特征变量中除所述干预变量之外的特征变量。
第二方面,本发明实施例还提供了一种模型修正装置,包括:
获取模块,用于获取M个样本数据;所述样本数据基于训练得到的目标模型对预设的验证集数据进行数据处理获得,所述样本数据包括标签变量和N个特征变量,所述标签变量用于表征所述样本数据是否为错误样本,所述特征变量用于表征样本特征,M为正整数,N为大于1的正整数;
构建模块,用于根据所述M个样本数据,构建与所述N个特征变量一一对应的N个目标因果模型;
处理模块,用于对于每个特征变量,通过所述特征变量对应的目标因果模型对所述M个样本数据进行因果推断,获得所述特征变量对应的分析结果;
修正模块,用于基于所述分析结果,修正所述目标模型。
可选地,所述处理模块,具体用于:
对于每个特征变量,通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值;K为大于1的正整数;
将所述K个第一因果效应估计值的平均值,确定为所述特征变量的第二因果效应估计值;
根据M个第二因果效应估计值,确定所述特征变量对应的分析结果。
可选地,所述处理模块,还具体用于:
对所述M个样本数据进行数据统计,确定所述特征变量对应的K个特征干预值;
通过所述特征变量对应的目标因果模型,依次设置所述特征变量对应的K个特征干预值,对每个样本数据进行K次因果推断,获得K个第一因果效应估计值。
可选地,所述模型修正装置还包括:
确定模块,用于对于每个样本数据,基于所述样本数据包括的每个特征变量对应的K个第一因果效应估计值,确定每个特征变量对应的不同的特征干预值对所述目标模型预测错误的影响程度;
修正模块,用于基于所述目标模型的原始值和目标特征干预值,修正所述样本数据,所述目标特征干预值为所述不同的特征干预值中对所述目标模型预测错误的影响程度最强的特征干预值。
可选地,所述处理模块,还具体用于:
对所述M个第二因果效应估计值进行假设检验统计,获得检验值;
根据所述检验值与预设的置信度数值之间的大小关系,生成所述特征变量对应的分析结果。
可选地,所述获取模块,具体用于:
通过训练得到的目标模型对预设的验证集数据进行数据处理,得到每个验证集样本对应的预测结果;所述验证集数据包括M个验证集样本;
基于所述每个验证集样本对应的预测结果以及每个验证集样本预先标注的真实结果,确定每个验证集样本对应的标签变量;
对所述每个验证集样本对应的预测结果、真实结果和标签变量、以及所述M个验证集样本包括的N个特征变量进行组合,获得所述M个样本数据。
可选地,所述构建模块,具体用于:
对于每个特征变量,根据所述M个样本数据训练预设的因果模型,获得所述特征变量对应的目标因果模型;
其中,所述因果模型在训练过程中的结果变量为所述M个样本数据包括的标签变量,所述因果模型在训练过程中的干预变量为所述特征变量,所述因果模型在训练过程中的调整变量包括所述M个样本数据包括的N个特征变量中除所述干预变量之外的特征变量。
第三方面,本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如上所述的模型修正方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如上所述的模型修正方法。
本实施例中,基于样本数据之间的因果关系,通过每个特征变量对应的目标因果模型对M个样本数据进行因果推断,获得每个特征变量对应的分析结果,进而基于上述分析结果修正模型。本实施例在模型修正的过程中,充分考虑到了样本特征之间的因果关系,为模型的修正提供了正确的参考,以此提高了修正后的模型的预测结果的准确性。
此外,本实施例提供的模型修正方法适用于修正不同类型的机器学习模型,例如,线性模型、神经网络模型和最邻近节点算法(K Nearest Neighbors,KNN)模型等。
此外,本实施例提供的模型修正方法使用的样本数据可以为单个样本数据,也可以为多个样本数据,以此满足不同颗粒度的需求,为模型的修正提供准确的信息支持。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例中模型修正方法的流程示意图;
图2为本发明实施例中模型修正装置的结构示意图;
图3为本发明实施例中一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
请参阅图1,图1为本发明实施例中特征提取器的训练方法的流程示意图。本发明实施例提供的特征提取器的训练方法包括:
S101,获取M个样本数据。
需要说明的是,上述样本数据是基于训练得到的目标模型对预设的验证集数据进行数据处理获得的。
上述目标模型包括分类型模型或连续型模型,上述目标模型包括但不限于线性模型、回归模型、神经网络模型和KNN模型。
上述样本数据包括但不限于类别型数据,例如,性别、职业、教育水平数据;以及连续型数据,例如,年龄、收入、温度数据。
上述样本数据包括标签变量和N个特征变量,其中,标签变量用于表征样本数据是否为错误样本(bad case),可选地,标签变量可以为0或1,在标签变量为1的情况下,表示样本数据为错误样本;在标签变量为0的情况下,表示样本数据为正确样本。上述特征变量用于表征样本特征,M为正整数,N为大于1的正整数。
可选地,上述样本数据可以为类别型数据,例如,特征变量表征的特征类别为“男”,干预值表征的特征类别为“女”。
需要说明的是,类别型的样本数据可以通过以下表一表示:
表一:
其中,从表一可以得到,样本数据的标签变量包括0和1,在标签变量为1的情况下,表示测试数据预先标注的真实结果与测试数据通过目标模型得到的测试结果不同;在标签变量为0的情况下,表示测试数据预先标注的真实结果与测试数据通过目标模型得到的测试结果相同。
可选地,上述样本数据可以为连续型数据。这种情况下,目标因果模型在每次因果推断过程中的干预值可以基于对征变量表征的样本特征进行多种数据处理方式确定。其中,上述多种数据处理方式包括但不限于分桶取值法、等宽法、二值化、基于聚类法等等。
例如,特征变量表征的数值为任意整数或小数的连续变量,则可以将样本数量等分三部分,然后取每个部分的均值,得到3个数值作为3个干预值。
需要说明的是,连续型的样本数据可以通过以下表二表示:
表二:
其中,表二中的差值为预测结果与真实结果之间的差值。可选地,在表二涉及的模型修正场景中,若差值大于或等于2,则认为预测结果错误,设置标签变量为1;若差值小于2,则认为预测结果正确,设置标签变量为0。
S102,根据所述M个样本数据,构建与N个特征变量一一对应的N个目标因果模型。
应理解,每个样本数据包括的特征变量都是相同的,例如,第1个样本数据的样本特征为“33岁”、“男性”、“本科”;第2个样本数据的样本特征为“26岁”、“女性”、“硕士”,可以得到,上述2个样本数据的第1个样本特征对应的样本变量为“年龄”,第2个样本特征对应的样本变量为“性别”,第3个样本特征对应的样本变量为“教育程度”。
本步骤中,在获得M个样本数据之后,可以构建每个特征变量一一对应的目标因果模型,具体的如何构建目标因果模型的实施方式,请参阅后续实施例。
S103,对于每个特征变量,通过所述特征变量对应的目标因果模型对所述M个样本数据进行因果推断,获得所述特征变量对应的分析结果。
本步骤中,在得到每个特征变量对应的目标因果模型之后,将M个样本数据输入至该特征变量对应的目标因果模型中,获得该特征变量对应的分析结果,容易理解的是,每个特征变量对应的分析结果的数量为M个,其中,上述分析结果用于表征特征变量对模型预测出错的影响是否显著。
S104,基于所述分析结果,修正所述目标模型。
如上所述,分析结果用于表征特征变量对模型预测出错的影响是否显著。本步骤中,在得到所有特征变量对应的分析结果,即N个分析结果之后,可以确定哪些特征变量为容易导致模型预测出错的特征变量,这种情况下,可以通过对特征变量的进一步分析,确定模型出错具体的原因,进而修正目标模型。可选地,上述模型出错具体的原因包括但不限于特征缺失值填充的方法不优、特征衍生的策略不优、特征本身为噪声。
本实施例中,基于样本数据之间的因果关系,通过每个特征变量对应的目标因果模型对M个样本数据进行因果推断,获得每个特征变量对应的分析结果,进而基于上述分析结果修正模型。本实施例在模型修正的过程中,充分考虑到了样本特征之间的因果关系,为模型的修正提供了正确的参考,以此提高了修正后的模型的预测结果的准确性。
此外,本实施例提供的模型修正方法适用于修正不同类型的机器学习模型,例如,线性模型、神经网络模型和最邻近节点算法(K Nearest Neighbors,KNN)模型等。
此外,本实施例提供的模型修正方法使用的样本数据可以为单个样本数据,也可以为多个样本数据,以此满足不同颗粒度的需求,为模型的修正提供准确的信息支持。
可选地,所述对于每个特征变量,通过所述特征变量对应的目标因果模型对所述M个样本数据进行因果推断,获得所述特征变量对应的分析结果,包括:
对于每个特征变量,通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值;K为大于1的正整数;
将所述K个第一因果效应估计值的平均值,确定为所述特征变量的第二因果效应估计值;
根据M个第二因果效应估计值,确定所述特征变量对应的分析结果。
如上所述,一个特征变量对应一个目标因果模型。本实施例中,可以通过特征变量对应的目标因果模型,确定该特征变量的K个第一因果效应估计值。
其中,上述目标因果模型包括但不限于双机器学习模型(Double MachineLearning)和因果森林模型(causal forest)等模型。上述第一因果效应估计值又称为个体因果效应估计(Individual Treatment Effect,ITE)值,上述第一因果效应估计值表示特征干预值对模型预测出错的量化影响。
在获得特征变量的K个第一因果效应估计值,将上述K个第一因果效应估计值的平均值,确定为特征变量的第二因果效应估计值。应理解,特征变量的数量为M个,因此第二因果效应估计值的数量也为M,进而根据M个第二因果效应估计值,确定特征变量对应的分析结果,具体的实施方式请参阅后续实施例。
本实施例中,通过目标因果模型对M个样本数据进行因果推断,以此基于样本数据之间的因果关系确定特征变量对应的分析结果,在后续的步骤中,基于上述分析结果修正模型,为模型的修正提供了正确的参考,进而提高了修正后的模型的预测结果的准确性。
可选地,所述通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值,包括:
对所述M个样本数据进行数据统计,确定所述特征变量对应的K个特征干预值;
通过所述特征变量对应的目标因果模型,依次设置所述特征变量对应的K个特征干预值,对每个样本数据进行K次因果推断,获得K个第一因果效应估计值。
为便于理解本实施例提供的技术方案,请参阅以下示例:
某样本数据包括“33岁”“男性”“本科”“3000元”,即样本数据包括的特征变量分别为“年龄”“性别”“教育程度”“收入”。在应用目标因果模型对上述样本数据进行一次因果推断的过程中,选择“硕士”作为目标因果模型的特征干预值,推断改变“教育程度”对预测得到错误的“收入”的影响程度,得到特征干预值“硕士”对应的第一因果效应估计值。应用目标因果模型重复上述对样本数据进行因果推断的方式,依次选择“高中”、“博士”等不同的特征干预值进行因果推断,得到多个第一因果效应估计值。
从上述示例可以得到,特征干预值“高中”、“硕士”和“博士”与样本数据中的样本特征“本科”同属于“教育程度”这一特征变量。
可选地,所述对于每个特征变量,通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值之后,所述方法还包括:
对于每个样本数据,基于所述样本数据包括的每个特征变量对应的K个第一因果效应估计值,确定每个特征变量对应的不同的特征干预值对所述目标模型预测错误的影响程度;
基于所述目标模型的原始值和目标特征干预值,修正所述样本数据,所述目标特征干预值为所述不同的特征干预值中对所述目标模型预测错误的影响程度最强的特征干预值。
如上所述,第一因果效应估计值表示特征干预值对模型预测出错的量化影响。本实施例中,在得到每个特征变量对应的K个第一因果效应估计值,可以基于特征变量对应的第一因果效应估计值的数值大小,确定每个特征干预值对目标模型预测错误的影响程度,并将对目标模型预测错误的影响程度最强的特征干预值确定为目标特征干预值。
本实施例中,根据目标模型的原始值和目标特征干预值,修正样本数据,以此针对单个样本数据的特征变量进行分析,修正单个样本数据,满足用户对于不同样本颗粒度的需求。
可选地,所述根据M个第二因果效应估计值,确定所述特征变量对应的分析结果,包括:
对所述M个第二因果效应估计值进行假设检验统计,获得检验值;
根据所述检验值与预设的置信度数值之间的大小关系,生成所述特征变量对应的分析结果。
本实施例中,在得到M个第二因果效应估计值之后,对每个第二因果效应估计值利用单侧检验的方式进行假设检验统计,获得检验值,上述假设检验统计又称为z检验,上述检验值又称为p值。
可选地,预先设置有置信度α,设置置信度数值为0.05。进一步的,比较检验值与置信度数值之间的大小,在检验值小于置信度数值的情况下,表示干预该个体因果效应估计值对应的特征变量会使模型预测出错的概率变大,也就是说,该特征变量对模型预测出错的影响较大;在检验值大于或等于置信度数值的情况下,表示干预该个体因果效应估计值对应的特征变量会使模型预测出错的概率变小,也就是说,该特征变量对模型预测出错的影响较小。
本实施例中,利用假设检验统计的方法获得检验值,通过比较检验值与预设的置信度数值之间的大小关系,确定特征变量对模型预测出错的影响,进而生成准确的分析结果。
可选地,所述获取M个样本数据,包括:
通过训练得到的目标模型对预设的验证集数据进行数据处理,获得每个验证集样本的预测结果;所述验证集数据包括M个验证集样本;
基于所述每个验证集样本对应的预测结果以及每个验证集样本预先标注的真实结果,确定每个验证集样本对应的标签变量;
对所述每个验证集样本对应的预测结果、真实结果和标签变量、以及所述M个验证集样本包括的N个特征变量进行组合,获得所述M个样本数据。
上述目标模型可以是训练好的机器学习模型。上述验证集数据包括但不限于类别型数据和连续型数据,上述验证集数据包括M个验证集样本,且验证集样本预先标注有真实结果。
本实施例中,将M个验证集样本输入至训练完成的目标模型中,获得每个验证集样本对应的预测结果。针对每个验证集样本,比较该验证集样本对应的预测结果与预先标注的真实结果,若预测结果与真实结果不一致,表示目标模型对该验证集样本的预测错误,则可以设置该验证集样本对应的标签变量为1;若预测结果与真实结果一致,表示目标模型对该验证集样本的预测正确,则可以设置该验证集样本对应的标签变量为0。
应理解,验证集样本包括N个特征变量,进一步的,对每个验证集样本对应的标签变量以及上述N个特征变量进行组合,获得M个样本数据。对于样本数据的具体表现形式,可参阅上述实施例中的表一和表二。
可选地,所述根据所述M个样本数据,构建与所述N个特征变量一一对应的N个目标因果模型,包括:
对于每个特征变量,根据所述M个样本数据训练预设的因果模型,获得所述特征变量对应的目标因果模型。
如上所述,目标因果模型包括但不限于双机器学习模型(Double MachineLearning)和因果森林模型(causal forest)等模型。应理解,在因果模型的一次训练过程中,需要设置因果模型的结果变量、干预变量和调整变量。
本实施例中,对于每个特征变量,可以将该特征变量作为因果模型在训练过程中使用的干预变量,将M个样本数据包括的标签变量作为因果模型在训练过程中使用的结果变量,将N个特征变量中除干预变量之外的特征变量作为因果模型在训练过程中使用的调整变量。通过定义因果模型在训练过程中使用的干预变量、结果变量和调整变量,训练因果模型,获得特征变量对应的目标因果模型。
本实施例中,通过M个样本数据训练预设的因果模型,获得每个特征变量对应的目标因果模型,进而在后续通过因果模型对样本数据进行因果推断的过程中,确保获得的分析结果的准确性。
本发明实施例还提供了一种模型修正装置,如图2所示,模型修正装置200包括:
获取模块201,用于获取M个样本数据;所述样本数据基于训练得到的目标模型对预设的验证集数据进行数据处理获得,所述样本数据包括标签变量和N个特征变量,所述标签变量用于表征所述样本数据是否为错误样本,所述特征变量用于表征样本特征,M为正整数,N为大于1的正整数;
构建模块202,用于根据所述M个样本数据,构建与所述N个特征变量一一对应的N个目标因果模型;
处理模块203,用于对于每个特征变量,通过所述特征变量对应的目标因果模型对所述M个样本数据进行因果推断,获得所述特征变量对应的分析结果;
修正模块204,用于基于所述分析结果,修正所述目标模型。
可选地,所述处理模块203,具体用于:
对于每个特征变量,通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值;K为大于1的正整数;
将所述K个第一因果效应估计值的平均值,确定为所述特征变量的第二因果效应估计值;
根据M个第二因果效应估计值,确定所述特征变量对应的分析结果。
可选地,所述处理模块203,还具体用于:
对所述M个样本数据进行数据统计,确定所述特征变量对应的K个特征干预值;
通过所述特征变量对应的目标因果模型,依次设置所述特征变量对应的K个特征干预值,对每个样本数据进行K次因果推断,获得K个第一因果效应估计值。
可选地,所述模型修正装置200还包括:
确定模块,用于对于每个样本数据,基于所述样本数据包括的每个特征变量对应的K个第一因果效应估计值,确定每个特征变量对应的不同的特征干预值对所述目标模型预测错误的影响程度;
修正模块,用于基于所述目标模型的原始值和目标特征干预值,修正所述样本数据,所述目标特征干预值为所述不同的特征干预值中对所述目标模型预测错误的影响程度最强的特征干预值。
可选地,所述处理模块203,还具体用于:
对所述M个第二因果效应估计值进行假设检验统计,获得检验值;
根据所述检验值与预设的置信度数值之间的大小关系,生成所述特征变量对应的分析结果。
可选地,所述获取模块201,具体用于:
通过训练得到的目标模型对预设的验证集数据进行数据处理,得到每个验证集样本对应的预测结果;所述验证集数据包括M个验证集样本;
基于所述每个验证集样本对应的预测结果以及每个验证集样本预先标注的真实结果,确定每个验证集样本对应的标签变量;
对所述每个验证集样本对应的预测结果、真实结果和标签变量、以及所述M个验证集样本包括的N个特征变量进行组合,获得所述M个样本数据。
可选地,所述构建模块202,具体用于:
对于每个特征变量,根据所述M个样本数据训练预设的因果模型,获得所述特征变量对应的目标因果模型;
其中,所述因果模型在训练过程中的结果变量为所述M个样本数据包括的标签变量,所述因果模型在训练过程中的干预变量为所述特征变量,所述因果模型在训练过程中的调整变量包括所述M个样本数据包括的N个特征变量中除所述干预变量之外的特征变量。
本发明实施例还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,所述计算机程序被所述处理器301执行时,用于获取M个样本数据;
根据所述M个样本数据,构建与所述N个特征变量一一对应的N个目标因果模型;
对于每个特征变量,通过所述特征变量对应的目标因果模型对所述M个样本数据进行因果推断,获得所述特征变量对应的分析结果;
基于所述分析结果,修正所述目标模型。
所述计算机程序被所述处理器301执行时,还用于对于每个特征变量,通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值;
将所述K个第一因果效应估计值的平均值,确定为所述特征变量的第二因果效应估计值;
根据M个第二因果效应估计值,确定所述特征变量对应的分析结果。
所述计算机程序被所述处理器301执行时,还用于对所述M个样本数据进行数据统计,确定所述特征变量对应的K个特征干预值;
通过所述特征变量对应的目标因果模型,依次设置所述特征变量对应的K个特征干预值,对每个样本数据进行K次因果推断,获得K个第一因果效应估计值。
所述计算机程序被所述处理器301执行时,还用于对于每个样本数据,基于所述样本数据包括的每个特征变量对应的K个第一因果效应估计值,确定每个特征变量对应的不同的特征干预值对所述目标模型预测错误的影响程度;
基于所述目标模型的原始值和目标特征干预值,修正所述样本数据。
所述计算机程序被所述处理器301执行时,还用于对所述M个第二因果效应估计值进行假设检验统计,获得检验值;
根据所述检验值与预设的置信度数值之间的大小关系,生成所述特征变量对应的分析结果。
所述计算机程序被所述处理器301执行时,还用于通过训练得到的目标模型对预设的验证集数据进行数据处理,得到每个验证集样本对应的预测结果;
基于所述每个验证集样本对应的预测结果以及每个验证集样本预先标注的真实结果,确定每个验证集样本对应的标签变量;
对所述每个验证集样本对应的预测结果、真实结果和标签变量、以及所述M个验证集样本包括的N个特征变量进行组合,获得所述M个样本数据。
所述计算机程序被所述处理器301执行时,还用于对于每个特征变量,根据所述M个样本数据训练预设的因果模型,获得所述特征变量对应的目标因果模型。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一实施例所述的模型修正方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一实施例所述的模型修正方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种模型修正方法,其特征在于,包括:
获取M个样本数据;所述样本数据基于训练得到的目标模型对预设的验证集数据进行数据处理获得,所述样本数据包括标签变量和N个特征变量,所述标签变量用于表征所述样本数据是否为预测错误样本,所述特征变量用于表征样本特征,M为正整数,N为大于1的正整数;
根据所述M个样本数据,构建与所述N个特征变量一一对应的N个目标因果模型;
对于每个特征变量,通过所述特征变量对应的目标因果模型对所述M个样本数据进行因果推断,获得所述特征变量对应的分析结果;
基于所述分析结果,修正所述目标模型。
2.根据权利要求1所述的方法,其特征在于,所述对于每个特征变量,通过所述特征变量对应的目标因果模型对所述M个样本数据进行因果推断,获得所述特征变量对应的分析结果,包括:
对于每个特征变量,通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值;K为大于1的正整数;
将所述K个第一因果效应估计值的平均值,确定为所述特征变量的第二因果效应估计值;
根据M个第二因果效应估计值,确定所述特征变量对应的分析结果。
3.根据权利要求2所述的方法,其特征在于,所述通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值,包括:
对所述M个样本数据进行数据统计,确定所述特征变量对应的K个特征干预值;
通过所述特征变量对应的目标因果模型,依次设置所述特征变量对应的K个特征干预值,对每个样本数据进行K次因果推断,获得K个第一因果效应估计值。
4.根据权利要求2所述的方法,其特征在于,所述对于每个特征变量,通过所述特征变量对应的目标因果模型,确定所述特征变量的K个第一因果效应估计值之后,所述方法还包括:
对于每个样本数据,基于所述样本数据包括的每个特征变量对应的K个第一因果效应估计值,确定每个特征变量对应的不同的特征干预值对所述目标模型预测错误的影响程度;
基于所述目标模型的原始值和目标特征干预值,修正所述样本数据,所述目标特征干预值为所述不同的特征干预值中对所述目标模型预测错误的影响程度最强的特征干预值。
5.根据权利要求2所述的方法,其特征在于,所述根据M个第二因果效应估计值,确定所述特征变量对应的分析结果,包括:
对所述M个第二因果效应估计值进行假设检验统计,获得检验值;
根据所述检验值与预设的置信度数值之间的大小关系,生成所述特征变量对应的分析结果。
6.根据权利要求1所述的方法,其特征在于,所述获取M个样本数据,包括:
通过训练得到的目标模型对预设的验证集数据进行数据处理,得到每个验证集样本的预测结果;所述验证集数据包括M个验证集样本;
基于所述每个验证集样本对应的预测结果以及每个验证集样本预先标注的真实结果,确定每个验证集样本对应的标签变量;
对所述每个验证集样本对应的预测结果、真实结果和标签变量、以及所述M个验证集样本包括的N个特征变量进行组合,获得所述M个样本数据。
7.根据权利要求1所述的方法,其特征在于,所述根据所述M个样本数据,构建与所述N个特征变量一一对应的N个目标因果模型,包括:
对于每个特征变量,根据所述M个样本数据训练预设的因果模型,获得所述特征变量对应的目标因果模型;
其中,所述因果模型在训练过程中的结果变量为所述M个样本数据包括的标签变量,所述因果模型在训练过程中的干预变量为所述特征变量,所述因果模型在训练过程中的调整变量包括所述M个样本数据包括的N个特征变量中除所述干预变量之外的特征变量。
8.一种模型修正装置,其特征在于,包括:
获取模块,用于获取M个样本数据;所述样本数据基于训练得到的目标模型对预设的验证集数据进行数据处理获得,所述样本数据包括标签变量和N个特征变量,所述标签变量用于表征所述样本数据是否为错误样本,所述特征变量用于表征样本特征,M为正整数,N为大于1的正整数;
构建模块,用于根据所述M个样本数据,构建与所述N个特征变量一一对应的N个目标因果模型;
处理模块,用于对于每个特征变量,通过所述特征变量对应的目标因果模型对所述M个样本数据进行因果推断,获得所述特征变量对应的分析结果;
修正模块,用于基于所述分析结果,修正所述目标模型。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如权利要求1-7中任一项所述的模型修正方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现如权利要求1-7中任一项所述的模型修正方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310348068.8A CN116757293A (zh) | 2023-04-03 | 2023-04-03 | 模型修正方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310348068.8A CN116757293A (zh) | 2023-04-03 | 2023-04-03 | 模型修正方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116757293A true CN116757293A (zh) | 2023-09-15 |
Family
ID=87946624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310348068.8A Pending CN116757293A (zh) | 2023-04-03 | 2023-04-03 | 模型修正方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116757293A (zh) |
-
2023
- 2023-04-03 CN CN202310348068.8A patent/CN116757293A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112862093B (zh) | 一种图神经网络训练方法及装置 | |
CN109165691B (zh) | 用于识别作弊用户的模型的训练方法、装置及电子设备 | |
CN110263853B (zh) | 利用错误样本检查人工客户端状态的方法及装置 | |
CN112199293A (zh) | 软件质量评价方法、装置、终端设备及存储介质 | |
CN112017777B (zh) | 相似对问题预测的方法、装置及电子设备 | |
CN111340233B (zh) | 机器学习模型的训练方法及装置、样本处理方法及装置 | |
CN110909868A (zh) | 基于图神经网络模型的节点表示方法和装置 | |
CN113067653A (zh) | 一种频谱感知方法、装置、电子设备及介质 | |
CN109615080B (zh) | 无监督模型评估方法、装置、服务器及可读存储介质 | |
CN111027412A (zh) | 一种人体关键点识别方法、装置及电子设备 | |
CN115391561A (zh) | 图网络数据集的处理方法、装置、电子设备、程序及介质 | |
CN114169460A (zh) | 样本筛选方法、装置、计算机设备和存储介质 | |
CN114298326A (zh) | 模型训练方法、装置及模型训练系统 | |
CN113656354A (zh) | 日志分类方法、系统、计算机设备和可读存储介质 | |
CN113177405A (zh) | 基于bert的数据纠错方法、装置、设备及存储介质 | |
CN112712181A (zh) | 模型构建优化方法、装置、设备和可读存储介质 | |
CN116166967B (zh) | 基于元学习与残差网络的数据处理方法、设备和存储介质 | |
CN117437471A (zh) | 基于多尺度卷积神经网络的油气管道漏磁检测方法和系统 | |
CN111783883A (zh) | 一种异常数据的检测方法及装置 | |
CN115641201B (zh) | 数据异常检测方法、系统、终端设备及存储介质 | |
CN116757293A (zh) | 模型修正方法、装置、设备和存储介质 | |
CN113066486B (zh) | 数据识别方法、装置、电子设备和计算机可读存储介质 | |
CN112528500B (zh) | 一种场景图构造模型的评估方法及评估设备 | |
CN111652379B (zh) | 模型管理方法、装置、电子设备及存储介质 | |
CN111737519B (zh) | 识别机器人账号的方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |