CN116028803A - 一种基于敏感属性再平衡的去偏方法 - Google Patents

一种基于敏感属性再平衡的去偏方法 Download PDF

Info

Publication number
CN116028803A
CN116028803A CN202211016743.9A CN202211016743A CN116028803A CN 116028803 A CN116028803 A CN 116028803A CN 202211016743 A CN202211016743 A CN 202211016743A CN 116028803 A CN116028803 A CN 116028803A
Authority
CN
China
Prior art keywords
attribute
sensitive
training
training set
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211016743.9A
Other languages
English (en)
Inventor
陈晋音
陈奕芃
郑海斌
赵云波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202211016743.9A priority Critical patent/CN116028803A/zh
Publication of CN116028803A publication Critical patent/CN116028803A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种基于敏感属性再平衡的去偏方法,首先选取原始数据集,并将该原始数据集按自定义比例划分为训练集和测试集;再对训练集提取类别标签以及敏感属性标签:对划分的训练集中的数据去除敏感属性;计算皮尔逊相关系数以获取次敏感属性,构造外推模型,合成敏感属性;构造预测模型,将合成敏感属性加入到去除敏感属性的训练集中,将合成好的训练集输入到预测模型中进行训练;将测试集输入到训练好的模型中进行测试,计算公平性评估指标,直至满足公平性评估指标。

Description

一种基于敏感属性再平衡的去偏方法
技术领域
本发明属于深度学习去偏领域,尤其涉及一种基于敏感属性再平衡的去偏方法。
背景技术
虽然深度学习在实际应用方面取得了巨大进展,但它们对虚假相关性也很敏感,通常依赖于这些错误关联。深度模型可能会将性别、种族或年龄等受保护属性与目标预测过度关联,从而放大对某些特定群体的偏见。已知的负面结果包括男性软件工程师在图像搜索结果中的比例过高、面部识别对不同肤色的人来说没有那么有效,对于危及生命的情况,例如,自动驾驶车辆中行人的识别率并非对所有人群都同样准确。
现有对去偏方法可以分为数据预处理去偏及模型中处理去偏等方法,数据预处理方法通常通过简单的修改数据集中的标签及权重达到去偏的效果,但是这样会使数据集中的一部分信息丢失,从而使预测精度下降;模型中处理去偏方法通常通过对抗性去偏及正则化约束,这样会增加网络的训练难度,并不好在实际中进行运用。
鉴于深度学习偏见存在的客观性,研究一种基于敏感属性再平衡的去偏方法。
发明内容
针对现有技术不足,本发明提出了一种基于敏感属性再平衡的去偏方法。
为实现上述技术目的,本发明的技术方案为:本发明实施例提供了一种基于敏感属性再平衡的去偏方法,包括以下步骤:
(1)选取原始数据集,并将该原始数据集按自定义比例划分为训练集和测试集;再对训练集提取类别标签以及敏感属性标签:
(2)对步骤(1)划分的训练集中的数据去除敏感属性;
(3)计算皮尔逊相关系数以获取次敏感属性,构造外推模型,合成敏感属性;
(4)构造预测模型Mfair,将步骤(3)得到的合成敏感属性加入到步骤(2)得到的去除敏感属性的训练集中,将合成好的训练集输入到预测模型Mfair中进行训练;
(5)将步骤(1)划分得到的测试集输入到训练好的模型中进行测试,计算公平性评估指标,重复步骤(4)直至满足公平性评估指标。
进一步地,所述原始数据集为COMPAS数据集、Adult数据集或Bank数据集。
进一步地,计算皮尔逊相关系数以获取次敏感属性的过程包括:
计算皮尔逊相关系数公式如下:
其中S为敏感属性,Si为训练集中第i个样本对应的敏感属性,NS为非敏感属性,NSi为训练集中第i个样本对应的非敏感属性,为敏感属性的平均值,为此非敏感属性的平均值;
当皮尔逊相关系数r大于自定义阈值时,该非敏感属性与敏感属性相关,并将该非敏感属性定义为次敏感属性LS。
进一步地,所述外推模型为全连接神经网络;该全连接神经网络为6层,每层的神经元个数分别为64、32、16、8、4、2。
进一步地,所述步骤(3)中合成敏感属性的过程为:将步骤(2)得到的去除敏感属性的训练集输入到构造的外推模型中,以次敏感属性作为预测标签进行训练,训练得到的预测结果作为合成敏感属性。
进一步地,所述预测模型Mfair采用全连接神经网络。全连接神经网络为6层,每层的神经元个数分别为64、32、16、8、4、2。全连接层使用SoftMax为激活函数对数据进行分类识别,训练过程的损失函数均使用交叉熵损失函数,优化器使用Adam。
进一步地,将合成好的训练集输入到预测模型Mfair中进行训练具体为:
将合成好的训练集输入到预测模型Mfair中,自定义训练批次的大小,在训练阶段采用预热学习率策略,优化器采用Adam进行优化;损失函数采用交叉熵的形式,公式如下所示:
L1=-[y·log(p)+(1-y)·log(1-p)]
其中y表示样本的标签,P表示预测结果为1的概率。
进一步地,计算公平性评估指标的公式如下:
其中表示模型预测,S为敏感属性,当上式的左右两边的结果相等时则认为预测模型Mfair达到了去偏效果。
本发明的有益效果为:本发明提出了一种基于敏感属性再平衡的去偏方法,通过计算皮尔逊相关系数以获取次敏感属性,对数据集中的敏感属性进行再平衡,进而对预测模型进行训练,达到去偏效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是本发明的实施例中基于敏感属性再平衡的去偏方法流程图。
具体实施方式
下面结合说明书附图对本发明的具体实施方式作进一步详细描述。
参照图1,本发明提出了一种基于敏感属性再平衡的去偏方法,步骤如下:
(1)选取原始数据集,并将该原始数据集按自定义比例划分为训练集和测试集;再对训练集提取类别标签以及敏感属性标签。
本发明实施例中选取COMPAS数据集、Adult数据集或Bank数据集作为原始数据集。本发明实施例中以5:1的比例划分训练集和测试集。
对训练集提取类别标签以及敏感属性标签的过程具体为:COMPAS数据集中每个样本有18个类别属性,在这些属性中有年龄、性别等多个潜在的敏感属性。特别地,对训练集中的非二分类的数据类别需进行one-hot编码,获取其对应的类别标签。
(2)对步骤(1)划分的训练集中的数据去除敏感属性。
具体地,本发明实施例中,搜索训练集中敏感属性所在的数据维度,再删除敏感属性所在的数据维度,得到去除敏感属性后的训练集。
(3)获取次敏感属性,构造外推模型,合成敏感属性。
具体包括以下步骤:
(3.1)计算皮尔逊相关系数以获取次敏感属性,具体为:
敏感属性本质上与分类问题无关,某些分类问题的训练数据中的敏感属性仅因为是其他相关信息的代理而具有信息性。因此,可以将敏感属性推断为其他非敏感属性的一些组合。本发明实施例中将与敏感属性高度相关的其他属性定义为次敏感属性。
本发明实施例中,通过皮尔逊相关系数获取次敏感属性。
对训练集中其他非敏感属性一一对其与敏感属性种族计算皮尔逊相关系数,公式如下:
其中S为敏感属性,Si为训练集中第i个样本对应的敏感属性,NS为非敏感属性,NSi为训练集中第i个样本对应的非敏感属性,为敏感属性的平均值,为此非敏感属性的平均值。
当皮尔逊相关系数r大于自定义阈值时,该非敏感属性与敏感属性相关,并将该非敏感属性定义为次敏感属性LS。本发明实施例中设置阈值为0.5。
(3.2)构造外推模型,具体为:
本发明实施例中外推模型采用全连接神经网络。全连接神经网络为6层,每层的神经元个数分别为64、32、16、8、4、2。全连接层使用SoftMax为激活函数对数据进行分类识别,训练过程的损失函数均使用交叉熵损失函数,优化器使用Adam。
(3.3)合成敏感属性,具体为:
将步骤(2)得到的去除敏感属性的训练集输入到步骤(3.2)构造的外推模型中,以步骤(3.1)获取的次敏感属性作为预测标签进行训练,训练得到的预测结果作为合成敏感属性。
添加到去除掉敏感属性的训练集中输入到模型中进行训练。
(4)构造预测模型Mfair,将步骤(3)得到的合成敏感属性加入到步骤(2)得到的去除敏感属性的训练集中,将训练集输入到预测模型Mfair中进行训练。
具体地,本发明实施例中预测模型Mfair采用全连接神经网络。全连接神经网络为6层,每层的神经元个数分别为64、32、16、8、4、2。全连接层使用SoftMax为激活函数对数据进行分类识别,训练过程的损失函数均使用交叉熵损失函数,优化器使用Adam。
将合成好的训练集输入到预测模型Mfair中,训练批次的大小定为100,在训练阶段采用预热学习率策略,优化器采用Adam进行优化。损失函数采用交叉熵的形式,公式如下所示:
L1=-[y·log(p)+(1-y)·log(1-p)]
其中y表示样本的标签,示例性地,当预测结果为再犯率时,罪犯会再次犯罪则y为1,罪犯不会再次犯罪则y为0;当预测结果为个体收入判断时,年收入大于50k则y为1,年收入小于50k则y为0。P表示预测结果为1的概率。
(5)将步骤(1)划分得到的测试集输入到训练好的预测模型Mfair中进行测试,计算公平性评估指标,重复步骤(4)直至满足公平性评估指标。
计算公平性评估指标的公式为:
其中表示模型预测,S为敏感属性,当上式的左右两边的结果相等或相近时则认为预测模型Mfair达到了去偏效果。
实施例1
(1)选取Adult为原始数据集,并将该原始数据集按2:1比例划分为训练集和测试集;再对训练集提取类别标签以及敏感属性标签:
在本发明实施例中,选取Adult数据集中每个个体的性别作为敏感属性,属性为“男”或者“女”则认为它是敏感的,并对其进行二值化处理,敏感属性为“男”被编码为1,敏感属性为“女”被编码为0。
(2)对步骤(1)划分的训练集中的数据去除敏感属性;
(3)计算皮尔逊相关系数以获取次敏感属性,构造外推模型,合成敏感属性;
(4)构造预测模型Mfair,将步骤(3)得到的合成敏感属性加入到步骤(2)得到的去除敏感属性的训练集中,将合成好的训练集输入到预测模型Mfair中进行训练;
(5)将步骤(1)划分得到的测试集输入到训练好的模型中进行测试,计算公平性评估指标,重复步骤(4)直至满足公平性评估指标。
构造的预测模型Mfair输出的预测值是一个二进制变量,输出结果只有0或1,预测目标为预测个体的年收入,0代表年收入小于50K,1代表年收入大于50K。通过计算公平性评估指标,公式如下:
其中表示模型预测结果,A为敏感属性,当上式的左右两边的结果相等或相近时则认为预测模型Mfair达到了去偏效果。
实施例2
(1)选取Bank原始数据集,并将该原始数据集按7:3比例划分为训练集和测试集;再对训练集提取类别标签以及敏感属性标签:
在本发明实施例中,选取Bank数据集中每个个体的年龄作为敏感属性,属性为“0~4”或者“5~9”则认为它是敏感的,其中“0~4”代表0~50岁年龄段,“5~9”代表50~100岁年龄段,并对其进行二值化处理,敏感属性为“0~4”被编码为1,敏感属性为“5~9”被编码为0。
(2)对步骤(1)划分的训练集中的数据去除敏感属性;
(3)计算皮尔逊相关系数以获取次敏感属性,构造外推模型,合成敏感属性;
(4)构造预测模型Mfair,将步骤(3)得到的合成敏感属性加入到步骤(2)得到的去除敏感属性的训练集中,将合成好的训练集输入到预测模型Mfair中进行训练;
(5)将步骤(1)划分得到的测试集输入到训练好的模型中进行测试,计算公平性评估指标,重复步骤(4)直至满足公平性评估指标。
构造的预测模型Mfair输出的预测值是一个二进制变量,输出结果只有0或1,预测目标为预测银行客户是否会认购银行的定期存款项目,0代表不会认购,1代表会认购。通过计算公平性评估指标,公式如下:
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (8)

1.一种基于敏感属性再平衡的去偏方法,其特征在于,包括以下步骤:
(1)选取原始数据集,并将该原始数据集按自定义比例划分为训练集和测试集;再对训练集提取类别标签以及敏感属性标签:
(2)对步骤(1)划分的训练集中的数据去除敏感属性;
(3)计算皮尔逊相关系数以获取次敏感属性,构造外推模型,合成敏感属性;
(4)构造预测模型Mfair,将步骤(3)得到的合成敏感属性加入到步骤(2)得到的去除敏感属性的训练集中,将合成好的训练集输入到预测模型Mfair中进行训练;
(5)将步骤(1)划分得到的测试集输入到训练好的模型中进行测试,计算公平性评估指标,重复步骤(4)直至满足公平性评估指标。
2.根据权利要求1所述的基于敏感属性再平衡的去偏方法,其特征在于,所述原始数据集为COMPAS数据集、Adult数据集或Bank数据集。
3.根据权利要求1所述的基于敏感属性再平衡的去偏方法,其特征在于,计算皮尔逊相关系数以获取次敏感属性的过程包括:
计算皮尔逊相关系数公式如下:
Figure FDA0003812818810000011
其中S为敏感属性,Si为训练集中第i个样本对应的敏感属性,NS为非敏感属性,NSi为训练集中第i个样本对应的非敏感属性,
Figure FDA0003812818810000012
为敏感属性的平均值,
Figure FDA0003812818810000013
为此非敏感属性的平均值;
当皮尔逊相关系数r大于自定义阈值时,该非敏感属性与敏感属性相关,并将该非敏感属性定义为次敏感属性LS。
4.根据权利要求1所述的基于敏感属性再平衡的去偏方法,其特征在于,所述外推模型为全连接神经网络;该全连接神经网络为6层,每层的神经元个数分别为64、32、16、8、4、2。
5.根据权利要求1所述的基于敏感属性再平衡的去偏方法,其特征在于,所述步骤(3)中合成敏感属性的过程为:将步骤(2)得到的去除敏感属性的训练集输入到构造的外推模型中,以次敏感属性作为预测标签进行训练,训练得到的预测结果作为合成敏感属性。
6.根据权利要求1所述的基于敏感属性再平衡的去偏方法,其特征在于,所述预测模型Mfair采用全连接神经网络。全连接神经网络为6层,每层的神经元个数分别为64、32、16、8、4、2。全连接层使用SoftMax为激活函数对数据进行分类识别,训练过程的损失函数均使用交叉熵损失函数,优化器使用Adam。
7.根据权利要求1所述的基于敏感属性再平衡的去偏方法,其特征在于,将合成好的训练集输入到预测模型Mfair中进行训练具体为:
将合成好的训练集输入到预测模型Mfair中,自定义训练批次的大小,在训练阶段采用预热学习率策略,优化器采用Adam进行优化;损失函数采用交叉熵的形式,公式如下所示:
L1=-[y·log(p)+(1-y)·log(1-p)]
其中y表示样本的标签,P表示预测结果为1的概率。
8.根据权利要求1所述的基于敏感属性再平衡的去偏方法,其特征在于,计算公平性评估指标的公式如下:
Figure FDA0003812818810000021
其中
Figure FDA0003812818810000022
表示模型预测,S为敏感属性,当上式的左右两边的结果相等时则认为预测模型Mfair达到了去偏效果。
CN202211016743.9A 2022-08-24 2022-08-24 一种基于敏感属性再平衡的去偏方法 Pending CN116028803A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211016743.9A CN116028803A (zh) 2022-08-24 2022-08-24 一种基于敏感属性再平衡的去偏方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211016743.9A CN116028803A (zh) 2022-08-24 2022-08-24 一种基于敏感属性再平衡的去偏方法

Publications (1)

Publication Number Publication Date
CN116028803A true CN116028803A (zh) 2023-04-28

Family

ID=86080208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211016743.9A Pending CN116028803A (zh) 2022-08-24 2022-08-24 一种基于敏感属性再平衡的去偏方法

Country Status (1)

Country Link
CN (1) CN116028803A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117315379A (zh) * 2023-11-29 2023-12-29 中电科大数据研究院有限公司 面向深度学习的医学影像分类模型公平性评估方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117315379A (zh) * 2023-11-29 2023-12-29 中电科大数据研究院有限公司 面向深度学习的医学影像分类模型公平性评估方法及装置
CN117315379B (zh) * 2023-11-29 2024-03-12 中电科大数据研究院有限公司 面向深度学习的医学影像分类模型公平性评估方法及装置

Similar Documents

Publication Publication Date Title
CN109034264B (zh) 交通事故严重性预测csp-cnn模型及其建模方法
Zarinbal et al. Relative entropy fuzzy c-means clustering
CN112115963B (zh) 一种基于迁移学习生成无偏见深度学习模型的方法
Huang A hybrid particle swarm optimization approach for clustering and classification of datasets
CN107798033B (zh) 一种公安领域案件文本的分类方法
CN111143842B (zh) 一种恶意代码检测方法及系统
CN110837523A (zh) 一种基于级联神经网络的高置信改造质量和减假暂量化评估方法
CN111753918B (zh) 一种基于对抗学习的去性别偏见的图像识别模型及应用
CN112687374B (zh) 一种基于文本和图像信息联合计算的心理危机预警方法
CN113761259A (zh) 一种图像处理方法、装置以及计算机设备
CN115688024B (zh) 基于用户内容特征和行为特征的网络异常用户预测方法
CN112015901A (zh) 文本分类方法及装置、警情分析系统
Manziuk et al. Definition of information core for documents classification
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN113269647A (zh) 基于图的交易异常关联用户检测方法
KR20200071865A (ko) 차원 축소에 기반한 영상 객체 인식 시스템 및 방법
CN109726703A (zh) 一种基于改进集成学习策略的人脸图像年龄识别方法
CN116307103A (zh) 一种基于硬参数共享多任务学习的交通事故预测方法
CN112330158A (zh) 基于自回归差分移动平均-卷积神经网络的识别交通指数时间序列的方法
CN116469561A (zh) 一种基于深度学习的乳腺癌生存预测方法
CN116028803A (zh) 一种基于敏感属性再平衡的去偏方法
CN113298254A (zh) 面向深度迁移学习的去偏方法及其装置
CN114782761B (zh) 基于深度学习的智能仓储物料识别方法和系统
CN115345248A (zh) 一种面向深度学习的数据去偏方法及装置
CN113361652A (zh) 一种面向个体收入预测的去偏方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination