CN116028803A

CN116028803A - 一种基于敏感属性再平衡的去偏方法

Info

Publication number: CN116028803A
Application number: CN202211016743.9A
Authority: CN
Inventors: 陈晋音; 陈奕芃; 郑海斌; 赵云波
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2022-08-24
Filing date: 2022-08-24
Publication date: 2023-04-28

Abstract

本发明公开了一种基于敏感属性再平衡的去偏方法，首先选取原始数据集，并将该原始数据集按自定义比例划分为训练集和测试集；再对训练集提取类别标签以及敏感属性标签：对划分的训练集中的数据去除敏感属性；计算皮尔逊相关系数以获取次敏感属性，构造外推模型，合成敏感属性；构造预测模型，将合成敏感属性加入到去除敏感属性的训练集中，将合成好的训练集输入到预测模型中进行训练；将测试集输入到训练好的模型中进行测试，计算公平性评估指标，直至满足公平性评估指标。

Description

一种基于敏感属性再平衡的去偏方法

技术领域

本发明属于深度学习去偏领域，尤其涉及一种基于敏感属性再平衡的去偏方法。

背景技术

虽然深度学习在实际应用方面取得了巨大进展，但它们对虚假相关性也很敏感，通常依赖于这些错误关联。深度模型可能会将性别、种族或年龄等受保护属性与目标预测过度关联，从而放大对某些特定群体的偏见。已知的负面结果包括男性软件工程师在图像搜索结果中的比例过高、面部识别对不同肤色的人来说没有那么有效，对于危及生命的情况，例如，自动驾驶车辆中行人的识别率并非对所有人群都同样准确。

现有对去偏方法可以分为数据预处理去偏及模型中处理去偏等方法，数据预处理方法通常通过简单的修改数据集中的标签及权重达到去偏的效果，但是这样会使数据集中的一部分信息丢失，从而使预测精度下降；模型中处理去偏方法通常通过对抗性去偏及正则化约束，这样会增加网络的训练难度，并不好在实际中进行运用。

鉴于深度学习偏见存在的客观性，研究一种基于敏感属性再平衡的去偏方法。

发明内容

针对现有技术不足，本发明提出了一种基于敏感属性再平衡的去偏方法。

为实现上述技术目的，本发明的技术方案为：本发明实施例提供了一种基于敏感属性再平衡的去偏方法，包括以下步骤：

(1)选取原始数据集，并将该原始数据集按自定义比例划分为训练集和测试集；再对训练集提取类别标签以及敏感属性标签：

(2)对步骤(1)划分的训练集中的数据去除敏感属性；

(3)计算皮尔逊相关系数以获取次敏感属性，构造外推模型，合成敏感属性；

(4)构造预测模型M_fair，将步骤(3)得到的合成敏感属性加入到步骤(2)得到的去除敏感属性的训练集中，将合成好的训练集输入到预测模型M_fair中进行训练；

(5)将步骤(1)划分得到的测试集输入到训练好的模型中进行测试，计算公平性评估指标，重复步骤(4)直至满足公平性评估指标。

进一步地，所述原始数据集为COMPAS数据集、Adult数据集或Bank数据集。

进一步地，计算皮尔逊相关系数以获取次敏感属性的过程包括：

计算皮尔逊相关系数公式如下：

其中S为敏感属性，S_i为训练集中第i个样本对应的敏感属性，NS为非敏感属性，NS_i为训练集中第i个样本对应的非敏感属性，为敏感属性的平均值，为此非敏感属性的平均值；

当皮尔逊相关系数r大于自定义阈值时，该非敏感属性与敏感属性相关，并将该非敏感属性定义为次敏感属性LS。

进一步地，所述外推模型为全连接神经网络；该全连接神经网络为6层，每层的神经元个数分别为64、32、16、8、4、2。

进一步地，所述步骤(3)中合成敏感属性的过程为：将步骤(2)得到的去除敏感属性的训练集输入到构造的外推模型中，以次敏感属性作为预测标签进行训练，训练得到的预测结果作为合成敏感属性。

进一步地，所述预测模型M_fair采用全连接神经网络。全连接神经网络为6层，每层的神经元个数分别为64、32、16、8、4、2。全连接层使用SoftMax为激活函数对数据进行分类识别，训练过程的损失函数均使用交叉熵损失函数，优化器使用Adam。

进一步地，将合成好的训练集输入到预测模型M_fair中进行训练具体为：

将合成好的训练集输入到预测模型M_fair中，自定义训练批次的大小，在训练阶段采用预热学习率策略，优化器采用Adam进行优化；损失函数采用交叉熵的形式，公式如下所示：

L₁＝-[y·log(p)+(1-y)·log(1-p)]

其中y表示样本的标签，P表示预测结果为1的概率。

进一步地，计算公平性评估指标的公式如下：

其中表示模型预测，S为敏感属性，当上式的左右两边的结果相等时则认为预测模型M_fair达到了去偏效果。

本发明的有益效果为：本发明提出了一种基于敏感属性再平衡的去偏方法，通过计算皮尔逊相关系数以获取次敏感属性，对数据集中的敏感属性进行再平衡，进而对预测模型进行训练，达到去偏效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动前提下，还可以根据这些附图获得其他附图。

图1是本发明的实施例中基于敏感属性再平衡的去偏方法流程图。

具体实施方式

下面结合说明书附图对本发明的具体实施方式作进一步详细描述。

参照图1，本发明提出了一种基于敏感属性再平衡的去偏方法，步骤如下：

(1)选取原始数据集，并将该原始数据集按自定义比例划分为训练集和测试集；再对训练集提取类别标签以及敏感属性标签。

本发明实施例中选取COMPAS数据集、Adult数据集或Bank数据集作为原始数据集。本发明实施例中以5：1的比例划分训练集和测试集。

对训练集提取类别标签以及敏感属性标签的过程具体为：COMPAS数据集中每个样本有18个类别属性，在这些属性中有年龄、性别等多个潜在的敏感属性。特别地，对训练集中的非二分类的数据类别需进行one-hot编码，获取其对应的类别标签。

(2)对步骤(1)划分的训练集中的数据去除敏感属性。

具体地，本发明实施例中，搜索训练集中敏感属性所在的数据维度，再删除敏感属性所在的数据维度，得到去除敏感属性后的训练集。

(3)获取次敏感属性，构造外推模型，合成敏感属性。

具体包括以下步骤：

(3.1)计算皮尔逊相关系数以获取次敏感属性，具体为：

敏感属性本质上与分类问题无关，某些分类问题的训练数据中的敏感属性仅因为是其他相关信息的代理而具有信息性。因此，可以将敏感属性推断为其他非敏感属性的一些组合。本发明实施例中将与敏感属性高度相关的其他属性定义为次敏感属性。

本发明实施例中，通过皮尔逊相关系数获取次敏感属性。

对训练集中其他非敏感属性一一对其与敏感属性种族计算皮尔逊相关系数，公式如下：

其中S为敏感属性，S_i为训练集中第i个样本对应的敏感属性，NS为非敏感属性，NS_i为训练集中第i个样本对应的非敏感属性，为敏感属性的平均值，为此非敏感属性的平均值。

当皮尔逊相关系数r大于自定义阈值时，该非敏感属性与敏感属性相关，并将该非敏感属性定义为次敏感属性LS。本发明实施例中设置阈值为0.5。

(3.2)构造外推模型，具体为：

本发明实施例中外推模型采用全连接神经网络。全连接神经网络为6层，每层的神经元个数分别为64、32、16、8、4、2。全连接层使用SoftMax为激活函数对数据进行分类识别，训练过程的损失函数均使用交叉熵损失函数，优化器使用Adam。

(3.3)合成敏感属性，具体为：

将步骤(2)得到的去除敏感属性的训练集输入到步骤(3.2)构造的外推模型中，以步骤(3.1)获取的次敏感属性作为预测标签进行训练，训练得到的预测结果作为合成敏感属性。

添加到去除掉敏感属性的训练集中输入到模型中进行训练。

(4)构造预测模型M_fair，将步骤(3)得到的合成敏感属性加入到步骤(2)得到的去除敏感属性的训练集中，将训练集输入到预测模型M_fair中进行训练。

具体地，本发明实施例中预测模型M_fair采用全连接神经网络。全连接神经网络为6层，每层的神经元个数分别为64、32、16、8、4、2。全连接层使用SoftMax为激活函数对数据进行分类识别，训练过程的损失函数均使用交叉熵损失函数，优化器使用Adam。

将合成好的训练集输入到预测模型M_fair中，训练批次的大小定为100，在训练阶段采用预热学习率策略，优化器采用Adam进行优化。损失函数采用交叉熵的形式，公式如下所示：

L₁＝-[y·log(p)+(1-y)·log(1-p)]

其中y表示样本的标签，示例性地，当预测结果为再犯率时，罪犯会再次犯罪则y为1，罪犯不会再次犯罪则y为0；当预测结果为个体收入判断时，年收入大于50k则y为1，年收入小于50k则y为0。P表示预测结果为1的概率。

(5)将步骤(1)划分得到的测试集输入到训练好的预测模型M_fair中进行测试，计算公平性评估指标，重复步骤(4)直至满足公平性评估指标。

计算公平性评估指标的公式为：

其中表示模型预测，S为敏感属性，当上式的左右两边的结果相等或相近时则认为预测模型M_fair达到了去偏效果。

实施例1

(1)选取Adult为原始数据集，并将该原始数据集按2:1比例划分为训练集和测试集；再对训练集提取类别标签以及敏感属性标签：

在本发明实施例中，选取Adult数据集中每个个体的性别作为敏感属性，属性为“男”或者“女”则认为它是敏感的，并对其进行二值化处理，敏感属性为“男”被编码为1，敏感属性为“女”被编码为0。

(2)对步骤(1)划分的训练集中的数据去除敏感属性；

构造的预测模型M_fair输出的预测值是一个二进制变量，输出结果只有0或1，预测目标为预测个体的年收入，0代表年收入小于50K，1代表年收入大于50K。通过计算公平性评估指标，公式如下：

其中表示模型预测结果，A为敏感属性，当上式的左右两边的结果相等或相近时则认为预测模型M_fair达到了去偏效果。

实施例2

(1)选取Bank原始数据集，并将该原始数据集按7:3比例划分为训练集和测试集；再对训练集提取类别标签以及敏感属性标签：

在本发明实施例中，选取Bank数据集中每个个体的年龄作为敏感属性，属性为“0～4”或者“5～9”则认为它是敏感的，其中“0～4”代表0～50岁年龄段，“5～9”代表50～100岁年龄段，并对其进行二值化处理，敏感属性为“0～4”被编码为1，敏感属性为“5～9”被编码为0。

(2)对步骤(1)划分的训练集中的数据去除敏感属性；

构造的预测模型M_fair输出的预测值是一个二进制变量，输出结果只有0或1，预测目标为预测银行客户是否会认购银行的定期存款项目，0代表不会认购，1代表会认购。通过计算公平性评估指标，公式如下：

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims

1.一种基于敏感属性再平衡的去偏方法，其特征在于，包括以下步骤：

(2)对步骤(1)划分的训练集中的数据去除敏感属性；

2.根据权利要求1所述的基于敏感属性再平衡的去偏方法，其特征在于，所述原始数据集为COMPAS数据集、Adult数据集或Bank数据集。

3.根据权利要求1所述的基于敏感属性再平衡的去偏方法，其特征在于，计算皮尔逊相关系数以获取次敏感属性的过程包括：

计算皮尔逊相关系数公式如下：

其中S为敏感属性，S_i为训练集中第i个样本对应的敏感属性，NS为非敏感属性，NS_i为训练集中第i个样本对应的非敏感属性，

为敏感属性的平均值，

为此非敏感属性的平均值；

4.根据权利要求1所述的基于敏感属性再平衡的去偏方法，其特征在于，所述外推模型为全连接神经网络；该全连接神经网络为6层，每层的神经元个数分别为64、32、16、8、4、2。

5.根据权利要求1所述的基于敏感属性再平衡的去偏方法，其特征在于，所述步骤(3)中合成敏感属性的过程为：将步骤(2)得到的去除敏感属性的训练集输入到构造的外推模型中，以次敏感属性作为预测标签进行训练，训练得到的预测结果作为合成敏感属性。

6.根据权利要求1所述的基于敏感属性再平衡的去偏方法，其特征在于，所述预测模型M_fair采用全连接神经网络。全连接神经网络为6层，每层的神经元个数分别为64、32、16、8、4、2。全连接层使用SoftMax为激活函数对数据进行分类识别，训练过程的损失函数均使用交叉熵损失函数，优化器使用Adam。

7.根据权利要求1所述的基于敏感属性再平衡的去偏方法，其特征在于，将合成好的训练集输入到预测模型M_fair中进行训练具体为：

L₁＝-[y·log(p)+(1-y)·log(1-p)]

其中y表示样本的标签，P表示预测结果为1的概率。

8.根据权利要求1所述的基于敏感属性再平衡的去偏方法，其特征在于，计算公平性评估指标的公式如下：

其中

表示模型预测，S为敏感属性，当上式的左右两边的结果相等时则认为预测模型M_fair达到了去偏效果。