CN115423038A

CN115423038A - 用于确定公平性的方法、装置、电子设备和存储介质

Info

Publication number: CN115423038A
Application number: CN202211193725.8A
Authority: CN
Inventors: 姚元舜; 朱兆伟; 孙建凯; 李航
Original assignee: Beijing Youzhuju Network Technology Co Ltd; Lemon Inc Cayman Island
Current assignee: Beijing Youzhuju Network Technology Co Ltd; Lemon Inc Cayman Island
Priority date: 2022-09-28
Filing date: 2022-09-28
Publication date: 2022-12-02

Abstract

本公开的实施例提供了一种用于确定公平性的方法、装置、电子设备和存储介质。在此描述的确定公平性的方法包括基于目标数据集来确定针对目标数据集的预测分类，并基于目标数据集和预测分类来确定目标模型的公平性指标。方法还包括基于预测分类相对于真实分类的概率分布来纠正目标模型的公平性指标。根据本公开的实施例的确定公平性的方法，针对无敏感变量的目标数据集，无需使用辅助数据对辅助模型进行训练，就能够有效提高目标模型的公平性指标计算的准确度。

Description

用于确定公平性的方法、装置、电子设备和存储介质

技术领域

本公开的实施例涉及计算机领域，并且更具体地，涉及用于确定公平性的方法、装置、电子设备和存储介质。

背景技术

近年来，随着数据的丰富与算力的提升，人工智能(AI)技术得到了快速发展，机器学习技术逐渐融入到社会的各个领域。基于机器学习的人工智能模型经过训练数据训练后，可以基于待处理数据预测特定数据结果，用以辅助人们根据所预测的数据结果进行决策。

例如，在媒体领域中的个性化推荐、法律领域中的同案类案检索、以及金融领域中的信用程度评级等，人工智能模型可以基于待处理数据，针对待预测事项，确定将待处理数据分类到哪项事项中。由此，各种领域可以结合本领域特点训练相应模型，便于评估数据整体情况，进而预测特定数据的分类。

发明内容

本公开的实施例提供了一种用于确定公平性的方案。

在本公开的第一方面，提供了一种确定公平性的方法。该方法包括：基于目标数据集，确定针对目标数据集的预测分类；基于目标数据集和预测分类，确定目标模型的公平性指标；以及基于预测分类相对于真实分类的概率分布，纠正目标模型的公平性指标。根据本公开的第一方面，针对无敏感变量的目标数据集，无需使用辅助数据对辅助模型进行分类训练，就能够有效提高目标模型的公平性指标计算的准确度。

在一些实施例中，其中目标数据集缺乏真实敏感变量，预测分类包括预测的敏感变量，并且确定预测分类包括：基于目标数据集的至少一个特征，通过辅助模型确定目标数据集的预测的敏感变量，其中辅助模型未被标注敏感变量的训练数据而训练。以这种方式，能够借助目标数据集对于辅助模型进行初步敏感变量的预测来对目标数据集标注与噪声相当的预测的敏感变量，从而无需真实或人工标注的敏感变量，能够极大节省资源和成本。

在一些实施例中，纠正目标模型的公平性指标包括：针对辅助模型，通过噪声标签学习确定用于表示概率分布的转移矩阵，其中转移矩阵包括由每个预测分类相对于每个真实分类的概率构成的概率分布；以及基于转移矩阵，纠正目标模型的公平性指标。以这种方式，能够基于转移矩阵来纠正基于带噪声的初步确定的公平性，从而进一步提高目标模型的公平性指标确定的准确度。

在一些实施例中，纠正目标模型的公平性指标还包括：基于转移矩阵，确定第一先验概率；基于预测分类，确定第二先验概率；以及基于第一先验概率、第二先验概率、以及转移矩阵，纠正公平性。在一些实施例中，纠正公平性包括：通过将第一先验概率的对角矩阵的逆矩阵、第二先验概率的对角矩阵、转移矩阵的转置矩阵的逆矩阵以及公平性相乘，更新公平性。在一些实施例中，其中第一先验概率表示统计的先验概率，并且第二先验概率表示带有噪声的先验概率。以这种方式，能够考虑辅助模型和与噪声相当的预测的敏感变量的概率，从而保证目标模型的公平性指标确定的准确度。

在一些实施例中，通过噪声标签学习确定用于表示概率分布的转移矩阵包括：利用基于各噪声标签的距离差分和无约束优化算法的高阶共识算法，确定转移矩阵。以这种方式，能够利用与噪声相当的预测的敏感变量的差分，来缩小预测分类与真实分类之间的差异，从而能够准确地确定用于纠正公平性的转移矩阵。

在一些实施例中，纠正目标模型的公平性指标包括：基于预测分类和真实分类的取值范围，确定用于表示概率分布的转移矩阵的行列结构。以这种方式，能够与分类器的类型对应地确定公平性纠正的具体方式，从而有效提高目标模型的公平性指标确定的准确度。

在一些实施例中，确定针对目标数据集的预测分类包括：由辅助模型确定预测分类，其中辅助模型包括二分类分类器或多分类分类器。在一些实施例中，确定目标模型的公平性指标包括：由目标模型确定目标模型的公平性指标，其中目标模型包括二分类分类器或多分类分类器。在一些实施例中，二分类分类器包括全连接层、激活函数层和二元逻辑回归层，多分类分类器包括全连接层、激活函数层和softmax函数层。以这种方式，能够将人工智能模型的公平性确定的提高方法适用于各种领域的分类器及其分类算法，从而增加了适用范围。

在本公开的第二方面，提供了一种公平性确定装置。该装置包括：预测分类确定模块，被配置为基于目标数据集，确定针对目标数据集的预测分类；公平性指标确定模块，被配置为基于目标数据集和预测分类，确定目标模型的公平性指标；以及公平性指标纠正模块，被配置为基于预测分类相对于真实分类的概率分布，纠正目标模型的公平性指标。

在本公开的第三方面，提供了一种电子设备。该电子设备包括：至少一个处理器；以及存储有计算机可执行指令的至少一个存储器，至少一个存储器和计算机可执行指令被配置为，与至少一个处理器一起，使得电子设备执行根据本公开的第一方面的方法。

在本公开的第四方面，提供了一种计算机可读存储介质。该计算机可读存储介质包括存储在其上的计算机可执行指令，计算机可执行指令在被执行时使一个或多个设备执行根据本公开的第一方面所述的方法。

提供发明内容部分是为了简化的形式来介绍对概念的选择，它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或主要特征，也无意限制本公开的范围。

附图说明

通过结合附图对本公开示例性实施例进行更详细的描述，本公开的上述以及其它目的、特征和优势将变得更加明显，其中，在本公开示例性实施例中，相同的参考标号通常代表相同部件。

图1是示出了根据本公开的一些实施例的示例系统架构的示意图；

图2A示出了根据本公开的一些实施例的用于确定公平性的方法的流程图；

图2B示出了根据本公开的一些实施例的目标模型和辅助模型的纠正架构的示意图；

图3示出了根据本公开的一些实施例的用于纠正模型的公平性指标的方法的流程图；

图4示出了根据本公开的另一实施例的目标模型和辅助模型的纠正架构的示意图；

图5示出了根据本公开的另一实施例的用于纠正模型的公平性指标的方法的流程图；

图6示出了根据本公开的一些实施例的公平性确定装置的示意性框图；以及

图7示出了可以用来实施本公开的实施例的示例设备的示意性框图。

具体实施方式

下面将参考附图中示出的若干示例实施例来描述本公开的原理。虽然附图中显示了本公开的优选实施例，但应当理解，描述这些实施例仅是为了使本领域技术人员能够更好地理解进而实现本公开，而并非以任何方式限制本公开的范围。

在本文中使用的术语“包括”及其变形表示开放性包括，即“包括但不限于”。除非特别申明，术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”、“第三”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

可以理解的是，在使用本公开各实施例公开的技术方案之前，均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。

可以理解的是，本技术方案所涉及的数据(包括但不限于数据本身、数据的获取或使用)应当遵循相应法律法规及相关规定的要求。

如上所述，通过人工智能模型所预测的分类结果能够用于辅助人们进行决策。然而，本申请的发明人注意到，受机器学习自身和技术特征的影响，所预测的分类结果可能包含一定程度的不公平因素。例如，用于推荐的人工智能模型进行训练的训练数据集，往往不会标注学历等涉及个人隐私限制而无法公开获取的敏感变量，而在训练数据集缺乏敏感变量的情况下对用于推荐的人工智能模型进行训练，将导致该人工智能模型的预测结果中不会考虑到一些个人隐私限制，以致可能造成带有偏见的不公平。例如，由于目标模型带有学历偏见，那么低端广告可能会被推荐给学历低的人群，而高端广告会被推荐给学历高的人群，导致模型输出结果存在不公平性。

因此，在训练数据集未被标注敏感变量或者被错误地标注了敏感变量的情况下，训练后的人工智能模型的预测结果可能会对某一个体或特定群体存在偏见，进而导致对该个体或群体的不公正待遇，使其利益受到损害。因此，需要针对人工智能模型确定、评估公平性，并且更新、纠正人工智能模型的这种不公平性，以能够使得人工智能模型进一步可受信赖，实现公平公正。

关于如何确定人工智能模型的公平性，本公开的发明人经研究发现，首先通过人工地对训练数据集中的一部分标注敏感变量，然后利用标注有敏感变量的部分数据计算人工智能模型的公平性指标。然而，在此方法中，需要标注敏感变量的人工资源，经济上和时间上均需要较高成本。同时，由于采样误差、人工标注错误等问题，据此计算得到的公平性指标准确性欠佳。另一方面，本公开的发明人经进一步研究，考虑利用公开的包含敏感变量的数据(例如，政府公开的统计数据或者开源数据)作为辅助数据，通过辅助数据训练处的辅助模型来标注目标数据集的敏感变量，从而计算人工智能模型的公平性指标。然而，在此方法中，要求辅助数据与目标数据独立同分布(Independent IdenticallyDistribution)，否则据此计算得到的公平性指标准确性依然欠佳，并且往往难以从公开渠道获取完整或准确的包含敏感变量的数据，无法应对各类人工智能模型的公平性指标计算。

为了至少解决上述问题，本公开的示例实施例提出了一种用于确定公平性的方案，该方案基于目标数据集确定针对所述目标数据集的预测分类，并基于所述目标数据集和预测分类确定目标模型的公平性指标。该方法还基于预测分类相对于真实分类的概率分布来纠正目标模型的公平性指标。根据本公开的实施例的确定公平性的方法，针对无敏感变量的目标数据集，无需使用辅助数据对辅助模型进行训练，就能够有效提高目标模型的公平性指标计算的准确度。也就是说，基于由辅助模型对缺乏敏感变量的目标数据集的预测分类，初步确定目标模型的带噪声的公平性指标，进一步基于该预测分类相对于真实分类的概率分布来纠正这一公平性指标，从而以例如噪声标签学习的方式处理带有预测的敏感变量的数据。因此，本公开的实施例无需带有敏感变量的目标数据集，也无需利用辅助数据对辅助模型进行公平性训练，就能够有效地提高目标模型的公平性指标计算的准确度，以便进一步客观评估目标模型的公平性。

图1是示出了根据本公开的一些实施例的系统架构100的示意图。如图1所示，系统架构100可以包括用于辅助预测敏感变量的辅助模型110、待进行公平性评估的目标模型120以及目标数据集130。应当理解，图1中的系统架构100可以包括更多的或更少的功能设备，不限于此。

在一些实施例中，辅助模型110和目标模型120可以集成地或单独地部署于节点上，该节点可以是能够实现目标模型和/或辅助模型的处理资源，例如可以包括图形处理器(Graphics Processing Unit，GPU)、中央处理器(Central Processing Unit，CPU)等用于数据处理的任意形式的计算资源。在一些实施例中，目标模型和/或辅助模型可以是基于神经网络的人工智能模型，例如包括基于卷积神经网络(Convolutional Neural Networks，CNN)、全卷积神经网络(Fully Convolutional Network，FCN)、生成式对抗网络(Generative Adversarial Networks，GAN)、循环神经网络(Recurrent Neural Network，RNN)、或长短期记忆网络(Long Short-Term Memory，LSTM)等任意神经网络的模型。

在一些实施例中，目标数据集130可以向辅助模型110、目标模型120提供目标数据。在本公开的实施例中，目标数据集130并不包括敏感变量，在不包括敏感变量的情况下作为目标模型120和/或辅助模型110的模型输入。在本文中，术语“敏感变量”表示对于人工智能模型的公平性产生影响的变量，例如是由于隐私、限制、道德、政策、法律、结构性缺损等因素而难以公开获取、难以完整获取或难以保证准确性的数据项。在本公开的实施例中，目标数据集可以包括各种结构化数据和非结构化数据(例如，图像数据、文本数据、语音数据)等，本公开的实施例对此不做限制，只要是适合于人工智能模型进行训练、预测等处理的数据即可。

如图1所示，在本公开的一些实施例中，基于目标数据集130，通过辅助模型110确定目标数据集130中的各个目标数据的预测分类115。然后基于目标数据集130和预测分类115，确定目标模型120的噪声公平性指标125，由于辅助模型110是未经训练的模型，因而噪声公平性指标125是不准确的。根据本公开的实施例，基于预测分类相对于真实分类的概率分布135，纠正目标模型120的公平性指标，进而获得纠正后公平性指标145，由此能够表征目标模型120的公平性状况。以下参考图2A至图7进一步描述本公开的各个实施例。

图2A示出了根据本公开的一些实施例的用于确定公平性的方法200的流程图，其中图2A的流程可以适于后述图2B和图4所示的辅助模型和目标模型的纠正架构。

图2B示出了根据本公开的一些实施例的目标模型120和辅助模型110的纠正架构250的示意图。在本公开的实施例中，目标模型120可以包括二分类分类器或多分类分类器，辅助模型110也可以包括二分类分类器或多分类分类器。在本公开的一个示例中，例如从包括昵称、浏览时长等数据项的数据集来预测消费意愿的情形，其中敏感变量可以为性别(男/女)，预测分类为男(例如，取值为1)或女(例如，取值为0)，目标模型120为基于目标数据集将消费意愿分类为高(例如，取值为1)或低(例如，取值为0)的二分类分类器，辅助模型110为基于目标数据集将敏感变量分类为男(例如，取值为1)或女(例如，取值为0)的二分类分类器。应当理解，在本公开的实施例中，二分类分类器支持的算法可以包括基于逻辑回归的二分类算法、基于支持向量机的二分类算法、基于决策树的二分类算法等，本公开的实施例不限于此，只要是能够实现本公开的实施例的二分类分类器均可。以这种方式，能够将人工智能模型的公平性指标计算方法适用于各种领域的分类器及其分类算法，从而增加了适用范围。

参考图2A，在201处，基于目标数据集，确定针对目标数据集的预测分类。例如，如图2B所示，辅助模型110依次包括全连接层211、激活函数层212、全连接层213和二元逻辑回归层214。在一些实施例中，例如，目标数据集向辅助模型110(例如，g(.)，

)提供目标数据集X(例如，包括昵称、浏览时长)，辅助模型110基于目标数据集X中的至少一部分作为输入t，依次经由全连接层211、激活函数层212、全连接层213提取目标数据集X中的特征并进行映射，然后经由二元逻辑回归层214预测目标数据集的预测分类

男(例如，

取值为1)或女(例如，

取值为0)。应当理解，输入t可以是目标数据集X中的所有特征，也可以是一部分特征，只要能够用于辅助模型预测分类即可。

在203处，基于目标数据集和预测分类，确定目标模型的公平性指标，即噪声公平性指标。例如，如图2B所示，目标模型120(例如，f(.))依次包括全连接层221、激活函数层222、全连接层223和二元逻辑回归层224。在一些实施例中，例如，目标模型120获取从辅助模型110得到的预测分类

从目标数据集130获取目标数据集X，目标模型120基于目标数据集X和预测分类

利用如下公式1确定目标模型120的噪声公平性指标

在一些实施例中，目标模型120将目标数据集X和预测分类

作为输入，依次经由全连接层221、激活函数层222、全连接层223提取目标数据集X和预测分类

中的特征并进行映射，然后经由二元逻辑回归层224预测目标模型120的噪声公平性指标

其中该噪声公平性指标

表示目标模型120的公平性程度，但是由于辅助模型110是未被训练的，因而是不准确的。在一些实施例中，公平性指标

例如可以是平等发生率(Equal Odds)、平等机会率(Equal Opportunity)、社会人口差异率(Demographic Disparity)等。

在205处，基于预测分类相对于真实分类的概率分布，纠正目标模型的公平性指标。例如，参考图2B，基于在201处确定的预测分类

相对于真实分类A的概率分布，针对在203处确定的噪声公平性指标

进行纠正，从而计算出纠正后公平性指标

在一些实施例中，可以基于纠正后公平性指标

来评估目标模型的公平性程度。

因此，根据本公开的实施例的确定公平性的方法200，针对无敏感变量的目标数据集，无需使用辅助数据对辅助模型进行训练，就能够有效提高目标模型的公平性指标计算的准确度。

此外，如图2B所示，在纠正公平性指标的过程中，可以根据辅助模型110生成对应的转移矩阵，进而确定出第一先验概率(即统计的先验概率)。基于预测分类，可以确定出第二先验概率(即带噪声的先验概率)。接下来，可以基于转移矩阵、第一先验概率、第二先验概率、噪声公平性指标，来计算出纠正后公平性指标。

图3示出了根据本公开的一些实施例的用于纠正模型的公平性的方法300的流程图。在本公开的实施例中，目标数据集X缺乏真实敏感变量，预测分类

包括预测的敏感变量。如图3的301所示，基于目标数据集X的至少一个特征，通过辅助模型110确定目标数据集X的预测的敏感变量，其中辅助模型未被标注敏感变量的训练数据而训练。在一些实施例中，例如，目标数据集X未被标注真实敏感变量A(例如，真实的性别男或女)，预测分类包括预测的敏感变量

(例如，性别男或女)。在进一步的实施例中，基于目标数据集X(例如，包括昵称、浏览时长)中的至少一个特征t(例如，昵称)，通过辅助模型110(例如，

)确定目标数据集X的预测的敏感变量

其中辅助模型110未被标注敏感变量的训练数据而训练。也就是说，在本公开的实施例中，辅助模型110无需利用已经人工标注有敏感变量的数据或者公开的包含敏感变量的数据(例如，政府公开的统计数据或者开源数据)作为辅助数据，通过辅助数据来标注目标数据集的敏感变量，而是能够直接利用目标数据集进行分类预测。以这种方式，能够借助目标数据集对于辅助模型进行初步敏感变量的预测来对目标数据集标注与噪声相当的预测的敏感变量，从而无需真实或人工标注的敏感变量，能够极大节省资源和成本。

在本公开的实施例中，如图3的303所示，基于目标数据集和预测分类，确定目标模型的公平性指标。在一些实施例中，例如，目标模型120获取从辅助模型110得到的预测分类

基于目标数据集X和预测分类

利用公式1确定目标模型120的公平性指标

如图3的304所示，基于所述预测分类和所述真实分类的取值范围，确定用于表示概率分布的转移矩阵的行列结构(2×2)。在本公开的实施例中，如图3的305所示，针对辅助模型110，通过噪声标签学习确定用于表示概率分布的转移矩阵，其中转移矩阵包括由每个预测分类相对于每个真实分类的概率构成的概率分布。在一些实施例中，例如，通过噪声标签学习针对辅助模型110，确定用于表示预测分类

相对于真实分类A的概率分布的如下转移矩阵：

其中，该转移矩阵例如包括由预测分类男相对于真实分类男、预测分类男相对于真实分类女、预测分类女相对于真实分类男、预测分类女相对于真实分类女的概率构成的概率分布。例如，在304确定的行列结构(2×2)中，由于预测分类

的取值范围为(0，1)并且真实分类A的取值范围为(0，1)，确定2×2的概率分布。以这种方式，能够与分类器的类型对应地确定公平性纠正的具体方式，能够有效提高目标模型的公平性指标确定的准确度。在一些实施例中，噪声标签学习(Noisy Label Learning)例如可以基于置信学习(Confidence Learning)、遗忘事件(Forgetting Event)、采样损失值、样本相似度来进行。以这种方式，能够基于转移矩阵来纠正基于带噪声的初步确定的公平性，能够有效地提高目标模型的公平性指标确定的准确度。例如，噪声标签学习也可以采用基于各噪声标签的距离差分和无约束优化算法的高阶共识(High-Order Consensuses)算法来进行，其中无约束优化算法可以包括梯度下降法、牛顿法、共轭梯度法等。以这种方式，能够利用与噪声相当的预测的敏感变量的差分，来缩小预测分类与真实分类之间的差异，从而能够准确地确定用于纠正公平性的转移矩阵。

在306处，基于转移矩阵确定第一先验概率，并且基于预测分类确定第二先验概率。在一些实施例中，例如，基于在305处确定的转移矩阵，利用如下公式3确定第一先验概率，基于预测分类

利用如下公式4确定第二先验概率。

在一些实施例中，第一先验概率表示统计的先验概率，第二先验概率表示基于噪声标签学习的带有噪声的先验概率。应当理解，确定先验概率的方法可以基于事先估计的概率分布而以任意的方式确定，在一些情况下也可以采用后验概率来实现。

在307处，基于第一先验概率、第二先验概率、以及转移矩阵，来纠正目标模型的公平性指标。在一些实施例中，通过将第一先验概率的对角矩阵的逆矩阵、第二先验概率的对角矩阵、转移矩阵的转置矩阵的逆矩阵以及目标模型的公平性指标相乘，更新目标模型的公平性指标，确定更新后的目标模型120的公平性

在一些实施例中，例如，利用如下公式5将第一先验概率的对角矩阵的逆矩阵

第二先验概率的对角矩阵

转移矩阵的转置矩阵的逆矩阵

以及目标模型120的噪声公平性指标

进行矩阵相乘，得到更新后的目标模型120的纠正后公平性指标

在一些实施例中，纠正后公平性指标

在进一步的实施例中，可以用来评估目标模型120的公平性程度。在进一步的实施例中，可以基于纠正后公平性指标

和敏感变量的取值范围(例如，1或0)，来确定目标模型120的公平性。例如，在目标模型120的公平性以社会人口差异来表征的情况下，目标模型120的公平性可以表示为

以这种方式，能够考虑辅助模型和与噪声相当的预测的敏感变量的概率分布，从而有效地提高目标模型的公平性指标确定的准确度。

根据本公开的实施例，基于由辅助模型对缺乏敏感变量的目标数据集的预测分类，初步确定目标模型的公平性指标，进一步基于该预测分类相对于真实分类的概率分布来纠正目标模型的公平性指标，从而以噪声标签学习的方式处理带有预测的敏感变量的数据，无需带有敏感变量的目标数据，也无需利用辅助数据对辅助模型进行训练，就能够有效地提高目标模型的公平性指标确定的准确度。例如，通过公平性纠正后的目标模型对于目标数据集进行处理，能够预测对于男女更为平等的消费意愿高低的判断，而减轻了原目标数据集中所存在的性别偏见，从而实现更公平的信息推荐。

在以上图2B及图3的实施例中，以目标模型和辅助模型为二分类分类器的情形为例进行了说明，本公开的实施例的用于确定公平性的方法还适用于目标模型和辅助模型为多分类分类器的情形。图4示出了根据本公开的另一实施例的目标模型和辅助模型的架构400的示意图。在本公开的另一实施例中，例如从包括昵称、浏览时长等数据项的数据集预测消费意愿的情形，其中敏感变量为年龄层(老年/中年/青年/儿童)，预测分类为老年(例如，取值为3)、中年(例如，取值为2)、青年(例如，取值为1)、儿童(例如，取值为0)，目标模型120为基于目标数据集将消费意愿分类为高(例如，取值为3)、中(例如，取值为2)、低(例如，取值为1)、无(例如，取值为0)的多分类分类器，辅助模型110为基于目标数据集将敏感变量分类为老年(例如，取值为3)、中年(例如，取值为2)、青年(例如，取值为1)、儿童(例如，取值为0)的多分类分类器。在上述示例中，敏感变量、预测分类的取值范围的值K均为4。应当理解，在本公开的实施例中，多分类分类器支持的算法可以包括基于softmax函数的多分类算法、基于K最邻近(K-Nearest Neighbor，KNN)的多分类算法、基于随机森林(RandomForest)的多分类算法、基于决策树的多分类算法等，但不限于此，只要是能够实现本公开的实施例的多分类分类器均可。以这种方式，能够将人工智能模型的公平性确定的提高方法适用于各种领域的分类器及其分类算法，从而增加了适用范围。

参考图4，辅助模型110依次包括全连接层411、激活函数层412、全连接层413和softmax函数层414。在一些实施例中，例如，目标数据集向目标模型120上部署的辅助模型(例如，g(.)，

)提供目标数据集X(例如，包括昵称、浏览时长)，辅助模型110基于目标数据集X中的至少一部分作为输入t，依次经由全连接层411、激活函数层412、全连接层413提取目标数据集X中的特征并进行映射，然后经由softmax函数层414预测目标数据集的分类

老年(例如，

取值为3)、中年(例如，

取值为2)、青年(例如，

取值为1)、儿童(例如，

继续参考图4，目标模型120(例如，f(.))依次包括全连接层421、激活函数层422、全连接层423和softmax函数层424。在一些实施例中，例如，目标模型120获取从辅助模型110得到的预测分类

确定目标模型120的公平性指标

例如，目标模型120将目标数据集X和预测分类

作为输入，依次经由全连接层421、激活函数层422、全连接层423提取目标数据集X和预测分类

中的特征并进行映射，然后经由softmax函数层424预测目标模型120的噪声公平性指标

其中噪声公平性指标

表示目标模型120的预测的公平性程度。

继续参考图4，基于所确定的预测分类

相对于真实分类A的概率分布，针对所确定的噪声公平性指标

进行纠正，确定纠正后公平性指标

在一些实施例中，可以基于纠正后公平性指标

来评估目标模型的公平性程度。此外，在纠正公平性指标的过程中，可以根据辅助模型110生成对应的转移矩阵，进而确定出第一先验概率(即统计的先验概率)。基于预测分类，可以确定出第二先验概率(即带噪声的先验概率)。接下来，可以基于转移矩阵、第一先验概率、第二先验概率、噪声公平性指标，来计算出纠正后公平性指标

图5示出了根据本公开的另一实施例的用于纠正模型的公平性的方法500的流程图。在本公开的实施例中，目标数据集缺乏真实敏感变量，预测分类包括预测的敏感变量。如图5的501所示，基于目标数据集的至少一个特征，通过辅助模型确定目标数据集的预测的敏感变量，其中辅助模型未被标注敏感变量的训练数据而训练。在一些实施例中，例如，目标数据集X未被标注真实敏感变量A(例如，真实的年龄层为老年/中年/青年/儿童)，预测分类包括预测的敏感变量

(例如，年龄层为老年/中年/青年/儿童)。在进一步的实施例中，基于目标数据集X(例如，包括昵称、浏览时长)中的至少一个特征t(例如，昵称)，通过辅助模型110(例如，

)确定目标数据集X的预测的敏感变量

在本公开的实施例中，如图5的503所示，基于目标数据集和预测分类，确定目标模型的公平性指标。在一些实施例中，例如，目标模型120获取从辅助模型110得到的预测分类

基于目标数据集X和预测分类

确定目标模型120的噪声公平性指标

在本公开的实施例中，如图5的504所示，基于预测分类和真实分类的取值范围，确定用于表示概率分布的转移矩阵的行列结构(K×K)。如图5的505所示，针对辅助模型，通过噪声标签学习确定用于表示概率分布的转移矩阵

其中转移矩阵

包括由每个预测分类相对于每个真实分类的概率构成的概率分布。例如，在本公开的实施例中，由于预测分类

的取值范围为(0，1，2，3)并且真实分类A的取值范围为(0，1，2，3)，确定4×4的概率分布。以这种方式，能够与分类器的类型对应地确定公平性纠正的具体方式，能够有效提高目标模型的公平性指标确定的准确度。在一些实施例中，例如，通过噪声标签学习针对辅助模型110，确定用于表示预测分类

相对于真实分类A的概率分布的转移矩阵。在一些实施例中，噪声标签学习例如可以基于置信学习、遗忘事件、采样损失值、样本相似度来进行，例如也可以采用高阶共识算法来进行。以这种方式，能够基于转移矩阵来纠正基于带噪声的初步确定的公平性，能够有效地提高目标模型的公平性指标确定的准确度。例如，噪声标签学习也可以采用基于各噪声标签的距离差分和无约束优化算法的高阶共识(High-OrderConsensuses)算法来进行，其中无约束优化算法可以包括梯度下降法、牛顿法、共轭梯度法等。以这种方式，能够利用与噪声相当的预测的敏感变量的差分，来缩小预测分类与真实分类之间的差异，从而能够准确地确定用于纠正公平性的转移矩阵。

在506处，基于转移矩阵确定第一先验概率，并且基于预测分类确定第二先验概率。在一些实施例中，例如，基于在505处确定的转移矩阵，确定第一先验概率

基于预测分类

确定第二先验概率

在507处，基于第一先验概率、第二先验概率、以及转移矩阵，纠正目标模型的公平性指标。在一些实施例中，通过将第一先验概率的对角矩阵的逆矩阵、第二先验概率的对角矩阵、转移矩阵的转置矩阵的逆矩阵以及目标模型的公平性指标相乘，更新目标模型的公平性指标，确定更新后的目标模型120的公平性

在一些实施例中，例如，利用上述公式5将第一先验概率的对角矩阵的逆矩阵

第二先验概率的对角矩阵

转移矩阵的转置矩阵的逆矩阵

以及目标模型120的公平性

进行矩阵进行相乘，得到更新后的目标模型120的公平性

在一些实施例中，可以基于纠正后公平性指标

来评估目标模型120的公平性程度。在进一步的实施例中，可以基于纠正后公平性指标

和敏感变量的取值范围(例如，3、2、1或0)，来确定目标模型120的公平性。例如，在目标模型120的公平性以社会人口差异来表征的情况下，目标模型120的公平性可以表示为

以这种方式，能够考虑辅助模型和与噪声相当的预测的敏感变量的概率，从而有效地提高目标模型的公平性指标确定的准确度。

根据本公开的实施例，基于由辅助模型对缺乏敏感变量的目标数据集的预测分类，初步确定目标模型的公平性指标，进一步基于该预测分类相对于真实分类的概率分布来纠正目标模型的公平性指标，从而以噪声标签学习的方式处理带有预测的敏感变量的数据，无需带有敏感变量的目标数据和/或辅助数据，也无需对辅助模型进行公平性训练就能够有效地提高目标模型的公平性指标确定的准确度，以便进一步优化目标模型的公平性指标。例如，通过公平性纠正后的目标模型对于目标数据集进行处理，能够预测对于各年龄层更为平等的消费意愿的分级判断，而减轻了原目标数据集中所存在的年龄偏见，从而实现更公平的大数据预测。

应当理解，在本公开的实施例中，辅助模型和目标模型的数量不限于一个，也可以是多个的组合，辅助模型和目标模型的分类器类型也可以进行任意的组合。应当理解，在一些实施例中，预测的敏感变量和真实的敏感变量各自包括的变量数量也不限于一种，也可以是多种的任意组合。

根据发明人的进一步研究，根据本公开的实施例的用于确定公平性的方法，纠正后公平性与未纠正的公平性相比接近真实公平性的程度若以平等发生率(Equal Odds)、平等机会率(Equal Opportunity)、社会人口差异率(Demographic Disparity)来表示，则如下表1所示：

表1本公开的实施例的纠正方案提高的准确度实验

如上表1所示，根据本公开的用于确定公平性的方法，纠正后公平性与未纠正的公平性相比接近真实公平性的程度能够提高47％至89％的准确度。

图6示出了根据本公开的一些实施例的公平性确定装置600的示意性框图。如图6所示，公平性确定装置600包括预测分类确定模块610、公平性指标确定模块620及公平性指标纠正模块630。预测分类确定模块610被配置为基于目标数据集，确定针对目标数据集的预测分类。公平性指标确定模块620被配置为基于目标数据集和预测分类，确定目标模型的公平性指标。公平性指标纠正模块630被配置为基于预测分类相对于真实分类的概率分布，纠正目标模型的公平性指标。根据本公开的公平性确定装置600，针对无敏感变量的目标数据集，无需使用辅助数据对辅助模型进行分类训练，就能够有效提高目标模型的公平性指标确定的准确度。

在一些实施例中，其中目标数据集缺乏真实敏感变量，预测分类包括预测的敏感变量，并且预测分类确定模块610包括敏感变量确定模块，被配置为基于目标数据集的至少一个特征，通过辅助模型确定目标数据集的预测的敏感变量，其中辅助模型未被标注敏感变量的训练数据而训练。以这种方式，能够借助目标数据集对于辅助模型进行初步敏感变量的预测来对目标数据集标注与噪声相当的预测的敏感变量，从而无需真实或人工标注的敏感变量，能够极大节省资源和成本。

在一些实施例中，公平性指标纠正模块630包括转移矩阵确定模块。在一些实施例中，转移矩阵确定模块被配置为针对辅助模型，通过噪声标签学习确定用于表示概率分布的转移矩阵，其中转移矩阵包括由每个预测分类相对于每个真实分类的概率构成的概率分布。在一些实施例中，公平性指标纠正模块630被配置为基于转移矩阵，纠正目标模型的公平性指标。以这种方式，能够基于转移矩阵来纠正基于带噪声的初步确定的公平性，能够有效地提高目标模型的公平性指标确定的准确度。

在一些实施例中，公平性指标纠正模块630包括先验概率确定模块。在一些实施例中，先验概率确定模块被配置为基于转移矩阵确定第一先验概率，基于预测分类确定第二先验概率，并且基于第一先验概率、第二先验概率、以及转移矩阵，纠正公平性。在一些实施例中，公平性指标纠正模块630通过将第一先验概率的对角矩阵的逆矩阵、第二先验概率的对角矩阵、转移矩阵的转置矩阵的逆矩阵以及公平性进行相乘，来更新公平性。在一些实施例中，第一先验概率表示统计的先验概率，并且第二先验概率表示带有噪声的先验概率。以这种方式，能够考虑辅助模型和与噪声相当的预测的敏感变量的概率，从而有效地提高目标模型的公平性指标确定的准确度。

在一些实施例中，在一些实施例中，转移矩阵确定模块包括高阶共识计算模块，被配置为利用基于各噪声标签的距离差分和无约束优化算法的高阶共识算法，确定转移矩阵。以这种方式，能够利用与噪声相当的预测的敏感变量的差分，来缩小预测分类与真实分类之间的差异，从而能够准确地确定用于纠正公平性的转移矩阵。

在一些实施例中，在一些实施例中，转移矩阵确定模块包括行列结构确定模块，被配置为基于预测分类和真实分类的取值范围，确定用于表示概率分布的转移矩阵的行列结构。以这种方式，能够与分类器的类型对应地确定公平性纠正的具体方式，能够有效提高目标模型的公平性指标确定的准确度。

在一些实施例中，预测分类确定模块610通过辅助模型确定预测分类，其中辅助模型包括二分类分类器或多分类分类器。在一些实施例中，公平性指标确定模块620通过目标模型确定目标模型的公平性指标，其中目标模型包括二分类分类器或多分类分类器。在一些实施例中，二分类分类器包括全连接层、激活函数层和二元逻辑回归层，多分类分类器包括全连接层、激活函数层和softmax函数层。以这种方式，能够将人工智能模型的公平性确定的提高方法适用于各种领域的分类器及其分类算法，从而增加了适用范围。

图7示出了可以用来实施本公开的实施例的示例设备700的示意性框图。设备700可以用于上述用于确定公平性的处理。如图7所示，设备700包括中央处理单元(CPU)701，其可以根据存储在只读存储器(ROM)702中的计算机程序指令或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序指令，来执行各种适当的动作和处理。在RAM 703中，还可存储设备700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

上文所描述的各个过程和处理，例如用于确定公平性的区域确定处理、区域切分处理及对象配置处理，可由处理单元701执行。例如，在一些实施例中，区域确定处理、区域切分处理及对象配置处理可以被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序被加载到RAM 703并由CPU701执行时，可以执行上文描述的区域确定处理、区域切分处理及对象配置处理的一个或多个动作。

本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是——但不限于——电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种用于确定公平性的方法，包括：

基于目标数据集，确定针对所述目标数据集的预测分类；

基于所述目标数据集和所述预测分类，确定目标模型的公平性指标；以及

基于所述预测分类相对于真实分类的概率分布，纠正所述目标模型的所述公平性指标。

2.根据权利要求1所述的方法，其中所述目标数据集缺乏真实的敏感变量，所述预测分类包括预测的敏感变量，并且确定所述预测分类包括：

基于所述目标数据集的至少一个特征，通过辅助模型确定所述目标数据集的所述预测的敏感变量，其中所述辅助模型未被标注敏感变量的训练数据而训练。

3.根据权利要求2所述的方法，其中纠正所述目标模型的所述公平性指标包括：

针对所述辅助模型，通过噪声标签学习来确定用于表示所述概率分布的转移矩阵，其中所述转移矩阵包括由每个预测分类相对于每个真实分类的概率分布；以及

基于所述转移矩阵，纠正所述目标模型的所述公平性指标。

4.根据权利要求3所述的方法，其中纠正所述目标模型的所述公平性指标还包括：

基于所述转移矩阵，确定第一先验概率；

基于所述预测分类，确定第二先验概率；以及

基于所述第一先验概率、所述第二先验概率、以及所述转移矩阵，纠正所述公平性。

5.根据权利要求4所述的方法，其中纠正所述公平性包括：

通过将所述第一先验概率的对角矩阵的逆矩阵、所述第二先验概率的对角矩阵、所述转移矩阵的转置矩阵的逆矩阵以及所述公平性进行相乘，来更新所述公平性。

6.根据权利要求4所述的方法，其中所述第一先验概率表示统计的先验概率，并且所述第二先验概率表示带噪声的先验概率。

7.根据权利要求3所述的方法，其中通过噪声标签学习确定用于表示所述概率分布的转移矩阵包括：

利用基于各噪声标签的距离差分和无约束优化算法的高阶共识算法，确定所述转移矩阵。

8.根据权利要求1所述的方法，其中纠正所述目标模型的所述公平性指标包括：

基于所述预测分类和所述真实分类的取值范围，确定用于表示所述概率分布的转移矩阵的行列结构。

9.根据权利要求1所述的方法，其中确定针对所述目标数据集的预测分类包括：

由辅助模型确定所述预测分类，其中所述辅助模型包括二分类分类器或多分类分类器。

10.根据权利要求1所述的方法，其中确定目标模型的公平性指标包括：

由所述目标模型生成所述公平性指标，其中所述目标模型包括二分类分类器或多分类分类器。

11.根据权利要求9或10所述的方法，其中所述二分类分类器包括全连接层、激活函数层和二元逻辑回归层，并且所述多分类分类器包括全连接层、激活函数层和softmax函数层。

12.一种公平性确定装置，包括：

预测分类确定模块，被配置为基于目标数据集，确定针对所述目标数据集的预测分类；

公平性指标确定模块，被配置为基于所述目标数据集和所述预测分类，确定目标模型的公平性指标；以及

公平性指标纠正模块，被配置为基于所述预测分类相对于真实分类的概率分布，纠正所述目标模型的所述公平性指标。

13.一种电子设备，其特征在于，包括：

处理器；以及

存储器，所述存储器存储有指令，所述指令在被所述处理器执行时，使得所述电子设备执行根据权利要求1至11中任一项所述的方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有指令，所述指令在被电子设备执行时，使得所述电子设备执行根据权利要求1至11中任一项所述的方法。