CN116663680A - 一种提高机器学习公平性的方法、电子设备及存储介质 - Google Patents

一种提高机器学习公平性的方法、电子设备及存储介质 Download PDF

Info

Publication number
CN116663680A
CN116663680A CN202310960015.1A CN202310960015A CN116663680A CN 116663680 A CN116663680 A CN 116663680A CN 202310960015 A CN202310960015 A CN 202310960015A CN 116663680 A CN116663680 A CN 116663680A
Authority
CN
China
Prior art keywords
machine learning
sensitive
fairness
model
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310960015.1A
Other languages
English (en)
Inventor
何向南
杨泽宇
冯福利
张及之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Data Space Research Institute
Original Assignee
Data Space Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Data Space Research Institute filed Critical Data Space Research Institute
Priority to CN202310960015.1A priority Critical patent/CN116663680A/zh
Publication of CN116663680A publication Critical patent/CN116663680A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/0895Weakly supervised learning, e.g. semi-supervised or self-supervised learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种提高机器学习公平性的方法、电子设备及存储介质,通过基于公平准则的正则项约束父任务的机器学习模型、构建用于有效训练敏感属性学习器的交互式学习框架、使用基于群组的主动学习算法挑选数据集中的少量样本进行敏感属性标注,本发明通过建模公平准则对敏感属性分类器学习的影响,更有效地实现机器学习模型的公平性,同时使用尽可能少的敏感群体标签,在有限标注预算下训练相近效果的模型,从而使得数据获取的成本大大降低。

Description

一种提高机器学习公平性的方法、电子设备及存储介质
技术领域
本发明涉及机器学习技术领域,尤其是涉及一种使用部分敏感群体标签提高机器学习公平性的方法、电子设备及存储介质。
背景技术
近年来,随着人工智能技术不断迅速发展并以多种方式深入影响我们的生活,研究人员开始关注机器学习算法的公平性问题,即模型对不同种群是否会产生偏差性的预测,从而对社会造成各种潜在的危害。它们将不同的公平标准用数学表达式的方法纳入模型训练中,从而利用敏感群体标签约束学习过程以实现模型的公正性。然而,受制于成本、隐私和法律问题等,获取完整的敏感属性信息在现实场景中几乎不可能实现。
部分研究曾尝试应用半监督学习的技术,以训练准确的敏感属性学习器为目标,在有限的预算内生成一个高精度的伪标签数据集。虽然该方法有效地降低了标注成本,但是其未考虑样本选择的重要性,不同样本可能导致很大的性能差异。此外,它们也未考虑公平准则对敏感属性标注的影响,而将其视为单独的任务,这必然导致标注效率的下降。
为了在有限标注预算的前提下,高效地利用敏感属性的标签,我们提出了一个基于贝叶斯损失的交互式主动学习算法。该方法利用公平准则的数学特性,对敏感属性学习器进行合理的限制,并根据模型表现选择最有价值的数据,从而在整体上提高机器学习模型的公平性。
发明内容
本发明的目的是提供一种使用部分敏感群体标签提高机器学习公平性的方法、电子设备及存储介质,通过建模公平准则对敏感属性分类器学习的影响,更有效地实现机器学习模型的公平性,同时使用尽可能少的敏感群体标签,在有限标注预算下训练相近效果的模型,从而使得数据获取的成本大大降低。
本发明为达到上述发明目的,采用如下技术方案:
第一方面,本发明提供一种使用部分敏感群体标签提高机器学习公平性的方法,该方法包括以下步骤:
S1、通过基于公平准则的正则项约束父任务的机器学习模型,以提升机器学习模型预测的公平性;
S2、基于贝叶斯公式建模公平准则对于敏感属性学习器的影响,以构建用于有效训练敏感属性学习器的交互式学习框架;
S3、使用基于群组的主动学习算法挑选数据集中的少量样本进行敏感属性标注,在有限的预算下获得最好的模型性能。
更进一步地,所述交互式学习框架由父任务的机器学习模型和敏感属性学习器模型组成,两个模型交互式训练、迭代更新。
更进一步地,所述父任务的机器学习模型的二分类任务以及其他不同的父任务中,使用公平性指标“人口均等”对父任务的机器学习模型的训练进行约束,表达为:,其中/>代表模型的预测值,/>代表种群,约束的出发点为使得父任务的机器学习模型对不同种群预测的正类比例相近,并将该公平性指标成为模型学习的目标函数,从“人口均等”的定义出发,基于数学近似进行推导得到损失项为:,其中/>表示样本/>的预测伪标签,且由父任务的机器学习模型得到,/>表示样本/>的特征,/>表示样本/>的敏感属性预测值,/>表示敏感属性标签中为0的个数,/>表示敏感属性标签中1的个数。
更进一步地,所述基于贝叶斯公式,对原公平准则进行适当的变形和转化,同样从“人口均等”的定义出发,进行数学推导得到损失项为:,其中/>表示样本/>的预测伪标签,且由父任务的机器学习模型得到,/>表示样本/>的特征,/>表示样本/>的敏感属性标签,/>表示敏感属性标签中为0的个数,/>表示敏感属性标签中1的个数。
更进一步地,在步骤S3中,所述最好的模型性能为通过主动选择数据获得标签,挑选得出对模型学习最有价值的样本。
更进一步地,所述主动学习算法的计算过程为:在给定随机挑选的标注样本的基础上,先分多次在敏感属性学习器模型的训练过程中,从样本池中挑选新样本进行标注,并在每轮挑选新样本时,将所有样本按照群组敏感信息进行分组;然后在训练过程中分别计算敏感属性学习器在每个群组的平均损失,选择平均损失最大的群组:,其中,/>表示敏感属性学习器对样本/>的损失函数;最后通过增加/>倍选择/>族群的概率,使得敏感属性学习器模型能够学习到更多不擅长的样本。
更进一步地,所述主动学习算法的具体计算过程为:
(1)群组主动学习,选择一组样本进行标注,/>表示样本/>的特征,/>表示样本/>的敏感属性标签,询问敏感属性学习器模型后得到样本/>的敏感属性标签;
(2)优化敏感属性学习器,将样本的特征/>输入敏感属性学习器模型,得到样本/>的敏感属性伪标签/>
(3)优化父任务模型,将样本的特征/>、敏感属性伪标签/>输入父任务的机器学习模型,得到样本/>的预测伪标签/>
(4)将样本的预测伪标签/>再次输入敏感属性学习器模型,进一步优化敏感属性学习器,并重复上述步骤进行迭代。
第二方面,本发明提供一种提高机器学习公平性的电子设备,包括存储器以及处理器,存储器存储有计算机可执行指令,处理器被配置为运行所述计算机可执行指令,所述计算机可执行指令被所述处理器运行时实现所述的使用部分敏感群体标签提高机器学习公平性的方法。
第三方面,本发明提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时实现所述的使用部分敏感群体标签提高机器学习公平性的方法。
与现有技术相比,本发明的有益效果如下:
半监督学习技术可以获得相对准确的敏感属性伪标签,但是它们忽略了敏感属性学习器对于父任务模型的直接影响,同时没有最大化利用标注的预算。本发明方法提出了一种交互式训练的框架,由父任务的机器学习模型和敏感属性学习器模型组成,两个模型交互式训练、迭代更新,使得两个模型不断优化并能直接促进算法更加公平,同时还提出了一种主动选择样本的算法,可以有效利用有限的预算获得最好的模型性能;
本发明区别于传统半监督学习随机选取部分数据集进行标注的做法,提出了一种主动选择数据获得标签的算法,该方法的核心思想是挑选出那些对模型学习最有价值的样本。在一定随机挑选的标注样本基础上,分多次在敏感属性学习器模型训练的过程中,从样本池中挑选新样本进行标注。
本发明提出了交互式训练框架将两个模型作为一个整体进行优化,改变了传统半监督方法将预测敏感信息伪标签独立训练的方式,通过全新的正则项使得该模型能够在学习过程中,不只关注预测出准确的敏感属性标签,而是更加直接地去优化父任务模型的公平性。
附图说明
图1为传统的交互式训练学习方法的示意图;
图2为本发明的实施例1中交互式学习框架的示意图;
图3为本发明的实施例1中交互式学习的训练过程的示意图。
具体实施方式
实施例1:
本实施例公开了一种使用部分敏感群体标签提高机器学习公平性的方法,参照图1~3,该方法包括以下步骤:
S1、通过基于公平准则的正则项约束父任务的机器学习模型,以提升机器学习模型预测的公平性;
S2、基于贝叶斯公式建模公平准则对于敏感属性学习器的影响,以构建用于有效训练敏感属性学习器的交互式学习框架;
S3、使用基于群组的主动学习算法挑选数据集中的少量样本进行敏感属性标注,在有限的预算下获得最好的模型性能,最好的模型性能为通过主动选择数据获得标签,挑选得出对模型学习最有价值的样本。
步骤S2中,交互式学习框架由父任务的机器学习模型和敏感属性学习器模型组成,两个模型交互式训练、迭代更新。父任务的机器学习模型的二分类任务以及其他不同的父任务中,使用公平性指标“人口均等”对父任务的机器学习模型的训练进行约束,表达为:,其中/>代表模型的预测值,/>代表种群,约束的出发点为使得父任务的机器学习模型对不同种群预测的正类比例相近,并将该公平性指标成为模型学习的目标函数,从“人口均等”的定义出发,基于数学近似进行推导得到损失项为:,其中/>表示样本/>的预测伪标签,且由父任务的机器学习模型得到,/>表示样本/>的特征,/>表示样本/>的敏感属性预测值,/>表示敏感属性标签中为0的个数,/>表示敏感属性标签中1的个数。基于贝叶斯公式/>,对原公平准则进行适当的变形和转化,同样从“人口均等”的定义出发,进行数学推导得到损失项为:/>,其中/>表示样本/>的预测伪标签,且由父任务的机器学习模型得到,/>表示样本/>的特征,/>表示样本/>的敏感属性标签,/>表示敏感属性标签中为0的个数,/>表示敏感属性标签中1的个数。
步骤S3中,主动学习算法的计算过程为:在给定随机挑选的标注样本的基础上,先分多次在敏感属性学习器模型的训练过程中,从样本池中挑选新样本进行标注,并在每轮挑选新样本时,将所有样本按照群组敏感信息进行分组;然后在训练过程中分别计算敏感属性学习器在每个群组的平均损失,选择平均损失最大的群组:,其中,/>表示敏感属性学习器对样本/>的损失函数;最后通过增加/>倍选择/>族群的概率,使得敏感属性学习器模型能够学习到更多不擅长的样本。该主动学习算法的具体计算过程为:
(1)群组主动学习,选择一组样本进行标注,/>表示样本/>的特征,/>表示样本/>的敏感属性标签,询问敏感属性学习器模型后得到样本/>的敏感属性标签;
(2)优化敏感属性学习器,将样本的特征/>输入敏感属性学习器模型,得到样本/>的敏感属性伪标签/>
(3)优化父任务模型,将样本的特征/>、敏感属性伪标签/>输入父任务的机器学习模型,得到样本/>的预测伪标签/>
(4)将样本的预测伪标签/>再次输入敏感属性学习器模型,进一步优化敏感属性学习器,并重复上述步骤进行迭代。
本实施例为了验证使用部分敏感群体标签提高机器学习公平性的方法,使用了朴素的逻辑回归为基础分类模型,选取两个公开不同类型的数据集Adult、COMPAS进行实验。通过以原始模型Random(传统半监督学习)和AL(主动学习)作为对比模型,发现原始模型Random(传统半监督学习)和AL(主动学习)不会进行交互式训练。对于本发明的实施例1设置了五次选择样本的时间节点,均等地分配标注的预算。对于所有方法设定了标注的预算为300。分别计算模型在数据集Adult和COMPAS上的准确率和公平性性能,并重点关注公平性的性能,实验结果如表1所示。
表1 不同方法在两个数据集上的性能比较
从表1记录的实验结果中可以发现:在两种不同类型的数据集上,本实施例的方法在公平性指标上均超越了传统的半监督学习方法,同时只损失了少量的准确率,说明该方法可以充分利用有限的标注的预算获得更优的模型公平性,证明交互式训练的有效性。与主动学习比较,该方法也可以获得更优秀的结果,说明本方法在选择样本时具有更强的针对性,可以挑选出对模型公平性更有价值的样本。
实施例2:
本实施例公开了一种提高机器学习公平性的电子设备,包括存储器以及处理器,存储器存储有计算机可执行指令,处理器被配置为运行所述计算机可执行指令,计算机可执行指令被处理器运行时实现实施例1公开使用部分敏感群体标签提高机器学习公平性的方法。
实施例3:
本实施例公开了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时实现实施例1公开使用部分敏感群体标签提高机器学习公平性的方法。

Claims (9)

1.一种使用部分敏感群体标签提高机器学习公平性的方法,其特征是,该方法包括以下步骤:
S1、通过基于公平准则的正则项约束父任务的机器学习模型,以提升机器学习模型预测的公平性;
S2、基于贝叶斯公式建模公平准则对于敏感属性学习器的影响,以构建用于有效训练敏感属性学习器的交互式学习框架;
S3、使用基于群组的主动学习算法挑选数据集中的少量样本进行敏感属性标注,在有限的预算下获得最好的模型性能。
2.根据权利要求1所述的使用部分敏感群体标签提高机器学习公平性的方法,其特征是,所述交互式学习框架由父任务的机器学习模型和敏感属性学习器模型组成,两个模型交互式训练、迭代更新。
3.根据权利要求2所述的使用部分敏感群体标签提高机器学习公平性的方法,其特征是,所述父任务的机器学习模型的二分类任务以及其他不同的父任务中,使用公平性指标“人口均等”对父任务的机器学习模型的训练进行约束,表达为:,其中/>代表模型的预测值,/>代表种群,约束的出发点为使得父任务的机器学习模型对不同种群预测的正类比例相近,并将该公平性指标成为模型学习的目标函数,从“人口均等”的定义出发,基于数学近似进行推导得到损失项为:,其中/>表示样本/>的预测伪标签,且由父任务的机器学习模型得到,/>表示样本/>的特征,/>表示样本/>的敏感属性预测值,/>表示敏感属性标签中为0的个数,/>表示敏感属性标签中1的个数。
4.根据权利要求2所述的使用部分敏感群体标签提高机器学习公平性的方法,其特征是,所述基于贝叶斯公式,对原公平准则进行适当的变形和转化,同样从“人口均等”的定义出发,进行数学推导得到损失项为:,其中/>表示样本/>的预测伪标签,且由父任务的机器学习模型得到,/>表示样本/>的特征,/>表示样本/>的敏感属性标签,/>表示敏感属性标签中为0的个数,/>表示敏感属性标签中1的个数。
5.根据权利要求1所述的使用部分敏感群体标签提高机器学习公平性的方法,其特征是,在步骤S3中,所述最好的模型性能为通过主动选择数据获得标签,挑选得出对模型学习最有价值的样本。
6.根据权利要求3所述的使用部分敏感群体标签提高机器学习公平性的方法,其特征是,所述主动学习算法的计算过程为:在给定随机挑选的标注样本的基础上,先分多次在敏感属性学习器模型的训练过程中,从样本池中挑选新样本进行标注,并在每轮挑选新样本时,将所有样本按照群组敏感信息进行分组;然后在训练过程中分别计算敏感属性学习器在每个群组的平均损失,选择平均损失最大的群组:,其中,/>表示敏感属性学习器对样本/>的损失函数;最后通过增加/>倍选择/>族群的概率,使得敏感属性学习器模型能够学习到更多不擅长的样本。
7.根据权利要求6所述的使用部分敏感群体标签提高机器学习公平性的方法,其特征是,所述主动学习算法的具体计算过程为:
(1)群组主动学习,选择一组样本进行标注,/>表示样本/>的特征,/>表示样本的敏感属性标签,询问敏感属性学习器模型后得到样本/>的敏感属性标签;
(2)优化敏感属性学习器,将样本的特征/>输入敏感属性学习器模型,得到样本/>的敏感属性伪标签/>
(3)优化父任务模型,将样本的特征/>、敏感属性伪标签/>输入父任务的机器学习模型,得到样本/>的预测伪标签/>
(4)将样本的预测伪标签/>再次输入敏感属性学习器模型,进一步优化敏感属性学习器,并重复上述步骤进行迭代。
8.一种提高机器学习公平性的电子设备,包括存储器以及处理器,存储器存储有计算机可执行指令,处理器被配置为运行所述计算机可执行指令,其特征在于,所述计算机可执行指令被所述处理器运行时实现权利要求1~7任一项所述的使用部分敏感群体标签提高机器学习公平性的方法。
9.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时实现权利要求1~7任一项所述的使用部分敏感群体标签提高机器学习公平性的方法。
CN202310960015.1A 2023-08-02 2023-08-02 一种提高机器学习公平性的方法、电子设备及存储介质 Pending CN116663680A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310960015.1A CN116663680A (zh) 2023-08-02 2023-08-02 一种提高机器学习公平性的方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310960015.1A CN116663680A (zh) 2023-08-02 2023-08-02 一种提高机器学习公平性的方法、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116663680A true CN116663680A (zh) 2023-08-29

Family

ID=87713974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310960015.1A Pending CN116663680A (zh) 2023-08-02 2023-08-02 一种提高机器学习公平性的方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116663680A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117315379A (zh) * 2023-11-29 2023-12-29 中电科大数据研究院有限公司 面向深度学习的医学影像分类模型公平性评估方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117315379A (zh) * 2023-11-29 2023-12-29 中电科大数据研究院有限公司 面向深度学习的医学影像分类模型公平性评估方法及装置
CN117315379B (zh) * 2023-11-29 2024-03-12 中电科大数据研究院有限公司 面向深度学习的医学影像分类模型公平性评估方法及装置

Similar Documents

Publication Publication Date Title
Yu et al. Beyond bilinear: Generalized multimodal factorized high-order pooling for visual question answering
CN113190699B (zh) 一种基于类别级语义哈希的遥感图像检索方法及装置
CN112819023B (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN111914156B (zh) 自适应标签感知的图卷积网络跨模态检索方法、系统
CN107657008B (zh) 基于深度判别排序学习的跨媒体训练及检索方法
CN111666406B (zh) 基于自注意力的单词和标签联合的短文本分类预测方法
Wang et al. Convolutional neural networks for expert recommendation in community question answering
CN109784405B (zh) 基于伪标签学习和语义一致性的跨模态检索方法及系统
Li et al. Efficient optimization of performance measures by classifier adaptation
Mensink et al. Tree-structured CRF models for interactive image labeling
CN109885728B (zh) 基于元学习的视频摘要方法
CN104112018A (zh) 一种大规模图像检索方法
CN112199532A (zh) 一种基于哈希编码和图注意力机制的零样本图像检索方法及装置
Ji et al. Image-attribute reciprocally guided attention network for pedestrian attribute recognition
CN114943017B (zh) 一种基于相似性零样本哈希的跨模态检索方法
Su et al. Semi-supervised knowledge distillation for cross-modal hashing
CN115080761B (zh) 一种基于语义感知的低资源知识图谱实体对齐方法
CN116663680A (zh) 一种提高机器学习公平性的方法、电子设备及存储介质
CN112800229A (zh) 基于知识图嵌入的涉案领域的半监督方面级情感分析方法
CN113656700A (zh) 基于多相似度一致矩阵分解的哈希检索方法
CN115048539A (zh) 基于动态记忆力的社交媒体数据在线检索方法及系统
Cai et al. Semantic and correlation disentangled graph convolutions for multilabel image recognition
CN110222737A (zh) 一种基于长短时记忆网络的搜索引擎用户满意度评估方法
Perdana et al. Instance-based deep transfer learning on cross-domain image captioning
CN117972122A (zh) 基于相关性匹配的跨模态图文检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230829

RJ01 Rejection of invention patent application after publication