CN114048860A - 提高机器学习模型公平性的多目标训练方法及计算机设备 - Google Patents
提高机器学习模型公平性的多目标训练方法及计算机设备 Download PDFInfo
- Publication number
- CN114048860A CN114048860A CN202110655819.1A CN202110655819A CN114048860A CN 114048860 A CN114048860 A CN 114048860A CN 202110655819 A CN202110655819 A CN 202110655819A CN 114048860 A CN114048860 A CN 114048860A
- Authority
- CN
- China
- Prior art keywords
- machine learning
- learning model
- fairness
- indexes
- accuracy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 331
- 238000012549 training Methods 0.000 title claims abstract description 96
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000005457 optimization Methods 0.000 claims abstract description 30
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 20
- 238000005259 measurement Methods 0.000 claims abstract description 17
- 238000005303 weighing Methods 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 3
- 230000003094 perturbing effect Effects 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 abstract description 13
- 238000013210 evaluation model Methods 0.000 abstract description 4
- 239000002699 waste material Substances 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000013209 evaluation strategy Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种提高机器学习模型公平性的多目标训练方法及计算机设备,尤其是在伦理问题的公平性背景中的提高机器学习模型公平性的多目标训练方法,该方法包括:根据场景确定多个正交性的公平性指标和准确性指标;使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。考虑多个具有正交性的指标,通过使用多个指标可以得到多角度的评估模型公平性,使评估更加全面,由于其“正交性”,不会重复从同一角度评估,避免计算资源的浪费或被动增加该指标的重要性。进一步的,确定的第三机器学习模型集能够兼顾多个、具有多样性的、正交性的公平性衡量指标,在准确性与多个公平性之间得到不同的优选折中方案集。
Description
技术领域
本发明实施例涉及机器学习技术,尤其涉及一种在伦理问题的公平性背景中的提高机器学习模型公平性的多目标训练方法及计算机设备。
背景技术
随着机器学习在不同应用中的广泛使用,机器学习的安全性和公平性的要求越来越高。大量的研究者尝试解决机器学习中不公平性的问题。
机器学习模型被广泛的应用于产品推荐、贷款申请人的风险评估、简历的自动筛选等预测类任务辅助人类决策。
然而,数据驱动的机器学习模型会因为训练数据(通常是包含人类决策的数据)中存在的“不公平性”或“偏见”,导致存在不公平或偏见的预测。
如图1所示,目前的一种实现方式为,以预测准确性指标为目标,使用训练数据训练机器学习模型。根据某个公平性指标对训练后获得的模型进行评估。该模型被一个或多个公平性指标是否判为公平。如果公平,则输出模型。如果不公平,则不使用该模型。通过对训练数据进行处理,如去除掉偏见数据,使用处理后的训练数据再次训练模型。上述实现方式在模型训练过程中未考虑公平性。
如图2所示,目前的另一种实现方式为,以预测准确性指标和单个公平性指标的加权和为目标,使用训练数据训练机器学习模型。根据某个公平性指标对训练后获得的模型进行评估。判断该模型被一个或多个公平性指标是否判公平。如果公平,则输出模型。如果不公平,则不使用该模型。通过对训练数据进行处理,如去掉偏见数据,或者改变预测准确性指标和单个公平性指标的加权和公式,再次训练模型。上述实现方式在机器学习模型训练过程中只考虑一个公平性指标,并且需要在训练前决定公平性指标和模型准确性指标的权值,一次训练只能获得一个相应的模型。因此,当处理不同问题时,需要调整其不同的权重值,来达到用户可接受的结果。当不同的用户需要在不同公平性指标与准确性指标之间具有不同的折中要求时,只能重新运行算法才能得到另一个折中方案的结果。
可见,目前的机器学习模型公平性相关研究主要围绕定义和量化多种多样的衡量机器学习模型公平性的指标,或是以一个公平性衡量指标为目标,通过数据清洗或优化算法、修改机器学习模型训练方式、目标函数等技术来提高所训练机器学习模型的公平性。由于公平性衡量指标的评估角度不同,不同指标之间可能存在矛盾。只考虑一个公平性衡量指标训练机器学习模型时,使用另一个公平性衡量指标评估所获得的模型时,可能因为两种指标的评估角度不同或矛盾性而获得相反的评估结果。如何获得在多种角度的公平性与准确性之间达到不同的优选折中方案成为亟待解决的问题。
发明内容
本发明提供一种提高机器学习模型公平性的多目标训练方法及计算机设备,以实现兼顾多个、具有多样性的、正交性的公平性衡量指标,在准确性与多个公平性之间得到不同的优选折中方案集,提高机器学习模型的公平性和准确性。
第一方面,本发明实施例提供了一种提高机器学习模型公平性的多目标训练方法,包括:
根据场景确定多个正交性的公平性指标和准确性指标;
使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。
在上述实施方式的基础上,所述使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化,包括:
步骤1、对多个第一机器学习模型进行训练;
步骤2、对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集;
步骤3、根据所述多个训练后的第一机器学习模型和训练后的第二机器学习模型集对应的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型。
第二方面,本发明实施例还提供了一种提高机器学习模型公平性的多目标训练装置,包括:
指标确定单元,用于根据场景确定多个正交性的公平性指标和准确性指标;
多目标优化单元,用于使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。
在上述实施方式的基础上,多目标优化单元包括第一机器学习模型训练模块、扰动模块和第三机器学习模型确定模块。
第一机器学习模型训练模块,用于对多个第一机器学习模型进行训练;
扰动模块,用于对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集;
第三机器学习模型确定模块,用于根据所述多个训练后的第一机器学习模型和训练后的第二机器学习模型集的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如本申请实施例所示的提高机器学习模型公平性的多目标训练方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行如本申请实施例所示的提高机器学习模型公平性的多目标训练方法。
本发明实施例提供的提高机器学习模型公平性的多目标训练方法,根据场景确定多个正交性的公平性指标和准确性指标;使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。同时考虑多个具有正交性的指标,通过使用多个指标可以得到多角度的评估模型公平性,使评估更加全面同时,同时由于其“正交性”,不会重复从同一角度评估,避免计算资源的浪费或被动增加该指标的重要性。在上述实施方式的基础上,对多个第一机器学习模型进行训练;对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集;根据多个训练后的第一机器学习模型和训练后的第二机器学习模型集的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型。相对于目前针对一种公平性衡量指标进行优化,本发明实施例能够基于某种策略对所选择指定的第一机器学习模型进行扰动,得到第二机器学习模型,使得第一机器学习模型能够在优化过程中进行调整,根据训练后的多个第一机器学习模型和训练后的第二机器学习模型集的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型,确定的第三机器学习模型集能够兼顾多个、具有多样性的、正交性的公平性衡量指标,在准确性与多个公平性之间得到不同的优选折中方案集,提高机器学习模型集在公平性和准确性上的表现。
附图说明
图1是现有技术的一种模型训练示意图;
图2是现有技术的另一种模型训练示意图;
图3是本发明实施例一中的提高机器学习模型公平性的多目标训练方法的流程图;
图4是本发明实施例二中的提高机器学习模型公平性的多目标训练方法的流程图;
图5是本发明实施例三中的提高机器学习模型公平性的多目标训练装置的结构示意图;
图6是本发明实施例四中的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图3为本发明实施例一提供的提高机器学习模型公平性的多目标训练方法的流程图,本实施例可适用于对机器学习使用的机器学习模型进行训练的情况,该方法可以由计算机设备来执行,具体包括如下步骤:
根据场景确定多个正交性的公平性指标和准确性指标。使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。
其中,使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化,可以通过下述方式实施:
步骤1、对多个第一机器学习模型进行训练。
预先配置训练集Dt和验证集Dv。可以配置第一数量n个第一机器学习模型, n为大于1的整数。使用训练集Dt对第一机器学习模型进行训练,得到n个第一机器学习模型,记为M1,…,Mn。多个第一机器学习模型又可称为第一学习模型集。
步骤2、对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集。
可选的,对第一学习模型集中每个训练后的第一机器学习模型进行扰动,得到第二机器学习模型。扰动得到的多个第二机器学习模型可称为第二机器学习模型集。可选的,根据预设策略对第一机器学习模型集中的部分第一机器学习模型进行扰动,得到第二机器学习模型集。
可选的,步骤2、对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集,可通过下述方式实施:
获取目标机器学习模型的部分信息,目标机器学习模型可以为任意一个训练后的第一机器学习模型;根据该部分信息进行调整,得到第二机器学习模型。
可选的,当对第一学习模型集中每个训练后的第一机器学习模型进行扰动时,目标机器学习模型为任意一个训练后的第一机器学习模型。可选的,当根据预设策略对第一机器学习模型集中的部分第一机器学习模型进行扰动时,目标机器学习模型为该部分第一机器学习模型中的任意一个。
其中,部分信息可以为机器学习模型中的部分参数。示例性的,对于目标机器学习模型,可以提取目标机器学习模型中的参数,该参数用于配置机器学习模型的计算。根据用户设置的策略对参数进行调整,得到第二学习模型。
上述实施方式由于对目标机器学习模型进行了调整,使得调整后的第二机器学习模型有别于目标机器学习模型,且是在目标机器学习模型基础上确定的,因此能够在改变目标机器学习模型的同时,保留目标机器学习模型的优势信息。。
步骤3、根据多个训练后的第一机器学习模型和训练后的第二机器学习模型集准确性指标和多个公平性衡量指标,确定多个第三机器学习模型。
根据第一机器学习模型集中每个第一机器学习模型计算该第一机器学习模型对应的公平性衡量指标与准确性指标。示例性的,根据第一机器学习模型计算出第一机器学习模型对应的公平性衡量指标与准确性指标。根据第二机器学习模型集中每个第二机器学习模型计算该第二机器学习模对应的公平性衡量指标与准确性指标。示例性的,对第二机器学习模型的进行训练,根据训练后的第二机器学习模型计算第二机器学习模型对应的公平性衡量指标与准确性指标。根据第一机器学习模型对应的公平性衡量指标与准确性指标和第二机器学习模型对应的公平性衡量指标与准确性指标从第一机器学习模型和第二机器学习模型中选择出更优的第一数量n个第三机器学习模型。可选的,根据多目标学习算法(Multi-objective Learning)从第一机器学习模型和第二机器学习模型中选择第一数量n个第三机器学习模型。
此外,可以对步骤3进行迭代处理,通过多次迭代,得到优化的多个第三机器学习模型。多个第三机器学习模型可称为第三机器学习模型集。由于选择出的第三机器学习模型是基于第一公平性衡量指标、第一准确性指标、多个第二公平性衡量指标以及第二准确性指标选择出的,因此随着迭代的进行,得到第三机器学习模型能够兼顾多个、具有多样性的、正交性的公平性衡量指标,在准确性与多个公平性之间得到不同的优选折中方案集。第三机器学习模型集中每个第三机器学习模型作为针对某个公平性衡量指标或者针对准确性的折中方案。多个第三机器学习模型提供侧重不同公平性衡量指标与准确性的多个优选的折中方案。在需要提供不同公平性衡量指标的场景中,无需单独对某个公平性衡量指标进行训练,而是通过本申请实施例提供的提高机器学习模型公平性的多目标训练方法得到多个优选的折中方案,用户可以在多个这种方案中选择一个进行评估。进而在提高公平性衡量指标以及准确性的同时,提高评估响应速度。
本发明实施例提供的提高机器学习模型公平性的多目标训练方法,在伦理问题的公平性场景下,使用了多目标优化算法,同时考虑模型准确性指标和多个公平性衡量指标为多个优化目标,对机器模型进行训练。通过多目标学习算法进行建模,形成模型提供侧重不同公平性衡量指标与准确性的多个优选的折中方案。
本发明实施例提供的提高机器学习模型公平性的多目标训练方法,根据场景确定多个正交性的公平性指标和准确性指标;使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。同时考虑多个具有正交性的指标,通过使用多个指标可以得到多角度的评估模型公平性,使评估更加全面同时,同时由于其“正交性”,不会重复从同一角度评估,避免计算资源的浪费或被动增加该指标的重要性。在上述实施方式的基础上,对多个第一机器学习模型进行训练;对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型;根据多个训练后的第一机器学习模型和训练后的第二机器学习模型集对应的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型。相对于目前针对一种公平性衡量指标进行优化,本发明实施例能够针对每个第一机器学习模型进行扰动,得到第二机器学习模型,使得第一机器学习模型能够在优化过程中进行调整,根据训练后的第一机器学习模型和训练后的多个第二机器学习模型的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型,能够基于多个公平性衡量指标和准确性指标共同确定第三机器学习模型,确定的第三机器学习模型集能够兼顾多个、具有多样性的、正交性的公平性衡量指标,在准确性与多个公平性之间得到不同的优选折中方案集,提高机器学习模型的公平性和准确性。
实施例二
图4为本发明实施例提供的提高机器学习模型公平性的多目标训练方法的流程图,作为对上述实施例的进一步说明,包括:
步骤210、对多个第一机器学习模型进行训练。
对包含多个第一机器学习模型的第一机器学习模型集进行训练。在一种实现方式中,随机初始化多个第一机器学习模型;根据训练数据集对每个第一机器学习模型进行训练。
可以使用相同的训练集对第一机器学习模型和第二机器学习模型进行训练。步骤210使用的训练数据集Dt与步骤230中训练第二机器学习模型所使用的数据集Dt相同,进而保证机器学习模型训练过程的稳定性,以便在训练数据不变的前提下,基于公平性衡量指标和准确性筛选更优的第三机器学习模型。
步骤220、对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集。
第二机器学习模型集包括多个第二机器学习模型。第二机器学习模型为对第一机器学习模型进行扰动得到的。
步骤220可参照上述实施例中步骤2的说明。
步骤230、对第二机器学习模型集中的每个第二机器学习模型进行训练。
在上述实施方式中,步骤230可实施为:根据训练数据集对第二机器学习模型集中的每个第二机器学习模型进行训练,训练后的多个第二机器学习模型组成第二机器学习模型集。
使用步骤210中的训练数据集Dt对每个第二机器学习模型进行训练。
步骤240、对于任意一个训练后的第二机器学习模型,根据训练后的第二机器学习模型确定第二机器学习模型对应的多个第二公平性衡量指标和第二准确性指标。
对针对每个训练后的第二机器学习模型计算多个第二公平性衡量指标和第二准确性指标。假设有m个公平性衡量指标,则每个第二机器学习模型得到m 个第二公平性衡量指标,以及一个第二准确性指标。对于任意一个第二机器学习模型i,其得到m个第二公平性衡量指标记为:E′i,1,E′i,2,…,E′i,m和一个第二准确性指标记为:E′i,m+1。
步骤250、模型确定第一机器学习模型对应的多个第一公平性衡量指标和第一准确性指标对于任意一个训练后的第一机器学习模型,根据训练后的第一机器学习。
第一机器学习模型和第二机器学习模型所使用的计算的公平性衡量指标计算方式形同。基于第一机器学习模型得到的公平性衡量指标称为第一公平性衡量指标,基于第二机器学习模型得到的公平性衡量指标称为第二公平性衡量指标。
步骤260、根据第一公平性衡量指标和第一准确性指标、第二公平性衡量指标和第二准确性指标,确定多个第三机器学习模型。
可选的,步骤260可通过下述方式实施:根据第一准确性指标、第二公平性衡量指标和第二准确性指标的数值进行排序;根据排序结果的顺序,确定多个第三机器学习模型。
可选的,可以通过所设计的评价策略,对各第一公平性衡量指标、第二公平性衡量指标、第一准确性指标以及第二准确性指标对应的公平性进行计算。上述评价策略用于在机器学习模型集(第一机器学习模型以及第二机器学习模型)中选择较好的第一数量的机器学习模型确定为第三机器学习模型。
进一步的,在步骤260确定多个第三机器学习模型之后,还包括:
将多个第三机器学习模型确定为新的多个训练后的第一机器学习模型,迭代执行步骤2、对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集;至步骤3、根据所述多个训练后的第一机器学习模型和训练后的第二机器学习模型集对应的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型。直至满足截止条件。
由于机器学习模型需要多次迭代进行优化,因此在确定第一数量n个第三机器学习模型之后,将多个第三机器学习模型确定为新的多个训练后的第一机器学习模型,并迭代执行步骤220至步骤260。
可选的,截止条件可以由用户进行配置。可选的,截止条件包括:迭代次数与预设迭代次数匹配;或者,迭代时长与预设执行时长匹配等。
可以将迭代的次数或者迭代的时间作为截止条件。当迭代次数满足预设迭代次数,或者迭代时间达到预设迭代时长时,确定满足截止条件。截止条件除了以预设迭代次数或执行时长为条件,还可以根据使用需求进行配置,此处不做赘述。
本发明实施例提供的提高机器学习模型公平性的多目标训练,能够基于多个公平性衡量指标和准确性对第一机器学习模型和第二机器学习模型进行筛选,得到更加优化的第三机器学习模型。通过多次迭代,使得第三机器学习模型能够具备多个公平性衡量指标平衡的同时,具备较高的准确性。
实施例三
图5为本发明实施例三提供的提高机器学习模型公平性的多目标训练装置的结构示意图,本实施例可适用于对机器学习使用的机器学习模型进行训练的情况,该装置可以由计算机设备来执行,该装置包括:指标确定单元和多目标优化单元。
指标确定单元,用于根据场景确定多个正交性的公平性指标和准确性指标;
多目标优化单元,用于使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。
其中,多目标优化单元包括:第一机器学习模型训练模块310、扰动模块 320以及第三机器学习模型确定模块330。
第一机器学习模型训练模块310,用于对多个第一机器学习模型进行训练;
扰动模块320,用于对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集;
第三机器学习模型确定模块330,用于根据所述多个训练后的第一机器学习模型和训练后的第二机器学习模型集的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型。
在上述实施例的基础上,扰动模块320用于:
获取目标机器学习模型的部分信息,所述目标机器学习模型为任意一个训练后的第一机器学习模型;
根据所述部分信息的数值进行调整,得到第二机器学习模型。
在上述实施例的基础上,第三机器学习模型确定模块330用于:
对每个第二机器学习模型进行训练;
对于任意一个训练后的第二机器学习模型,根据所述训练后的第二机器学习模型确定所述第二机器学习模型对应的多个第二公平性衡量指标和第二准确性指标;
对于任意一个训练后的第一机器学习模型,根据所述训练后的第一机器学习模型确定所述第一机器学习模型对应的多个第一公平性衡量指标和第一准确性指标;
根据所述第一公平性衡量指标和所述第一准确性指标、所述第二公平性衡量指标和所述第二准确性指标,确定多个第三机器学习模型。
在上述实施例的基础上,还包括迭代模块,迭代模块用于:将多个第三机器学习模型确定为新的多个训练后的第一机器学习模型,迭代执行步骤2至步骤3,直至满足截止条件。
在上述实施例的基础上,截止条件包括:
迭代次数与预设迭代次数匹配;
或者,迭代时长与预设执行时长匹配。
在上述实施例的基础上,第一机器学习模型训练模块310用于:
根据训练数据集对每个第一机器学习模型进行训练;
相应的,第三机器学习模型确定模块330用于:
根据训练数据集对每个第二机器学习模型进行训练。
本发明实施例提供的提高机器学习模型公平性的多目标训练装置,指标确定单元,用于根据场景确定多个正交性的公平性指标和准确性指标;多目标优化单元,用于使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。同时考虑多个具有正交性的指标,通过使用多个指标可以得到多角度的评估模型公平性,使评估更加全面同时,同时由于其“正交性”,不会重复从同一角度评估,避免计算资源的浪费或被动增加该指标的重要性。在上述实施方式的基础上,第一机器学习模型训练模块310对多个第一机器学习模型进行训练;扰动模块320对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型;第三机器学习模型根据多个训练后的第一机器学习模型和训练后的第二机器学习模型集的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型。相对于目前针对一种公平性衡量指标进行优化,本发明实施例能够基于某种策略对所选择指定的第一机器学习模型进行扰动,得到第二机器学习模型,使得第一机器学习模型能够在优化过程中进行调整,根据训练后的多个第一机器学习模型和训练后的第二机器学习模型集的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型,确定的第三机器学习模型集能够兼顾多个、具有多样性的、正交性的公平性衡量指标,在准确性与多个公平性之间得到不同的优选折中方案集,提高机器学习模型集在公平性和准确性上的表现。
本发明实施例所提供的提高机器学习模型公平性的多目标训练装置可执行本发明任意实施例所提供的提高机器学习模型公平性的多目标训练方法,具备执行方法相应的功能模块和有益效果。
实施例四
图6为本发明实施例四提供的一种计算机设备的结构示意图,如图6所示,该计算机设备包括处理器40、存储器41、输入装置42和输出装置43;计算机设备中处理器40的数量可以是一个或多个,图6中以一个处理器40为例;计算机设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的提高机器学习模型公平性的多目标训练方法对应的程序指令/模块(例如,提高机器学习模型公平性的多目标训练装置中的第一机器学习模型训练模块310、扰动模块320和第三机器学习模型确定模块330)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的提高机器学习模型公平性的多目标训练方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置43可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行一种提高机器学习模型公平性的多目标训练方法,该方法包括:
根据场景确定多个正交性的公平性指标和准确性指标;
使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。
在上述实施例的基础上,使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化,包括:
步骤1、对多个第一机器学习模型进行训练;
步骤2、对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集;
步骤3、根据所述多个训练后的第一机器学习模型和训练后的第二机器学习模型集对应的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型。
在上述实施例的基础上,对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集,包括:
获取目标机器学习模型的部分信息,所述目标机器学习模型为任意一个训练后的第一机器学习模型;
根据所述部分信息的数值进行调整,得到第二机器学习模型。
在上述实施例的基础上,所述根据所述多个训练后的第一机器学习模型和训练后的第二机器学习模型集对应的准确性指标和多个公平性衡量指标,确定第三机器学习模型,包括:
对每个所述第二机器学习模型进行训练;
对于任意一个训练后的第二机器学习模型,根据所述训练后的第二机器学习模型确定所述第二机器学习模型对应的多个第二公平性衡量指标和第二准确性指标;
对于任意一个训练后的第一机器学习模型,根据所述训练后的第一机器学习模型确定所述第一机器学习模型对应的多个第一公平性衡量指标和第一准确性指标;
根据所述第一公平性衡量指标和所述第一准确性指标、所述第二公平性衡量指标和所述第二准确性指标,确定多个第三机器学习模型。
在上述实施例的基础上,在确定多个第三机器学习模型之后,还包括:
将多个第三机器学习模型确定为新的多个训练后的第一机器学习模型,迭代执行步骤2至步骤3,直至满足截止条件。
在上述实施例的基础上,截止条件包括:
迭代次数与预设迭代次数匹配;
或者,迭代时长与预设执行时长匹配。
或者其他人为关于实际问题背景所设置的条件。
在上述实施例的基础上,对多个第一机器学习模型进行训练,包括:
根据训练数据集对每个所述第一机器学习模型进行训练;
相应的,所述对每个所述第二机器学习模型进行训练,包括:
根据所述训练数据集对每个所述第二机器学习模型进行训练。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上的方法操作,还可以执行本发明任意实施例所提供的提高机器学习模型公平性的多目标训练方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器 (Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述提高机器学习模型公平性的多目标训练装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种提高机器学习模型公平性的多目标训练方法,其特征在于,包括:
根据场景确定多个正交性的公平性指标和准确性指标;
使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。
2.根据权利要求1所述的方法,其特征在于,所述使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化,包括:
步骤1、对多个第一机器学习模型进行训练;
步骤2、对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集;
步骤3、根据所述多个训练后的第一机器学习模型和训练后的第二机器学习模型集对应的准确性指标和多个公平性衡量指标,确定多个第三机器学习模型。
3.根据权利要求2所述的方法,其特征在于,所述对多个训练后的第一机器学习模型进行扰动,得到第二机器学习模型集,包括:
获取目标机器学习模型的部分信息,所述目标机器学习模型为任意一个训练后的第一机器学习模型;
根据所述部分信息的数值进行调整,得到第二机器学习模型。
4.根据权利要求2所述的方法,其特征在于,所述根据所述多个训练后的第一机器学习模型和训练后的第二机器学习模型集对应的准确性指标和多个公平性衡量指标,确定第三机器学习模型,包括:
对每个所述第二机器学习模型进行训练;
对于任意一个训练后的第二机器学习模型,根据所述训练后的第二机器学习模型确定所述第二机器学习模型对应的多个第二公平性衡量指标和第二准确性指标;
对于任意一个训练后的第一机器学习模型,根据所述训练后的第一机器学习模型确定所述第一机器学习模型对应的多个第一公平性衡量指标和第一准确性指标;
根据所述第一公平性衡量指标和所述第一准确性指标、所述第二公平性衡量指标和所述第二准确性指标,确定多个第三机器学习模型。
5.根据权利要求3所述的方法,其特征在于,在确定多个第三机器学习模型之后,还包括:
将多个第三机器学习模型确定为新的多个训练后的第一机器学习模型,迭代执行步骤2至步骤3,直至满足截止条件。
6.根据权利要求5所述的方法,其特征在于,所述截止条件包括:
迭代次数与预设迭代次数匹配;
或者,迭代时长与预设执行时长匹配。
7.根据权利要求4所述的方法,其特征在于,对多个第一机器学习模型进行训练,包括:
根据训练数据集对每个所述第一机器学习模型进行训练;
相应的,所述对每个所述第二机器学习模型进行训练,包括:
根据所述训练数据集对每个所述第二机器学习模型进行训练。
8.一种提高机器学习模型公平性的多目标训练装置,其特征在于,包括:
指标确定单元,用于根据场景确定多个正交性的公平性指标和准确性指标;
多目标优化单元,用于使用多目标优化算法对所述多个正交性的公平性指标和准确性指标进行同时优化。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的提高机器学习模型公平性的多目标训练方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的提高机器学习模型公平性的多目标训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110655819.1A CN114048860A (zh) | 2021-06-11 | 2021-06-11 | 提高机器学习模型公平性的多目标训练方法及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110655819.1A CN114048860A (zh) | 2021-06-11 | 2021-06-11 | 提高机器学习模型公平性的多目标训练方法及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114048860A true CN114048860A (zh) | 2022-02-15 |
Family
ID=80204287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110655819.1A Pending CN114048860A (zh) | 2021-06-11 | 2021-06-11 | 提高机器学习模型公平性的多目标训练方法及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114048860A (zh) |
-
2021
- 2021-06-11 CN CN202110655819.1A patent/CN114048860A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mao et al. | Towards a trust prediction framework for cloud services based on PSO-driven neural network | |
CN107797931B (zh) | 一种基于二次评价的软件质量评价方法及系统 | |
CN110046706A (zh) | 模型生成方法、装置及服务器 | |
Azzouz et al. | Steady state IBEA assisted by MLP neural networks for expensive multi-objective optimization problems | |
CN109165081B (zh) | 基于机器学习的Web应用自适应资源配置方法 | |
CN111797320A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN112801231B (zh) | 用于业务对象分类的决策模型训练方法和装置 | |
CN115277354B (zh) | 一种面向指挥控制网络管理系统的故障检测方法 | |
Syberfeldt et al. | Real-world simulation-based manufacturing optimization using cuckoo search | |
CN110308658A (zh) | 一种pid参数整定方法、装置、系统及可读存储介质 | |
Zhu et al. | Adaptive deep reinforcement learning for non-stationary environments | |
CN105933138B (zh) | 一种时空维度相结合的云服务可信态势评估与预测方法 | |
CN109255389B (zh) | 一种装备评价方法、装置、设备及可读存储介质 | |
CN110880117A (zh) | 虚假业务识别方法、装置、设备和存储介质 | |
CN116993433B (zh) | 一种基于大数据的互联网电商异常用户检测方法 | |
CN110302539B (zh) | 一种游戏策略计算方法、装置、系统及可读存储介质 | |
CN116952265A (zh) | 基于袋獾优化算法的工厂智能车巡检路径规划方法及系统 | |
CN114048860A (zh) | 提高机器学习模型公平性的多目标训练方法及计算机设备 | |
CN113642226A (zh) | 基于多目标进化算法的公平机器学习模型的训练方法 | |
CN116088761A (zh) | 一种基于强化学习的分布式存储系统自动调参方法及系统 | |
Wang et al. | Multi-criteria decision making based architecture selection for single-hidden layer feedforward neural networks | |
CN114692888A (zh) | 系统参数处理方法、装置、设备及存储介质 | |
CN110232517B (zh) | 一种移动群智感知用户收益选取方法 | |
CN112906785A (zh) | 基于融合的零样本物体种类识别方法、装置及设备 | |
CN115185649A (zh) | 资源调度的方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |