CN114418039A - 一种提升分类公平性的异构分类器聚合方法 - Google Patents

一种提升分类公平性的异构分类器聚合方法 Download PDF

Info

Publication number
CN114418039A
CN114418039A CN202210320909.XA CN202210320909A CN114418039A CN 114418039 A CN114418039 A CN 114418039A CN 202210320909 A CN202210320909 A CN 202210320909A CN 114418039 A CN114418039 A CN 114418039A
Authority
CN
China
Prior art keywords
classifier
aggregation
class
category
heterogeneous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210320909.XA
Other languages
English (en)
Inventor
王志波
庞晓艺
孙鹏
任奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202210320909.XA priority Critical patent/CN114418039A/zh
Publication of CN114418039A publication Critical patent/CN114418039A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种提升分类公平性的异构分类器聚合方法,针对多源异构分类器聚合中不公平监督导致的类别偏见问题,首先定量分析聚合过程中各个类别的不公平监督水平、衡量类别相关度,然后据此为每个类别定制误分类代价,并以误分类代价作为惩罚参数调整分类器聚合过程中各个类别的重要性,缓解聚合分类器对监督较弱的类别的歧视和对监督较强的类别的偏好,提升其分类公平性,使得其达到更好的性能。

Description

一种提升分类公平性的异构分类器聚合方法
技术领域
本发明涉及端智能与模型聚合领域,具体涉及一种提升分类公平性的异构分类器聚合方法。
背景技术
随着智能设备的爆炸式增长和深度学习的成熟,设备上的模型训练变得越来越普遍。这在许多方面都能得到应用,例如人脸识别。然而,由于设备上的本地训练数据和计算资源有限,本地训练得到的分类器的性能和分类能力通常不会太强。异构分类器聚合成为一种范式,可以将在多源异构设备上训练得到的在架构和目标任务上都具有异构性的本地分类器整合成一个能力更强或性能更好的综合分类器。
现有工作提出基于知识蒸馏的异构分类器聚合方法,将多源异构设备上的本地分类器看作教师,将聚合分类器看作学生,让学生模仿教师学到的特征和预测以融合教师的知识,聚合得到能够执行所有教师分类器的分类任务的综合分类器。然而,在此过程中,由于多源异构设备上的本地分类器具有异构的目标任务,在基于知识蒸馏的分类器聚合过程中传递给聚合分类器的各个类别的知识的数量和质量并不均衡,这使得聚合分类器的训练处于不公平的监督下,最终生成的聚合分类器可能存在类别偏见(即在各个类别上的分类表现不公平,属于监督较弱的类别的样本比属于监督较强的类别的样本更容易被误分类),影响聚合分类器性能。因此,亟需研究提升分类公平性的异构分类器聚合方法。
发明内容
本发明针对现有技术的不足,提供了一种提升分类公平性的异构分类器聚合方法,能够缓解聚合分类器中的类别偏见,提升其分类公平性,使其达到更好的性能。
本发明所采用的技术方案如下:
本发明公开了一种提升分类公平性的异构分类器聚合方法,包含以下步骤:
步骤1:给定若干智能设备,每个设备用本地数据训练出本地分类器,分类器在架构和目标任务具有异构性,通过聚合服务器统计这些分类器的目标类集合及其对每个类别的平均分类精度;
步骤2:设计不公平监督水平评估方法,聚合服务器根据步骤1中的统计信息,从数量和质量两个方面评估聚合分类器训练时各个类别受到的监督水平,得到类别不公平监督水平向量;
步骤3:设计类别相关度评估方法,聚合服务器将聚合分类器训练集中的图像输入到多源异构设备上的本地分类器中,得到相应的响应信息,其中反映了将图像分类到每个类别的概率,根据各个类别间的概率大小关系,评估各个类别的相关度,得到类别相关度矩阵;
步骤4:设计细粒度误分类代价矩阵定制方法,聚合服务器根据步骤2中得到的类别不公平监督水平向量和步骤3中得到的类别相关度矩阵,为每个类别定制细粒度的误分类代价,得到误分类代价矩阵;
步骤5:设计提升分类公平性的异构分类器聚合算法,其通过响应信息将多源异构分类器学到的知识传递给聚合分类器以实现分类器聚合,并在此过程中利用步骤4中生成的误分类代价矩阵对响应信息转化得到的软标签进行扰动以调整各个类别的重要性,构造能够应对不公平监督、提升分类公平性的聚合分类器损失函数,在聚合服务器上运行该算法,实现提升分类公平性的异构分类器聚合。
作为进一步地改进,本发明所述的步骤1具体为:
设置类别分类精度向量
Figure 583462DEST_PATH_IMAGE001
,指示多源异构分类器对每个类别的平均分类精度,
Figure 392280DEST_PATH_IMAGE002
的第
Figure 375280DEST_PATH_IMAGE003
个元素
Figure 301647DEST_PATH_IMAGE004
表示多源异构分类器对类别
Figure 506233DEST_PATH_IMAGE003
的平均分类;为每个分类器
Figure 859854DEST_PATH_IMAGE005
设置目标类信息指示向量
Figure 330149DEST_PATH_IMAGE006
,指示其目标类信息,
Figure 420727DEST_PATH_IMAGE007
的第
Figure 292868DEST_PATH_IMAGE003
个元素
Figure 207604DEST_PATH_IMAGE008
等于1当且仅当
Figure 165195DEST_PATH_IMAGE009
,否则
Figure 433366DEST_PATH_IMAGE008
等于0,每个智能设备
Figure 848429DEST_PATH_IMAGE010
将其本地分类器
Figure 809431DEST_PATH_IMAGE005
的目标类集合
Figure 254319DEST_PATH_IMAGE011
以及对每个类别的分类精度上传至聚合服务器,聚合服务器根据异构分类器上传的信息统计得到
Figure 185235DEST_PATH_IMAGE002
Figure 94285DEST_PATH_IMAGE012
作为进一步地改进,本发明所述的步骤2具体为:
所述的设计不公平监督水平评估方法,从数量方面,使用多源异构分类器中每个类别的类频率来衡量聚合分类器训练时该类别所受到的监督水平,类别
Figure 835976DEST_PATH_IMAGE013
的类频率表示为:
Figure 518893DEST_PATH_IMAGE014
;从质量方面,使用每个类别在多源异构分类器上的平均分类精度来衡量聚合模型训练时该类别所受到的监督水平,类别
Figure 128865DEST_PATH_IMAGE015
的平均分类精度为
Figure 33368DEST_PATH_IMAGE016
;类别
Figure 70594DEST_PATH_IMAGE017
的相对监督数量表示为
Figure 473762DEST_PATH_IMAGE018
,相对监督质量表示为
Figure 762792DEST_PATH_IMAGE019
,则类别
Figure 646434DEST_PATH_IMAGE017
的不平衡监督水平
Figure 480661DEST_PATH_IMAGE020
评估为:
Figure 449754DEST_PATH_IMAGE021
,计算出每个类别的不公平监督水平后,得到类别不公平监督水平向量
Figure 276895DEST_PATH_IMAGE022
。评估各个类别的不平衡监督水平是为了更好地设置各个类别的分类代价,继而解决不平衡监督带来的分类不公平问题。
作为进一步地改进,本发明所述的步骤3具体为:
给定数据集
Figure 280623DEST_PATH_IMAGE023
,其中包含所有多源异构分类器
Figure 315444DEST_PATH_IMAGE024
的总共
Figure 771833DEST_PATH_IMAGE025
个目标类,即
Figure 402666DEST_PATH_IMAGE023
中样本的标签集合为
Figure 995321DEST_PATH_IMAGE026
,根据
Figure 436929DEST_PATH_IMAGE023
的样本在设备本地分类器
Figure 380615DEST_PATH_IMAGE027
上的响应信息,评估其目标类集合
Figure 815138DEST_PATH_IMAGE028
中各个类别的相关度,令
Figure 253511DEST_PATH_IMAGE029
表示目标类集合中包含
Figure 895714DEST_PATH_IMAGE017
的设备本地分类器ID集合,则有
Figure 733220DEST_PATH_IMAGE030
当且仅当
Figure 456587DEST_PATH_IMAGE031
;则根据
Figure 23835DEST_PATH_IMAGE032
对于
Figure 56513DEST_PATH_IMAGE023
中样本的响应信息,推测出类别
Figure 974790DEST_PATH_IMAGE017
与集合
Figure 734805DEST_PATH_IMAGE033
中其他类别的相关度。
作为进一步地改进,本发明所述的根据
Figure 156559DEST_PATH_IMAGE032
对于
Figure 156876DEST_PATH_IMAGE023
中样本的响应信息,推测出类别
Figure 922969DEST_PATH_IMAGE017
与集合
Figure 627620DEST_PATH_IMAGE033
中其他类别的相关度,包括如下步骤:
1)令
Figure 44826DEST_PATH_IMAGE034
表示设备本地分类器
Figure 747203DEST_PATH_IMAGE035
对于一个
Figure 374493DEST_PATH_IMAGE017
类的样本的响应信息,
Figure 741889DEST_PATH_IMAGE036
表示根据
Figure 138236DEST_PATH_IMAGE037
估计得到的类别
Figure 480355DEST_PATH_IMAGE017
的相关度向量,其中的第j个元素
Figure 221040DEST_PATH_IMAGE038
表示根据
Figure 1915DEST_PATH_IMAGE037
估计得到的类别
Figure 721609DEST_PATH_IMAGE017
与类别
Figure 437892DEST_PATH_IMAGE039
的相关度,若有
Figure 39775DEST_PATH_IMAGE040
,则根据
Figure 748974DEST_PATH_IMAGE037
中对应元素的大小估计类别
Figure 119912DEST_PATH_IMAGE017
与类别
Figure 7097DEST_PATH_IMAGE039
的相关度,若
Figure 830696DEST_PATH_IMAGE041
,则设置
Figure 845051DEST_PATH_IMAGE042
,有:
Figure 336075DEST_PATH_IMAGE043
对于每个类别
Figure 394161DEST_PATH_IMAGE044
,从多源异构分类器
Figure 705056DEST_PATH_IMAGE045
对于
Figure 21637DEST_PATH_IMAGE046
中样本的响应信息中,估计出
Figure 101589DEST_PATH_IMAGE047
个相关度向量,即
Figure 596155DEST_PATH_IMAGE048
,将这些向量聚合起来,评估出类别
Figure 394347DEST_PATH_IMAGE044
与集合
Figure 762223DEST_PATH_IMAGE049
中其他类别的相关度,得到类别
Figure 696681DEST_PATH_IMAGE044
的相关度向量
Figure 362148DEST_PATH_IMAGE050
,聚合方式为:
Figure 647636DEST_PATH_IMAGE051
Figure 40440DEST_PATH_IMAGE052
表示从多源异构分类器
Figure 298246DEST_PATH_IMAGE045
对于
Figure 931353DEST_PATH_IMAGE046
中样本的响应信息中估计得到的类别
Figure 641820DEST_PATH_IMAGE044
与类别
Figure 713681DEST_PATH_IMAGE053
的相关度;
2)聚合服务器用数据集
Figure 514409DEST_PATH_IMAGE023
Figure 380734DEST_PATH_IMAGE017
类的每个样本均可用上述方法得到一个类别
Figure 781760DEST_PATH_IMAGE017
相关度向量的评估结果,将这些结果取均值,即得到最终的类别
Figure 126153DEST_PATH_IMAGE017
的相关度向量
Figure 545502DEST_PATH_IMAGE054
,基于此,最终得到
Figure 582728DEST_PATH_IMAGE025
个类别的相关度向量,
Figure 205471DEST_PATH_IMAGE025
个类别的相关度向量组成类别相关度矩阵
Figure 822397DEST_PATH_IMAGE055
,即
Figure 706039DEST_PATH_IMAGE056
Figure 805844DEST_PATH_IMAGE057
的第
Figure 774937DEST_PATH_IMAGE017
行第
Figure 602079DEST_PATH_IMAGE039
列的元素
Figure 871386DEST_PATH_IMAGE058
表示类别
Figure 109470DEST_PATH_IMAGE017
与类别
Figure 831438DEST_PATH_IMAGE039
的相关度;
3)为了完善类间相关度的评估,提出若在
Figure 462271DEST_PATH_IMAGE057
中没有类别
Figure 320505DEST_PATH_IMAGE017
与类别
Figure 762113DEST_PATH_IMAGE039
的相关度的评估结果,则用类别
Figure 909061DEST_PATH_IMAGE017
与其他类别的相关度评估结果估计类别
Figure 202639DEST_PATH_IMAGE017
与类别
Figure 790746DEST_PATH_IMAGE039
的相关度,得到新的相关度矩阵
Figure 777157DEST_PATH_IMAGE059
,其中
Figure 332772DEST_PATH_IMAGE060
4)为了统一任意两个类之间的相关度,设置最终的类别相关度矩阵为
Figure 430041DEST_PATH_IMAGE061
,其中
Figure 872655DEST_PATH_IMAGE062
,则最终得到的类别
Figure 29966DEST_PATH_IMAGE017
与类别
Figure 574343DEST_PATH_IMAGE039
的相关度为
Figure 209723DEST_PATH_IMAGE063
。为了评估各个类别间的相关度,以便更好地设置各个类别的误分类代价。
作为进一步地改进,本发明所述的步骤4具体为:
设计细粒度误分类代价矩阵定制方法采用以下两个原则:
1)所受监督较弱的类别应该有较大的误分类代价,而所受监督较强的类别应该有较小的误分类代价;
2)将属于某个类别的图像错误分类为不太相关的类别的代价应该比将其错误分类为高度相关的类别代价大;
Figure 38002DEST_PATH_IMAGE064
表示误分类代价矩阵,其中第
Figure 366215DEST_PATH_IMAGE017
行第
Figure 630843DEST_PATH_IMAGE039
列的元素
Figure 335494DEST_PATH_IMAGE065
表示将属于类别
Figure 752700DEST_PATH_IMAGE017
的图像误分类为类别
Figure 455077DEST_PATH_IMAGE039
的误分类代价;则根据上述原则,
Figure 82367DEST_PATH_IMAGE065
的值与类别
Figure 685649DEST_PATH_IMAGE017
的监督水平
Figure 347575DEST_PATH_IMAGE020
成反比,与类别
Figure 158536DEST_PATH_IMAGE017
与类别
Figure 7543DEST_PATH_IMAGE039
的相对相关度
Figure 913051DEST_PATH_IMAGE066
成反比,即
Figure 429483DEST_PATH_IMAGE067
设计如下的单调递减函数
Figure 145766DEST_PATH_IMAGE068
,为每个类别
Figure 747649DEST_PATH_IMAGE017
定制细粒度的误分类代价,将属于类别
Figure 755050DEST_PATH_IMAGE017
的图像误分类为类别
Figure 1355DEST_PATH_IMAGE039
的误分类代价为:
Figure 668966DEST_PATH_IMAGE069
其中
Figure 899090DEST_PATH_IMAGE070
是以2为底的对数函数;聚合服务器根据步骤2中得到的类别不公平监督水平向量和步骤3中得到的类别相关度矩阵,利用上式计算任意两个类别间的误分类代价,得到误分类代价矩阵
Figure 444603DEST_PATH_IMAGE064
步骤4中明确了误分类代价与不公平监督水平、类间相关度的关系,设计了函数g,可以根据类不平衡监督水平和类间相关度的实际情况定制能够解决本发明关注问题的误分类代价。
作为进一步地改进,本发明所述的步骤5具体为:
若对于
Figure 404469DEST_PATH_IMAGE023
中的样本
Figure 462555DEST_PATH_IMAGE071
,设备本地分类器
Figure 39029DEST_PATH_IMAGE027
的响应信息为
Figure 90031DEST_PATH_IMAGE072
,聚合分类器
Figure 169982DEST_PATH_IMAGE073
的响应信息为
Figure 664549DEST_PATH_IMAGE074
,则用softmax函数
Figure 462740DEST_PATH_IMAGE075
将响应信息转化为软标签(标准化的类别概率向量):
Figure 338337DEST_PATH_IMAGE076
,多源异构分类器和聚合分类器的目标类集合是异构的,当它们的软标签的维数不同时,需要用某种方法实现输出间的映射,若
Figure 413741DEST_PATH_IMAGE077
是能够将设备本地分类器
Figure 203842DEST_PATH_IMAGE027
的软标签和聚合分类器
Figure 348385DEST_PATH_IMAGE073
的软标签联系起来的映射函数,二者的关系表示为
Figure 882134DEST_PATH_IMAGE078
,则基于知识蒸馏的异构分类器聚合训练的损失函数为:
Figure 546465DEST_PATH_IMAGE079
其中
Figure 241888DEST_PATH_IMAGE080
是样本的真实标签向量,
Figure 640771DEST_PATH_IMAGE081
Figure 712632DEST_PATH_IMAGE082
的能够与
Figure 497049DEST_PATH_IMAGE083
相比较的映射,有
Figure 628953DEST_PATH_IMAGE084
设计提升分类公平性的异构分类器聚合算法,利用步骤4中生成的误分类代价矩阵调整上述基于知识蒸馏的异构分类器聚合过程中各个类别的重要性,从而缓解聚合分类器中的类别偏见、提升其分类公平性,首先,利用误分类代价对聚合分类器的响应信息转化得到的软标签进行扰动,然后,用扰动的结果构建能够应对不公平监督、提升分类公平性的聚合分类器训练损失函数。
作为进一步地改进,本发明所述的设计提升分类公平性的异构分类器聚合算法具体为:
对于
Figure 544825DEST_PATH_IMAGE023
中的样本
Figure 295743DEST_PATH_IMAGE071
,令
Figure 324879DEST_PATH_IMAGE085
,聚合分类器
Figure 722625DEST_PATH_IMAGE073
的软标签为
Figure 470001DEST_PATH_IMAGE086
Figure 759031DEST_PATH_IMAGE082
,令
Figure 642673DEST_PATH_IMAGE087
Figure 975434DEST_PATH_IMAGE088
分别表示其受到误分类代价扰动后的结果,则有
Figure 944527DEST_PATH_IMAGE089
其中
Figure 833986DEST_PATH_IMAGE090
Figure 198234DEST_PATH_IMAGE091
中第
Figure 577262DEST_PATH_IMAGE092
类的扰动结果,
Figure 174597DEST_PATH_IMAGE093
Figure 664484DEST_PATH_IMAGE094
中第
Figure 647352DEST_PATH_IMAGE092
类的扰动结果,将所有类别进行这样的扰动,则可得到完整的聚合分类器
Figure 462862DEST_PATH_IMAGE073
的扰动后的软标签
Figure 16334DEST_PATH_IMAGE087
Figure 732748DEST_PATH_IMAGE088
基于此,本发明构建的能够应对不公平监督、提升分类公平性的聚合分类器训练损失函数如下:
Figure 445489DEST_PATH_IMAGE095
其中
Figure 307266DEST_PATH_IMAGE080
是样本的真实标签,
Figure 659619DEST_PATH_IMAGE096
Figure 756888DEST_PATH_IMAGE088
的能够与
Figure 199502DEST_PATH_IMAGE083
相比较的映射,有
Figure 356814DEST_PATH_IMAGE097
,第一项是提升分类公平性的预测损失,第二项是提升分类公平性的蒸馏损失,
Figure 370031DEST_PATH_IMAGE098
是平衡参数,用于平衡这两类损失的系数;前者匹配聚合分类器受到误分类代价扰动后的软标签和真实标签,后者使聚合分类器受到误分类代价扰动后的软标签模仿多源异构分类器的软标签。
本发明的有益效果如下:
针对异构分类器聚合中面临的不公平监督导致的类别偏见问题,实现了提升分类公平性的异构分类器聚合方法。本发明提出定量分析每个类别的不公平监督水平并估计类间相关度,在此基础上为每个类别定制细粒度的误分类代价,从而在聚合分类器的训练中重新加权每个类的分布,增强监督较弱的类别的重要性,缓解聚合分类器中由于不公平监督导致的类别偏见,提升聚合分类器的分类公平性。图3、图4和图5将本发明提出的提升分类公平性的异构分类器聚合方法与现有的异构分类器聚合方法对比,证明此方法能够有效缓解聚合分类器中的类别偏见,提升其分类公平性和模型性能。同时,此方法还具有扩展性,能够与其他异构分类器聚合方法结合以提升聚合模型的分类公平性。此外,图5还证明此方法能够以更少次数的查询实现异构分类器的聚合,降低了多源异构设备上的本地分类器的隐私泄露风险。
附图说明
图1是本发明中的异构分类器聚合场景示意图;
图2是本发明提出的提升分类公平性的异构分类器聚合方法的框架图;
图3是本发明的实例中聚合分类器各个类别的分类精度与UHC方法的对比图;
图4是本发明实例中聚合分类器的精度随聚合分类器训练的损失函数中的平衡参数
Figure 270991DEST_PATH_IMAGE098
的变化曲线与SKD1、SKD2、UHC这几种方法的对比图;
图5是本发明实例中聚合分类器的精度随用于训练的每个类别的样本数量的变化曲线图与UHC,SKD2这两种方法的对比图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合说明书附图及具体实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本实例中,图1是本发明中的异构分类器聚合场景示意图,假设有
Figure 833691DEST_PATH_IMAGE099
个多源异构智能设备,每个设备
Figure 161904DEST_PATH_IMAGE100
用其本地数据训练出本地分类器
Figure 426532DEST_PATH_IMAGE027
;聚合服务器旨在利用多源异构设备上的本地分类器
Figure 865603DEST_PATH_IMAGE024
对聚合分类器训练集
Figure 282809DEST_PATH_IMAGE023
中各个样本的响应信息聚合这些分类器,得到一个能力更强或性能更好的聚合分类器
Figure 781924DEST_PATH_IMAGE073
。假设每个
Figure 832051DEST_PATH_IMAGE027
可以分类的目标类集合为
Figure 278075DEST_PATH_IMAGE028
,即
Figure 815367DEST_PATH_IMAGE027
可以对类别为
Figure 485383DEST_PATH_IMAGE101
的样本进行响应。不同设备上的本地分类器可能具有不同的分类器架构和目标类集合,即对于任意
Figure 459024DEST_PATH_IMAGE102
Figure 505477DEST_PATH_IMAGE103
,可能有
Figure 897276DEST_PATH_IMAGE104
,甚至
Figure 738193DEST_PATH_IMAGE105
;此外,不同设备上的本地分类器的目标类集合可能有交集,即存在
Figure 700595DEST_PATH_IMAGE106
Figure 285160DEST_PATH_IMAGE103
Figure 797044DEST_PATH_IMAGE107
。令
Figure 543283DEST_PATH_IMAGE108
表示所有多源异构分类器
Figure 22675DEST_PATH_IMAGE024
的目标类并集,即
Figure 145351DEST_PATH_IMAGE109
。记
Figure 511742DEST_PATH_IMAGE110
,则聚合多源异构分类器
Figure 694461DEST_PATH_IMAGE024
得到的聚合分类器可以分类
Figure 208619DEST_PATH_IMAGE025
个目标类。聚合分类器的训练集
Figure 772804DEST_PATH_IMAGE111
包含来自
Figure 118335DEST_PATH_IMAGE025
个类别的
Figure 347322DEST_PATH_IMAGE112
个样本
Figure 145514DEST_PATH_IMAGE113
,其对应的标签为
Figure 265786DEST_PATH_IMAGE114
,其中每个类别的样本数量相同。将
Figure 465823DEST_PATH_IMAGE023
中的样本输入到多源异构设备上的本地分类器中可以得到相应的响应信息,利用这些响应信息可以将多源异构分类器中的知识融合到聚合分类器中,实现分类器聚合。
图2是本发明提出的提升分类公平性的异构分类器聚合方法的框架图;本发明提供一种提升分类公平性的异构分类器聚合方法,包含以下步骤:
步骤1:给定若干智能设备,每个设备用本地数据训练出本地分类器,这些分类器在架构和目标任务具有异构性。聚合服务器统计这些分类器的目标类集合及其对每个类别的平均分类精度;
本发明设置类别分类精度向量
Figure 865711DEST_PATH_IMAGE001
,指示多源异构分类器对每个类别的平均分类精度,
Figure 151199DEST_PATH_IMAGE002
的第
Figure 311047DEST_PATH_IMAGE003
个元素
Figure 365591DEST_PATH_IMAGE004
表示多源异构分类器对类别
Figure 936381DEST_PATH_IMAGE003
的平均分类;为每个分类器
Figure 709165DEST_PATH_IMAGE005
设置目标类信息指示向量
Figure 905660DEST_PATH_IMAGE006
,指示其目标类信息,
Figure 814710DEST_PATH_IMAGE007
的第
Figure 821980DEST_PATH_IMAGE003
个元素
Figure 816481DEST_PATH_IMAGE008
等于1当且仅当
Figure 895295DEST_PATH_IMAGE009
,否则
Figure 81688DEST_PATH_IMAGE008
等于0,每个智能设备
Figure 587756DEST_PATH_IMAGE010
将其本地分类器
Figure 944919DEST_PATH_IMAGE005
的目标类集合
Figure 358583DEST_PATH_IMAGE011
以及对每个类别的分类精度上传至聚合服务器,聚合服务器根据异构分类器上传的信息统计得到
Figure 366859DEST_PATH_IMAGE002
Figure 840566DEST_PATH_IMAGE012
步骤2:设计不公平监督水平评估方法,聚合服务器根据步骤1中的统计信息,从数量和质量两个方面评估聚合分类器训练时各个类别受到的监督水平,得到类别不公平监督水平向量。具体实施过程是:
设备本地分类器
Figure 685025DEST_PATH_IMAGE115
的目标类集合
Figure 902380DEST_PATH_IMAGE116
包含类
Figure 266627DEST_PATH_IMAGE017
意味着该分类器可以预测样本属于
Figure 176814DEST_PATH_IMAGE017
类的概率,因此在分类器聚合过程中,
Figure 508570DEST_PATH_IMAGE115
可以通过其对样本的响应信息向聚合分类器传递与类别
Figure 264036DEST_PATH_IMAGE017
相关的知识。在本发明的异构分类器聚合场景中,每个设备上的分类器都有自己的目标类集合,这些目标类集合可能是异构的,且会有一定重叠。如果在这些多源异构分类器的目标类集合中,类别
Figure 246905DEST_PATH_IMAGE017
出现的频率较高,意味着可以提供类别
Figure 796835DEST_PATH_IMAGE017
相关知识的分类器的数量会较大,那么在分类器聚合过程中聚合分类器能够从多源异构分类器处融合的关于类别
Figure 943782DEST_PATH_IMAGE017
的知识的数量会较大。因此,从数量方面,本发明使用多源异构分类器中每个类别的类频率来衡量聚合分类器训练时该类别所受到的监督水平。类别
Figure 378306DEST_PATH_IMAGE013
的类频率表示为:
Figure 91047DEST_PATH_IMAGE014
设备本地分类器
Figure 703556DEST_PATH_IMAGE027
对其目标类
Figure 868958DEST_PATH_IMAGE117
分类准确率越高,表明该分类器对属于类别
Figure 841593DEST_PATH_IMAGE017
的样本进行分类的能力越强,分类器所能提供的
Figure 674420DEST_PATH_IMAGE017
类相关知识的质量越高。在本发明的异构分类器聚合场景中,类别
Figure 956366DEST_PATH_IMAGE017
相关的合并知识的质量与类别
Figure 609064DEST_PATH_IMAGE017
在所有多源异构分类器上的平均分类准确度高度相关。因此,从质量方面,本发明使用每个类别在多源异构分类器上的平均分类精度来衡量聚合模型训练时该类别所受到的监督水平。类别
Figure 385390DEST_PATH_IMAGE015
的平均分类精度为
Figure 338303DEST_PATH_IMAGE016
给定聚合分类器训练时每个类别的监督数量和质量,本发明设计不公平监督水平评估方法,从相对监督数量和质量方面来衡量每个类别受到的不公平监督水平。类别
Figure 292614DEST_PATH_IMAGE017
的相对监督数量表示为
Figure 432609DEST_PATH_IMAGE018
,相对监督质量表示为
Figure 747046DEST_PATH_IMAGE019
,则类别
Figure 288886DEST_PATH_IMAGE017
的不平衡监督水平
Figure 912634DEST_PATH_IMAGE020
评估为:
Figure 539925DEST_PATH_IMAGE021
。类别
Figure 658054DEST_PATH_IMAGE017
的相对监督数量和质量越高,
Figure 54400DEST_PATH_IMAGE020
的值越大,意味着在聚合分类器训练过程中,类别
Figure 927678DEST_PATH_IMAGE017
受到的监督越强。计算出每个类别的不公平监督水平后,得到类别不公平监督水平向量
Figure 668363DEST_PATH_IMAGE022
.
步骤3:设计类别相关度评估方法,聚合服务器将聚合分类器训练集中的图像输入到多源异构设备上的本地分类器中,得到相应的响应信息,其中反映了将图像分类到每个类别的概率,根据各个类别间的概率大小关系,评估各个类别的相关度,得到类别相关度矩阵。具体实施过程是:
分类器学习到的知识包含类相似性和相关度的信息,通常会反映在分类器对输入样本的响应信息中。本发明充分利用这一点,设计类别相关度评估方法,利用分类器对样本的响应信息来估计类别相关度。其中分类器的响应信息反映了该样本被分类到每一个类别的概率。具体来说,响应信息中样本属于不同类别的概率的相对大小可以反映相应类之间的相关程度。理解如下:假设有分类器的目标类集合为
Figure 714817DEST_PATH_IMAGE118
,对于
Figure 841036DEST_PATH_IMAGE119
类的一个图像,该分类器的响应信息为
Figure 681953DEST_PATH_IMAGE120
,若有
Figure 674048DEST_PATH_IMAGE121
,则可以推断
Figure 258613DEST_PATH_IMAGE122
类的图像比
Figure 504918DEST_PATH_IMAGE123
类的图像更近似于
Figure 516736DEST_PATH_IMAGE119
类的图像,因此类别
Figure 232014DEST_PATH_IMAGE122
Figure 557953DEST_PATH_IMAGE119
的相关度比
Figure 783398DEST_PATH_IMAGE123
Figure 903801DEST_PATH_IMAGE119
的相关度高。
本发明中,给定数据集
Figure 339330DEST_PATH_IMAGE023
,其中包含所有多源异构分类器
Figure 265698DEST_PATH_IMAGE024
的总共
Figure 814491DEST_PATH_IMAGE025
个目标类,即
Figure 43478DEST_PATH_IMAGE023
中样本的标签集合为
Figure 841670DEST_PATH_IMAGE026
。根据
Figure 982846DEST_PATH_IMAGE023
的样本在设备本地分类器
Figure 386145DEST_PATH_IMAGE027
上的响应信息,可以评估其目标类集合
Figure 786034DEST_PATH_IMAGE028
中各个类别的相关度。令
Figure 71522DEST_PATH_IMAGE029
表示目标类集合中包含
Figure 464326DEST_PATH_IMAGE017
的设备本地分类器ID集合,则有
Figure 518869DEST_PATH_IMAGE030
当且仅当
Figure 355238DEST_PATH_IMAGE031
。则根据
Figure 393601DEST_PATH_IMAGE032
对于
Figure 825982DEST_PATH_IMAGE023
中样本的响应信息,可以推测出类别
Figure 611DEST_PATH_IMAGE017
与集合
Figure 742303DEST_PATH_IMAGE033
中其他类别的相关度。
Figure 2383DEST_PATH_IMAGE034
表示设备本地分类器
Figure 736989DEST_PATH_IMAGE035
对于一个
Figure 766125DEST_PATH_IMAGE017
类的样本的响应信息,
Figure 944297DEST_PATH_IMAGE036
表示根据
Figure 629356DEST_PATH_IMAGE037
估计得到的类别
Figure 43020DEST_PATH_IMAGE017
的相关度向量,其中的第j个元素
Figure 552761DEST_PATH_IMAGE038
表示根据
Figure 26467DEST_PATH_IMAGE037
估计得到的类别
Figure 136506DEST_PATH_IMAGE017
与类别
Figure 88281DEST_PATH_IMAGE039
的相关度。若有
Figure 216643DEST_PATH_IMAGE040
,本发明根据
Figure 64514DEST_PATH_IMAGE037
中对应元素的大小估计类别
Figure 193007DEST_PATH_IMAGE017
与类别
Figure 151735DEST_PATH_IMAGE039
的相关度,若
Figure 744391DEST_PATH_IMAGE041
,则设置
Figure 185999DEST_PATH_IMAGE042
,因此有:
Figure 395263DEST_PATH_IMAGE124
对于每个类别
Figure 829787DEST_PATH_IMAGE044
,从多源异构分类器
Figure 542528DEST_PATH_IMAGE045
对于
Figure 387993DEST_PATH_IMAGE046
中样本的响应信息中,可以估计出
Figure 818974DEST_PATH_IMAGE047
个相关度向量,即
Figure 119505DEST_PATH_IMAGE048
。将这些向量聚合起来,评估出类别
Figure 827698DEST_PATH_IMAGE044
与集合
Figure 719431DEST_PATH_IMAGE049
中其他类别的相关度,得到类别
Figure 263807DEST_PATH_IMAGE044
的相关度向量
Figure 430346DEST_PATH_IMAGE050
。本发明提出的聚合方式为:
Figure 727467DEST_PATH_IMAGE051
Figure 55680DEST_PATH_IMAGE052
表示从多源异构分类器
Figure 320308DEST_PATH_IMAGE045
对于
Figure 24959DEST_PATH_IMAGE046
中样本的响应信息中估计得到的类别
Figure 442165DEST_PATH_IMAGE044
与类别
Figure 941279DEST_PATH_IMAGE053
的相关度。
聚合服务器用数据集
Figure 771832DEST_PATH_IMAGE023
Figure 640693DEST_PATH_IMAGE017
类的每个样本都可以用上述方法得到一个类别
Figure 37039DEST_PATH_IMAGE017
相关度向量的评估结果,将这些结果取均值,即得到最终的类别
Figure 582421DEST_PATH_IMAGE017
的相关度向量
Figure 697008DEST_PATH_IMAGE054
。基于此,最终可以得到
Figure 602516DEST_PATH_IMAGE025
个类别的相关度向量,这些相关度向量可以组成类别相关度矩阵
Figure 384527DEST_PATH_IMAGE055
,即
Figure 100810DEST_PATH_IMAGE056
Figure 702693DEST_PATH_IMAGE057
的第
Figure 490520DEST_PATH_IMAGE017
行第
Figure 284295DEST_PATH_IMAGE039
列的元素
Figure 171480DEST_PATH_IMAGE058
表示类别
Figure 995079DEST_PATH_IMAGE017
与类别
Figure 507969DEST_PATH_IMAGE039
的相关度。
考虑到存在
Figure 733414DEST_PATH_IMAGE125
,可能对于任意
Figure 791500DEST_PATH_IMAGE126
都无法同时满足
Figure 367975DEST_PATH_IMAGE127
Figure 920441DEST_PATH_IMAGE128
,这种情况下无法从多源异构分类器的响应信息中衡量出类别
Figure 392DEST_PATH_IMAGE017
与类别
Figure 494959DEST_PATH_IMAGE039
的相关度,得到的相关度矩阵中
Figure 293150DEST_PATH_IMAGE129
。用矩阵
Figure 147843DEST_PATH_IMAGE130
来反映
Figure 285563DEST_PATH_IMAGE057
中的相关度情况,若
Figure 75665DEST_PATH_IMAGE131
,则
Figure 236519DEST_PATH_IMAGE132
,表示在
Figure 504689DEST_PATH_IMAGE057
中有类别
Figure 197050DEST_PATH_IMAGE017
与类别
Figure 158053DEST_PATH_IMAGE039
的相关度的评估结果,否则
Figure 806203DEST_PATH_IMAGE133
,表示在
Figure 878064DEST_PATH_IMAGE057
中没有类别
Figure 177327DEST_PATH_IMAGE017
与类别
Figure 43652DEST_PATH_IMAGE039
的相关度的评估结果。为了完善类间相关度的评估,本发明提出若在
Figure 179098DEST_PATH_IMAGE057
中没有类别
Figure 789071DEST_PATH_IMAGE017
与类别
Figure 21470DEST_PATH_IMAGE039
的相关度的评估结果,则用类别
Figure 684794DEST_PATH_IMAGE017
与其他类别的相关度评估结果估计类别
Figure 432170DEST_PATH_IMAGE017
与类别
Figure 721200DEST_PATH_IMAGE039
的相关度,得到新的相关度矩阵
Figure 604843DEST_PATH_IMAGE059
,其中
Figure 468763DEST_PATH_IMAGE060
为了统一任意两个类之间的相关度,本发明设置最终的类别相关度矩阵为
Figure 437856DEST_PATH_IMAGE061
,其中
Figure 264997DEST_PATH_IMAGE062
。则最终得到的类别
Figure 268725DEST_PATH_IMAGE017
与类别
Figure 273853DEST_PATH_IMAGE039
的相关度为
Figure 933504DEST_PATH_IMAGE063
步骤4:设计细粒度误分类代价矩阵定制方法,聚合服务器根据步骤2中得到的类别不公平监督水平向量和步骤3中得到的类别相关度矩阵,为每个类别定制细粒度的误分类代价,得到误分类代价矩阵。具体实施过程是:
误分类代价用作惩罚参数在聚合分类器训练过程中修改每个类别的重要性,以减轻其对具有更强监督的类别的偏好与对具有更弱监督的类别的歧视。本发明采用以下两个原则定制细粒度误分类代价:首先,所受监督较弱的类别应该有较大的误分类代价,而所受监督较强的类别应该有较小的误分类代价。其次,将属于某个类别的图像错误分类为不太相关的类别的代价应该比将其错误分类为高度相关的类别代价大。令
Figure 688971DEST_PATH_IMAGE064
表示误分类代价矩阵,其中第
Figure 422571DEST_PATH_IMAGE017
行第
Figure 238081DEST_PATH_IMAGE039
列的元素
Figure 306400DEST_PATH_IMAGE065
表示将属于类别
Figure 599978DEST_PATH_IMAGE017
的图像误分类为类别
Figure 188085DEST_PATH_IMAGE039
的误分类代价。则根据上述原则,
Figure 440075DEST_PATH_IMAGE065
的值与类别
Figure 497155DEST_PATH_IMAGE017
的监督水平
Figure 594424DEST_PATH_IMAGE020
成反比,与类别
Figure 364934DEST_PATH_IMAGE017
与类别
Figure 397612DEST_PATH_IMAGE039
的相对相关度
Figure 315889DEST_PATH_IMAGE066
成反比,即
Figure 75904DEST_PATH_IMAGE067
本发明设计如下的单调递减函数
Figure 763237DEST_PATH_IMAGE068
,为每个类别
Figure 232396DEST_PATH_IMAGE017
定制细粒度的误分类代价,将属于类别
Figure 372390DEST_PATH_IMAGE017
的图像误分类为类别
Figure 703139DEST_PATH_IMAGE039
的误分类代价为:
Figure 244979DEST_PATH_IMAGE069
其中log是以2为底的对数函数。
聚合服务器根据步骤2中得到的类别不公平监督水平向量和步骤3中得到的类别相关度矩阵,利用上式计算任意两个类别间的误分类代价,得到误分类代价矩阵
Figure 619460DEST_PATH_IMAGE064
步骤5:设计提升分类公平性的异构分类器聚合算法,其通过响应信息将多源异构分类器学到的知识传递给聚合分类器以实现分类器聚合,并在此过程中利用步骤4中生成的误分类代价矩阵对响应信息转化得到的软标签进行扰动以调整各个类别的重要性,构造能够应对不公平监督、提升分类公平性的聚合分类器损失函数,从而缓解聚合分类器中的类别偏见、提升其分类公平性和模型性能。在聚合服务器上运行该算法,实现提升分类公平性的异构分类器聚合。具体实施过程是:
给定数据集
Figure 246750DEST_PATH_IMAGE023
,其中包含所有多源异构分类器
Figure 427196DEST_PATH_IMAGE024
的总共
Figure 213755DEST_PATH_IMAGE025
个目标类,即
Figure 883771DEST_PATH_IMAGE023
中样本的标签集合为
Figure 873724DEST_PATH_IMAGE109
Figure 654598DEST_PATH_IMAGE134
Figure 797128DEST_PATH_IMAGE023
中各个类别的样本数量相同。假设对于
Figure 638045DEST_PATH_IMAGE023
中的样本
Figure 380874DEST_PATH_IMAGE071
,设备本地分类器
Figure 965439DEST_PATH_IMAGE027
的响应信息为
Figure 461011DEST_PATH_IMAGE072
,聚合分类器
Figure 472829DEST_PATH_IMAGE073
的响应信息为
Figure 171795DEST_PATH_IMAGE074
,则可以用softmax函数
Figure 560051DEST_PATH_IMAGE075
将响应信息转化为软标签(标准化的类别概率向量):
Figure 411595DEST_PATH_IMAGE076
。其中softmax函数表达式为
Figure 594314DEST_PATH_IMAGE135
Figure 374051DEST_PATH_IMAGE136
为第
Figure 175785DEST_PATH_IMAGE017
个类别的输出值,
Figure 255737DEST_PATH_IMAGE025
是输出类别的总数,
Figure 999571DEST_PATH_IMAGE137
是softmax函数的温度参数,表示软化处理的程度, softmax函数对原响应信息中的每一项进行处理,生成软标签。
Figure 63342DEST_PATH_IMAGE083
Figure 137608DEST_PATH_IMAGE027
的软标签,
Figure 603224DEST_PATH_IMAGE086
Figure 19425DEST_PATH_IMAGE082
Figure 39333DEST_PATH_IMAGE073
在不同蒸馏温度下的软标签。由于多源异构分类器和聚合分类器的目标类集合是异构的,因此它们的软标签的维数可能不同(例如
Figure 448449DEST_PATH_IMAGE083
的维数可能不同于
Figure 502993DEST_PATH_IMAGE086
Figure 401678DEST_PATH_IMAGE082
的维数),需要用某种方法实现输出间的映射。假设
Figure 299096DEST_PATH_IMAGE077
是能够将设备本地分类器
Figure 370957DEST_PATH_IMAGE027
的软标签和聚合分类器
Figure 155374DEST_PATH_IMAGE073
的软标签联系起来的映射函数,
Figure 287278DEST_PATH_IMAGE138
能够将二者变换为同样的维数,使其具有可比较性。则基于知识蒸馏的异构分类器聚合训练的损失函数为:
Figure 161738DEST_PATH_IMAGE079
其中
Figure 37290DEST_PATH_IMAGE080
是样本的真实标签向量,
Figure 941792DEST_PATH_IMAGE081
Figure 979018DEST_PATH_IMAGE082
的能够与
Figure 851028DEST_PATH_IMAGE083
相比较的映射,有
Figure 264692DEST_PATH_IMAGE084
Figure 23700DEST_PATH_IMAGE139
的维数相同。第一项是预测损失,第二项是蒸馏损失,
Figure 435090DEST_PATH_IMAGE098
是平衡参数,用于平衡这两类损失的系数。前者匹配聚合分类器的软标签和真实标签,后者使聚合分类器的软标签模仿多源异构分类器的软标签。
本发明设计提升分类公平性的异构分类器聚合算法,利用步骤4中生成的误分类代价矩阵调整上述基于知识蒸馏的异构分类器聚合过程中各个类别的重要性,从而缓解聚合分类器中的类别偏见、提升其分类公平性。首先,利用误分类代价对聚合分类器的响应信息转化得到的软标签进行扰动,然后,用扰动的结果构建能够应对不公平监督、提升分类公平性的聚合分类器训练损失函数。对于
Figure 404183DEST_PATH_IMAGE023
中的样本
Figure 247637DEST_PATH_IMAGE071
,令
Figure 985785DEST_PATH_IMAGE085
,聚合分类器
Figure 505760DEST_PATH_IMAGE073
的软标签为
Figure 962149DEST_PATH_IMAGE086
Figure 842249DEST_PATH_IMAGE082
,令
Figure 966063DEST_PATH_IMAGE087
Figure 656938DEST_PATH_IMAGE088
分别表示其受到误分类代价扰动后的结果,则有
Figure 335044DEST_PATH_IMAGE089
其中
Figure 520300DEST_PATH_IMAGE090
Figure 233041DEST_PATH_IMAGE091
中第
Figure 94818DEST_PATH_IMAGE092
类的扰动结果,
Figure 525799DEST_PATH_IMAGE093
Figure 826331DEST_PATH_IMAGE094
中第
Figure 314950DEST_PATH_IMAGE092
类的扰动结果,将所有类别进行这样的扰动,则可得到完整的聚合分类器
Figure 675524DEST_PATH_IMAGE073
的扰动后的软标签
Figure 203588DEST_PATH_IMAGE087
Figure 104548DEST_PATH_IMAGE088
基于此,本发明构建的能够应对不公平监督、提升分类公平性的聚合分类器训练损失函数如下:
Figure 417980DEST_PATH_IMAGE095
其中
Figure 11773DEST_PATH_IMAGE080
是样本的真实标签,
Figure 27133DEST_PATH_IMAGE096
Figure 466205DEST_PATH_IMAGE088
的能够与
Figure 132678DEST_PATH_IMAGE083
相比较的映射,有
Figure 631793DEST_PATH_IMAGE097
Figure 134449DEST_PATH_IMAGE139
的维数相同。第一项是提升分类公平性的预测损失,第二项是提升分类公平性的蒸馏损失,
Figure 580474DEST_PATH_IMAGE098
是平衡参数,用于平衡这两类损失的系数。前者匹配聚合分类器受到误分类代价扰动后的软标签和真实标签,后者使聚合分类器受到误分类代价扰动后的软标签模仿多源异构分类器的软标签。
在上述损失函数基础上,基于已有工作,可以明确映射函数
Figure 242400DEST_PATH_IMAGE140
的定义,例如
Figure 538514DEST_PATH_IMAGE141
,基于此映射函数,聚合模型软标签
Figure 387521DEST_PATH_IMAGE142
变换得到的
Figure 309341DEST_PATH_IMAGE143
的维数与本地分类器
Figure 825773DEST_PATH_IMAGE027
的软标签
Figure 56903DEST_PATH_IMAGE083
的维数相同,具有可比较性,可以得到具体的提升分类公平性的异构分类器聚合算法的训练目标为最小化如下的聚合分类器训练损失函数:
Figure 393206DEST_PATH_IMAGE144
在聚合服务器上以上述目标进行聚合分类器训练,实现提升分类公平性的异构分类器聚合。
需要说明的是,在本发明设计的能够应对不公平监督、提升分类公平性的聚合分类器训练损失函数中,每个类的每个样本对损失计算的贡献被根据误分类代价矩阵重新加权。一方面,将更加重视属于具有较高误分类成本的类别的样本。另一方面,样本的预测越不准确(即不正确或相关度较低的类的概率越大),其对学习算法的贡献就越大。因此,本发明提出的提升分类公平性的异构分类器聚合方法可以减轻聚合分类器中的类别偏见、提升其分类公平性、提高其全局精确度。需要指出的是,虽然上述训练目标是基于
Figure 853138DEST_PATH_IMAGE141
的映射函数设计的,但本发明提出的提升分类公平性的异构分类器聚合方法也可以扩展到其他映射函数,同样可以减轻聚合分类器中的类别偏好。
图3是本发明的实例中聚合分类器各个类别的分类精度与UHC方法的对比图,横轴表示从0到9这十个类别,纵轴表示聚合分类器中的类别分类精度;其中CBHMA(Class-Balanced Heterogeneous Model Aggregation)是本发明提出的提升分类公平性的异构分类器聚合方法,UHC(Unifying Heterogeneous Classifiers)是已有的基于知识蒸馏的异构分类器聚合方法,其与CBHMA的区别在于没有考虑聚合模型分类不公平的问题;在UHC中,使得设备本地分类器
Figure 224076DEST_PATH_IMAGE027
的软标签和聚合分类器
Figure 439157DEST_PATH_IMAGE073
的软标签具有可比较性的映射函数为
Figure 154434DEST_PATH_IMAGE145
。图3左图是在实验配置为C1 (Fashion MNIST数据集)下的结果,图3右图是在实验配置为C2 (Tiny ImageNet数据集)下的结果。可以发现,在配置C1下,UHC的聚合分类器在2、4、6类上的表现相对较差。反映了在分类器聚合过程中,类别2、4、6受到的监督可能比其他类要弱。还可以发现,CBHMA在第 2、4、6 类上比UHC实现了更好的准确度,这缓解了聚合分类器中的类别偏见,提升了其分类公平性。同样,在配置C2下,可以观察到CBHMA可以提高大多数UHC不偏向的类的准确性。因此,可以得出结论,本发明提出的提升分类公平性的异构分类器聚合方法可以有效应对异构分类器聚合中由于不公平的监督导致的类别偏见问题,减轻聚合分类器对监督较弱的类别的歧视,提升其分类公平性。
图4是本发明实例中聚合分类器的精度随聚合分类器训练的损失函数中的平衡参数
Figure 277111DEST_PATH_IMAGE098
的变化曲线与SKD1、SKD2、UHC这几种方法的对比图,横轴表示不同的平衡参数
Figure 643501DEST_PATH_IMAGE098
的取值,纵轴表示聚合分类器整体分类精度;其中CBHMA(Class-Balanced HeterogeneousModel Aggregation)和CBHMA-E(Class-Balanced Heterogeneous Model Aggregation-Extension)是本发明提出的提升分类公平性的异构分类器聚合方法及其变种,二者的区别在于映射函数(映射函数将多源异构设备上的本地分类器的软标签与聚合分类器的软标签联系起来)的不同,SKD1(Simple extension of Knowledge Distillation-1)、SKD2(Simple extension of Knowledge Distillation-2)、UHC(Unifying HeterogeneousClassifiers)是现有的基于知识蒸馏的异构分类器聚合方法,其与CBHMA和CNHMA-E的区别在于没有考虑聚合模型分类不公平的问题;在SKD1中,每个本地分类器
Figure 826221DEST_PATH_IMAGE027
的软标签直接被扩展到与聚合分类器
Figure 261751DEST_PATH_IMAGE073
的软标签一样的维度以使二者具有可比较性,即将没有包含在
Figure 188118DEST_PATH_IMAGE027
的目标类中的类别的概率设为0;在SKD2中,先将所有本地分类器
Figure 409015DEST_PATH_IMAGE027
的软标签进行简单叠加,然后将聚合分类器
Figure 28215DEST_PATH_IMAGE073
的软标签进行扩展,即按照所有
Figure 452506DEST_PATH_IMAGE027
的软标签叠加后相同的类顺序放置
Figure 182564DEST_PATH_IMAGE073
的软标签中的类别概率,形成与所有
Figure 992388DEST_PATH_IMAGE027
的软标签叠加后相同维度的向量,以进行比较;在UHC中,使得设备本地分类器
Figure 782490DEST_PATH_IMAGE027
的软标签和聚合分类器
Figure 192612DEST_PATH_IMAGE073
的软标签具有可比较性的映射函数为
Figure 726361DEST_PATH_IMAGE145
; CBHMA和CBHMA-E分别采用与UHC和SKD2相同的映射方式。图4左图是在实验配置为C1(Fashion MNIST数据集)下的结果,图4右图是在实验配置为C2(Tiny ImageNet数据集)下的结果。可以发现,不同的平衡参数
Figure 656271DEST_PATH_IMAGE098
取值会导致不同的聚合分类器精度。同时,无论平衡参数
Figure 351694DEST_PATH_IMAGE098
取值如何,CBHMA和CBHMA-E总是比 SKD1、SKD2 和 UHC 效果更好。这是因为CBHMA和 CBHMA-E考虑了不公平监督导致的类别偏见问题,而SKD1、SKD2和UHC 忽略了这个问题。这个结果证明了本发明提出的提升分类公平性的多源异构分类器聚合方法的有效性和可扩展性。
图5是本发明实例中聚合分类器的精度随用于训练的每个类别的样本数量的变化曲线图与UHC,SKD2这两种方法的对比图,横轴表示不同的用于聚合分类器训练的每个类别的样本数量,纵轴表示聚合分类器整体分类精度。其中CBHMA(Class-BalancedHeterogeneous Model Aggregation)和CBHMA-E(Class-Balanced Heterogeneous ModelAggregation-Extension)是本发明提出的提升分类公平性的异构分类器聚合方法及其变种,二者的区别在于映射函数(映射函数将多源异构设备上的本地分类器的软标签与聚合分类器的软标签联系起来)的不同, SKD2(Simple extension of KnowledgeDistillation-2)、UHC(Unifying Heterogeneous Classifiers)是现有的基于知识蒸馏的异构分类器聚合方法其与CBHMA和CBHMA-E的区别在于没有考虑聚合模型分类不公平的问题;在SKD2中,先将所有本地分类器
Figure 327741DEST_PATH_IMAGE027
的软标签进行简单叠加,然后将聚合分类器
Figure 25701DEST_PATH_IMAGE073
的软标签进行扩展,即按照所有
Figure 934751DEST_PATH_IMAGE027
的软标签叠加后相同的类顺序放置
Figure 942021DEST_PATH_IMAGE073
的软标签中的类别概率,形成与所有
Figure 936522DEST_PATH_IMAGE027
的软标签叠加后相同维度的向量,以进行比较;在UHC中,使得设备本地分类器
Figure 139970DEST_PATH_IMAGE027
的软标签和聚合分类器
Figure 637947DEST_PATH_IMAGE073
的软标签具有可比较性的映射函数为
Figure 391070DEST_PATH_IMAGE145
;CBHMA和CBHMA-E分别采用与UHC和SKD2相同的映射方式。该图展示的是在实验配置为C1(Fashion MNIST数据集)下的结果。可以发现,随着训练样本数量的增加,聚合分类器性能变得更好,且即使训练样本数量很少,本发明设计的提升分类公平性的多源异构分类器聚合方法CBHMA 和 CBHMAE 也优于UHC和SKD2。基于此,可以得出两个结论:一是CBHMA和CBHMA-E可以有效地在小规模训练集下实现异构分类器的聚合;另一个是CBHMA和CBHMA-E可以用较少的训练样本达到一定的聚合分类器精确度。在异构分类器聚合过程中,更少的训练样本意味着对多源异构分类器进行更少次数的查询,这减少了它们的信息泄露,从而为它们提供了更强的隐私保障。因此,可以得出结论,与其他的异构分类器聚合方法相比,本发明提出的提升分类公平性的多源异构分类器聚合方法可以以更保护隐私的方式实现具有更好性能的异构分类器聚合。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (8)

1.一种提升分类公平性的异构分类器聚合方法,其特征在于,包含以下步骤:
步骤1:给定若干智能设备,每个设备用本地数据训练出本地分类器,所述的分类器在架构和目标任务具有异构性,通过聚合服务器统计这些分类器的目标类集合及其对每个类别的平均分类精度;
步骤2:设计不公平监督水平评估方法,所述的聚合服务器根据步骤1中的统计信息,从数量和质量两个方面评估聚合分类器训练时各个类别受到的监督水平,得到类别不公平监督水平向量;
步骤3:设计类别相关度评估方法,聚合服务器将聚合分类器训练集中的图像输入到多源异构设备上的本地分类器中,得到相应的响应信息,其中反映了将图像分类到每个类别的概率,根据各个类别间的概率大小关系,评估各个类别的相关度,得到类别相关度矩阵;
步骤4:设计细粒度误分类代价矩阵定制方法,聚合服务器根据步骤2中得到的类别不公平监督水平向量和步骤3中得到的类别相关度矩阵,为每个类别定制细粒度的误分类代价,得到误分类代价矩阵;
步骤5:设计提升分类公平性的异构分类器聚合算法,其通过响应信息将多源异构分类器学到的知识传递给聚合分类器以实现分类器聚合,并在此过程中利用步骤4中生成的误分类代价矩阵对响应信息转化得到的软标签进行扰动以调整各个类别的重要性,构造能够应对不公平监督、提升分类公平性的聚合分类器损失函数,在聚合服务器上运行该算法,实现提升分类公平性的异构分类器聚合。
2.根据权利要求1所述的提升分类公平性的异构分类器聚合方法,其特征在于,所述的步骤1具体为:
设置类别分类精度向量
Figure 298886DEST_PATH_IMAGE001
,指示多源异构分类器对每个类别的平均分类精度,
Figure 684868DEST_PATH_IMAGE002
的第
Figure 136709DEST_PATH_IMAGE003
个元素
Figure 968136DEST_PATH_IMAGE004
表示多源异构分类器对类别
Figure 516929DEST_PATH_IMAGE003
的平均分类;为每个分类器
Figure 11495DEST_PATH_IMAGE005
设置目标类信息指示向量
Figure 12950DEST_PATH_IMAGE006
,指示其目标类信息,
Figure 883954DEST_PATH_IMAGE007
的第
Figure 287253DEST_PATH_IMAGE003
个元素
Figure 442467DEST_PATH_IMAGE008
等于1当且仅当
Figure 665638DEST_PATH_IMAGE009
,否则
Figure 137070DEST_PATH_IMAGE008
等于0,每个智能设备
Figure 332560DEST_PATH_IMAGE010
将其本地分类器
Figure 496825DEST_PATH_IMAGE005
的目标类集合
Figure 909089DEST_PATH_IMAGE011
以及对每个类别的分类精度上传至聚合服务器,聚合服务器根据异构分类器上传的信息统计得到
Figure 918633DEST_PATH_IMAGE002
Figure 234208DEST_PATH_IMAGE012
3.根据权利要求1或2所述的提升分类公平性的异构分类器聚合方法,其特征在于,所述的步骤2具体为:
所述的设计不公平监督水平评估方法,从数量方面,使用多源异构分类器中每个类别的类频率来衡量聚合分类器训练时该类别所受到的监督水平,类别
Figure 303795DEST_PATH_IMAGE013
的类频率表示为:
Figure 704821DEST_PATH_IMAGE014
;从质量方面,使用每个类别在多源异构分类器上的平均分类精度来衡量聚合模型训练时该类别所受到的监督水平,类别
Figure 252477DEST_PATH_IMAGE015
的平均分类精度为
Figure 189602DEST_PATH_IMAGE016
;类别
Figure 695670DEST_PATH_IMAGE017
的相对监督数量表示为
Figure 318412DEST_PATH_IMAGE018
,相对监督质量表示为
Figure 669759DEST_PATH_IMAGE019
,则类别
Figure 756664DEST_PATH_IMAGE017
的不平衡监督水平
Figure 135430DEST_PATH_IMAGE020
评估为:
Figure 42207DEST_PATH_IMAGE021
,计算出每个类别的不公平监督水平后,得到类别不公平监督水平向量
Figure 134928DEST_PATH_IMAGE022
4.根据权利要求3所述的提升分类公平性的异构分类器聚合方法,其特征在于,所述的步骤3具体为:
给定数据集
Figure 341918DEST_PATH_IMAGE023
,其中包含所有多源异构分类器
Figure 127471DEST_PATH_IMAGE024
的总共
Figure 787123DEST_PATH_IMAGE025
个目标类,即
Figure 184999DEST_PATH_IMAGE023
中样本的标签集合为
Figure 980917DEST_PATH_IMAGE026
,根据
Figure 937372DEST_PATH_IMAGE023
的样本在设备本地分类器
Figure 84319DEST_PATH_IMAGE027
上的响应信息,评估其目标类集合
Figure 784422DEST_PATH_IMAGE028
中各个类别的相关度,令
Figure 198961DEST_PATH_IMAGE029
表示目标类集合中包含
Figure 60737DEST_PATH_IMAGE017
的设备本地分类器ID集合,则有
Figure 694981DEST_PATH_IMAGE030
当且仅当
Figure 933196DEST_PATH_IMAGE031
;则根据
Figure 969285DEST_PATH_IMAGE032
对于
Figure 503428DEST_PATH_IMAGE023
中样本的响应信息,推测出类别
Figure 624967DEST_PATH_IMAGE017
与集合
Figure 666873DEST_PATH_IMAGE033
中其他类别的相关度。
5.根据权利要求4所述的提升分类公平性的异构分类器聚合方法,其特征在于,所述的根据
Figure 26310DEST_PATH_IMAGE032
对于
Figure 761048DEST_PATH_IMAGE023
中样本的响应信息,推测出类别
Figure 104304DEST_PATH_IMAGE017
与集合
Figure 245173DEST_PATH_IMAGE033
中其他类别的相关度,包括如下步骤:
1)令
Figure 927959DEST_PATH_IMAGE034
表示设备本地分类器
Figure 630335DEST_PATH_IMAGE035
对于一个
Figure 398571DEST_PATH_IMAGE017
类的样本的响应信息,
Figure 844596DEST_PATH_IMAGE036
表示根据
Figure 178626DEST_PATH_IMAGE037
估计得到的类别
Figure 502770DEST_PATH_IMAGE017
的相关度向量,其中的第j个元素
Figure 820619DEST_PATH_IMAGE038
表示根据
Figure 8018DEST_PATH_IMAGE037
估计得到的类别
Figure 665395DEST_PATH_IMAGE017
与类别
Figure 709575DEST_PATH_IMAGE039
的相关度,若有
Figure 950938DEST_PATH_IMAGE040
,则根据
Figure 738765DEST_PATH_IMAGE037
中对应元素的大小估计类别
Figure 250649DEST_PATH_IMAGE017
与类别
Figure 465730DEST_PATH_IMAGE039
的相关度,若
Figure 430275DEST_PATH_IMAGE041
,则设置
Figure 523258DEST_PATH_IMAGE042
,有:
Figure 686386DEST_PATH_IMAGE043
对于每个类别
Figure 275631DEST_PATH_IMAGE044
,从多源异构分类器
Figure 789789DEST_PATH_IMAGE045
对于
Figure 857102DEST_PATH_IMAGE046
中样本的响应信息中,估计出
Figure 140315DEST_PATH_IMAGE047
个相关度向量,即
Figure 398996DEST_PATH_IMAGE048
,将这些向量聚合起来,评估出类别
Figure 603713DEST_PATH_IMAGE044
与集合
Figure 537034DEST_PATH_IMAGE049
中其他类别的相关度,得到类别
Figure 612437DEST_PATH_IMAGE044
的相关度向量
Figure 340222DEST_PATH_IMAGE050
,聚合方式为:
Figure 330437DEST_PATH_IMAGE051
Figure 739552DEST_PATH_IMAGE052
表示从多源异构分类器
Figure 731779DEST_PATH_IMAGE045
对于
Figure 896044DEST_PATH_IMAGE046
中样本的响应信息中估计得到的类别
Figure 809774DEST_PATH_IMAGE044
与类别
Figure 521115DEST_PATH_IMAGE053
的相关度;
2)聚合服务器用数据集
Figure 899007DEST_PATH_IMAGE023
Figure 906277DEST_PATH_IMAGE017
类的每个样本均可用上述方法得到一个类别
Figure 104040DEST_PATH_IMAGE017
相关度向量的评估结果,将这些结果取均值,即得到最终的类别
Figure 917276DEST_PATH_IMAGE017
的相关度向量
Figure 884095DEST_PATH_IMAGE054
,基于此,最终得到
Figure 563731DEST_PATH_IMAGE025
个类别的相关度向量,所述的
Figure 514370DEST_PATH_IMAGE025
个类别的相关度向量组成类别相关度矩阵
Figure 68979DEST_PATH_IMAGE055
,即
Figure 890304DEST_PATH_IMAGE056
Figure 567273DEST_PATH_IMAGE057
的第
Figure 677312DEST_PATH_IMAGE017
行第
Figure 330885DEST_PATH_IMAGE039
列的元素
Figure 475558DEST_PATH_IMAGE058
表示类别
Figure 57849DEST_PATH_IMAGE017
与类别
Figure 451922DEST_PATH_IMAGE039
的相关度;
3)为了完善类间相关度的评估,提出若在
Figure 348333DEST_PATH_IMAGE057
中没有类别
Figure 409830DEST_PATH_IMAGE017
与类别
Figure 856031DEST_PATH_IMAGE039
的相关度的评估结果,则用类别
Figure 737399DEST_PATH_IMAGE017
与其他类别的相关度评估结果估计类别
Figure 234240DEST_PATH_IMAGE017
与类别
Figure 87926DEST_PATH_IMAGE039
的相关度,得到新的相关度矩阵
Figure 12020DEST_PATH_IMAGE059
,其中
Figure 646264DEST_PATH_IMAGE060
4)为了统一任意两个类之间的相关度,设置最终的类别相关度矩阵为
Figure 383013DEST_PATH_IMAGE061
,其中
Figure 887944DEST_PATH_IMAGE062
,则最终得到的类别
Figure 248518DEST_PATH_IMAGE017
与类别
Figure 307741DEST_PATH_IMAGE039
的相关度为
Figure 146384DEST_PATH_IMAGE063
6.根据权利要求1或2或4或5所述的提升分类公平性的异构分类器聚合方法,其特征在于,所述的步骤4具体为:
所述的设计细粒度误分类代价矩阵定制方法采用以下两个原则:
1)所受监督较弱的类别应该有较大的误分类代价,而所受监督较强的类别应该有较小的误分类代价;
2)将属于某个类别的图像错误分类为不太相关的类别的代价应该比将其错误分类为高度相关的类别代价大;
Figure 771400DEST_PATH_IMAGE064
表示误分类代价矩阵,其中第
Figure 742024DEST_PATH_IMAGE017
行第
Figure 85280DEST_PATH_IMAGE039
列的元素
Figure 930877DEST_PATH_IMAGE065
表示将属于类别
Figure 410400DEST_PATH_IMAGE017
的图像误分类为类别
Figure 112776DEST_PATH_IMAGE039
的误分类代价;则根据上述原则,
Figure 379547DEST_PATH_IMAGE065
的值与类别
Figure 294414DEST_PATH_IMAGE017
的监督水平
Figure 159602DEST_PATH_IMAGE020
成反比,与类别
Figure 970563DEST_PATH_IMAGE017
与类别
Figure 22832DEST_PATH_IMAGE039
的相对相关度
Figure 6969DEST_PATH_IMAGE066
成反比,即
Figure 165811DEST_PATH_IMAGE067
设计如下的单调递减函数
Figure 944411DEST_PATH_IMAGE068
,为每个类别
Figure 749556DEST_PATH_IMAGE017
定制细粒度的误分类代价,将属于类别
Figure 475067DEST_PATH_IMAGE017
的图像误分类为类别
Figure 783688DEST_PATH_IMAGE039
的误分类代价为:
Figure 998769DEST_PATH_IMAGE069
其中
Figure 461849DEST_PATH_IMAGE070
是以2为底的对数函数;聚合服务器根据步骤2中得到的类别不公平监督水平向量和步骤3中得到的类别相关度矩阵,利用上式计算任意两个类别间的误分类代价,得到误分类代价矩阵
Figure 787788DEST_PATH_IMAGE064
7.根据权利要求1所述的提升分类公平性的异构分类器聚合方法,其特征在于,所述的步骤5具体为:
若对于
Figure 216496DEST_PATH_IMAGE023
中的样本
Figure 540161DEST_PATH_IMAGE071
,设备本地分类器
Figure 319898DEST_PATH_IMAGE027
的响应信息为
Figure 387211DEST_PATH_IMAGE072
,聚合分类器
Figure 640731DEST_PATH_IMAGE073
的响应信息为
Figure 400877DEST_PATH_IMAGE074
,则用softmax函数
Figure 402331DEST_PATH_IMAGE075
将响应信息转化为软标签,即标准化的类别概率向量:
Figure 7756DEST_PATH_IMAGE076
,多源异构分类器和聚合分类器的目标类集合是异构的,当它们的软标签的维数不同时,需要用某种方法实现输出间的映射,若
Figure 145476DEST_PATH_IMAGE077
是能够将设备本地分类器
Figure 637375DEST_PATH_IMAGE027
的软标签和聚合分类器
Figure 594967DEST_PATH_IMAGE073
的软标签联系起来的映射函数,二者的关系表示为
Figure 269662DEST_PATH_IMAGE078
,则基于知识蒸馏的异构分类器聚合训练的损失函数为:
Figure 527468DEST_PATH_IMAGE079
其中
Figure 160574DEST_PATH_IMAGE080
是样本的真实标签向量,
Figure 339883DEST_PATH_IMAGE081
Figure 878373DEST_PATH_IMAGE082
的能够与
Figure 725106DEST_PATH_IMAGE083
相比较的映射,有
Figure 60273DEST_PATH_IMAGE084
所述的设计提升分类公平性的异构分类器聚合算法,利用步骤4中生成的误分类代价矩阵调整上述基于知识蒸馏的异构分类器聚合过程中各个类别的重要性,从而缓解聚合分类器中的类别偏见、提升其分类公平性,首先,利用误分类代价对聚合分类器的响应信息转化得到的软标签进行扰动,然后,用扰动的结果构建能够应对不公平监督、提升分类公平性的聚合分类器训练损失函数。
8.根据权利要求7所述的提升分类公平性的异构分类器聚合方法,其特征在于,所述的设计提升分类公平性的异构分类器聚合算法具体为:
对于
Figure 992457DEST_PATH_IMAGE023
中的样本
Figure 8954DEST_PATH_IMAGE071
,令
Figure 241352DEST_PATH_IMAGE085
,聚合分类器
Figure 918059DEST_PATH_IMAGE073
的软标签为
Figure 603118DEST_PATH_IMAGE086
Figure 220045DEST_PATH_IMAGE082
,令
Figure 244632DEST_PATH_IMAGE087
Figure 390443DEST_PATH_IMAGE088
分别表示其受到误分类代价扰动后的结果,则有
Figure 562798DEST_PATH_IMAGE089
基于此,本发明构建的能够应对不公平监督、提升分类公平性的聚合分类器训练损失函数如下:
Figure 422563DEST_PATH_IMAGE090
其中
Figure 363975DEST_PATH_IMAGE080
是样本的真实标签,
Figure 946266DEST_PATH_IMAGE091
Figure 543600DEST_PATH_IMAGE088
的能够与
Figure 502329DEST_PATH_IMAGE083
相比较的映射,有
Figure 44DEST_PATH_IMAGE092
,第一项是提升分类公平性的预测损失,第二项是提升分类公平性的蒸馏损失,
Figure 753236DEST_PATH_IMAGE093
是平衡参数,用于平衡这两类损失的系数;前者匹配聚合分类器受到误分类代价扰动后的软标签和真实标签,后者使聚合分类器受到误分类代价扰动后的软标签模仿多源异构分类器的软标签。
CN202210320909.XA 2022-03-30 2022-03-30 一种提升分类公平性的异构分类器聚合方法 Pending CN114418039A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210320909.XA CN114418039A (zh) 2022-03-30 2022-03-30 一种提升分类公平性的异构分类器聚合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210320909.XA CN114418039A (zh) 2022-03-30 2022-03-30 一种提升分类公平性的异构分类器聚合方法

Publications (1)

Publication Number Publication Date
CN114418039A true CN114418039A (zh) 2022-04-29

Family

ID=81263589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210320909.XA Pending CN114418039A (zh) 2022-03-30 2022-03-30 一种提升分类公平性的异构分类器聚合方法

Country Status (1)

Country Link
CN (1) CN114418039A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009571A (zh) * 2017-11-16 2018-05-08 苏州大学 一种新的直推式半监督数据分类方法及系统
CN108921294A (zh) * 2018-07-11 2018-11-30 浙江大学 一种用于神经网络加速的渐进式块知识蒸馏方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009571A (zh) * 2017-11-16 2018-05-08 苏州大学 一种新的直推式半监督数据分类方法及系统
CN108921294A (zh) * 2018-07-11 2018-11-30 浙江大学 一种用于神经网络加速的渐进式块知识蒸馏方法

Similar Documents

Publication Publication Date Title
US20210390355A1 (en) Image classification method based on reliable weighted optimal transport (rwot)
CN107766929B (zh) 模型分析方法及装置
CN108304316B (zh) 一种基于协同迁移的软件缺陷预测方法
CN110866819A (zh) 一种基于元学习的自动化信贷评分卡生成方法
CN112508044A (zh) 人工智能ai模型的评估方法、系统及设备
Song et al. Using grey relational analysis to predict software effort with small data sets
US20220067588A1 (en) Transforming a trained artificial intelligence model into a trustworthy artificial intelligence model
WO2021051917A1 (zh) 人工智能ai模型的评估方法、系统及设备
CN115146764A (zh) 一种预测模型的训练方法、装置、电子设备及存储介质
JP2021103083A (ja) 機械学習装置、デマンド制御システム、及び、空調制御システム
CN112541639A (zh) 基于图神经网络和注意力机制的推荐系统评分预测方法
CN110310199B (zh) 借贷风险预测模型的构建方法、系统及借贷风险预测方法
CN115063664A (zh) 用于工业视觉检测的模型学习方法、训练方法及系统
Ordieres-Meré et al. Comparison of models created for the prediction of the mechanical properties of galvanized steel coils
CN104217296A (zh) 一种上市公司绩效综合评价方法
CN111639688B (zh) 一种基于线性核svm的物联网智能模型的局部解释方法
CN116911994B (zh) 对外贸易风险预警系统
Lo Predicting software reliability with support vector machines
CN111950652A (zh) 一种基于相似度的半监督学习数据分类算法
Lo Early software reliability prediction based on support vector machines with genetic algorithms
CN111797935A (zh) 基于群体智能的半监督深度网络图片分类方法
de Sá et al. Algorithm recommendation for data streams
Chen Embedding a back propagation network into fuzzy c-means for estimating job cycle time: wafer fabrication as an example
CN114418039A (zh) 一种提升分类公平性的异构分类器聚合方法
Fan Data mining model for predicting the quality level and classification of construction projects

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220429

RJ01 Rejection of invention patent application after publication