CN116402366A - 基于联合学习的数据贡献评价方法及装置 - Google Patents

基于联合学习的数据贡献评价方法及装置 Download PDF

Info

Publication number
CN116402366A
CN116402366A CN202111592630.9A CN202111592630A CN116402366A CN 116402366 A CN116402366 A CN 116402366A CN 202111592630 A CN202111592630 A CN 202111592630A CN 116402366 A CN116402366 A CN 116402366A
Authority
CN
China
Prior art keywords
data
participant
joint learning
training
participants
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111592630.9A
Other languages
English (en)
Inventor
孙浩
刘嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinzhi I Lai Network Technology Co ltd
Original Assignee
Xinzhi I Lai Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinzhi I Lai Network Technology Co ltd filed Critical Xinzhi I Lai Network Technology Co ltd
Priority to CN202111592630.9A priority Critical patent/CN116402366A/zh
Publication of CN116402366A publication Critical patent/CN116402366A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开涉及机器学习技术领域,提供了一种基于联合学习的数据贡献评价方法及装置。该方法包括:基于联合学习架构,确定加入联合学习评价任务的参与方;接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据;按预设条件对贡献数据进行排序,并得到预设条件中的指定排序对应的参与方;根据预设条件中的指定排序对应的参与方,确定参与方的任务数据量;基于参与方的任务数据量,给出参与方的数据贡献评价值。采用上述技术手段,解决现有技术中,联合学习训练中无法对参与方的贡献合理评价的问题。

Description

基于联合学习的数据贡献评价方法及装置
技术领域
本公开涉及机器学习技术领域,尤其涉及一种基于联合学习的数据贡献评价方法及装置。
背景技术
随着机器学习技术的发展,神经网络模型被广泛应用于各行各业。因为大规模的模型训练对硬件的要求高,同时为了确保模型的精度,需要大量的数据进行模型训练,因此仅仅通过一方去训练模型,受限因素很多。为了解决上述问题,联合学习被引入到多方训练的场景中。因为联合学习是多个参与方分别训练模型,发起方或者中心只需要聚合多个参与方的模型参数,就可以得到相当于使用多个参与方的数据训练的模型,因此可以很好的应用于多方训练的场景中。但是联合学习训练中每个参与方对整个训练的贡献,无法具体确定。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下技术问题:联合学习训练中无法对参与方的贡献合理评价的问题。
发明内容
有鉴于此,本公开实施例提供了一种基于联合学习的数据贡献评价方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,联合学习训练中无法对参与方的贡献合理评价的问题。
本公开实施例的第一方面,提供了一种基于联合学习的数据贡献评价方法,包括:基于联合学习架构,确定加入联合学习评价任务的参与方;接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据;按预设条件对贡献数据进行排序,并得到预设条件中的指定排序对应的参与方;根据预设条件中的指定排序对应的参与方,确定参与方的任务数据量;基于参与方的任务数据量,给出参与方的数据贡献评价值。
本公开实施例的第二方面,提供了一种基于联合学习的数据贡献评价装置,包括:第一确定模块,被配置为基于联合学习架构,确定加入联合学习评价任务的参与方;接收模块,被配置为接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据;排序模块,被配置为按预设条件对贡献数据进行排序,并得到预设条件中的指定排序对应的参与方;第二确定模块,被配置为根据预设条件中的指定排序对应的参与方,确定参与方的任务数据量;评价模块,被配置为基于参与方的任务数据量,给出参与方的数据贡献评价值。
本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本公开实施例与现有技术相比存在的有益效果是:基于联合学习架构,确定加入联合学习评价任务的参与方;接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据;按预设条件对贡献数据进行排序,并得到预设条件中的指定排序对应的参与方;根据预设条件中的指定排序对应的参与方,确定参与方的任务数据量;基于参与方的任务数据量,给出参与方的数据贡献评价值。采用上述技术手段,可以解决现有技术中,联合学习训练中无法对参与方的贡献合理评价的问题,进而提供一种合理评价参与方贡献的方法。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本公开实施例的一种联合学习的架构示意图;
图2是本公开实施例提供的一种基于联合学习的数据贡献评价方法的流程示意图;
图3是本公开实施例提供的一种基于联合学习的数据贡献评价装置的结构示意图;
图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
联合学习是指在确保数据安全及用户隐私的前提下,综合利用多种AI(Artificial Intelligence,人工智能)技术,联合多方合作共同挖掘数据价值,催生基于联合建模的新的智能业态和模式。联合学习至少具有以下特点:
(1)参与节点控制自有数据的弱中心化联合训练模式,确保共创智能过程中的数据隐私安全。
(2)在不同应用场景下,利用筛选和/或组合AI算法、隐私保护计算,建立多种模型聚合优化策略,以获取高层次、高质量的模型。
(3)在确保数据安全及用户隐私的前提下,基于多种模型聚合优化策略,获取提升联合学习引擎的效能方法,其中效能方法可以是通过解决包括计算架构并行、大规模跨域网络下的信息交互、智能感知、异常处理机制等,提升联合学习引擎的整体效能。
(4)获取各场景下多方用户的需求,通过互信机制,确定合理评估各联合参与方的真实贡献度,进行分配激励。
基于上述方式,可以建立基于联合学习的AI技术生态,充分发挥行业数据价值,推动垂直领域的场景落地。
下面将结合附图详细说明根据本公开实施例的一种基于联合学习的数据贡献评价方法和装置。
图1是本公开实施例的一种联合学习的架构示意图。如图1所示,联合学习的架构可以包括服务器(中心节点)101以及参与方102、参与方103和参与方104。
在联合学习过程中,基本模型可以通过服务器101建立,服务器101将该模型发送至与其建立通信连接的参与方102、参与方103和参与方104。基本模型还可以是任一参与方建立后上传至服务器101,服务器101将该模型发送至与其建立通信连接的其他参与方。参与方102、参与方103和参与方104根据下载的基本结构和模型参数构建模型,利用本地数据进行模型训练,获得更新的模型参数,并将更新的模型参数加密上传至服务器101。服务器101对参与方102、参与方103和参与方104发送的模型参数进行聚合,获得全局模型参数,并将全局模型参数传回至参与方102、参与方103和参与方104。参与方102、参与方103和参与方104根据接收的全局模型参数对各自的模型进行迭代,直到模型最终收敛,从而实现对模型的训练。在联合学习过程中,参与方102、参与方103和参与方104上传的数据为模型参数,本地数据并不会上传至服务器101,且所有参与方可以共享最终的模型参数,因此可以在保证数据隐私的基础上实现共同建模。需要说明的是,参与方的数量不限于如上的三个,而是可以根据需要进行设置,本公开实施例对此不作限制。
图2是本公开实施例提供的一种基于联合学习的数据贡献评价方法的流程示意图。图2的基于联合学习的数据贡献评价方法可以由图1的服务器执行。如图2所示,该基于联合学习的数据贡献评价方法包括:
S201,基于联合学习架构,确定加入联合学习评价任务的参与方;
S202,接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据;
S203,按预设条件对贡献数据进行排序,并得到预设条件中的指定排序对应的参与方;
S204,根据预设条件中的指定排序对应的参与方,确定参与方的任务数据量;
S205,基于参与方的任务数据量,给出参与方的数据贡献评价值。
本公开实施例的执行主体可以是发起联合训练的发起方或者一个训练中心。新建联合学习评价任务,通过联合学习评价任务计算每个参与联合学习训练的参与方的数据贡献评价值。本公开实施例提出了一种新的参与联合学习训练的参与方的贡献的评价标准。加入联合学习评价任务的参与方,都是参与本次联合学习训练的参与方,一个联合学习评价任务对应一次联合学习训练。参与方发送的本地资源输出量,可以理解为参与方的所有数据的量,一个参与方的贡献数据,可以理解为根据该参与方提供的训练数据的量,应该给出的申报数据(申报数据是候选方参与联合学习训练,发起方或者训练中心需要支付的代价,该代价可以是经济效益,也可以是训练的成果即联合学习模型的使用权限,还可以是联合学习模型的识别或者检测的结果等)。按预设条件对贡献数据进行排序,比如可以是按照参与方报价,从高到低的排序。参与方的任务数据量是参与方的提供的训练数据的量,参与方的所有数据包括训练数据。参与方的数据贡献评价值是该参与方在本次联合学习中的贡献。
利用多个参与方的训练数据进行联合学习训练,每个参与方都有自己的训练数据。
根据本公开实施例提供的技术方案,基于联合学习架构,确定加入联合学习评价任务的参与方;接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据;按预设条件对贡献数据进行排序,并得到预设条件中的指定排序对应的参与方;根据预设条件中的指定排序对应的参与方,确定参与方的任务数据量;基于参与方的任务数据量,给出参与方的数据贡献评价值。参与方的贡献数据为参与方参与联合学习的申报数据,因此采用上述技术手段,可以解决现有技术中,联合学习训练中无法对参与方的贡献合理评价的问题,进而提供一种合理评价参与方贡献的方法。
在步骤201中,基于联合学习架构,确定加入联合学习评价任务的参与方,包括:基于联合学习架构,接收来自联合学习架构中的需求方提出的任务;根据需求方提出的任务,确定与需求方提出的任务相关数据量;根据需求方提出的任务相关数据量,建立联合学习评价任务;利用联合学习评价任务,确定加入联合学习评价任务的参与方。
联合学习架构中的需求方就是发起方或者训练中心,需求方提出的任务就是本次训练的主题,任务相关数据量是本次训练对应的训练数据的类型和数据量的多少。
在步骤201中,接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据,包括:接收每个参与方发送的本地资源输出量;根据多个参与方发送的本地资源输出量,得到资源总输出量;根据资源总输出量和每个参与方发送的本地资源输出量确定每个参与方的贡献数据。
每个参与方发送的本地资源输出量可以是每个参与方的所有数据的量,资源总输出量是所有的参与方的所拥有的所有的数据的总量。根据资源总输出量和每个参与方发送的本地资源输出量确定每个参与方的贡献数据。比如使用每个参与方发送的本地资源输出量除以资源总输出量,将得到的值确定为每个参与方的贡献数据。
在步骤201中,根据预设条件中的指定排序对应的参与方,确定参与方的任务数据量,包括:获取联合学习评价任务对应的总数据量;根据预设条件中的指定排序对应的每个参与方和总数据量确定每个参与方的任务数据量。
每个参与方的任务数据量是参与方的提供的训练数据的量,联合学习评价任务对应的总数据量是所有参与方的任务数据量加起来的值。根据预设条件中的指定排序对应的每个参与方和总数据量确定每个参与方的任务数据量,可以是使用总数据量除以每个参与方的排序,得到的值和该参与方的任务数据量相关。
在一个可选实施例中,获取多个候选方参与联合学习训练的申报数据;按照预设规则计算多个候选方的训练数据的质量评估结果;根据每个候选方的申报数据和质量评估结果,从多个候选方中确定出多个参与方;利用多个参与方的训练数据进行联合学习训练。
联合学习训练开始前,发起方或者训练中心通过广播机制向所有的数据供给方(数据供给方是持有数据的一方)发送此次训练的主题,比如是人脸识别,或者电气预测等主题;数据供给方在接收到此次训练的主题,根据自身的需求,确定自己是否要参加这次的训练,将确认参加这次训练的数据供给方确定为候选方参;为了降低成本,本公开实施例通过提前获取多个候选方参与联合学习训练的申报数据,从中选出符合发起方或者训练中心支付代价预期的候选方作为参与方;同时,为了避免候选方,发起方或者训练中心会提前按照预设规则计算多个候选方的训练数据的估计数据(是对候选方的训练数据对应的真实应该支付的代价的评估),根据训练数据的估计数据,选出真实发送申报数据的候选方,不真实发送申报数据的候选方被淘汰。
在执行步骤S204之后,根据预设条件中的指定排序对应的参与方,确定参与方的任务数据量之后,方法还包括:利用预设条件中的指定排序对应的每个参与方的训练数据对神经网络模型进行第一次训练;获取通过预设条件中的指定排序对应的每个参与方的训练数据训练后的神经网络模型的模型参数;对预设条件中的指定排序对应的每个参与方对应的模型参数进行参数聚合操作,得到聚合参数;利用聚合参数更新神经网络模型的模型参数,得到联合学习模型。
本公开中的神经网络模型可以是任意一种常用的神经网络模型。本公开实施例,因为是使用每个参与方的训练数据对神经网络模型进行了训练,发起方或者训练中心,只需要将每个参与方对应的神经网络模型的模型参数进行参数聚合操作,得到全局参数,基于全局参数更新神经网络模型的模型参数,就可以得到联合学习模型,所以可以降低发起方或者训练中心的硬件要求,同时,因为每个参与方只需要训练自己一方的数据,数据量比起所有参与方的数据加起来的数据要少得多,所以每个参与方的硬件要求也不高。
利用聚合参数更新神经网络模型的模型参数,这里的神经网络模型是发起方或者训练中心保存的模型,没有经过训练;利用每个参与方的训练数据,通过每个参与方的训练数据对神经网络模型进行第一次训练,这里的神经网络模型是发起方或者训练中心发送给每个参与方的。
利用聚合参数更新神经网络模型的模型参数,得到联合学习模型之后,方法还包括:获取基础数据和基础数据对应的基础数据信息,并根据基础数据信息,从预设条件中的指定排序对应的每个参与方训练数据中抽取出部分数据;利用预设条件中的指定排序对应的多个参与方的多个部分数据对联合学习模型进行第二次训练,直至联合学习模型对应的损失函数的损失值小于第三预设阈值,停止第二次训练;利用基础数据对联合学习模型进行第三次训练,直至联合学习模型对应的损失函数的损失值小于第四预设阈值,停止第三次训练。
发起方或者训练中心,如果只是将每个参与方的神经网络模型的模型参数进行参数聚合操作,得到全局参数,基于全局参数更新神经网络模型的模型参数,得到的联合学习模型,可能精度不高,不能符合要求,所以本公开实施例提供了一种提高聚合参数得到的联合学习模型的精度的方法:利用多个参与方的多个部分数据对联合学习模型进行第二次训练;利用基础数据对联合学习模型进行第三次训练。基础数据信息是关于基础数据的种类和每个种类中的数据多少的信息。根据基础数据信息,从每个参与方的训练数据中抽取出的部分数据,是与其他参与方种类不同的数据,当然也可以是其他参与方的某一个种类的补充(其他参与方的该种类中的数据较少)。参数聚合操作就是对参数数据进行聚合的操作。
利用预设条件中的指定排序对应的每个参与方的训练数据对神经网络模型进行第一次训练,包括:在预设条件中的指定排序对应的每个参与方中:确定每次对神经网络模型进行训练的批处理条数,其中,批处理条数用于指示每次训练神经网络模型时,从参与方的训练数据中选取的数据的条数;循环执行如下步骤对神经网络模型进行第一次训练:从参与方的训练数据中确定出批处理条数条数据;根据确定出的每条数据生成第一矩阵,得到多个第一矩阵;分别将多个第一矩阵依次输入神经网络模型,得到多个第二矩阵;通过神经网络模型的损失函数计算每个第一矩阵与每个第一矩阵所对应的第二矩阵的误差值;根据误差值对神经网络模型进行训练;在当前批次的训练中,在最后一个输入神经网络模型的第一矩阵和最后一个输入神经网络模型的第一矩阵所对应的第二矩阵的误差值小于第五预设阈值时,结束循环。
第一批处理条数是每次批处理对应的从每个参与方的训练数据中选择数据的条数,批处理是模型训练中的专有名词,本公开不再解释,每个参与方的训练数据存在多条数据。需要说明的是,确定训练神经网络模型时的批处理条数时,还可以确定神经网络模型的最大模型维度,确定网络各个模块中超参数,例如神经网络模型的网络层数、学习率、学习率衰减、学习种子等超参数。根据确定出的每条数据生成第一矩阵,是将每条数据转换为了矩阵数据,也就是第一矩阵。分别将多个第一矩阵依次输入神经网络模型,得到多个第二矩阵。其中,第二矩阵是神经网络模型根据第一矩阵,预测出的数据的数据。通过损失函数计算每个第一矩阵与每个第一矩阵所对应的第二矩阵的误差值,也就是计算神经网络模型预测的值和真实值之间的差距,最后根据误差值对神经网络模型进行训练。在循环训练中,逐渐减小误差值,提高神经网络模型仿真的准确率,在当前批次训练的最后一个输入神经网络模型的第一矩阵和最后一个输入神经网络模型的第一矩阵所对应的第二矩阵的误差值小于第五预设阈值时,结束循环。需要说明的是,每次循环从推理结果中确定出批处理条数条数据,是可以重复的。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图3是本公开实施例提供的一种基于联合学习的数据贡献评价装置的示意图。如图3所示,该基于联合学习的数据贡献评价装置包括:
第一确定模块301,被配置为基于联合学习架构,确定加入联合学习评价任务的参与方;
接收模块302,被配置为接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据;
排序模块303,被配置为按预设条件对贡献数据进行排序,并得到预设条件中的指定排序对应的参与方;
第二确定模块304,被配置为根据预设条件中的指定排序对应的参与方,确定参与方的任务数据量;
评价模块305,被配置为基于参与方的任务数据量,给出参与方的数据贡献评价值。
本公开实施例的执行主体可以是发起联合训练的发起方或者一个训练中心。新建联合学习评价任务,通过联合学习评价任务计算每个参与联合学习训练的参与方的数据贡献评价值。本公开实施例提出了一种新的参与联合学习训练的参与方的贡献的评价标准。加入联合学习评价任务的参与方,都是参与本次联合学习训练的参与方,一个联合学习评价任务对应一次联合学习训练。参与方发送的本地资源输出量,可以理解为参与方的所有数据的量,一个参与方的贡献数据,可以理解为根据该参与方提供的训练数据的量,应该给出的申报数据(申报数据是候选方参与联合学习训练,发起方或者训练中心需要支付的代价,该代价可以是经济效益,也可以是训练的成果即联合学习模型的使用权限,还可以是联合学习模型的识别或者检测的结果等)。按预设条件对贡献数据进行排序,比如可以是按照参与方报价,从高到低的排序。参与方的任务数据量是参与方的提供的训练数据的量,参与方的所有数据包括训练数据。参与方的数据贡献评价值是该参与方在本次联合学习中的贡献。
利用多个参与方的训练数据进行联合学习训练,每个参与方都有自己的训练数据。
根据本公开实施例提供的技术方案,基于联合学习架构,确定加入联合学习评价任务的参与方;接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据;按预设条件对贡献数据进行排序,并得到预设条件中的指定排序对应的参与方;根据预设条件中的指定排序对应的参与方,确定参与方的任务数据量;基于参与方的任务数据量,给出参与方的数据贡献评价值。参与方的贡献数据为参与方参与联合学习的申报数据,因此采用上述技术手段,可以解决现有技术中,联合学习训练中无法对参与方的贡献合理评价的问题,进而提供一种合理评价参与方贡献的方法。
可选地,第一确定模块301还被配置为基于联合学习架构,接收来自联合学习架构中的需求方提出的任务;根据需求方提出的任务,确定与需求方提出的任务相关数据量;根据需求方提出的任务相关数据量,建立联合学习评价任务;利用联合学习评价任务,确定加入联合学习评价任务的参与方。
联合学习架构中的需求方就是发起方或者训练中心,需求方提出的任务就是本次训练的主题,任务相关数据量是本次训练对应的训练数据的类型和数据量的多少。
可选地,接收模块302还被配置为接收每个参与方发送的本地资源输出量;根据多个参与方发送的本地资源输出量,得到资源总输出量;根据资源总输出量和每个参与方发送的本地资源输出量确定每个参与方的贡献数据。
每个参与方发送的本地资源输出量可以是每个参与方的所有数据的量,资源总输出量是所有的参与方的所拥有的所有的数据的总量。根据资源总输出量和每个参与方发送的本地资源输出量确定每个参与方的贡献数据。比如使用每个参与方发送的本地资源输出量除以资源总输出量,将得到的值确定为每个参与方的贡献数据。
可选地,第二确定模块304还被配置为获取联合学习评价任务对应的总数据量;根据预设条件中的指定排序对应的每个参与方和总数据量确定每个参与方的任务数据量。
每个参与方的任务数据量是参与方的提供的训练数据的量,联合学习评价任务对应的总数据量是所有参与方的任务数据量加起来的值。根据预设条件中的指定排序对应的每个参与方和总数据量确定每个参与方的任务数据量,可以是使用总数据量除以每个参与方的排序,得到的值和该参与方的任务数据量相关。
可选地,第一确定模块301还被配置为获取多个候选方参与联合学习训练的申报数据;按照预设规则计算多个候选方的训练数据的质量评估结果;根据每个候选方的申报数据和质量评估结果,从多个候选方中确定出多个参与方;利用多个参与方的训练数据进行联合学习训练。
联合学习训练开始前,发起方或者训练中心通过广播机制向所有的数据供给方(数据供给方是持有数据的一方)发送此次训练的主题,比如是人脸识别,或者电气预测等主题;数据供给方在接收到此次训练的主题,根据自身的需求,确定自己是否要参加这次的训练,将确认参加这次训练的数据供给方确定为候选方参;为了降低成本,本公开实施例通过提前获取多个候选方参与联合学习训练的申报数据,从中选出符合发起方或者训练中心支付代价预期的候选方作为参与方;同时,为了避免候选方,发起方或者训练中心会提前按照预设规则计算多个候选方的训练数据的估计数据(是对候选方的训练数据对应的真实应该支付的代价的评估),根据训练数据的估计数据,选出真实发送申报数据的候选方,不真实发送申报数据的候选方被淘汰。
可选地,第二确定模块304还被配置为利用预设条件中的指定排序对应的每个参与方的训练数据对神经网络模型进行第一次训练;获取通过预设条件中的指定排序对应的每个参与方的训练数据训练后的神经网络模型的模型参数;对预设条件中的指定排序对应的每个参与方对应的模型参数进行参数聚合操作,得到聚合参数;利用聚合参数更新神经网络模型的模型参数,得到联合学习模型。
本公开中的神经网络模型可以是任意一种常用的神经网络模型。本公开实施例,因为是使用每个参与方的训练数据对神经网络模型进行了训练,发起方或者训练中心,只需要将每个参与方对应的神经网络模型的模型参数进行参数聚合操作,得到全局参数,基于全局参数更新神经网络模型的模型参数,就可以得到联合学习模型,所以可以降低发起方或者训练中心的硬件要求,同时,因为每个参与方只需要训练自己一方的数据,数据量比起所有参与方的数据加起来的数据要少得多,所以每个参与方的硬件要求也不高。
利用聚合参数更新神经网络模型的模型参数,这里的神经网络模型是发起方或者训练中心保存的模型,没有经过训练;利用每个参与方的训练数据,通过每个参与方的训练数据对神经网络模型进行第一次训练,这里的神经网络模型是发起方或者训练中心发送给每个参与方的。
可选地,第二确定模块304还被配置为获取基础数据和基础数据对应的基础数据信息,并根据基础数据信息,从预设条件中的指定排序对应的每个参与方训练数据中抽取出部分数据;利用预设条件中的指定排序对应的多个参与方的多个部分数据对联合学习模型进行第二次训练,直至联合学习模型对应的损失函数的损失值小于第三预设阈值,停止第二次训练;利用基础数据对联合学习模型进行第三次训练,直至联合学习模型对应的损失函数的损失值小于第四预设阈值,停止第三次训练。
发起方或者训练中心,如果只是将每个参与方的神经网络模型的模型参数进行参数聚合操作,得到全局参数,基于全局参数更新神经网络模型的模型参数,得到的联合学习模型,可能精度不高,不能符合要求,所以本公开实施例提供了一种提高聚合参数得到的联合学习模型的精度的方法:利用多个参与方的多个部分数据对联合学习模型进行第二次训练;利用基础数据对联合学习模型进行第三次训练。基础数据信息是关于基础数据的种类和每个种类中的数据多少的信息。根据基础数据信息,从每个参与方的训练数据中抽取出的部分数据,是与其他参与方种类不同的数据,当然也可以是其他参与方的某一个种类的补充(其他参与方的该种类中的数据较少)。参数聚合操作就是对参数数据进行聚合的操作。
可选地,第二确定模块304还被配置为在预设条件中的指定排序对应的每个参与方中:确定每次对神经网络模型进行训练的批处理条数,其中,批处理条数用于指示每次训练神经网络模型时,从参与方的训练数据中选取的数据的条数;循环执行如下步骤对神经网络模型进行第一次训练:从参与方的训练数据中确定出批处理条数条数据;根据确定出的每条数据生成第一矩阵,得到多个第一矩阵;分别将多个第一矩阵依次输入神经网络模型,得到多个第二矩阵;通过神经网络模型的损失函数计算每个第一矩阵与每个第一矩阵所对应的第二矩阵的误差值;根据误差值对神经网络模型进行训练;在当前批次的训练中,在最后一个输入神经网络模型的第一矩阵和最后一个输入神经网络模型的第一矩阵所对应的第二矩阵的误差值小于第五预设阈值时,结束循环。
第一批处理条数是每次批处理对应的从每个参与方的训练数据中选择数据的条数,批处理是模型训练中的专有名词,本公开不再解释,每个参与方的训练数据存在多条数据。需要说明的是,确定训练神经网络模型时的批处理条数时,还可以确定神经网络模型的最大模型维度,确定网络各个模块中超参数,例如神经网络模型的网络层数、学习率、学习率衰减、学习种子等超参数。根据确定出的每条数据生成第一矩阵,是将每条数据转换为了矩阵数据,也就是第一矩阵。分别将多个第一矩阵依次输入神经网络模型,得到多个第二矩阵。其中,第二矩阵是神经网络模型根据第一矩阵,预测出的数据的数据。通过损失函数计算每个第一矩阵与每个第一矩阵所对应的第二矩阵的误差值,也就是计算神经网络模型预测的值和真实值之间的差距,最后根据误差值对神经网络模型进行训练。在循环训练中,逐渐减小误差值,提高神经网络模型仿真的准确率,在当前批次训练的最后一个输入神经网络模型的第一矩阵和最后一个输入神经网络模型的第一矩阵所对应的第二矩阵的误差值小于第五预设阈值时,结束循环。需要说明的是,每次循环从推理结果中确定出批处理条数条数据,是可以重复的。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。
图4是本公开实施例提供的电子设备4的示意图。如图4所示,该实施例的电子设备4包括:处理器401、存储器402以及存储在该存储器402中并且可在处理器401上运行的计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中的步骤。或者,处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能。
示例性地,计算机程序403可以被分割成一个或多个模块/单元,一个或多个模块/单元被存储在存储器402中,并由处理器401执行,以完成本公开。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序403在电子设备4中的执行过程。
电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备4可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解,图4仅仅是电子设备4的示例,并不构成对电子设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如,电子设备还可以包括输入输出设备、网络接入设备、总线等。
处理器401可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器402可以是电子设备4的内部存储单元,例如,电子设备4的硬盘或内存。存储器402也可以是电子设备4的外部存储设备,例如,电子设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器402还可以既包括电子设备4的内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需的其它程序和数据。存储器402还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
在本公开所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/电子设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围,均应包含在本公开的保护范围之内。

Claims (10)

1.一种基于联合学习的数据贡献评价方法,其特征在于,包括:
基于联合学习架构,确定加入联合学习评价任务的参与方;
接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据;
按预设条件对所述贡献数据进行排序,并得到所述预设条件中的指定排序对应的所述参与方;
根据所述预设条件中的指定排序对应的所述参与方,确定所述参与方的任务数据量;
基于所述参与方的任务数据量,给出所述参与方的数据贡献评价值。
2.根据权利要求1所述的方法,其特征在于,基于联合学习架构,确定加入联合学习评价任务的参与方,包括:
基于联合学习架构,接收来自联合学习架构中的需求方提出的任务;
根据所述需求方提出的任务,确定与所述需求方提出的任务相关数据量;
根据所述需求方提出的任务相关数据量,建立联合学习评价任务;
利用所述联合学习评价任务,确定加入联合学习评价任务的参与方。
3.根据权利要求1所述的方法,其特征在于,所述接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据,包括:
接收每个所述参与方发送的本地资源输出量;
根据多个所述参与方发送的本地资源输出量,得到资源总输出量;
根据所述资源总输出量和每个所述参与方发送的本地资源输出量确定每个所述参与方的所述贡献数据。
4.根据权利要求1所述的方法,其特征在于,所述根据预设条件中的指定排序对应的所述参与方,确定所述参与方的任务数据量,包括:
获取所述联合学习评价任务对应的总数据量;
根据所述预设条件中的指定排序对应的每个所述参与方和所述总数据量确定每个所述参与方的任务数据量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述预设条件中的指定排序对应的所述参与方,确定所述参与方的任务数据量之后,所述方法还包括:
利用所述预设条件中的指定排序对应的每个所述参与方的训练数据对神经网络模型进行第一次训练;
获取通过所述预设条件中的指定排序对应的每个所述参与方的训练数据训练后的神经网络模型的模型参数;
对所述预设条件中的指定排序对应的每个所述参与方对应的模型参数进行参数聚合操作,得到聚合参数;
利用所述聚合参数更新所述神经网络模型的模型参数,得到联合学习模型。
6.根据权利要求5所述的方法,其特征在于,所述利用所述聚合参数更新所述神经网络模型的模型参数,得到联合学习模型之后,所述方法还包括:
获取基础数据和所述基础数据对应的基础数据信息,并根据所述基础数据信息,从所述预设条件中的指定排序对应的每个所述参与方的训练数据中抽取出部分数据;
利用所述预设条件中的指定排序对应的多个所述参与方的多个部分数据对所述联合学习模型进行第二次训练,直至所述联合学习模型对应的损失函数的损失值小于第三预设阈值,停止所述第二次训练;
利用所述基础数据对所述联合学习模型进行第三次训练,直至所述联合学习模型对应的损失函数的损失值小于第四预设阈值,停止所述第三次训练。
7.根据权利要求5所述的方法,其特征在于,所述利用所述预设条件中的指定排序对应的每个所述参与方的训练数据对神经网络模型进行第一次训练,包括:
在所述预设条件中的指定排序对应的每个所述参与方中:
确定每次对所述神经网络模型进行训练的批处理条数,其中,所述批处理条数用于指示每次训练所述神经网络模型时,从所述参与方的训练数据中选取的数据的条数;
循环执行如下步骤对所述神经网络模型进行第一次训练:
从所述参与方的训练数据中确定出所述批处理条数条数据;
根据确定出的每条数据生成第一矩阵,得到多个所述第一矩阵;
分别将多个所述第一矩阵依次输入所述神经网络模型,得到多个第二矩阵;
通过所述神经网络模型的损失函数计算每个所述第一矩阵与每个所述第一矩阵所对应的所述第二矩阵的误差值;
根据所述误差值对所述神经网络模型进行训练;
在当前批次的训练中,在最后一个输入所述神经网络模型的所述第一矩阵和最后一个输入所述神经网络模型的所述第一矩阵所对应的所述第二矩阵的误差值小于第五预设阈值时,结束循环。
8.一种基于联合学习的数据贡献评价装置,其特征在于,包括:
第一确定模块,被配置为基于联合学习架构,确定加入联合学习评价任务的参与方;
接收模块,被配置为接收加入联合学习评价任务的参与方发送的本地资源输出量,以得到贡献数据;
排序模块,被配置为按预设条件对所述贡献数据进行排序,并得到所述预设条件中的指定排序对应的所述参与方;
第二确定模块,被配置为根据所述预设条件中的指定排序对应的所述参与方,确定所述参与方的任务数据量;
评价模块,被配置为基于所述参与方的任务数据量,给出所述参与方的数据贡献评价值。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
CN202111592630.9A 2021-12-23 2021-12-23 基于联合学习的数据贡献评价方法及装置 Pending CN116402366A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111592630.9A CN116402366A (zh) 2021-12-23 2021-12-23 基于联合学习的数据贡献评价方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111592630.9A CN116402366A (zh) 2021-12-23 2021-12-23 基于联合学习的数据贡献评价方法及装置

Publications (1)

Publication Number Publication Date
CN116402366A true CN116402366A (zh) 2023-07-07

Family

ID=87018439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111592630.9A Pending CN116402366A (zh) 2021-12-23 2021-12-23 基于联合学习的数据贡献评价方法及装置

Country Status (1)

Country Link
CN (1) CN116402366A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117670146A (zh) * 2024-02-01 2024-03-08 青岛培诺教育科技股份有限公司 一种学习过程测评方法、装置、电子设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117670146A (zh) * 2024-02-01 2024-03-08 青岛培诺教育科技股份有限公司 一种学习过程测评方法、装置、电子设备及介质
CN117670146B (zh) * 2024-02-01 2024-04-30 青岛培诺教育科技股份有限公司 一种学习过程测评方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
CN113988310A (zh) 深度学习模型选择方法、装置、计算机设备和介质
CN113435534A (zh) 一种基于相似度度量的数据异构处理方法、装置、计算机设备及计算机可读存储介质
CN116402366A (zh) 基于联合学习的数据贡献评价方法及装置
CN114202018A (zh) 一种模块化的联合学习方法及系统
CN112598132A (zh) 模型训练方法及装置、存储介质、电子装置
WO2023071529A1 (zh) 设备数据清洗方法、装置、计算机设备及介质
CN116340959A (zh) 一种面向断点隐私保护的方法、装置、设备及介质
CN114553869A (zh) 基于联合学习的确定资源贡献度的方法、装置和电子设备
CN116050557A (zh) 电力负荷预测方法、装置、计算机设备和介质
CN114219338A (zh) 基于联合学习的资源分配方法及装置
CN116384461A (zh) 基于联合学习的模型优化训练方法及装置
CN116384501A (zh) 一种联合学习训练方法及装置
CN113887745A (zh) 数据异构的联合学习方法及装置
CN115271042A (zh) 基于样本的采样时间的模型训练方法及装置
CN114897186A (zh) 联合学习训练方法及装置
CN114897185A (zh) 基于类别异构数据的联合学习训练方法及装置
CN116402261A (zh) 基于联合学习的数据激励处理方法及装置
CN116432010A (zh) 一种联合学习模型的训练方法及装置
CN116484708A (zh) 一种基于联合学习的数据对象处理方法和装置
CN116070708A (zh) 基于联合学习的模型训练方法及装置
CN116484707A (zh) 联合学习模型的确定方法及装置
CN117313831A (zh) 基于模型蒸馏的联合学习训练方法及装置
CN116485215A (zh) 联合学习中资源的分配方法及装置
CN116304651A (zh) 一种优化模型性能的训练方法及装置
CN114298320A (zh) 联合学习的贡献值计算方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination