CN111222646B

CN111222646B - 联邦学习机制的设计方法、装置和存储介质

Info

Publication number: CN111222646B
Application number: CN201911264303.3A
Authority: CN
Inventors: 丛明舒; 瞿中明; 黄艺茁
Original assignee: Shenzhen Logitech Co ltd
Current assignee: Shenzhen Logitech Co ltd
Priority date: 2019-12-11
Filing date: 2019-12-11
Publication date: 2021-07-30
Anticipated expiration: 2039-12-11
Also published as: CN111222646A

Abstract

本发明公开了一种联邦学习机制的设计方法。该方法包括：配置预设计算图；获取可选优化目标；根据所述可选优化目标为所述预设计算图配置损失函数，获取配置有损失函数的计算图；获取数据有效性先验分布数据和参与者类型先验分布数据；根据所述数据有效性先验分布数据和所述参与者类型先验分布数据生成随机训练数据；根据所述随机训练数据训练所述配置有损失函数的计算图，得到最优的训练参数；根据所述最优的训练参数和所述预设计算图，获得联邦学习机制。本发明还公开了一种联邦学习机制的设计装置及计算机可读存储介质。本发明能够实现提高联邦学习机制计算的便捷性。

Description

联邦学习机制的设计方法、装置和存储介质

技术领域

本发明涉及机制设计领域，尤其涉及一种联邦学习机制的设计方法、装置和计算机可读存储介质。

背景技术

联邦学习(federated learning)又名联邦机器学习，是一个机器学习框架，能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下，进行数据使用和机器学习建模。联邦学习允许多个数据提供者联合建模，能够解决数据孤岛化的问题。目前，联邦学习需要设计一个激励机制，即确定出一个最优的社会选择函数，用于在满足机制中关于激励相容、个体理性、预算平衡、社会福利最大化和公平等各项要求的前提下，对不同的数据提供者提供不同经济激励。

但是目前，现有技术中，联邦学习激励机制的设计过程，即最优的社会选择函数的确定过程，还是依赖于资深机制设计专家的经验和直觉，这样不仅会造成设计结果不够准确，还需要一定的人力脑力劳动，具有局限性。

发明内容

本发明的主要目的在于提供一种联邦学习机制的设计方法、装置和计算机可读存储介质，旨在实现提高联邦学习机制计算的便捷性。

为实现上述目的，本发明提供一种联邦学习机制的设计方法，所述联邦学习机制的设计方法包括以下步骤：

配置预设计算图；

获取可选优化目标；

根据所述可选优化目标为所述预设计算图配置损失函数，获取配置有损失函数的计算图；

获取数据有效性先验分布数据和参与者类型先验分布数据；

根据所述数据有效性先验分布数据和所述参与者类型先验分布数据生成随机训练数据；

根据所述随机训练数据训练所述配置有损失函数的计算图，得到最优的训练参数；

根据所述最优的训练参数和所述预设计算图，获得联邦学习机制。

可选地，所述可选优化目标包括个体理性、预算平衡和公平中的一种或者多种。

可选地，所述预设计算图包括代表基础VCG支付的节点、代表调整支付的节点、代表FVCG支付的节点、代表数据有效性的节点、代表参与者类型的节点、代表社会福利的节点、代表损失函数的节点、代表子损失函数的节点、和代表可观测量的节点中的一种或者多种。

可选地，所述可选优化目标包括多个可选优化子目标数据，所述根据所述可选优化目标为所述预设计算图配置损失函数，获取配置有损失函数的计算图的步骤包括：

根据所述可选优化子目标数据配置子损失函数；

根据所述子损失函数配置计算图中的损失函数，得到配置有损失函数的计算图。

可选地，所述配置预设计算图的步骤包括：

在预设计算图中配置神经网络，将神经网络的输出节点作为代表调整支付的节点。

可选地，所述根据所述随机训练数据训练所述配置有损失函数的计算图，得到最优的训练参数的步骤包括：

根据所述随机训练数据计算所述配置有损失函数的计算图中的基础VCG 支付结果；

根据所述随机训练数据计算所述配置有损失函数的计算图中的调整支付结果；

根据所述基础VCG支付结果和所述调整支付结果，得到所述最优的训练参数。

可选地，所述根据所述随机训练数据计算所述配置有损失函数的计算图中的基础VCG支付结果的步骤包括：

根据所述随机训练数据，计算最优的每个参与者提供的数据的接受程度；

根据所述最优的每个参与者提供的数据的接受程度，计算包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利；

根据所述包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利和所述随机训练数据中的第一参与者提供数据的成本数据，计算第一参与者的基础VCG支付。

可选地，所述根据所述最优的每个参与者提供的数据的接受程度，计算包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利的步骤包括：

根据所述最优的每个参与者提供的数据的接受程度，利用预设的社会福利函数计算包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利。

可选地，所述根据所述随机训练数据计算所述配置有损失函数的计算图中的调整支付结果的步骤包括：

获取所述随机训练数据中的数据有效性和参与者类型两种数据信息；

对所述随机训练数据中的数据有效性和/或参与者类型两种数据信息利用所述神经网络进行前向传播，计算所述配置有损失函数的计算图中的调整支付结果。

可选地，所述根据所述基础VCG支付结果和所述调整支付结果，得到所述最优的训练参数的步骤包括：

根据所述基础VCG支付结果和所述调整支付结果计算损失函数的样本值；

训练所述配置有损失函数的计算图，获取使得所述配置有损失函数的计算图中的损失函数的样本值的加总值最小化的训练参数；

将所述使得损失函数的训练样本值的加总值最小化的训练参数作为最优的训练参数。

可选地，所述训练所述配置有损失函数的计算图，获取使得所述配置有损失函数的计算图中的损失函数的样本值的加总值最小化的训练参数的步骤包括：

采用反向传播算法训练所述配置有损失函数的计算图，获取所述使得配置有损失函数的计算图中的损失函数的样本值的加总值最小化的训练参数。

采用无监督学习算法训练所述配置有损失函数的计算图，获取使得所述配置有损失函数的计算图中的损失函数的样本值的加总值最小化的训练参数。

可选地，所述联邦学习机制的设计方法还包括以下步骤：

获取参与者的数据有效性和参与者类型两种数据信息；

根据所述数据有效性和/或参与者类型两种数据信息利用所述联邦学习机制进行计算，确定所述数据有效性和/或参与者类型两种数据信息所对应的支付结果。

此外，为实现上述目的，本发明还提供一种联邦学习机制的设计装置，所述联邦学习机制的设计装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的联邦学习机制的设计程序，所述联邦学习机制的设计程序被所述处理器执行时实现如上所述的联邦学习机制的设计方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有联邦学习机制的设计程序，所述联邦学习机制的设计程序被处理器执行时实现上述的联邦学习机制的设计方法的步骤。

本发明提供一种联邦学习机制的设计方法、装置和计算机存储介质。在该方法中，配置预设计算图；获取可选优化目标；根据所述可选优化目标为所述预设计算图配置损失函数，获取配置有损失函数的计算图；获取数据有效性先验分布数据和参与者类型先验分布数据；根据所述数据有效性先验分布数据和所述参与者类型先验分布数据生成随机训练数据；根据所述随机训练数据训练所述配置有损失函数的计算图，得到最优的训练参数；根据所述最优的训练参数和所述预设计算图，获得联邦学习机制。通过上述方式，本发明基于神经网络，将联邦学习激励机制设计转化成为一个神经网络优化问题，可以使用神经网络训练方法来训练这个用于联邦学习激励机制设计的神经网络，以得到最优的联邦学习激励机制，使得计算机领域从业者可以在不需要具有较多经验的情况下能够设计个性化的联邦学习激励机制，简化联邦学习激励机制设计的复杂度，同时保证了联邦学习机制中激励相容、个体理性、预算平衡、社会福利最大化、公平等机制设计目标。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图；

图2为本发明联邦学习机制的设计方法第一实施例的流程示意图；

图3为本发明联邦学习机制的设计方法第二实施例的流程示意图；

图4为本发明联邦学习机制的设计方法第三实施例的流程示意图；

图5为本发明联邦学习机制的设计方法第四实施例的流程示意图；

图6为本发明联邦学习机制的设计方法第五实施例的流程示意图；

图7为本发明联邦学习机制的设计方法第六实施例的流程示意图；

图8为本发明联邦学习机制的设计方法第七实施例的流程示意图；

图9为本发明联邦学习机制的设计方法第八实施例的流程示意图；

图10为本发明联邦学习机制的设计方法第一实施例预设计算图的节点模块示意图；

图11为本发明联邦学习机制的设计方法第一实施例预设计算图的节点连接关系示意图；

图12为本发明联邦学习机制的设计方法第一实施例计算效果示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图。

本发明实施例终端可以是PC，也可以是智能手机、平板电脑、便携计算机等具有数据处理功能的终端设备。

如图1所示，该终端可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如 WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器 (non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、Wi-Fi模块等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在移动终端移动到耳边时，关闭显示屏和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；当然，移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及联邦学习机制的设计程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的联邦学习机制的设计程序，并执行以下操作：

配置预设计算图；

获取可选优化目标；

获取数据有效性先验分布数据和参与者类型先验分布数据；

进一步地，处理器1001可以调用存储器1005中存储的联邦学习机制的设计程序，还执行以下操作：

所述可选优化目标包括个体理性、预算平衡和公平中的一种或者多种。

所述预设计算图包括代表基础VCG支付的节点、代表调整支付的节点、代表FVCG支付的节点、代表数据有效性的节点、代表参与者类型的节点、代表社会福利的节点、代表损失函数的节点、代表子损失函数的节点、和代表可观测量的节点中的一种或者多种。

所述可选优化目标包括多个可选优化子目标数据，所述根据所述可选优化目标为所述预设计算图配置损失函数，获取配置有损失函数的计算图的步骤包括：

根据所述可选优化子目标数据配置子损失函数；

所述配置预设计算图的步骤包括：

所述根据所述随机训练数据训练所述配置有损失函数的计算图，得到最优的训练参数的步骤包括：

所述根据所述随机训练数据计算所述配置有损失函数的计算图中的基础 VCG支付结果的步骤包括：

所述根据所述最优的每个参与者提供的数据的接受程度，计算包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利的步骤包括：

所述根据所述随机训练数据计算所述配置有损失函数的计算图中的调整支付结果的步骤包括：

所述根据所述基础VCG支付结果和所述调整支付结果，得到所述最优的训练参数的步骤包括：

所述训练所述配置有损失函数的计算图，获取使得所述配置有损失函数的计算图中的损失函数的样本值的加总值最小化的训练参数的步骤包括：

所述联邦学习机制的设计方法还包括以下步骤：

获取参与者的数据有效性和参与者类型两种数据信息；

本发明联邦学习机制的设计设备的具体实施例与下述联邦学习机制的设计方法各实施例基本相同，在此不作赘述。

参照图2，图2为本发明联邦学习机制的设计方法第一实施例的流程示意图，所述联邦学习机制的设计方法包括：

步骤S100，配置预设计算图；

在本实施例中，先配置预设计算图。

具体地，本实施例中的预设计算图是指系统预置的一个计算模型，具体见图10，预设计算图包括有代表基础VCG支付的节点、代表调整支付的节点、代表FVCG支付的节点、代表数据有效性的节点、代表参与者类型的节点、代表社会福利的节点、代表损失函数的节点、代表子损失函数的节点、代表可观测量的节点中的一种或者多种。进一步地，参见图11，计算图的节点关系示意图。节点τ(516)代表基础VCG支付；节点h(513)和节点g(514)代表调整支付；节点p(515)代表FVCG支付；节点q(512)代表数据有效性；节点γ(511)代表参与者类型；节点S*(518)和S^-1*(517)代表社会福利；节点Loss1(533)、Loss2(531)、Loss3(532)、LOSS(540)代表损失函数。在所述计算图中，节点h的第i个元素h_i仅依赖于节点q除第i个元素以外的其他元素q^-i，以及节点γ除第i个元素以外的其他元素γ^-i；节点g 的第i个元素g_i仅依赖于节点q的第i个元素qⁱ。例如，节点h的第1个元素 h₁仅依赖于节点q除第1个元素以外的其他元素q^-1，以及节点γ除第1个元素以外的其他元素γ^-1，这些计算关系在图中用连接线551-556示意性示出。所述代表FVCG支付的节点被配置为代表基础VCG支付的节点和代表调整支付的节点之和。例如，在图中，所述代表FVCG支付的节点p(515)被配置为代表基础VCG支付的节点τ(516)和代表调整支付的节点节点h(513)和节点g(514)之和。进一步地，在所述计算图中还加入代表所述第一最优社会福利和第二最优社会福利的节点。例如，在所述计算图中加入代表所述第一最优社会福利的节点S*(518)和代表第二最优社会福利的节点S^-i*(517)。

所述预设计算图中包括一个或多个子神经网络，所述子神经网络的输入节点是代表数据有效性的节点和代表参与者类型的节点，所述子神经网络的输出节点是代表调整支付的节点。

所述子神经网络包括一个或多个所述预设计算图的节点，这些节点称为神经元，神经元之间由特殊的计算关系相连接。例如，神经元Out和其依赖的神经元In之间的计算关系可以是Out＝σ(W_*In+b)，其中，将W称为权重，b 称为偏置，函数σ称为激活函数。例如，函数σ可以是sigmoid函数。关于神经网络的配置有许多公开资料，在此不再赘述。

所述计算图中包括一个或多个子神经网络(520-523)，分别代表节点h和节点g的每个元素和其所依赖的其他节点的元素之间的计算关系。例如，所述子神经网络520的输入节点是代表数据有效性的节点q中除第1个元素以外的其他元素q^-1，以及代表参与者类型的节点γ中除第1个元素以外的其他元素 γ^-1，所述子神经网络的输出节点是代表调整支付的节点h的第1个元素h₁。应理解，在该实施例的计算图中，可以用子神经网络520替换连接线551-556 所代表的计算关系。

所述计算图还可以包括代表可观测量的节点，子神经网络的输入节点还可以所述代表可观测量的节点。例如，可以在图中加入代表可观测量的节点，所述子神经网络520的输入节点还可以所述代表该可观测量的节点。

步骤S200，获取可选优化目标；

在本实施例中，获取可选优化目标，具体地，可选优化目标可以包括个体理性、预算平衡、以及公平中的一者或多者。对于联邦学习激励机制，个体理性(individualrationality)是指，每个参与者参与联邦学习得到的净效用不为负；预算平衡(budgetbalance)是指联邦收入不低于对所有参与者的支付总和；公平(fairness)是指计划者定义的不公平函数达到最小。在本实施例中，所述可选优化目标可以通过人机交互界面(例如，图形用户界面)确定获得，也可以通过其他方式确定获得。进一步地，在本实施例中，对于每个可选优化目标，需要指定该可选优化目标的具体形式。例如，如果选择公平作为可选优化目标，则要求确定不公平函数的具体形式等。在本实施例中，步骤100与步骤200之间没有先后顺序。

步骤S300，根据所述可选优化目标为所述预设计算图配置损失函数，获取配置有损失函数的计算图；

在本实施例中，在获得可选优化目标后，可以根据所述可选优化目标对所述预设计算图进行配置，获取配置有损失函数的计算图。

在本实施例中，根据所述可选优化目标为所述预设计算图配置损失函数，获取配置有损失函数的计算图，可以通过可选优化目标中的可选优化子目标如公平去对应地配置计算图中的子损失函数节点，然后，将所有子损失函数节点配置完成，即完成了对预设计算图的配置过程，获得配置有损失函数的计算图。当然，根据可选优化目标对预设计算图的配置过程，还可以通过其他方式进行。

步骤S400，获取数据有效性先验分布数据和参与者类型先验分布数据；

数据有效性先验分布数据和参与者类型先验分布数据为预设知道的，通过联邦学习中的参加者获得。即参与者类型是指参与者提供数据的成本函数所依赖的一个或一组变量。参与者类型是参与者的私有信息，计划者事前并不知道，仅知道参与者类型的先验分布为Δ(γ)。参与者i(i∈N)的类型记为γ_i，所有参与者的类型记为γ。当数据提供者i提供且被接受的数据质量参数q_iη_i一定时(η_i代表对参与者i提供的数据的接受程度)，γ_i越高表示其提供数据的成本越高。

步骤S500，根据所述数据有效性先验分布数据和所述参与者类型先验分布数据生成随机训练数据；

在获取数据有效性先验分布数据和参与者类型先验分布数据后，根据数据有效性和参与者类型的先验分布随机生成训练数据。例如，对于数据有效性q代表的随机变量，可以根据q的先验分布Δ(q)来随机产生节点q对应的训练数据；对于参与者类型γ可以根据γ的先验分布Δ(γ)来随机产生节点γ对应的训练数据。所述随机产生训练数据可以通过任意程序设计语言内置的随机数生成器实现。明确起见，记本步骤产生的训练数据总数为T，其中第t条数据用右上标t表示，例如，关于数据有效性q的第t条数据记为q^t，根据第t条数据计算的损失函数LOSS的值记为LOSSt。在本实施例中，步骤300与步骤500 之间没有先后顺序。

步骤S600，根据所述随机训练数据训练所述配置有损失函数的计算图，得到最优的训练参数；

在获取随机训练数据后，根据所述随机训练数据训练所述配置有损失函数的计算图，得到最优的训练参数。具体地，即为使用所述训练数据最优化所述计算图中的参数，以使得所述损失函数关于训练数据最小化。而最小化时的计算图中的参数为最优的训练参数。

步骤S700，根据所述最优的训练参数和所述预设计算图，获得联邦学习机制。

在获取最优的训练参数和预设计算图，通过构建，即获得设计好的联邦学习机制。具体而言，先将预设计算图中的训练参数设置为所述最优的训练参数。对于任何给定的数据有效性和/或参与者类型的具体值，分别将其传给图11的预设计算图中的节点q(512)和节点γ(511)。另外，可以计算与之对应的基础VCG支付，并将其传给所述预设计算图中的节点τ(516)。在对预设计算图执行前向传播算法，计算得到节点p(515)的值。节点p(515) 的值即为对各个参与者的支付结果。这种通过数据有效性和/或参与者类型的具体值计算对各个参与者的支付结果的映射函数即为联邦学习机制。

本发明方法中的联邦学习机制具有较准确的计算效果，见图12，根据参与者类型和数据有效性数据，可以通过联邦学习机制计算出对参与者的支付结果。图12中绘出了与所有可能的参与者类型和数据有效性数据对应的对参与者的支付结果，故而，图12也是联邦学习机制的一种数值表示形式。

请参阅图3，图3为本发明联邦学习机制的设计方法第二实施例的流程示意图。

基于上述实施例，本实施例中，步骤S300包括：

步骤S310，根据所述可选优化子目标数据配置子损失函数；

在本实施例中，所述可选优化目标包括多个可选优化子目标数据，如个体理性、预算平衡、以及公平。根据可选优化目标对预设计算图进行配置，即根据可选优化目标配置所述计算图中代表损失函数的节点，可以通过根据每一项可选优化目标配置代表子损失函数的节点，例如，根据可选优化目标个体理性，可以按如下公式配置计算图中代表子损失函数的节点Loss2(531)中的子损失函数，以获得该节点与计算图中其他节点的计算关系：

其中，h_i代表节点h的第i个元素，g_i代表节点g的第i个元素。

例如，根据可选优化目标预算平衡，可以按如下公式配置计算代表子损失函数的节点Loss3(532)中的子损失函数，以获得该节点与计算图中其他节点的计算关系：

例如，根据可选优化目标公平，可以按如下公式配置计算代表子损失函数的节点Loss1(533)中的子损失函数，以获得该节点与计算图中其他节点的计算关系：

Loss1＝ω(p，(q，γ))

其中，ω是计划者定义的不公平函数，p是计算图中代表FVCG支付的节点。

这样，每一个可选优化子目标数据都可以配置为一个子损失函数，根据子损失函数可以配置计算图中的对应的子损失函数节点。

步骤S320，根据所述子损失函数配置计算图中的损失函数，得到配置有损失函数的计算图。

在配置计算图中的对应的子损失函数节点之后，可以根据对应于所有可选优化目标(即个体理性、预算平衡、公平)的子损失函数对应的节点Loss1 (533)、Loss2(531)、Loss3(532)配置所述代表损失函数的节点LOSS(540) 中的损失函数，以获得该节点的计算关系：

这样，每个子损失函数通过一定的计算关系可以得到损失函数，就可以得到配置有损失函数的计算图。

请参阅图4，图4为本发明联邦学习机制的设计方法第三实施例的流程示意图。

基于上述实施例，本实施例中，步骤S100包括：

步骤S110，在预设计算图中配置神经网络，将神经网络的输出节点作为代表调整支付的节点。

在本实施例中，所述计算图中包括一个或多个子神经网络，所述子神经网络的输入节点是代表数据有效性的节点和代表参与者类型的节点，所述子神经网络的输出节点是代表调整支付的节点。所述子神经网络包括一个或多个所述计算图的节点，这些节点称为神经元，神经元之间由特殊的计算关系相连接。例如，神经元Out和其依赖的神经元In之间的计算关系可以是Out＝σ(W ×In+b)，其中，将W称为权重，b称为偏置，函数称为激活函数。例如，函数可以是sigmoid函数。

请参阅图5，图5为本发明联邦学习机制的设计方法第四实施例的流程示意图。

基于上述实施例，本实施例中，步骤S600包括：

步骤S610，根据所述随机训练数据计算所述配置有损失函数的计算图中的基础VCG支付结果；

在本实施例中，所述随机训练数据包括数据有效性q和参与者类型γ，根据数据有效性q和参与者类型γ可以计算基础VCG支付τ。计算基础VCG支付 τ可以先计算最优的每个参与者提供的数据的接受程度，再根据所述最优的每个参与者提供的数据的接受程度，计算包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利，最后，根据所述包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利和所述随机训练数据中的第一参与者提供数据的成本数据，计算第一参与者的基础VCG支付。

步骤S620，根据所述随机训练数据计算所述配置有损失函数的计算图中的调整支付结果；

计算基础VCG支付后，还可以根据所述随机训练数据利用预设计算图中的神经网络，训练得到所述配置有损失函数的计算图中的调整支付结果。所述随机训练数据包括数据有效性q和参与者类型γ。根据数据有效性q和参与者类型γ，前向传播预设计算图中的神经网络520～523，即可以计算得到计算图中的调整支付结果。

步骤S630，根据所述基础VCG支付结果和所述调整支付结果，得到所述最优的训练参数。

在获得基础VCG支付结果和所述调整支付结果后，在通过计算图，得到最优的训练参数。即使得所述损失函数关于训练数据的样本值的加总值最小化。

请参阅图6，图6为本发明联邦学习机制的设计方法第五实施例的流程示意图。

基于上述实施例，本实施例中，步骤S610包括：

步骤S611，根据所述随机训练数据，计算最优的每个参与者提供的数据的接受程度；

在本实施例中，先根据随机训练数据计算最优的每个参与者提供的数据的接受程度，具体地，通过参与者提供的数据的有效性q和参与者报告的类型 γ计算其所对应的基础VCG支付τ的方法。

可以证明，在FVCG中，如果参与者是理性的，那么参与者提供的数据的有效性q应等于参与者实际拥有的数据的有效性，参与者报告的类型γ应等于参与者真实的类型，

对于参数q和γ，可以按照以下公式计算最优的对每个参与者提供的数据的接受程度η^*：

其中，

是对应于被接受的数据的联邦收入，c_i(q_iη_i,γ_i)是参与者i被接受的数据对参与者i造成的成本，i＝0,1...,n-1。

步骤S612，根据所述最优的每个参与者提供的数据的接受程度，计算包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利；

在获得最优的每个参与者提供的数据的接受程度后，根据所述最优的每个参与者提供的数据的接受程度，计算包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利，具体地，利用以下公式计算包括所有参与者的第一最优社会福利，以及计算不包括某个第一参与者的第二最优社会福利。

例如，对于参数q和γ，可以按照如下公式计算包括所有参与者的第一最优社会福利S^*(q,η)：

其中，η^*是计算的最优的对每个参与者提供的数据的接受程度，

是η^*的第i个元素。

根据不同的对于联邦收入函数

和成本函数

的设定，η^*和S^*(q，γ)的计算方法也不同。例如，将联邦收入函数

及将成本函数设置为c_i(q_iη_i，γ_i)＝γ_iq_iη_i，可以通过如下算法计算η^*和S^*。其中该算法的输入是数据有效性参数和参与者类型。

进一步地，在本实施例中，利用如下公式计算不包括某个第一参与者的第二最优社会福利S^-i*(q^-i，γ^-i)，其中q^-i和γ^-i分别是不包括某个第一参与者i 的其他参与者的真实数据有效性参数和真实类型参数。在该实施例中，为了计算S^-i*(q^-i，γ^-i)，只需要将q^-i和γ^-i作为算法的输入，此时该算法的输出即包括S^-i*(q^-i，γ^-i)。对于n个参与者中的每个参与者，都可以计算相应的第二最优社会福利S^-i*(q^-i，γ^-i)，i＝1，...，n，这n个第二最优社会福利构成的向量记为 S^-*(q，γ)＝(S^-1*(q^-1，γ^-1)，…，S^-n*(q^-n，γ^-n))。

进一步地，步骤S612可以包括如下步骤：

步骤S010，根据所述最优的每个参与者提供的数据的接受程度，计算包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利。

所述计算基础VCG支付包括根据设定的社会福利函数计算所述第一最优社会福利和第二最优社会福利。

在上面的实施例中，社会福利函数被设定为：

此种社会福利函数的设定也称为社会剩余，是联邦作为一个整体的收入减去联邦作为一个整体的成本产生的剩余。在其他实施例中，社会福利函数

此时社会福利最大化被具体化为联邦收入最大化。以根据设定的社会福利函数

计算所述第一最优社会福利S^*(q,γ)和第二最优社会福利S^-i*(q^-i,γ^-i),i＝1,…,n。

这样，就获得包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利。

步骤S613，根据所述包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利和所述随机训练数据中的第一参与者提供数据的成本数据，计算第一参与者的基础VCG支付。

在获得包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利后，就可以根据第一最优社会福利、第二最优社会福利、以及所述第一参与者提供数据的成本计算对所述第一参与者的基础VCG支付。

根据第一最优社会福利S^*(q，γ)、第二最优社会福利S^-i*(q^-i，γ^-i)、以及所述第一参与者提供数据的成本

根据如下公式计算对所述第一参与者的基础VCG支付τ_i，

最后，就得到基础VCG支付结果。

请参阅图7，图7为本发明联邦学习机制的设计方法第六实施例的流程示意图。

基于上述实施例，本实施例中，步骤S620包括：

步骤S621，获取所述随机训练数据中的数据有效性和参与者类型两种数据信息；

在本实施例中，根据所述随机训练数据利用预设计算图中的神经网络，训练得到所述配置有损失函数的计算图中的调整支付结果，可以先获取所述随机训练数据中的数据有效性和参与者类型两种数据信息。数据有效性和参与者类型为计算图的输入数据。

步骤S622，对所述随机训练数据中的数据有效性和/或参与者类型两种数据信息利用所述神经网络进行前向传播，计算所述配置有损失函数的计算图中的调整支付结果。

在获得数据有效性和参与者类型两种数据信息后，对所述随机训练数据中的数据有效性和/或参与者类型两种数据信息利用所述神经网络进行前向传播，计算所述配置有损失函数的计算图中的调整支付结果。计算图中的子神经网络，所述子神经网络以代表数据有效性的节点和代表参与者类型的节点为输入节点、并以代表调整支付的节点为输出节点；以及根据所述子神经网络、参与者实际提供的数据有效性、参与者实际报告的类型计算调整支付。

请参阅图8，图8为本发明联邦学习机制的设计方法第七实施例的流程示意图。

基于上述实施例，本实施例中，步骤S630包括：

步骤S631，根据所述基础VCG支付结果和所述调整支付结果计算损失函数的样本值；

在本实施例中，根据所述基础VCG支付结果和所述调整支付结果计算损失函数的样本值；所述损失函数关于训练数据最小化是指使得通过每一条训练数据计算出的损失函数的样本值的某种加总最小化，例如，可以按平均值加总损失函数的样本值，即

当然，还可以通过其他方式加总根据随机产生的训练数据计算的所述损失函数的样本值，例如，可以计算根据随机产生的样本计算的所述损失函数的所有的样本值中的最大者，并不断更新可训练参数的值以最小化所述损失函数的所有的样本值中的最大者。

步骤S632，训练所述配置有损失函数的计算图，获取使得所述配置有损失函数的计算图中的损失函数的样本值的加总值最小化的训练参数；

本实施例中，记所有可训练参数的集合为PAR，在一个实施例中，可以采用梯度下降法(gradient descent)最优化所述计算图中的参数。梯度下降法的每一步通过下述公式更新参数的值：

其中，α是一个系统设定的超参数，称为学习率，例如可以取为0.01或 0.001。

进一步地，步骤S632可以包括如下步骤：

步骤S020，采用反向传播算法训练所述配置有损失函数的计算图，获取所述使得配置有损失函数的计算图中的损失函数的样本值的加总值最小化的训练参数。

使用所述训练数据最优化所述计算图中的参数还包括使用反向传播算法计算所述损失函数关于所述参数的梯度。例如，

可以通过反向传播 (backpropagation)算法计算。反向传播算法在大部分关于深度学习的参考书中都有详细描述，在此不再赘述。

当根据当前参数的值计算的FVCG支付τ₁+h₁+g₁＜0时，将每个

输出层的偏置增加一个小量β。其中β是系统设定的一个超参数。

进一步地，步骤S632可以包括如下步骤：

步骤S030，采用无监督学习算法训练所述配置有损失函数的计算图，获取使得所述配置有损失函数的计算图中的损失函数的样本值的加总值最小化的训练参数。

使用所述训练数据最优化所述计算图中的参数还包括使用无监督学习算法最优化所述计算图中的参数。例如，由于训练样本是随机产生的，不涉及任何人工标注过程，故而该算法是使用无监督学习算法最优化所述计算图中的参数。

除了梯度下降法外，还可以通过其他任何的神经网络训练算法最优化所述计算图中的参数。该等神经网络训练算法例如可以包括Adam算法、随机梯度下降法(stochastic gradient descent)、动量梯度下降法(momentum gradient descent)、小批量梯度下降法(mini-batch gradient descent)等。该等神经网络训练算法在关于神经网络的公开材料中都有详细描述，在此不在赘述。

步骤S633，将所述使得损失函数的训练样本值的加总值最小化的训练参数作为最优的训练参数。

在获得损失函数最小化的训练参数后，将损失函数的样本值的加总值AverageLoss最小化的训练参数定义为最优的训练参数，即我们需要的最优的训练参数。

请参阅图9，图9为本发明联邦学习机制的设计方法第八实施例的流程示意图。

基于上述实施例，本实施例中，还包括如下步骤：

步骤S800，获取参与者的数据有效性和参与者类型两种数据信息；

在本实施例中，在获得联邦学习机制后，还可以通过联邦学习机制自动计算对于不同参与者的支付。为此，需要先获得需要计算的参与者的数据有效性和参与者类型两种数据信息。

步骤S900，根据所述数据有效性和/或参与者类型两种数据信息利用所述联邦学习机制进行计算，确定所述数据有效性和/或参与者类型两种数据信息所对应的支付结果。

在获得参与者的数据有效性和参与者类型两种数据信息后，可以根据所述计算图、最优化的所述计算图中的参数、参与者实际提供的数据有效性、和参与者实际报告的类型计算对参与者的FVCG支付。即通过设计训练好的联邦学习机制进行计算。具体地，根据计算图中的参数、参与者参与者实际提供的数据有效性的值、和参与者实际报告的类型γ的值计算对参与者的 FVCG支付。将q的值和γ的值分别赋给所述神经网络的输入节点q(512)和γ (551)，前向传播得到节点p(515)的值，该节点p的值即为对参与者的FVCG 支付。即所述计算对参与者的FVCG支付包括：取出所述计算图中的子神经网络，所述子神经网络以代表数据有效性的节点和/或代表参与者类型的节点为输入节点、并以代表调整支付的节点为输出节点；以及根据所述子神经网络、参与者实际提供的数据有效性、参与者实际报告的类型计算调整支付。

例如，取出所述计算图11中的子神经网络

所述子神经网络以代表数据有效性的节点q和代表参与者类型的节点γ为输入节点、并以代表调整支付的节点为输出节点h的子神经网络；以及根据所述子神经网络

参与者实际提供的数据有效性q的值、参与者实际报告的类型γ的值计算调整支付h₁的值。以及，取出所述计算图中的子神经网络

所述子神经网络以代表数据有效性的节点q为输入节点、并以代表调整支付的节点g为输出节点的子神经网络；以及根据所述子神经网络

参与者实际提供的数据有效性q的值计算调整支付g₁的值。

当然，所述计算对参与者的FVCG支付还包括：根据计算的基础VCG支付和计算的调整支付计算对参与者的FVCG支付。例如，根据S101计算的基础VCG支付τ₁和上述计算的调整VCG支付h₁的值和g₁的值计算对参与者的 FVCG支付p₁的值。例如，可以按如下公式计算p₁的值：

p₁＝τ₁+h₁+g₁。

最后，根据所述数据有效性和/或参与者类型两种数据信息利用所述联邦学习机制进行计算，确定所述数据有效性和/或参与者类型两种数据信息所对应的支付结果。具体而言，先将预设计算图中的训练参数设置为所述最优的训练参数。对于任何给定的数据有效性和/或参与者类型的具体值，分别将其传给预设计算图中代表数据有效性的节点和代表参与者类型的节点。另外，可以计算与之对应的基础VCG支付，并将其传给所述预设计算图中代表基础 VCG支付的节点。再对预设计算图执行前向传播算法，计算得到代表FVCG支付的节点的值，将其作为对各个参与者的支付结果。这种通过数据有效性和/或参与者类型的具体值计算对各个参与者的支付结果的映射函数即为联邦学习机制。

此外，本发明实施例还提出一种计算机可读存储介质。

本发明计算机可读存储介质上存储有联邦学习机制的设计程序，所述联邦学习机制的设计程序被处理器执行时实现如上所述的联邦学习机制的设计方法的步骤。

其中，在所述处理器上运行的联邦学习机制的设计程序被执行时所实现的方法可参照本发明联邦学习机制的设计方法各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种联邦学习机制的设计方法，其特征在于，所述联邦学习机制的设计方法包括以下步骤：

配置预设计算图；

获取可选优化目标；

获取数据有效性先验分布数据和参与者类型先验分布数据；

根据所述随机训练数据训练所述配置有损失函数的计算图，得到最优的训练参数，其中，根据所述随机训练数据，计算最优的每个参与者提供的数据的接受程度，所述随机训练数据包括数据有效性

和参与者类型

，所述计算最优的每个参与者提供的数据的接受程度

的公式为

，其中，

为被接受的数据的联邦收入，

为参与者i被接受的数据对参与者i造成的成本，根据所述最优的每个参与者提供的数据的接受程度，计算包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利，根据所述所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利以及所述配置有损失函数的计算图，得到最优的训练参数；

2.如权利要求1所述的联邦学习机制的设计方法，其特征在于，所述可选优化目标包括个体理性、预算平衡和公平中的一种或者多种。

3.如权利要求1所述的联邦学习机制的设计方法，其特征在于，所述预设计算图包括代表基础VCG支付的节点、代表调整支付的节点、代表FVCG支付的节点、代表数据有效性的节点、代表参与者类型的节点、代表社会福利的节点、代表损失函数的节点、代表子损失函数的节点和代表可观测量的节点中的一种或者多种。

4.如权利要求1所述的联邦学习机制的设计方法，其特征在于，所述可选优化目标包括多个可选优化子目标数据，所述根据所述可选优化目标为所述预设计算图配置损失函数，获取配置有损失函数的计算图的步骤包括：

根据所述可选优化子目标数据配置子损失函数；

5.如权利要求3所述的联邦学习机制的设计方法，其特征在于，所述配置预设计算图的步骤包括：

6.如权利要求3所述的联邦学习机制的设计方法，其特征在于，所述根据所述随机训练数据训练所述配置有损失函数的计算图，得到最优的训练参数的步骤包括：

根据所述随机训练数据计算所述配置有损失函数的计算图中的基础VCG支付结果；

7.如权利要求6所述的联邦学习机制的设计方法，其特征在于，所述根据所述随机训练数据计算所述配置有损失函数的计算图中的基础VCG支付结果的步骤包括：

8.如权利要求7所述的联邦学习机制的设计方法，其特征在于，所述根据所述最优的每个参与者提供的数据的接受程度，计算包括所有参与者的第一最优社会福利和不包括任一第一参与者的第二最优社会福利的步骤包括：

9.如权利要求6所述的联邦学习机制的设计方法，其特征在于，所述根据所述随机训练数据计算所述配置有损失函数的计算图中的调整支付结果的步骤包括：

对所述随机训练数据中的数据有效性和/或参与者类型两种数据信息利用神经网络进行前向传播，计算所述配置有损失函数的计算图中的调整支付结果。

10.如权利要求6所述的联邦学习机制的设计方法，其特征在于，所述根据所述基础VCG支付结果和所述调整支付结果，得到所述最优的训练参数的步骤包括：

11.如权利要求10所述的联邦学习机制的设计方法，其特征在于，所述训练所述配置有损失函数的计算图，获取使得所述配置有损失函数的计算图中的损失函数的样本值的加总值最小化的训练参数的步骤包括：

12.如权利要求10所述的联邦学习机制的设计方法，其特征在于，所述训练所述配置有损失函数的计算图，获取使得所述配置有损失函数的计算图中的损失函数的样本值的加总值最小化的训练参数的步骤包括：

13.如权利要求1所述的联邦学习机制的设计方法，其特征在于，所述联邦学习机制的设计方法还包括以下步骤：

获取参与者的数据有效性和参与者类型两种数据信息；

14.一种联邦学习机制的设计装置，其特征在于，所述联邦学习机制的设计装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的联邦学习机制的设计程序，所述联邦学习机制的设计程序被所述处理器执行时实现如权利要求1至13中任一项所述联邦学习机制的设计方法的步骤。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有联邦学习机制的设计程序，所述联邦学习机制的设计程序被处理器执行时实现如权利要求1至13中任一项所述联邦学习机制的设计方法的步骤。