CN116562396A - 联邦学习参与方筛选方法、装置、电子设备及存储介质 - Google Patents

联邦学习参与方筛选方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116562396A
CN116562396A CN202310587124.3A CN202310587124A CN116562396A CN 116562396 A CN116562396 A CN 116562396A CN 202310587124 A CN202310587124 A CN 202310587124A CN 116562396 A CN116562396 A CN 116562396A
Authority
CN
China
Prior art keywords
participant
model parameters
difference values
model
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310587124.3A
Other languages
English (en)
Inventor
程炎敏
宋云龙
杨明川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Research Institute Of China Telecom Corp ltd
China Telecom Corp Ltd
Original Assignee
Beijing Research Institute Of China Telecom Corp ltd
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Research Institute Of China Telecom Corp ltd, China Telecom Corp Ltd filed Critical Beijing Research Institute Of China Telecom Corp ltd
Priority to CN202310587124.3A priority Critical patent/CN116562396A/zh
Publication of CN116562396A publication Critical patent/CN116562396A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开提供了一种联邦学习参与方筛选方法、装置、电子设备及存储介质,涉及联邦学习技术领域。该方法包括:获取每一参与方设备的多个差异值,多个差异值是每一参与方设备的模型参数与其他各个参与方设备的模型参数之间的差异值;根据每一参与方设备的多个差异值,从多个参与方设备中筛选出验证设备,在多个参与方设备中,验证设备的多个差异值中小于差异阈值的数量,不小于其他各个参与方设备的多个差异值中小于差异阈值的数量;获取验证设备对至少一个参与方设备的模型参数进行测试得到的模型质量数据,根据模型质量数据从多个参与方设备中筛选出参与联邦学习的参与方设备。此种方式,提供了一种能够避免恶意的参与方设备影响联邦学习的方法。

Description

联邦学习参与方筛选方法、装置、电子设备及存储介质
技术领域
本公开涉及联邦学习技术领域,尤其涉及一种联邦学习参与方筛选方法、装置、电子设备及存储介质。
背景技术
联邦学习是一种新兴的人工智能技术,一轮联邦学习的过程包括:中心设备将初始模型参数下发到各个参与方设备,然后由各个参与方设备根据初始模型参数构建出初始模型,并利用本地数据对初始模型进行训练,得到相应的本地模型。之后,各个参与方设备将本地模型的模型参数发往中心设备,中心设备接收到各个参与方设备发送的模型参数后,将接收到的多组模型参数进行聚合,并将聚合后的模型参数作为下一轮联邦学习的初始模型参数,或者在聚合后的模型参数满足收敛条件的情况下,结束联邦学习。
然而,多个参与方设备参与联邦学习时,存在恶意的参与方设备。恶意的参与方设备通过向中心设备上传质量差的模型参数来对联邦学习造成负面影响,如何避免恶意的参与方设备对联邦学的影响是亟待解决的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开提供一种联邦学习参与方筛选方法、装置、电子设备及存储介质,至少在一定程度上提供了能够避免恶意的参与方设备影响联邦学习的方法。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种联邦学习参与方筛选方法,应用于联邦学习网络的中心设备,所述联邦学习网络还包括多个参与方设备,包括:获取每一参与方设备的多个差异值,每一参与方设备对应一组模型参数,所述多个差异值是所述每一参与方设备的模型参数与其他各个参与方设备的模型参数之间的差异值;根据每一参与方设备的多个差异值,从所述多个参与方设备中筛选出验证设备,在所述多个参与方设备中,所述验证设备的多个差异值中小于差异阈值的数量,不小于其他各个参与方设备的多个差异值中小于所述差异阈值的数量;获取所述验证设备对至少一个参与方设备的模型参数进行测试得到的模型质量数据,并根据所述模型质量数据,从所述多个参与方设备中筛选出参与联邦学习的参与方设备。
在一个实施例中,所述获取每一参与方设备的多个差异值,包括:接收所述多个参与方设备分别发送的模型参数,得到多组模型参数;计算所述多组模型参数中每组模型参数与其他各组模型参数之间的差异值,得到每一参与方设备的多个差异值。
在一个实施例中,所述计算所述多组模型参数中每组模型参数与其他各组模型参数之间的差异值,得到每一参与方设备的多个差异值,包括:计算所述多组模型参数中每组模型参数与其他各组模型参数之间的欧氏距离,得到每组模型参数的多个欧氏距离;确定每组模型参数的多个欧氏距离为相应参与方设备的多个差异值;或者,计算所述多组模型参数中每组模型参数与其他各组模型参数之间的余弦距离,得到每组模型参数的多个余弦距离;确定每组模型参数的多个余弦距离为相应参与方设备的多个差异值。
在一个实施例中,所述根据每一参与方设备的多个差异值,从所述多个参与方设备中筛选出验证设备,包括:确定所述多个参与方设备的全部差异值的平均值,将所述平均值作为所述差异阈值;根据所述差异阈值和每一参与方设备的多个差异值,建立无向关联图,所述无向关联图中包括多个节点和多个边,每个节点对应一组模型参数,每个边两端的节点之间的差异值小于所述差异阈值;确定所述无向关联图包括的子集中的最大子集,将所述最大子集的中心节点对应的参与方设备作为所述验证设备。
在一个实施例中,所述至少一个参与方设备的模型参数是所述多个参与方设备的模型参数;或者,所述至少一个参与方设备的模型参数是所述验证设备对应的多个差异值中,不小于所述差异阈值的差异值所对应的模型参数。
在一个实施例中,所述获取所述验证设备对至少一个参与方设备的模型参数进行测试得到的模型质量数据,包括:向所述验证设备发送所述至少一个参与方设备的模型参数;接收所述验证设备根据每组模型参数测试得到的模型质量数据。
在一个实施例中,还包括:根据所述参与联邦学的参与方设备的模型参数进行参数聚合,得到全局模型参数。
根据本公开的另一个方面,提供一种联邦学习参与方筛选装置,应用于联邦学习网络的中心设备,所述联邦学习网络还包括多个参与方设备,包括:
获取模块,用于获取每一参与方设备的多个差异值,每一参与方设备对应一组模型参数,所述多个差异值是所述每一参与方设备的模型参数与其他各个参与方设备的模型参数之间的差异值;筛选模块,用于根据每一参与方设备的多个差异值,从所述多个参与方设备中筛选出验证设备,在所述多个参与方设备中,所述验证设备的多个差异值中小于差异阈值的数量,不小于其他各个参与方设备的多个差异值中小于所述差异阈值的数量;获取及筛选模块,用于获取所述验证设备对至少一个参与方设备的模型参数进行测试得到的模型质量数据,并根据所述模型质量数据,从所述多个参与方设备中筛选出参与联邦学习的参与方设备。
在一个实施例中,所述获取模块,用于接收所述多个参与方设备分别发送的模型参数,得到多组模型参数;计算所述多组模型参数中每组模型参数与其他各组模型参数之间的差异值,得到每一参与方设备的多个差异值。
在一个实施例中,所述获取模块,用于计算所述多组模型参数中每组模型参数与其他各组模型参数之间的欧氏距离,得到每组模型参数的多个欧氏距离;确定每组模型参数的多个欧氏距离为相应参与方设备的多个差异值;或者,计算所述多组模型参数中每组模型参数与其他各组模型参数之间的余弦距离,得到每组模型参数的多个余弦距离;确定每组模型参数的多个余弦距离为相应参与方设备的多个差异值。
在一个实施例中,所述筛选模块,用于确定所述多个参与方设备的全部差异值的平均值,将所述平均值作为所述差异阈值;根据所述差异阈值和每一参与方设备的多个差异值,建立无向关联图,所述无向关联图中包括多个节点和多个边,每个节点对应一组模型参数,每个边两端的节点之间的差异值小于所述差异阈值;确定所述无向关联图包括的子集中的最大子集,将所述最大子集的中心节点对应的参与方设备作为所述验证设备。
在一个实施例中,所述至少一个参与方设备的模型参数是所述多个参与方设备的模型参数;或者,所述至少一个参与方设备的模型参数是所述验证设备对应的多个差异值中,不小于所述差异阈值的差异值所对应的模型参数。
在一个实施例中,所述获取及筛选模块,用于向所述验证设备发送所述至少一个参与方设备的模型参数;接收所述验证设备根据每组模型参数测试得到的模型质量数据。
在一个实施例中,所述装置还包括:聚合模块,用于根据所述参与联邦学的参与方设备的模型参数进行参数聚合,得到全局模型参数。
根据本公开的又一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任一所述的联邦学习参与方筛选方法。
根据本公开的又一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的联邦学习参与方筛选方法。
根据本公开的又一个方面,提供一种计算机程序产品,所述计算机程序产品包括计算机程序或计算机指令,所述计算机程序或所述计算机指令由处理器加载并执行,以使计算机实现上述任一所述的联邦学习参与方筛选方法。
本公开的实施例所提供的技术方案至少包括以下有益效果:
本公开的实施例所提供的技术方案,中心设备获取得到每一参与方设备的多个差异值后,根据每一参与方设备的多个差异值从多个参与方设备中筛选出验证设备。其中,验证设备的多个差异值中小于差异阈值的数量,不小于其他各个参与方设备的多个差异值中小于差异阈值的数量。通过此种方式确定出的验证设备的可信度高。
由于验证设备具有较高的可信度,因此通过验证设备对模型参数测试得到的模型质量数据也具有较高的可信度。之后,中心设备根据模型质量数据筛选出参与联邦学习的参与方设备,完成恶意的参与方设备的过滤,避免了恶意的参与方设备影响联邦学习。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开一个实施例中联邦学习参与方筛选系统示意图;
图2示出本公开一个实施例中联邦学习参与方筛选方法流程图;
图3示出本公开一个实施例中无向关联图的示意图;
图4示出本公开一个实施例中无向关联图所具有的子集的示意图;
图5示出本公开另一个实施例中联邦学习参与方筛选方法流程图;
图6示出本公开一个实施例中联邦学习参与方筛选装置示意图;
图7示出本公开一个实施例中电子设备的结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
图1示出本公开实施例中一种联邦学习参与方筛选系统的示意图,该系统可以应用本公开各种实施例中的联邦学习参与方筛选方法或联邦学习参与方筛选装置。
如图1所示,该联邦学习参与方筛选系统可以包括:中心设备101和多个参与方设备102。
其中,多个参与方设备102中的每一参与方设备均具可以对模型进行训练,并将训练得到的模型参数向中心设备101发送。多个参与方设备102中的每一参与方设备还可以接收中心设备101发送的模型参数,并能够根据模型参数构建出相应的模型。
中心设备101可以接收多个参与方设备102分别发送的模型参数,并能够对接收到的多组模型参数进行处理。例如,计算多组模型参数互相之间的差异值。中心设备101还可以向多个参与方设备102中任意一个参与方设备发送模型参数。例如,中心设备101根据多组模型参数互相之间的差异值筛选出验证设备,然后向验证设备发送模型参数,由验证设备根据本地数据测试模型参数,得到模型质量数据。验证设备可以将测试得到的模型质量数据向中心设备101发送。中心设备101可以根据接收到的模型质量数据从多个参与方设备102中筛选出参数联邦学习的参与方设备。
在一个实施例中,中心设备101还可以对两组以上的模型参数进行聚合。
中心设备101和每一参与方设备之间通过网络实现通信连接,该网络可以是有线网络,也可以是无线网络。
可选地,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合)。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(ExtensibleMarkupLanguage,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(InternetProtocolSecurity,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
中心设备101和每一参与方设备均可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机等。
中心设备101和每一参与方设备均可以是提供各种服务的服务器。可选地,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
本领域技术人员可以知晓,图1中的参与方设备的数量仅仅是示意性的,根据实际需要,可以具有任意数目的参与方设备。本公开实施例对此不作限定。
下面结合附图及实施例对本示例实施方式进行详细说明。
本公开实施例中提供了一种联邦学习参与方筛选方法,该方法可以由任意具备计算处理能力的电子设备执行。例如,该电子设备为联邦学习网络的中心设备,该联邦学习网络还包括多个参与方设备。
图2示出本公开一个实施例中的联邦学习参与方筛选方法流程图,如图2所示,本公开实施例中提供的联邦学习参与方筛选方法包括如下S201至S203。
S201,获取每一参与方设备的多个差异值,每一参与方设备对应一组模型参数,多个差异值是每一参与方设备的模型参数与其他各个参与方设备的模型参数之间的差异值。
其中,多个参与方设备中的每一个参与方设备对应一组模型参数。中心设备是联邦学习中作为中心节点的设备,参与方设备是联邦学习中作为参与节点的设备。
在一个实施例中,获取每一参与方设备的多个差异值,可以包括:接收多个参与方设备分别发送的模型参数,得到多组模型参数;计算多组模型参数中每组模型参数与其他各组模型参数之间的差异值,得到每一参与方设备的多个差异值。
其中,差异值用于表示两组模型参数之间不同或相似的程度,差异值越大,则该差异值对应的两组模型参数之间不同的程度越高,也即该差异值对应的两组模型参数之间的相似度越低。
以多组模型参数是n组模型参数为例,n为大于或等于2的整数,则计算多组模型参数中每组模型参数与其他各组模型参数之间的差异值,得到每组模型参数对应的参与方设备的(n-1)个差异值。例如,多个参与方设备中参与方设备的数量为10,相应地,多组模型参数中模型参数的数量为10,则每一参与方设备的多个差异值的数量为9。
关于多组模型参数中每组模型参数与其他各组模型参数之间的差异值,具体为何种表示差异的数据,本公开实施例不做限制。例如,差异值为余弦距离或欧氏距离等。
在一个实施例中,计算多组模型参数中每组模型参数与其他各组模型参数之间的差异值,得到每一参与方设备的多个差异值,可以包括:计算多组模型参数中每组模型参数与其他各组模型参数之间的欧氏距离,得到每组模型参数的多个欧氏距离;确定每组模型参数的多个欧氏距离为相应参与方设备的多个差异值;或者,计算多组模型参数中每组模型参数与其他各组模型参数之间的余弦距离,得到每组模型参数的多个余弦距离;确定每组模型参数的多个余弦距离为相应参与方设备的多个差异值。
在另一个实施例中,获取每一参与方设备的多个差异值,可以包括:从其他设备中,获取每一参与方设备的多个差异值,其中,其他设备存储有根据多个参与方设备的模型参数计算出的每一参与方设备的多个差异值。
S202,根据每一参与方设备的多个差异值,从多个参与方设备中筛选出验证设备,在多个参与方设备中,验证设备的多个差异值中小于差异阈值的数量,不小于其他各个参与方设备的多个差异值中小于差异阈值的数量。
在一个实施例中,差异阈值可以是预设值,还可以是根据每组模型参数的多个差异值计算得到的值,本公开实施例对此不做限制。若两组模型参数之间的差异值小于差异阈值,则可以认为该两组模型参数之间较为相似,即差异较小。反之,若两组模型参数之间的差异值不小于差异阈值,则可以认为该两组模型参数之间的相似度较低,即差异较大。
其他各个参与方设备是多个参与方设备中除验证设备之外的各个参与方设备。
以多个参与方设备为n个参与方设备为例,n为大于或等于2的整数,则每个参与方设备对应有(n-1)个差异值,一个参与方设备对应一组模型参数。在多个参与方设备中,验证设备的(n-1)个差异值中小于差异阈值的数量,不小于其他任意一个参与方设备的(n-1)个差异值中小于差异阈值的数量。若验证设备对应的(n-1)个差异值中小于差异阈值的数量为5,则其他任意一个参与方设备的(n-1)个差异值中小于差异阈值的数量小于或等于5。
在联邦学习中,参与联邦学习的多个参与方设备中存在恶意的参与方设备时,往往仅少部分的参与方设备是恶意的,而大部分的参与方设备是非恶意的,且非恶意的参与方设备在同一轮联邦学习中上传的模型参数较为相似。而通过差异值筛选出的验证设备对应的模型参数,与其他各个参与方设备对应的模型参数相比,具有更多的、较为相似的模型参数。因此,S203中确定出的验证设备的可信度高。
关于如何根据每一参与方设备的多个差异值,从多个参与方设备中筛选出验证设备,本公开实施例不做限制。例如,可以直接通过数学计算的方式,比较各个参与方设备的多个差异值中小于差异阈值的差异值的数量,从而从多个参与方设备中选出验证设备。
在一个实施例中,根据每一参与方设备的多个差异值,从多个参与方设备中筛选出验证设备,包括:确定多个参与方设备的全部差异值的平均值,将平均值作为差异阈值;根据差异阈值和每一参与方设备的多个差异值,建立无向关联图,无向关联图中包括多个节点和多个边,每个节点对应一组模型参数,每个边两端的节点之间的差异值小于差异阈值;确定无向关联图包括的子集中的最大子集,将最大子集的中心节点对应的参与方设备作为验证设备。
利用无向关联图筛选出验证设备的方式具有更高的效率。
仍以多个参与方设备为n个参与方设备为例,n为大于或等于2的整数,则多个参与方设备对应的全部差异值的平均值,是n×(n-1)个差异值的平均值,在n×(n-1)中(n-1)为每个参与方设备所具有的差异值的数量。
以多个参与方设备为5个参与方设备为例,则多组模型参数为5组模型参数,每组模型参数对应一个节点,则一个无向关联图可以如图3所示。图1中节点1与节点2-5均具有相连接的边,也就是说,节点1对应的模型参数与节点2-5对应的模型参数之间的差异值均小于差异阈值(即平均值)。节点2与节点1、3、4之间均具有相连接的边。节点3与节点1、2之间均具有相连接的边。节点4与节点1、2之间均具有相连接的边。节点5与节点1之间具有相连接的边。
图3所示的无向关联图所具有的子集如图4所示,图4中,无向关联图包括5个子集,该5个子集分别是:图4中的(1)对应的以节点1为中心节点的子集、图4中的(2)对应的以节点2为中心节点的子集、图4中的(3)对应的以节点3为中心节点的子集、图4中的(4)对应的以节点4为中心节点的子集、图4中的(5)对应的以节点5为中心节点的子集。该5个子集中的最大子集是以节点1为中心的子集。相应地,验证设备是节点1对应的参与方设备。
S203,获取验证设备对至少一个参与方设备的模型参数进行测试得到的模型质量数据,并根据模型质量数据,从多个参与方设备中筛选出参与联邦学习的参与方设备。
其中,至少一个参与方设备的模型参数,可以是多组模型参数(多个参与方设备对应的多组模型参数,每一参与方设备对应一组模型参数)中任意的一组或多组模型参数。在一个实施例中,至少一个参与方设备的模型参数是多个参与方设备的模型参数;或者,至少一个参与方设备的模型参数是验证设备对应的多个差异值中,不小于差异阈值的差异值所对应的模型参数。其中,在验证设备是具有更高可信度的情况下,与验证设备对应的模型参数具有较大差异的模型参数,具有更大的可能性是由恶意的参与方设备上传的。因此,至少一个参与方设备的模型参数是验证设备对应的多个差异值中,不小于差异阈值的差异值所对应的模型参数时,可以减少需要测试的模型参数的组数。
模型质量数据用于表示相应模型的质量,也即相应模型参数的质量。关于模型质量数据具是哪一种或多种表示模型质量的数据,本公开实施例不做限制。例如,模型质量数据可以是模型的准确率。
在一个实施例中,获取验证设备对至少一个参与方设备的模型参数进行测试得到的模型质量数据,可以包括:向验证设备发送至少一个参与方设备的模型参数;接收验证设备根据每组模型参数测试得到的模型质量数据。
其中,验证设备接收到中心设备发送的至少一个参与方设备的模型参数后,生成每组模型参数对应的训练模型,得到至少一个训练模型。其中,一个训练模型对应一组模型参数。然后利用本地数据对每个训练模型进行测试,得到每个训练模型的模型质量数据。之后,验证设备向中心设备发送每个训练模型的模型质量数据,中心设备接收到该每个训练模型的模型质量数据后,完成质量数据的获取。
在一个实施例中,根据模型质量数据,从多个参与方设备中筛选出参与联邦学习的参与方设备,可以包括:中心设备从多组模型参数中去除模型质量数量不符合预设条件的模型参数,并确定剩余的模型参数对应的参与方设备参与联邦学习。
由于验证设备具有较高的可信度,因此通过验证设备对模型参数测试得到的模型质量数据也具有较高的可信度。之后,验证设备将各组模型参数的模型质量数据发送给中心设备,由中心设备根据模型质量数据筛选出参与联邦学习的参与方设备,完成恶意的参与方设备的过滤,避免恶意的参与方设备影响联邦学习。
其中,预设条件与模型质量数据相对应。例如,模型质量数据是准确率的情况下,预设条件可以是大于某一准确率值。在一个实施例中,质量数据不符合预设条件的模型参数,可以认为是由恶意的参与方上传的模型参数,在多组模型参数中将不合符预设条件的模型参数去除,剩下的模型参数所对应的参与方设备可以认为是非恶意的参与方设备。
在一个实施例中,中心设备还可以根据参与联邦学的参与方设备的模型参数进行参数聚合,得到全局模型参数。
在另一个实施例中,中心设备还可以向该剩余的模型参数对应的参与方设备发送新一轮的初始模型参数。
本公开的实施例所提供的技术方案,中心设备获取得到每一参与方设备的多个差异值后,根据每一参与方设备的多个差异值从多个参与方设备中筛选出验证设备。其中,验证设备的多个差异值中小于差异阈值的数量,不小于其他各个参与方设备的多个差异值中小于差异阈值的数量。通过此种方式确定出的验证设备的可信度高。
由于验证设备具有较高的可信度,因此通过验证设备对模型参数测试得到的模型质量数据也具有较高的可信度。之后,中心设备根据模型质量数据筛选出参与联邦学习的参与方设备,完成恶意的参与方设备的过滤,避免了恶意的参与方设备影响联邦学习。
本公开实施例中提供了另一种联邦学习参与方筛选方法,该方法可以由任意具备计算处理能力的电子设备执行。例如,该电子设备为验证设备。
图5示出本公开另一个实施例中的联邦学习参与方筛选方法流程图,如图5所示,本公开实施例中提供的联邦学习参与方筛选方法包括如下S501至S504。
S501,验证设备接收中心设备发送的至少一个参与方设备的模型参数。
S502,验证设备生成每组模型参数对应的训练模型,得到至少一个训练模型。
其中,一个训练模型对应一组模型参数。
S503,验证设备对每个训练模型进行测试,得到每个训练模型的模型质量数据。
其中,模型质量数据用于表示相应模型的质量,也即相应模型参数的质量。关于模型质量数据具是哪一种或多种表示模型质量的数据,本公开实施例不做限制。例如,模型质量数据可以是模型的准确率。
在一个实施例中,验证设备具有本地数据,对每个训练模型进行测试,得到每个训练模型的模型质量数据,可以包括:利用本地数据对每个训练模型进行测试,得到每个训练模型的模型质量数据。
S504,验证设备向中心设备发送每个训练模型的模型质量数据,以便于中心设备根据每个训练模型的模型质量数据筛选参与联邦学习的参与方设备。
本公开的实施例所提供的技术方案中,由于验证设备具有较高的可信度,因此通过验证设备对模型参数测试得到的模型质量数据也具有较高的可信度。之后,验证设备将各组模型参数的模型质量数据发送给中心设备,由中心设备根据模型质量数据筛选出参与联邦学习的参与方设备,完成恶意的参与方设备的过滤,避免恶意的参与方设备影响联邦学习。
在一个实施例中,上述图2和图5对应的实施例均可以应用于任意一个场景。例如,过滤掉联邦学习中参与训练风控模型(用于根据数据生成风险报告,应用于金融领域)的恶意的参与方。
基于同一发明构思,本公开实施例中还提供了两种联邦学习参与方筛选装置,如下面的实施例。由于该装置实施例解决问题的原理与上述方法实施例相似,因此该装置实施例的实施可以参见上述方法实施例的实施,重复之处不再赘述。
图6示出本公开一个实施例中的联邦学习参与方筛选装置示意图,如图6所示,该装置应用于联邦学习网络的中心设备,联邦学习网络还包括多个参与方设备,包括:获取模块601,用于获取每一参与方设备的多个差异值,每一参与方设备对应一组模型参数,多个差异值是每一参与方设备的模型参数与其他各个参与方设备的模型参数之间的差异值;筛选模块602,用于根据每一参与方设备的多个差异值,从多个参与方设备中筛选出验证设备,在多个参与方设备中,验证设备的多个差异值中小于差异阈值的数量,不小于其他各个参与方设备的多个差异值中小于差异阈值的数量;获取及筛选模块603,用于获取验证设备对至少一个参与方设备的模型参数进行测试得到的模型质量数据,并根据模型质量数据,从多个参与方设备中筛选出参与联邦学习的参与方设备。
在一个实施例中,获取模块601,用于接收多个参与方设备分别发送的模型参数,得到多组模型参数;计算多组模型参数中每组模型参数与其他各组模型参数之间的差异值,得到每一参与方设备的多个差异值。
在一个实施例中,获取模块601,用于计算多组模型参数中每组模型参数与其他各组模型参数之间的欧氏距离,得到每组模型参数的多个欧氏距离;确定每组模型参数的多个欧氏距离为相应参与方设备的多个差异值;或者,计算多组模型参数中每组模型参数与其他各组模型参数之间的余弦距离,得到每组模型参数的多个余弦距离;确定每组模型参数的多个余弦距离为相应参与方设备的多个差异值。
在一个实施例中,筛选模块602,用于确定多个参与方设备的全部差异值的平均值,将平均值作为差异阈值;根据差异阈值和每一参与方设备的多个差异值,建立无向关联图,无向关联图中包括多个节点和多个边,每个节点对应一组模型参数,每个边两端的节点之间的差异值小于差异阈值;确定无向关联图包括的子集中的最大子集,将最大子集的中心节点对应的参与方设备作为验证设备。
在一个实施例中,至少一个参与方设备的模型参数是多个参与方设备的模型参数;或者,至少一个参与方设备的模型参数是验证设备对应的多个差异值中,不小于差异阈值的差异值所对应的模型参数。
在一个实施例中,获取及筛选模块603,用于向验证设备发送至少一个参与方设备的模型参数;接收验证设备根据每组模型参数测试得到的模型质量数据。
在一个实施例中,装置还包括:聚合模块604,用于根据参与联邦学的参与方设备的模型参数进行参数聚合,得到全局模型参数。
本公开的实施例所提供的技术方案,中心设备获取得到每一参与方设备的多个差异值后,根据每一参与方设备的多个差异值从多个参与方设备中筛选出验证设备。其中,验证设备的多个差异值中小于差异阈值的数量,不小于其他各个参与方设备的多个差异值中小于差异阈值的数量。通过此种方式确定出的验证设备的可信度高。
由于验证设备具有较高的可信度,因此通过验证设备对模型参数测试得到的模型质量数据也具有较高的可信度。之后,中心设备根据模型质量数据筛选出参与联邦学习的参与方设备,完成恶意的参与方设备的过滤,避免了恶意的参与方设备影响联邦学习。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图7来描述根据本公开的这种实施方式的电子设备700。图7显示的电子设备700仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700以通用计算设备的形式表现。电子设备700的组件可以包括但不限于:上述至少一个处理单元710、上述至少一个存储单元720、连接不同系统组件(包括存储单元720和处理单元710)的总线730。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元710执行,使得所述处理单元710执行本说明书上述“具体实施方式”部分中描述的根据本公开各种示例性实施方式的步骤。
存储单元720可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)7201和/或高速缓存存储单元7202,还可以进一步包括只读存储单元(ROM)7203。
存储单元720还可以包括具有一组(至少一个)程序模块7205的程序/实用工具7204,这样的程序模块7205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线730可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备700也可以与一个或多个外部设备740(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备700交互的设备通信,和/或与使得该电子设备700能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口750进行。并且,电子设备700还可以通过网络适配器760与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图7所示,网络适配器760通过总线730与电子设备700的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质可以是可读信号介质或者可读存储介质。其上存储有能够实现本公开上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“具体实施方式”部分中描述的根据本公开各种示例性实施方式的步骤。
本公开中的计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本公开中,计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可选地,计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
在具体实施时,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本公开的示例性实施例中,还提供了一种计算机程序产品,计算机程序产品包括计算机程序或计算机指令,计算机程序或计算机指令由处理器加载并执行,以使计算机实现本说明书上述“具体实施方式”部分中描述的根据本公开各种示例性实施方式的步骤。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围由所附的权利要求指出。

Claims (10)

1.一种联邦学习参与方筛选方法,其特征在于,应用于联邦学习网络的中心设备,所述联邦学习网络还包括多个参与方设备,包括:
获取每一参与方设备的多个差异值,每一参与方设备对应一组模型参数,所述多个差异值是所述每一参与方设备的模型参数与其他各个参与方设备的模型参数之间的差异值;
根据每一参与方设备的多个差异值,从所述多个参与方设备中筛选出验证设备,在所述多个参与方设备中,所述验证设备的多个差异值中小于差异阈值的数量,不小于其他各个参与方设备的多个差异值中小于所述差异阈值的数量;
获取所述验证设备对至少一个参与方设备的模型参数进行测试得到的模型质量数据,并根据所述模型质量数据,从所述多个参与方设备中筛选出参与联邦学习的参与方设备。
2.根据权利要求1所述的方法,其特征在于,所述获取每一参与方设备的多个差异值,包括:
接收所述多个参与方设备分别发送的模型参数,得到多组模型参数;
计算所述多组模型参数中每组模型参数与其他各组模型参数之间的差异值,得到每一参与方设备的多个差异值。
3.根据权利要求2所述的方法,其特征在于,所述计算所述多组模型参数中每组模型参数与其他各组模型参数之间的差异值,得到每一参与方设备的多个差异值,包括:
计算所述多组模型参数中每组模型参数与其他各组模型参数之间的欧氏距离,得到每组模型参数的多个欧氏距离;确定每组模型参数的多个欧氏距离为相应参与方设备的多个差异值;
或者,计算所述多组模型参数中每组模型参数与其他各组模型参数之间的余弦距离,得到每组模型参数的多个余弦距离;确定每组模型参数的多个余弦距离为相应参与方设备的多个差异值。
4.根据权利要求1所述的方法,其特征在于,所述根据每一参与方设备的多个差异值,从所述多个参与方设备中筛选出验证设备,包括:
确定所述多个参与方设备的全部差异值的平均值,将所述平均值作为所述差异阈值;
根据所述差异阈值和每一参与方设备的多个差异值,建立无向关联图,所述无向关联图中包括多个节点和多个边,每个节点对应一组模型参数,每个边两端的节点之间的差异值小于所述差异阈值;
确定所述无向关联图包括的子集中的最大子集,将所述最大子集的中心节点对应的参与方设备作为所述验证设备。
5.根据权利要求1所述的方法,其特征在于,所述至少一个参与方设备的模型参数是所述多个参与方设备的模型参数;
或者,所述至少一个参与方设备的模型参数是所述验证设备对应的多个差异值中,不小于所述差异阈值的差异值所对应的模型参数。
6.根据权利要求1所述的方法,其特征在于,所述获取所述验证设备对至少一个参与方设备的模型参数进行测试得到的模型质量数据,包括:
向所述验证设备发送所述至少一个参与方设备的模型参数;
接收所述验证设备根据每组模型参数测试得到的模型质量数据。
7.根据权利要求1-6任意一项所述的方法,其特征在于,还包括:
根据所述参与联邦学的参与方设备的模型参数进行参数聚合,得到全局模型参数。
8.一种联邦学习参与方筛选装置,其特征在于,应用于联邦学习网络的中心设备,所述联邦学习网络还包括多个参与方设备,包括:
获取模块,用于获取每一参与方设备的多个差异值,每一参与方设备对应一组模型参数,所述多个差异值是所述每一参与方设备的模型参数与其他各个参与方设备的模型参数之间的差异值;
筛选模块,用于根据每一参与方设备的多个差异值,从所述多个参与方设备中筛选出验证设备,在所述多个参与方设备中,所述验证设备的多个差异值中小于差异阈值的数量,不小于其他各个参与方设备的多个差异值中小于所述差异阈值的数量;
获取及筛选模块,用于获取所述验证设备对至少一个参与方设备的模型参数进行测试得到的模型质量数据,并根据所述模型质量数据,从所述多个参与方设备中筛选出参与联邦学习的参与方设备。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~7中任意一项所述的联邦学习参与方筛选方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~7中任意一项所述的联邦学习参与方筛选方法。
CN202310587124.3A 2023-05-23 2023-05-23 联邦学习参与方筛选方法、装置、电子设备及存储介质 Pending CN116562396A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310587124.3A CN116562396A (zh) 2023-05-23 2023-05-23 联邦学习参与方筛选方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310587124.3A CN116562396A (zh) 2023-05-23 2023-05-23 联邦学习参与方筛选方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116562396A true CN116562396A (zh) 2023-08-08

Family

ID=87489688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310587124.3A Pending CN116562396A (zh) 2023-05-23 2023-05-23 联邦学习参与方筛选方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116562396A (zh)

Similar Documents

Publication Publication Date Title
CN113221183B (zh) 实现隐私保护的多方协同更新模型的方法、装置及系统
CN103294947A (zh) 程序解析系统及方法
CN108933695B (zh) 用于处理信息的方法和装置
CN114697304B (zh) 一种灰度发布方法、系统、装置、设备及存储介质
CN114928574B (zh) 信息发送方法、装置、电子设备和计算机可读介质
CN114363212B (zh) 一种设备检测方法、装置、设备和存储介质
US20100054118A1 (en) Self-optimization and self-healing of voice quality problems utilizing service oriented architecture
CN114650179A (zh) 风险数据监测方法、装置、系统、电子设备及存储介质
CN113537512A (zh) 基于联邦学习的模型训练方法、装置、系统、设备和介质
CN115345279B (zh) 多指标异常检测方法、装置、电子设备及存储介质
CN116562396A (zh) 联邦学习参与方筛选方法、装置、电子设备及存储介质
CN113762421B (zh) 分类模型的训练方法、流量分析方法、装置及设备
CN113053531B (zh) 医疗数据处理方法、装置、计算机可读存储介质及设备
US20190332507A1 (en) Burn process data retrieval and notification
CN118052274A (zh) 联邦学习方法、装置、电子设备及计算机可读存储介质
CN118095475A (zh) 联邦学习方法、装置、电子设备及计算机可读存储介质
CN115564056B (zh) 节点选择方法、装置、电子设备及计算机可读存储介质
CN114785605B (zh) 网络异常检测模型的确定方法、装置、设备及存储介质
CN113886780B (zh) 客户信息校验方法、装置、介质及电子设备
CN115526339B (zh) 联邦学习方法、装置、电子设备及计算机可读存储介质
CN114722061B (zh) 数据处理方法及装置、设备、计算机可读存储介质
CN112799956B (zh) 资产识别能力测试方法、装置及系统装置
CN114399355B (zh) 基于用户转化率的信息推送方法、装置和电子设备
CN116107426A (zh) 手势识别方法、装置、电子设备及计算机可读存储介质
CN117556212A (zh) 一种流式大数据的分析方法、装置、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination