CN114841372A - 基于区块链的联邦处理方法、装置、设备及存储介质 - Google Patents
基于区块链的联邦处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114841372A CN114841372A CN202210531118.1A CN202210531118A CN114841372A CN 114841372 A CN114841372 A CN 114841372A CN 202210531118 A CN202210531118 A CN 202210531118A CN 114841372 A CN114841372 A CN 114841372A
- Authority
- CN
- China
- Prior art keywords
- task
- local
- federal
- data set
- block chain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供了一种基于区块链的联邦处理方法、装置、设备及存储介质,涉及人工智能技术领域,尤其涉及区块链技术和机器学习技术领域。该方法包括:对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集;基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对所述本地基础数据集进行随机排序,得到联邦任务的本地目标数据集;采用所述本地目标数据集与其他参与方的其他目标数据集对所述联邦任务进行模型评估。通过上述技术方案,能够提高模型性能评估的可靠性。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及区块链技术和机器学习技术领域。
背景技术
在联邦学习系统中,有多个参与方共同进行模型训练。每一方持有一部分数据,也就是训练样本。出于数据安全的考虑,这些数据不能直接进行交换。在有监督的机器学习中,执行模型评估需要将已有的数据集划分为测试集(test set)和训练集(trainingset)。在各参与方数据安全的前提下,如何进行模型性能评估十分重要。
发明内容
本公开提供了一种基于区块链的联邦处理方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种基于区块链的联邦处理方法,该方法包括:
对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集;
基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对所述本地基础数据集进行随机排序,得到联邦任务的本地目标数据集;
采用所述本地目标数据集与其他参与方的其他目标数据集对所述联邦任务进行模型评估。
根据本公开的另一方面,提供了一种基于区块链的联邦处理装置,该装置包括:
基础数据集确定模块,用于对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集;
目标数据集确定模块,用于基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对所述本地基础数据集进行随机排序,得到联邦任务的本地目标数据集;
模型评估模块,用于采用所述本地目标数据集与其他参与方的其他目标数据集对所述联邦任务进行模型评估。
根据本公开的另一方面,提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述基于区块链的联邦处理方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开任一实施例所述的基于区块链的联邦处理方法。
根据本公开的技术,能够提高模型性能评估的可靠性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例提供的一种基于区块链的联邦处理方法的流程图;
图2是根据本公开实施例提供的另一种基于区块链的联邦处理方法的流程图;
图3是根据本公开实施例提供的又一种基于区块链的联邦处理方法的流程图;
图4是根据本公开实施例提供的一种基于区块链的联邦处理装置的结构示意图;
图5是用来实现本公开实施例的基于区块链的联邦处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本公开实施例提供的一种基于区块链的联邦处理方法的流程图。该方法适用于如何对模型进行评估的情况,尤其适用于在联邦学习场景中如何对模型进行评估的情况。该方法可以由基于区块链的联邦处理装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成于承载基于区块链的联邦处理功能的电子设备中,具体可以是参与模型评估的任一参与方的电子设备中。如图1所示,本实施例的基于区块链的联邦处理方法可以包括:
S101,对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集。
本实施例中,联邦任务是指需要多参与方参与完成模型评估的任务。所谓本地样本可以包括本地参与方的本地用户、本地用户特征(属性)等数据。其他样本可以包括其他参与方的其他用户、其他用户特征(属性)等数据。所谓本地基础数据集是指本地参与方与其他参与方中用户相同但用户特征不完全相同的本地样本数据,也即本地参与方与其他参与方之间存在交集的数据,可以包括用户id和至少一个维度的用户特征(或属性);本地基础数据集可以用于后续参与联邦任务。
所谓样本对齐,是纵向联邦学习技术中的重要步骤之一。纵向联邦学习中的样本分属于不同的参与方,各个参与方的样本的覆盖范围各有差异。参与方样本ID不适合直接进行交集的计算,样本对齐即在不泄露参与方样本ID(Identity Document)的情况下,获取参与方样本ID的交集。例如,对样本ID集合进行签名、随机扰动等处理得到隐私集合,并基于隐私集合求交,保障ID不被破解。
示例性的,可以基于隐私集合求交(Private Set Intersection,PSI)技术,对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据。
S102,基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对本地基础数据集进行随机排序,得到联邦任务的本地目标数据集。
本实施例中,任务标识信息是指用于唯一标识任务的信息,可以以数字、字母等形式存在,示例性的,可以采用UUID(Universally Unique IDentifier)算法,生成联邦任务的任务标识信息。所谓本地目标数据集是指对本地基础数据集进行随机打乱后的数据集。
所谓预先达成共识的排序算法,即联邦任务的所有参数方采用的一致的排序算法。
具体的,可以以区块链中联邦任务的任务标识信息为扰动参数,基于预先达成共识的排序算法,对本地基础数据集中的数据进行随机排序,得到联邦任务的本地目标数据集,这样保证了本地目标数据集中的数据顺序与其他参与方的其他目标数据集中的数据顺序是一致的,即实现了各参与方目标数据集之间的样本对齐。
S103,采用本地目标数据集与其他参与方的其他目标数据集对联邦任务进行模型评估。
示例性的,可以基于不同的模型评估方式,例如交叉验证法或者留一法,采用本地目标数据集与其他参与方的其他目标数据集对联邦任务进行模型评估。
本公开实施例的技术方案,通过对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集,之后基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对本地基础数据集进行随机排序,得到联邦任务的本地目标数据集,进而采用本地目标数据集与其他参与方的其他目标数据集对联邦任务进行模型评估。上述技术方案,在联邦学习场景中,各参与方通过相同方式为数据集添加随机扰动,使得验证集具有随机性,提高了模型性能评估的可靠性,并且,使得各参与方的数据集之间的对齐,避免了数据浪费,提高了数据利用率。
在上述实施例的基础上,作为本公开的一种可选方式,任务标识信息通过如下方式确定:根据联邦任务的任务需求信息、本地参与方的本地标识信息和其他参与方的其他标识信息,确定联邦任务的任务描述信息;确定任务描述信息的摘要信息,并将摘要信息作为任务标识信息。
其中,任务需求信息是指完成联邦任务所需要的需求算力和需求样本等信息。所谓本地标识用于唯一标识本地参与方。所谓其他标识信息用于唯一标识其他参与方。所谓任务描述信息是指用于描述联邦任务的信息。
示例性的,可以基于预设规则,根据联邦任务的任务需求信息、本地参与方的本地标识信息和其他参与方的其他标识信息,确定联邦任务的任务描述信息,例如可以将联邦任务的任务需求信息、本地参与方的本地标识和其他参与方的其他标识信息,进行拼接,得到联邦任务的任务描述信息。之后,可以采用哈希算法,对任务描述信息进行签名,得到任务描述信息的摘要信息,并将摘要信息作为任务标识信息。
可以理解的是,通过任务描述信息来确定任务标识信息,使得任务标识信息更加合理。
在上述实施例的基础上,作为本公开的一种可选方式,还可以从区块链获取联邦任务的任务需求信息;根据本地参与方的本地样本和本地算力确定是否参与执行联邦任务;在参与执行的情况下,向区块链网络发送联邦任务的参与执行消息,用于根据参与执行消息更新联邦任务的任务状态。
其中,本地算力是指本地参与方可以执行联邦任务的计算资源。所谓参与执行消息是指确认可以参与执行联邦任务的消息。所谓任务状态是指联邦任务的状态。
具体的,本地参与方可以从区块链中获取联邦任务的任务需求信息,之后可以将本地参与方的本地样本和任务需求信息中的需求样本进行比对,并将本地参与方的本地算力和任务需求信息中的需求算力进行比对,根据比对结果,确定本地参与方是否参与联邦任务,若可以参与执行联邦任务,则向区块链网络发送联邦任务的参与执行消息;相应的,区块链网络中的智能合约可以根据参与执行消息自动更新联邦任务的任务状态,例如,将任务状态切换为启动状态。
可以理解的是,在模型评估前,通过区块链来确定可参与联邦任务的参与方,避免没有能力执行联邦任务的参与方参与到联邦任务的执行过程中,从而保证了联邦任务的执行效率;同时保证了全链路的可审计、可自证、可相信。
图2是根据本公开实施例提供的另一种基于区块链的联邦处理方法的流程图。本实施例在上述实施例的基础上,对“基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对本地基础数据集进行随机排序,得到联邦任务的本地目标数据集”进一步优化,提供一种可选实施方案。如图2所示,本实施例的基于区块链的联邦处理方法可以包括:
S201,对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集。
S202,在存在至少两轮模型评估的情况下,确定本轮模型评估的评估轮次。
具体的,在存在至少两轮模型评估的情况下,从区块链网络中确定本轮模型评估的评估轮次。
S203,基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息和评估轮次对本地基础数据集进行随机排序,得到联邦任务在本轮模型评估中的本地目标数据集。
具体的,可以以区块链中联邦任务的任务标识信息和评估轮次为扰动参数,基于预先达成共识的排序算法,对本地基础数据集中的数据进行随机排序,得到联邦任务的本地目标数据集。
需要说明的是,在只有一轮模型评估的情况下,可以以区块链中联邦任务的任务标识信息为扰动参数,基于预先达成共识的排序算法,对本地基础数据集中的数据进行随机排序,得到联邦任务的本地目标数据集。
S204,采用本地目标数据集与其他参与方的其他目标数据集对联邦任务进行模型评估。
具体的,对于每一轮模型评估,采用该轮模型评估对应的本地目标数据集与其他参与方的其他目标数据集对联邦任务进行模型评估。
本公开实施例的技术方案,通过对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集,之后在存在至少两轮模型评估的情况下,确定本轮模型评估的评估轮次,并基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息和评估轮次对本地基础数据集进行随机排序,得到联邦任务在本轮模型评估中的本地目标数据集,进而采用本地目标数据集与其他参与方的其他目标数据集对联邦任务进行模型评估。上述技术方案,引入评估轮次,对联邦任务进行多伦评估,进一步提高了模型评估的可靠性。
在上述实施例的基础上,作为本公开的一种可选方式,根据区块链中联邦任务的任务标识信息和评估轮次对本地基础数据集进行随机排序还可以是,根据区块链中联邦任务的任务标识信息和评估轮次,生成随机种子;采用随机种子创建随机数生成器;采用随机数生成器,对本地基础数据集进行随机排序。
具体的,可以以一定规则,根据区块链中联邦任务的任务标识信息和评估轮次,生成随机种子,例如可以对区块链中联邦任务的任务标识信息和评估轮次进行拼接,将拼接后的结果作为随机种子,之后,采用随机种子创建随机数生成器;采用随机数生成器,得到新的数据序列,采用新的数据序列对本地基础数据集进行随机排序。
需要说明的是,在本轮评估过程中,各参与方的随机种子相同,在不同轮次评估过程中的随机种子不同。
可以理解的是,通过随机种子来对本地基础数据集进行排序,使得所得到本地目标数据集具有随机性。
图3是根据本公开实施例提供的又一种基于区块链的联邦处理方法的流程图。在上述实施例的基础上,对“采用本地目标数据集与其他参与方的其他目标数据集对联邦任务进行模型评估”进一步优化,提供一种可选方案。如图3所示,本实施例的基于区块链的联邦处理方法可以包括:
S301,对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集。
S302,基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对本地基础数据集进行随机排序,得到联邦任务的本地目标数据集。
S303,基于预设的模型评估方式,将本地目标数据集划分为本地训练集和本地验证集。
具体的,可以基于预设的模型评估方式对应的数据集划分方式,将本地目标数据集划分为本地训练集和本地验证集。
例如,若采用留一法的模型评估方式,则每次进行模型评估时,可以从本地目标数据集中选择一条数据作为本地验证集,剩余的数据作为本地训练集。
又如,若采用交叉验证的模型评估方式,将本地目标数据集分为K个子集,则每次进行模型评估时,选取K-1个子集作为本地训练集,剩余部分子集作为本地验证集,其中K为正整数。
需要说明的是,其他训练集和其他验证集通过基于模型评估方式对其他目标数据集进行划分得到,且所基于的模型评估方式与本地训练集和本地验证集所基于的模型评估方式相同。
S304,采用本地训练集与其他参与方的其他训练集进行模型训练得到联邦任务模型。
示例性的,可以基于纵向联邦学习,采用本地训练集与其他参与方的其他训练集进行模型训练得到联邦任务模型。在分布式训练过程中,各参与方之间会进行多轮交互。
具体的,本地参与方在本地终端采用本地训练集进行模型训练,得到本地模型参数,其他参与方在其他终端采用其他训练集进行模型,得到其他模型参数;各参与方分别采用同态加密方式模型参数进行加密,并将加密后的模型参数进行相互转发;相应的,各参与方接收到加密后的模型参数后进行解密,采用解密后的模型参数更新本地模型参数,并对模型进行重新训练;依次类推,直到整个训练过程收敛,得到联邦任务模型。
S305,采用本地验证集与其他参与方的其他验证集对联邦任务模型进行模型评估。
具体的,本地参与方采用本地验证集对联邦任务模型进行模型评估,得到本地验证结果,其他参与方采用其他验证集对联邦任务模型进行模型评估,得到其他验证结果;之后各参与方将验证结果传输给标签持有方。相应的,标签持有方根据验证结果和验证结果对应的真实标签数据,得到联邦任务模型的评估结果。在验证过程中,各参与方会进行多轮交互。
其中,标签持有方是指拥有验证结果对应的真实标签数据的参与方。
本公开实施例的技术方案,通过对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集,之后基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对本地基础数据集进行随机排序,得到联邦任务的本地目标数据集,进而基于预设的模型评估方式,将本地目标数据集划分为本地训练集和本地验证集,采用本地训练集与其他参与方的其他训练集进行模型训练得到联邦任务模型,并采用本地验证集与其他参与方的其他验证集对联邦任务模型进行模型评估。上述技术方案,通过样本对齐和随机排序,使得训练集和验证集具有随机性,从而保证了模型评估的可靠性。
图4是根据本公开实施例提供的一种基于区块链的联邦处理装置的结构示意图。本实施例适用于如何对模型进行评估的情况,尤其适用于在联邦学习场景中如何对模型进行评估的情况。该装置可以采用软件和/或硬件的方式实现,并可集成于承载基于区块链的联邦处理功能的电子设备中。如图4所示,本实施例的基于区块链的联邦处理装置400可以包括:
基础数据集确定模块401,用于对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集;
目标数据集确定模块402,用于基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对本地基础数据集进行随机排序,得到联邦任务的本地目标数据集;
模型评估模块403,用于采用本地目标数据集与其他参与方的其他目标数据集对联邦任务进行模型评估。
本公开实施例的技术方案,通过对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集,之后基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对本地基础数据集进行随机排序,得到联邦任务的本地目标数据集,进而采用本地目标数据集与其他参与方的其他目标数据集对联邦任务进行模型评估。上述技术方案,在联邦学习场景中,各参与方通过相同方式为数据集添加随机扰动,使得验证集具有随机性,提高了模型性能评估的可靠性,并且,使得各参与方的数据集之间的对齐,避免了数据浪费,提高了数据利用率。
进一步地,目标数据集确定模块402,包括:
评估轮次确定单元,用于在存在至少两轮模型评估的情况下,确定本轮模型评估的评估轮次;
目标数据集确定单元,用于基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息和评估轮次对本地基础数据集进行随机排序,得到联邦任务在本轮模型评估中的本地目标数据集。
进一步地,目标数据集确定单元具体用于:
根据区块链中联邦任务的任务标识信息和评估轮次,生成随机种子;
采用随机种子创建随机数生成器;
采用随机数生成器,对本地基础数据集进行随机排序。
进一步地,该装置还包括任务标识确定模块,任务标识确定模块用于:
根据联邦任务的任务需求信息、本地参与方的本地标识信息和其他参与方的其他标识信息,确定联邦任务的任务描述信息;
确定任务描述信息的摘要信息,并将摘要信息作为任务标识信息。
进一步地,模型评估模块403具体用于:
基于预设的模型评估方式,将本地目标数据集划分为本地训练集和本地验证集;
采用本地训练集与其他参与方的其他训练集进行模型训练得到联邦任务模型;
采用本地验证集与其他参与方的其他验证集对联邦任务模型进行模型评估;
其中,其他训练集和其他验证集通过基于模型评估方式对其他目标数据集进行划分得到。
进一步地,该装置还包括:
任务需求信息获取模块,用于从区块链获取联邦任务的任务需求信息;
任务参与确定模块,用于根据本地参与方的本地样本和本地算力确定是否参与执行联邦任务;
参与执行信息发送模块,用于在参与执行的情况下,向区块链网络发送联邦任务的参与执行消息,用于根据参与执行消息更新联邦任务的任务状态。
本公开的技术方案中,所涉及的样本等的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图5是用来实现本公开实施例的基于区块链的联邦处理方法的电子设备的框图。图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,电子设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储电子设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
电子设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许电子设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如基于区块链的联邦处理方法。例如,在一些实施例中,基于区块链的联邦处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到电子设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的基于区块链的联邦处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于区块链的联邦处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术及机器学习/深度学习技术、大数据处理技术、知识图谱技术等几大方向。
云计算(cloud computing),指的是通过网络接入弹性可扩展的共享物理或虚拟资源池,资源可以包括服务器、操作系统、网络、软件、应用和存储设备等,并可以按需、自服务的方式对资源进行部署和管理的技术体系。通过云计算技术,可以为人工智能、区块链等技术应用、模型训练提供高效强大的数据处理能力。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (15)
1.基于区块链的联邦处理方法,包括:
对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集;
基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对所述本地基础数据集进行随机排序,得到联邦任务的本地目标数据集;
采用所述本地目标数据集与其他参与方的其他目标数据集对所述联邦任务进行模型评估。
2.根据权利要求1所述的方法,其中,所述基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对所述本地基础数据集进行随机排序,得到联邦任务的本地目标数据集,包括:
在存在至少两轮模型评估的情况下,确定本轮模型评估的评估轮次;
基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息和所述评估轮次对所述本地基础数据集进行随机排序,得到联邦任务在本轮模型评估中的本地目标数据集。
3.根据权利要求2所述的方法,其中,所述根据区块链中联邦任务的任务标识信息和所述评估轮次对所述本地基础数据集进行随机排序,包括:
根据区块链中联邦任务的任务标识信息和所述评估轮次,生成随机种子;
采用所述随机种子创建随机数生成器;
采用所述随机数生成器,对所述本地基础数据集进行随机排序。
4.根据权利要求1-3中任一项所述的方法,其中,所述任务标识信息通过如下方式确定:
根据所述联邦任务的任务需求信息、所述本地参与方的本地标识信息和所述其他参与方的其他标识信息,确定联邦任务的任务描述信息;
确定所述任务描述信息的摘要信息,并将所述摘要信息作为所述任务标识信息。
5.根据权利要求1所述的方法,其中,所述采用所述本地目标数据集与其他参与方的其他目标数据集对所述联邦任务进行模型评估,包括:
基于预设的模型评估方式,将所述本地目标数据集划分为本地训练集和本地验证集;
采用所述本地训练集与其他参与方的其他训练集进行模型训练得到联邦任务模型;
采用所述本地验证集与其他参与方的其他验证集对所述联邦任务模型进行模型评估;
其中,所述其他训练集和所述其他验证集通过基于所述模型评估方式对所述其他目标数据集进行划分得到。
6.根据权利要求1所述的方法,还包括:
从区块链获取联邦任务的任务需求信息;
根据本地参与方的本地样本和本地算力确定是否参与执行所述联邦任务;
在参与执行的情况下,向区块链网络发送所述联邦任务的参与执行消息,用于根据所述参与执行消息更新所述联邦任务的任务状态。
7.基于区块链的联邦处理装置,包括:
基础数据集确定模块,用于对本地参与方的本地样本与联邦任务中其他参与方的其他样本进行样本对齐,得到联邦任务的本地基础数据集;
目标数据集确定模块,用于基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息对所述本地基础数据集进行随机排序,得到联邦任务的本地目标数据集;
模型评估模块,用于采用所述本地目标数据集与其他参与方的其他目标数据集对所述联邦任务进行模型评估。
8.根据权利要求7所述的装置,其中,所述目标数据集确定模块,包括:
评估轮次确定单元,用于在存在至少两轮模型评估的情况下,确定本轮模型评估的评估轮次;
目标数据集确定单元,用于基于预先达成共识的排序算法,根据区块链中联邦任务的任务标识信息和所述评估轮次对所述本地基础数据集进行随机排序,得到联邦任务在本轮模型评估中的本地目标数据集。
9.根据权利要求8所述的装置,其中,所述目标数据集确定单元具体用于:
根据区块链中联邦任务的任务标识信息和所述评估轮次,生成随机种子;
采用所述随机种子创建随机数生成器;
采用所述随机数生成器,对所述本地基础数据集进行随机排序。
10.根据权利要求7-9中任一项所述的装置,其中,该装置还包括任务标识确定模块,所述任务标识确定模块用于:
根据所述联邦任务的任务需求信息、所述本地参与方的本地标识信息和所述其他参与方的其他标识信息,确定联邦任务的任务描述信息;
确定所述任务描述信息的摘要信息,并将所述摘要信息作为所述任务标识信息。
11.根据权利要求7所述的装置,其中,所述模型评估模块具体用于:
基于预设的模型评估方式,将所述本地目标数据集划分为本地训练集和本地验证集;
采用所述本地训练集与其他参与方的其他训练集进行模型训练得到联邦任务模型;
采用所述本地验证集与其他参与方的其他验证集对所述联邦任务模型进行模型评估;
其中,所述其他训练集和所述其他验证集通过基于所述模型评估方式对所述其他目标数据集进行划分得到。
12.根据权利要求7所述的装置,该装置还包括:
任务需求信息获取模块,用于从区块链获取联邦任务的任务需求信息;
任务参与确定模块,用于根据本地参与方的本地样本和本地算力确定是否参与执行所述联邦任务;
参与执行信息发送模块,用于在参与执行的情况下,向区块链网络发送所述联邦任务的参与执行消息,用于根据所述参与执行消息更新所述联邦任务的任务状态。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的基于区块链的联邦处理方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-6中任一项所述的基于区块链的联邦处理方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的基于区块链的联邦处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210531118.1A CN114841372A (zh) | 2022-05-16 | 2022-05-16 | 基于区块链的联邦处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210531118.1A CN114841372A (zh) | 2022-05-16 | 2022-05-16 | 基于区块链的联邦处理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114841372A true CN114841372A (zh) | 2022-08-02 |
Family
ID=82569556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210531118.1A Pending CN114841372A (zh) | 2022-05-16 | 2022-05-16 | 基于区块链的联邦处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114841372A (zh) |
-
2022
- 2022-05-16 CN CN202210531118.1A patent/CN114841372A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113537508B (zh) | 联邦计算的处理方法、装置、电子设备和存储介质 | |
CN114647742A (zh) | 学习新字词 | |
CN109146490A (zh) | 区块生成方法、装置和系统 | |
US11244153B2 (en) | Method and apparatus for processing information | |
CN113407850B (zh) | 一种虚拟形象的确定和获取方法、装置以及电子设备 | |
CN112866391A (zh) | 消息推送方法、装置、电子设备及存储介质 | |
CN112434620B (zh) | 场景文字识别方法、装置、设备和计算机可读介质 | |
CN111629063A (zh) | 基于区块链的分布式文件下载的方法和电子设备 | |
CN113037489B (zh) | 数据处理方法、装置、设备和存储介质 | |
CN114301670B (zh) | 基于ipv6地址的终端认证方法、装置、设备及介质 | |
CN113590756A (zh) | 信息序列生成方法、装置、终端设备和计算机可读介质 | |
CN113032817B (zh) | 基于区块链的数据对齐方法、装置、设备和介质 | |
CN113918102B (zh) | 一种基于区块链的数据处理方法、装置、设备及存储介质 | |
CN113935069B (zh) | 一种基于区块链的数据验证方法、装置、设备及存储介质 | |
CN114841372A (zh) | 基于区块链的联邦处理方法、装置、设备及存储介质 | |
CN114363094B (zh) | 一种数据分享方法、装置、设备及存储介质 | |
CN115883187A (zh) | 网络流量数据中的异常信息识别方法、装置、设备和介质 | |
CN115545215A (zh) | 一种去中心化的联邦聚类学习方法、装置、设备及介质 | |
US20230418794A1 (en) | Data processing method, and non-transitory medium and electronic device | |
CN115423030A (zh) | 一种设备识别的方法和装置 | |
CN112242978A (zh) | 一种处理数据的方法和装置 | |
CN108055193A (zh) | 以活动为媒介的通信方法 | |
CN116186720A (zh) | 数据加密模型建模、使用方法及相关设备 | |
CN114282237B (zh) | 一种通信方法、装置、设备及存储介质 | |
CN113691442B (zh) | 好友推荐方法、装置、设备、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |