CN117792641A - 联邦学习系统的全局评价指标获取方法及联邦学习系统 - Google Patents
联邦学习系统的全局评价指标获取方法及联邦学习系统 Download PDFInfo
- Publication number
- CN117792641A CN117792641A CN202410211567.7A CN202410211567A CN117792641A CN 117792641 A CN117792641 A CN 117792641A CN 202410211567 A CN202410211567 A CN 202410211567A CN 117792641 A CN117792641 A CN 117792641A
- Authority
- CN
- China
- Prior art keywords
- global
- confusion matrix
- central server
- local
- steps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000011156 evaluation Methods 0.000 title claims abstract description 37
- 239000011159 matrix material Substances 0.000 claims abstract description 151
- 238000012360 testing method Methods 0.000 claims abstract description 34
- 238000003860 storage Methods 0.000 claims description 8
- 230000004931 aggregating effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 230000002776 aggregation Effects 0.000 abstract description 9
- 238000004220 aggregation Methods 0.000 abstract description 9
- 238000004891 communication Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 11
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Mobile Radio Communication Systems (AREA)
Abstract
本申请提供一种联邦学习系统的全局评价指标获取方法及联邦学习系统,联邦学习系统的每两个参与方商量一个秘密随机数。每个参与方根据己方的所有秘密随机数生成干扰系数,利用干扰系数对本地混淆矩阵进行加密,得到加密本地混淆矩阵。在中心服务器获取所有参与方的加密混淆矩阵并进行聚合,在聚合时加密本地混淆矩阵中的干扰系数会抵消掉,从而得到全局混淆矩阵。本实施例中,参与方向中心服务器发送的是加密本地混淆矩阵,同时中心服务器不针对每一加密本地混淆矩阵进行解密,不会泄露参与方本地测试集的正例样本数量和反例样本数量等敏感信息,保证了参与方测试集数据的隐私和安全。
Description
技术领域
本申请涉及隐私计算技术领域,具体而言,涉及一种联邦学习系统的全局评价指标获取方法及联邦学习系统。
背景技术
联邦学习是一种分布式机器学习的范式,它允许多个数据拥有方在保持数据本地化的前提下,通过协作训练一个共享的全局模型。联邦学习的目的是利用分布在不同位置和设备的海量数据,提高机器学习模型的性能和泛化能力,同时保护数据的隐私和安全。在联邦学习中,模型评价是一个重要的环节,它可以帮助了解模型在不同数据集上的表现,选择最优的模型参数和算法,以及比较不同模型或算法之间的优劣。模型评价通常需要使用一些评价指标来衡量模型的准确性、稳定性、效率等方面的特征,针对分类模型的评价指标主要有准确率(Accuracy),召回率(Recall),精确率(Precision),F1值(F1_score),混淆矩阵(Confusion matrix)等等。
通常在联邦学习理论研究中,为了评价联邦学习算法的好坏会有一个全局测试集用来评价最终结果,所有模型评价指标都通过全局测试集计算得到,这样就不会产生多个测试集多个结果的分歧。但是在实际的联邦学习平台中,数据都分布在各个参与方中并没有理想的全局测试集。在测试阶段,只会在每个参与方自己划分的测试集上得到模型指标结果。当然也可以将各个参与方的测试数据集集中到中心服务器得到全局数据集,但这样做会存在严重的隐私问题。
在联邦学习平台中,由于每个参与方的数据都不会离开本地,所以无法直接使用一个全局的测试集来对全局模型进行评价。这就导致了以下几个问题:
首先,只能依据每个参与方自己划分的本地测试集来对本地模型进行评价,这样就会产生n个参与方得到n个结果的情况,而这些结果可能会有很大的差异和不一致性,因为每个参与方的数据分布和规模可能不同。这就给对全局模型进行评价和比较带来了困难和挑战。
其次,无法对训练过程中不同迭代轮次产生的不同全局模型进行有效地选择。因为无法直接比较不同轮次全局模型在全局测试集上的表现,只能根据每轮迭代后各个参与方的本地测试结果来进行推测和估计。这就导致无法确定哪一轮次是最优的。
最后,无法保证数据的隐私和安全。虽然可以将各个参与方的测试数据集集中到中心服务器得到一个全局测试集,从而解决上述两个问题,但这样做会违背联邦学习的初衷和原则,即保持数据本地化。因为一旦数据离开了本地,就有可能被窃取、篡改或泄露给第三方,从而危害数据拥有方的隐私和利益。
发明内容
本申请实施例的目的在于提供一种联邦学习系统的全局评价指标获取方法及联邦学习系统,用以解决现有技术中无法在保证联邦学习各个参与方数据的隐私和安全的前提下,获取模型的全局评价指标的问题。
本申请实施例提供的一种联邦学习系统的全局评价指标获取方法,联邦学习系统包括中心服务器和n个参与方,每一参与方包括己方的测试集数据,全局评价指标包括全局混淆矩阵;其中,n为大于1的正整数;
方法包括:
在每一参与方C u,执行以下步骤:
参与方C u分别与其他参与方C v商量一个秘密随机数S uv,其中v不等于u,S uv等于S vu;其中,1<u<n,1<v<n;
根据参与方C u的测试集数据,得到参与方C u的本地混淆矩阵H u;
利用参与方C u的所有秘密随机数,生成干扰系数;其中,干扰系数为;
利用干扰系数对本地混淆矩阵H u进行加密,得到加密本地混淆矩阵,并向中心服务器发送加密本地混淆矩阵;
在中心服务器,将所有加密本地混淆矩阵进行聚合,得到全局混淆矩阵。
上述技术方案中,联邦学习系统的每两个参与方商量一个秘密随机数。每个参与方根据己方的所有秘密随机数生成干扰系数,利用干扰系数对本地混淆矩阵进行加密,得到加密本地混淆矩阵。在中心服务器获取所有参与方的加密混淆矩阵并进行聚合,在聚合时加密本地混淆矩阵中的干扰系数会抵消掉,从而得到全局混淆矩阵。本实施例中,参与方向中心服务器发送的是加密本地混淆矩阵,同时中心服务器不针对每一加密本地混淆矩阵进行解密,不会泄露参与方本地测试集的正例样本数量和反例样本数量等敏感信息,保证了参与方测试集数据的隐私和安全。
在一些可选的实施方式中,利用干扰系数对本地混淆矩阵H u进行加密,包括:
将本地混淆矩阵H u加上干扰系数,得到加密本地混淆矩阵;
或,将本地混淆矩阵H u减去干扰系数,得到加密本地混淆矩阵。
上述技术方案中,将本地混淆矩阵加上或减去对应的干扰系数,由于干扰系数为,使得在中心服务器对所有加密混淆矩阵进行聚合时所有干扰系数之和等于0,得到的全局混淆矩阵没有精度损失。
在一些可选的实施方式中,参与方C u分别与其他参与方C v商量一个秘密随机数S uv,包括:
参与方C u与参与方C v共同选取大素数和一个素数生成器/>,其中,1</></>;
在参与方C u,生成随机数A,计算公钥,向参与方C v发送公钥/>;在参与方C v,生成随机数B,计算公钥/>,向参与方C u发送/>;
在参与方C u,根据公钥,得到密钥Suv=/>;在参与方Cv,根据公钥,得到密钥S vu=/>。
上述技术方案中,参与方C u与参与方C v不直接交换秘密随机数,而是通过共同生成一个共享的秘密随机数来保证安全性,即使在公网上被截获了公钥,也无法计算出密钥(即秘密随机数),只有拥有私钥(随机数A和随机数B)的双方才能计算出秘密随机数。因此,本实施例能够有效地防止秘密随机数的泄露。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局准确率;
方法,还包括:
在中心服务器,根据全局混淆矩阵,计算全局准确率:
。
上述技术方案中,在得到了全局混淆矩阵之后,能够根据全局混淆矩阵中的真正例TP、假反例FN、假正例FP和真反例TN,计算全局准确率。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局精确率;
方法,还包括:
在中心服务器,根据全局混淆矩阵,计算全局精确率:
Precision=TP/(TP+FP)。
上述技术方案中,在得到了全局混淆矩阵之后,能够根据全局混淆矩阵中的真正例TP和假正例FP,计算全局精确率。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局召回率;
方法,还包括:
在中心服务器,根据全局混淆矩阵,计算全局召回率:
Recall=TP/(TP+FN)。
上述技术方案中,在得到了全局混淆矩阵之后,能够根据全局混淆矩阵中的真正例TP和假反例FN,计算全局召回率。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局F1得分;
方法,还包括:
在中心服务器,根据全局混淆矩阵,计算全局F1得分:
F1-Score=2×Precision×Recall/(Precision+ Recall)
Precision=TP/(TP+FP)
Recall=TP/(TP+FN)。
上述技术方案中,在得到了全局混淆矩阵之后,能够根据全局混淆矩阵中的真正例TP、假反例FN和假正例FP,计算全局F1得分。
本申请实施例提供的一种联邦学习系统,包括中心服务器和n个参与方,每一参与方包括己方的测试集数据;其中,n为大于1的正整数;
参与方用于:
参与方C u分别与其他参与方C v商量一个秘密随机数S uv,其中v不等于u,S uv等于S vu;其中,1<u<n,1<v<n;
根据参与方C u的测试集数据,得到参与方C u的本地混淆矩阵H u;
利用参与方C u的所有秘密随机数,生成干扰系数;其中,干扰系数为;
利用干扰系数对本地混淆矩阵H u进行加密,得到加密本地混淆矩阵,并向中心服务器发送加密本地混淆矩阵;
中心服务器用于:将所有加密本地混淆矩阵进行聚合,得到全局混淆矩阵。
在一些可选的实施方式中,参与方还用于:
将本地混淆矩阵H u加上干扰系数,得到加密本地混淆矩阵;
或,将本地混淆矩阵H u减去干扰系数,得到加密本地混淆矩阵。
在一些可选的实施方式中,参与方还用于:
参与方C u与参与方C v共同选取大素数和一个素数生成器/>,其中,1</></>;
在参与方C u,生成随机数A,计算公钥,向参与方C v发送公钥/>;在参与方C v,生成随机数B,计算公钥/>,向参与方C u发送/>;
在参与方C u,根据公钥,得到密钥Suv=/>;在参与方Cv,根据公钥,得到密钥S vu=/>。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局准确率;中心服务器还用于:根据全局混淆矩阵,计算全局准确率:
。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局精确率;中心服务器还用于:根据全局混淆矩阵,计算全局精确率:
Precision=TP/(TP+FP)。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局召回率;中心服务器还用于:根据全局混淆矩阵,计算全局召回率:
Recall=TP/(TP+FN)。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局F1得分;中心服务器还用于:根据全局混淆矩阵,计算全局F1得分:
F1-Score=2×Precision×Recall/(Precision+ Recall)
Precision=TP/(TP+FP)
Recall=TP/(TP+FN)。
本申请实施例提供的一种电子设备,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如以上任一所述的方法。
本申请实施例提供的一种计算机可读存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如以上任一所述的方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种联邦学习系统的全局评价指标获取方法步骤流程图;
图2为本申请实施例提供的电子设备的一种可能的结构示意图。
图标:110-通信单元,120-存储器,130-输入单元,131-触敏表面,132-其他输入设备,140-显示单元,141-显示面板,150-传感器,160-音频电路,170-无线通信单元,180-处理器,190-电源。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
请参照图1,图1为本申请实施例提供的一种联邦学习系统的全局评价指标获取方法步骤流程图,联邦学习系统包括中心服务器和n个参与方,每一参与方包括己方的测试集数据,全局评价指标包括全局混淆矩阵。其中,n为大于1的正整数。
其中,混淆矩阵是一种用于评估分类模型性能的矩阵,它可以显示模型对每个类别的预测结果和实际结果的对比。混淆矩阵的行表示实际类别,列表示预测类别。每个单元格的值表示属于该行和该列对应的类别的样本数量。例如,下表1是一个二分类问题的混淆矩阵:
表1
通过混淆矩阵的结构可以看出,其中包含本地测试集的正例样本数量和反例样本数量等敏感信息,所以不能直接传输混淆矩阵的明文给中心服务器。为了实现无偏的得到全局混淆矩阵,并且保护各方的测试集数据隐私,本申请的方法具体包括:
步骤100、在每一参与方C u,执行以下步骤110-140:
步骤110、参与方C u分别与其他参与方C v商量一个秘密随机数S uv,其中v不等于u,S uv等于S vu;其中,1<u<n,1<v<n;
具体地,两个参与方商量一个秘密随机数的方法,可以采用Diffie-Hellman算法、Elgamal算法、背包算法、Rabin算法、椭圆曲线加密算法等,这些算法都能够在不安全的通信渠道上协商出一个共享密钥,以避免密钥传输的风险,提高通信的安全性,在本实施例中将算法生成的共享密钥作为秘密随机数使用。
步骤120、根据参与方C u的测试集数据,得到参与方C u的本地混淆矩阵H u;
步骤130、利用参与方C u的所有秘密随机数,生成干扰系数;其中,干扰系数为;
步骤140、利用干扰系数对本地混淆矩阵H u进行加密,得到加密本地混淆矩阵,并向中心服务器发送加密本地混淆矩阵;具体地,利用干扰矩阵进行加密的方法可以为:干扰系数乘以某一不为0的系数后得到噪声,将该噪声与本地混淆矩阵相加,以使得在中心服务器进行聚合时,所有噪声相互抵消,得到全局混淆矩阵。
步骤200、在中心服务器,将所有加密本地混淆矩阵进行聚合,得到全局混淆矩阵。
本申请实施例中,联邦学习系统的每两个参与方商量一个秘密随机数。每个参与方根据己方的所有秘密随机数生成干扰系数,利用干扰系数对本地混淆矩阵进行加密,得到加密本地混淆矩阵。在中心服务器获取所有参与方的加密混淆矩阵并进行聚合,在聚合时加密本地混淆矩阵中的干扰系数会抵消掉,从而得到全局混淆矩阵。本实施例中,参与方向中心服务器发送的是加密本地混淆矩阵,同时中心服务器不针对每一加密本地混淆矩阵进行解密,不会泄露参与方本地测试集的正例样本数量和反例样本数量等敏感信息,保证了参与方测试集数据的隐私和安全。
在一些可选的实施方式中,步骤140,利用干扰系数对本地混淆矩阵H u进行加密,包括:将本地混淆矩阵H u加上干扰系数,得到加密本地混淆矩阵;或,将本地混淆矩阵H u减去干扰系数,得到加密本地混淆矩阵/>。
本申请实施例中,将本地混淆矩阵加上或减去对应的干扰系数,由于干扰系数为,使得在中心服务器对所有加密混淆矩阵进行聚合时所有干扰系数之和等于0,得到的全局混淆矩阵没有精度损失。
在一些可选的实施方式中,步骤110,参与方C u分别与其他参与方C v商量一个秘密随机数S uv,具体包括:
步骤111、参与方C u与参与方C v共同选取大素数和一个素数生成器/>,其中,1</><;
步骤112、在参与方C u,生成随机数A,计算公钥,向参与方C v发送公钥/>;在参与方C v,生成随机数B,计算公钥/>,向参与方C u发送;
步骤113、在参与方C u,根据公钥,得到密钥Suv=/>;在参与方Cv,根据公钥/>,得到密钥S vu=/>。
本申请实施例中,参与方C u与参与方C v不直接交换秘密随机数,而是通过共同生成一个共享的秘密随机数来保证安全性,即使在公网上被截获了公钥,也无法计算出密钥(即秘密随机数),只有拥有私钥(随机数A和随机数B)的双方才能计算出秘密随机数。因此,本实施例能够有效地防止秘密随机数的泄露。
因此,本申请实施例中的参与方的混淆矩阵得到了加密处理,相当于是混淆的方式加入了噪声,这时中心服务器无法得到参与方本地混淆矩阵的明文结果从而保护参与方本地数据隐私。并且,中心服务器会在聚合后消掉密钥,对聚合结果没有影响。最终得到结果即为多方本地混淆矩阵的和,但在中心服务器无法窥探到每个参与方的本地混淆矩阵,只可以通过聚合得到全局混淆矩阵。接下来就可以通过全局混淆矩阵计算出其他全局评价指标。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局准确率;
该方法,还包括:
在中心服务器,根据全局混淆矩阵,计算全局准确率:
。
本申请实施例中,在得到了全局混淆矩阵之后,能够根据全局混淆矩阵中的真正例TP、假反例FN、假正例FP和真反例TN,计算全局准确率。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局精确率;
该方法,还包括:
在中心服务器,根据全局混淆矩阵,计算全局精确率:
Precision=TP/(TP+FP)。
本申请实施例中,在得到了全局混淆矩阵之后,能够根据全局混淆矩阵中的真正例TP和假正例FP,计算全局精确率。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局召回率;
该方法,还包括:
在中心服务器,根据全局混淆矩阵,计算全局召回率:
Recall=TP/(TP+FN)。
本申请实施例中,在得到了全局混淆矩阵之后,能够根据全局混淆矩阵中的真正例TP和假反例FN,计算全局召回率。
在一些可选的实施方式中,全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,全局评价指标还包括全局F1得分;
该方法,还包括:
在中心服务器,根据全局混淆矩阵,计算全局F1得分:
F1-Score=2×Precision×Recall/(Precision+ Recall)
Precision=TP/(TP+FP)
Recall=TP/(TP+FN)。
本申请实施例中,在得到了全局混淆矩阵之后,能够根据全局混淆矩阵中的真正例TP、假反例FN和假正例FP,计算全局F1得分。
具体地,上述获取全局混淆矩阵、全局准确率、全局精确率、全局召回率以及全局F1得分的方法,可以应用在以下场景中:根据多个医院参与方的本地医疗数据,预测患者可能患有的疾病类型,例如:基于患者的症状、体征、实验室检查结果等数据,预测患者可能患有的疾病类型,患病类型预测模型输出具体的疾病类型,包括但不限于糖尿病、高血压、呼吸系统疾病、心脏病等。本实施例利用多个医院参与方的本地医疗数据进行患病类型预测模型的联邦学习,能够在不泄露医院端病患隐私的基础上,训练患病类型预测模型,并且,通过获取全局混淆矩阵、全局准确率、全局精确率、全局召回率以及全局F1得分,评估模型的预测能力和性能,从而能够选择合适的模型或调整模型参数以改进性能。
本实施例的上述所有可选技术方案,可以采用可以结合的方式任意组合形成本发明的可选技术方案,在此不再一一举例。
本申请实施例提供的一种联邦学习系统,包括中心服务器和n个参与方,每一参与方包括己方的测试集数据;n为大于1的正整数。
其中,参与方用于:参与方C u分别与其他参与方C v商量一个秘密随机数S uv,其中v不等于u,S uv等于S vu;其中,1<u<n,1<v<n;根据参与方C u的测试集数据,得到参与方C u的本地混淆矩阵H u;利用参与方C u的所有秘密随机数,生成干扰系数;其中,干扰系数为;利用干扰系数对本地混淆矩阵H u进行加密,得到加密本地混淆矩阵/>,并向中心服务器发送加密本地混淆矩阵。
中心服务器用于:将所有加密本地混淆矩阵进行聚合,得到全局混淆矩阵。
本实施例的联邦学习系统,还通过采用上述模块实现联邦学习系统的全局评价指标获取方法与上述相关方法实施例的实现机制相同,详细可以参考上述实施例的记载,在此不再赘述。
本实施例的联邦学习系统具体可以设置在浏览器客户端侧,作为浏览器的一个引擎装置来使用。还可以设置在一个电子设备中,单独执行其功能。
图2是本发明实施例提供的一种电子设备结构示意图。参见图2,该电子设备可以用于实施上述实施例中提供的联邦学习系统的全局评价指标获取方法。具体来讲:
电子设备可以包括通信单元110、包括有一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、无线通信单元170、包括有一个或者一个以上处理核心的处理器180、以及电源190等部件。本领域技术人员可以理解,图2中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
通信单元110可用于收发信息或通话过程中,信号的接收和发送,该通信单元110可以为RF(RadioFrequency,射频)电路、路由器、调制解调器等网络通信设备。特别地,当通信单元110为RF电路时,将基站的下行信息接收后,交由一个或者一个以上处理器180处理;另外,将涉及上行的数据发送给基站。通常,作为通信单元的RF电路包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,通信单元110还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global Systemof Mobile communication,全球移动通讯系统)、GPRS(General PacketRadio Service,通用分组无线服务)、CDMA(Code Division Multiple Access,码分多址)、WCDMA(Wideband Code Division Multiple Access,宽带码分多址)、LTE(Long TermEvolution,长期演进)、电子邮件、SMS(Short Messaging Service,短消息服务)等。存储器120可用于存储软件程序以及模块,处理器180通过运行存储在存储器120的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器120还可以包括存储器控制器,以提供处理器180和输入单元130对存储器120的访问。
输入单元130可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器180,并能接收处理器180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131,输入单元130还可以包括其他输入设备132。具体地,其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元140可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的,触敏表面131可覆盖显示面板141,当触敏表面131检测到在其上或附近的触摸操作后,传送给处理器180以确定触摸事件的类型,随后处理器180根据触摸事件的类型在显示面板141上提供相应的视觉输出。虽然在图2中,触敏表面131与显示面板141是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面131与显示面板141集成而实现输入和输出功能。
电子设备还可包括至少一种传感器150,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板141的亮度,接近传感器可在电子设备移动到耳边时,关闭显示面板141和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路160、扬声器,传声器可提供用户与电子设备之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路160接收后转换为音频数据,再将音频数据输出处理器180处理后,经RF电路110以发送给比如另一电子设备,或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔,以提供外设耳机与电子设备的通信。
为了实现无线通信,该电子设备上可以配置有无线通信单元170,该无线通信单元170可以为WiFi模块。WiFi属于短距离无线传输技术,电子设备通过无线通信单元170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图2示出了无线通信单元170,但是可以理解的是,其并不属于电子设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器180是电子设备的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器120内的软件程序和/或模块,以及调用存储在存储器120内的数据,执行电子设备的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器180可包括一个或多个处理核心;优选的,处理器180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器180中。
电子设备还包括给各个部件供电的电源190(比如电池),优选的,电源可以通过电源管理系统与处理器180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,电子设备还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备的显示单元是触摸屏显示器,电子设备还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:在参与方执行以下步骤:参与方C u分别与其他参与方C v商量一个秘密随机数S uv,其中v不等于u,S uv等于S vu;其中,1<u<n,1<v<n;根据参与方C u的测试集数据,得到参与方C u的本地混淆矩阵H u;利用参与方C u的所有秘密随机数,生成干扰系数;其中,干扰系数为;利用干扰系数对本地混淆矩阵H u进行加密,得到加密本地混淆矩阵/>,并向中心服务器发送加密本地混淆矩阵。在中心服务器执行以下步骤:将所有加密本地混淆矩阵进行聚合,得到全局混淆矩阵。
可选地,该存储器还用于存储以下指令:
将本地混淆矩阵H u加上干扰系数,得到加密本地混淆矩阵;
或,将本地混淆矩阵H u减去干扰系数,得到加密本地混淆矩阵。
可选地,该存储器还用于存储以下指令:
参与方C u与参与方C v共同选取大素数和一个素数生成器/>,其中,1</></>;
在参与方C u,生成随机数A,计算公钥,向参与方C v发送公钥/>;在参与方C v,生成随机数B,计算公钥/>,向参与方C u发送/>;
在参与方C u,根据公钥,得到密钥Suv=/>;在参与方Cv,根据公钥,得到密钥S vu=/>。
可选地,该存储器还用于存储以下指令:根据全局混淆矩阵,计算全局准确率:
。
可选地,该存储器还用于存储以下指令:根据全局混淆矩阵,计算全局精确率:
Precision=TP/(TP+FP)。
可选地,该存储器还用于存储以下指令:根据全局混淆矩阵,计算全局召回率:
Recall=TP/(TP+FN)。
可选地,该存储器还用于存储以下指令:根据全局混淆矩阵,计算全局F1得分:
F1-Score=2×Precision×Recall/(Precision+ Recall)
Precision=TP/(TP+FP)
Recall=TP/(TP+FN)。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种联邦学习系统的全局评价指标获取方法,其特征在于,所述联邦学习系统包括中心服务器和n个参与方,每一参与方包括己方的测试集数据,所述全局评价指标包括全局混淆矩阵;其中,n为大于1的正整数;
所述方法包括:
在每一参与方C u,执行以下步骤:
参与方C u分别与其他参与方C v商量一个秘密随机数S uv,其中v不等于u,S uv等于S vu;其中,1<u<n,1<v<n;
根据参与方C u的测试集数据,得到参与方C u的本地混淆矩阵H u;
利用参与方C u的所有秘密随机数,生成干扰系数;其中,所述干扰系数为;
利用所述干扰系数对本地混淆矩阵H u进行加密,得到加密本地混淆矩阵,并向所述中心服务器发送加密本地混淆矩阵;
在所述中心服务器,将所有加密本地混淆矩阵进行聚合,得到所述全局混淆矩阵。
2.如权利要求1所述的方法,其特征在于,所述利用所述干扰系数对本地混淆矩阵H u进行加密,包括:
将本地混淆矩阵H u加上所述干扰系数,得到加密本地混淆矩阵;
或,将本地混淆矩阵H u减去所述干扰系数,得到加密本地混淆矩阵。
3.如权利要求1所述的方法,其特征在于,所述参与方C u分别与其他参与方C v商量一个秘密随机数S uv,包括:
参与方C u与参与方C v共同选取大素数和一个素数生成器/>,其中,1</></>;
在参与方C u,生成随机数A,计算公钥,向参与方C v发送公钥/>;在参与方C v,生成随机数B,计算公钥/>,向参与方C u发送/>;
在参与方C u,根据公钥,得到密钥Suv=/>;在参与方Cv,根据公钥/>,得到密钥S vu=/>。
4.如权利要求1所述的方法,其特征在于,所述全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,所述全局评价指标还包括全局准确率;
所述方法,还包括:
在所述中心服务器,根据所述全局混淆矩阵,计算所述全局准确率:
。
5.如权利要求1所述的方法,其特征在于,所述全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,所述全局评价指标还包括全局精确率;
所述方法,还包括:
在所述中心服务器,根据所述全局混淆矩阵,计算所述全局精确率:
Precision=TP/(TP+FP)。
6.如权利要求1所述的方法,其特征在于,所述全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,所述全局评价指标还包括全局召回率;
所述方法,还包括:
在所述中心服务器,根据所述全局混淆矩阵,计算所述全局召回率:
Recall=TP/(TP+FN)。
7.如权利要求1所述的方法,其特征在于,所述全局混淆矩阵包括真正例TP、假反例FN、假正例FP和真反例TN,所述全局评价指标还包括全局F1得分;
所述方法,还包括:
在所述中心服务器,根据所述全局混淆矩阵,计算所述全局F1得分:
F1-Score=2×Precision×Recall/(Precision+ Recall)
Precision=TP/(TP+FP)
Recall=TP/(TP+FN)。
8.一种联邦学习系统,其特征在于,包括中心服务器和n个参与方,每一参与方包括己方的测试集数据;其中,n为大于1的正整数;
所述参与方用于:
参与方C u分别与其他参与方C v商量一个秘密随机数S uv,其中v不等于u,S uv等于S vu;其中,1<u<n,1<v<n;
根据参与方C u的测试集数据,得到参与方C u的本地混淆矩阵H u;
利用参与方C u的所有秘密随机数,生成干扰系数;其中,所述干扰系数为;
利用所述干扰系数对本地混淆矩阵H u进行加密,得到加密本地混淆矩阵,并向所述中心服务器发送加密本地混淆矩阵;
所述中心服务器用于:将所有加密本地混淆矩阵进行聚合,得到全局混淆矩阵。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1-7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410211567.7A CN117792641A (zh) | 2024-02-27 | 2024-02-27 | 联邦学习系统的全局评价指标获取方法及联邦学习系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410211567.7A CN117792641A (zh) | 2024-02-27 | 2024-02-27 | 联邦学习系统的全局评价指标获取方法及联邦学习系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117792641A true CN117792641A (zh) | 2024-03-29 |
Family
ID=90394905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410211567.7A Pending CN117792641A (zh) | 2024-02-27 | 2024-02-27 | 联邦学习系统的全局评价指标获取方法及联邦学习系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117792641A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1543118A (zh) * | 2003-03-27 | 2004-11-03 | ���µ�����ҵ��ʽ���� | 公开密钥生成装置、共享密钥生成装置、密钥交换装置以及密钥交换方法 |
US20050027764A1 (en) * | 2003-07-31 | 2005-02-03 | Indian Institute Of Technology | Polynomial time deterministic method for testing primality of numbers |
CN113112032A (zh) * | 2021-04-16 | 2021-07-13 | 中国民航大学 | 基于联邦学习的航班延误预测系统及方法 |
CN115527669A (zh) * | 2022-09-27 | 2022-12-27 | 杭州医康慧联科技股份有限公司 | 基于联邦学习的急性心梗数据处理方法和数据处理系统 |
-
2024
- 2024-02-27 CN CN202410211567.7A patent/CN117792641A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1543118A (zh) * | 2003-03-27 | 2004-11-03 | ���µ�����ҵ��ʽ���� | 公开密钥生成装置、共享密钥生成装置、密钥交换装置以及密钥交换方法 |
US20050027764A1 (en) * | 2003-07-31 | 2005-02-03 | Indian Institute Of Technology | Polynomial time deterministic method for testing primality of numbers |
CN113112032A (zh) * | 2021-04-16 | 2021-07-13 | 中国民航大学 | 基于联邦学习的航班延误预测系统及方法 |
CN115527669A (zh) * | 2022-09-27 | 2022-12-27 | 杭州医康慧联科技股份有限公司 | 基于联邦学习的急性心梗数据处理方法和数据处理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017185711A1 (zh) | 控制智能设备的方法、装置、系统和存储介质 | |
CN108901020B (zh) | 网络接入的方法、移动终端及服务器 | |
US10454905B2 (en) | Method and apparatus for encrypting and decrypting picture, and device | |
CN111339572A (zh) | 云数据完整性的验证方法、系统、终端设备及存储介质 | |
CN111181909B (zh) | 一种身份信息的获取方法及相关装置 | |
CN109766705B (zh) | 一种基于电路的数据验证方法、装置及电子设备 | |
CN110572268B (zh) | 一种匿名认证方法和装置 | |
CN116541865A (zh) | 基于数据安全的密码输入方法、装置、设备及存储介质 | |
CN108933670B (zh) | 一种数字签名方法、装置、移动设备及存储介质 | |
CN114701394A (zh) | 一种换电电池云边协同控制方法、装置、终端与存储介质 | |
CN114547082A (zh) | 一种数据聚合的方法、相关装置、设备以及存储介质 | |
CN112231768B (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN104639394B (zh) | 客户端使用人数的统计方法、装置和系统 | |
CN110597840B (zh) | 基于区块链的伴侣关系建立方法、装置、设备及存储介质 | |
CN115270163B (zh) | 数据处理方法、相关装置及存储介质 | |
CN109451011B (zh) | 一种基于区块链的信息存储方法及移动终端 | |
CN114092101B (zh) | 交易验证方法、装置、存储介质及电子设备 | |
CN114553612B (zh) | 数据加密、解密方法、装置、存储介质及电子设备 | |
CN107786423A (zh) | 一种即时通讯的方法和系统 | |
CN115549889A (zh) | 解密方法、相关装置及存储介质 | |
CN115589281A (zh) | 解密方法、相关装置及存储介质 | |
CN109992939A (zh) | 一种登录方法及终端设备 | |
CN110191106A (zh) | 一种数据发送方法、终端及通信系统 | |
CN109743289B (zh) | 一种基于神经网络的数据验证方法、装置及电子设备 | |
CN111292224B (zh) | 一种图像处理方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |