CN114611722A - 一种基于聚类分析的安全横向联邦学习方法 - Google Patents
一种基于聚类分析的安全横向联邦学习方法 Download PDFInfo
- Publication number
- CN114611722A CN114611722A CN202210277784.7A CN202210277784A CN114611722A CN 114611722 A CN114611722 A CN 114611722A CN 202210277784 A CN202210277784 A CN 202210277784A CN 114611722 A CN114611722 A CN 114611722A
- Authority
- CN
- China
- Prior art keywords
- data
- data set
- training
- model
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000007621 cluster analysis Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 66
- 238000004364 calculation method Methods 0.000 claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 238000009826 distribution Methods 0.000 claims description 28
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 239000006185 dispersion Substances 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 7
- 238000007405 data analysis Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 abstract description 6
- 241000700605 Viruses Species 0.000 abstract description 4
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000145637 Lepturus Species 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于聚类分析的安全横向联邦学习方法,属于联邦学习数据安全性技术领域,通过采用密文计算的方式,让梯度值在密文的情况加进行计算,等计算完毕后在进行解密,通过聚类分析和服务器端参数的分析对比评分机制,来解决横向联邦学习中存在的数据投毒攻击和不诚实参与者问题,这在解决这个问题的同时,还可以在一定程度上提升训练的准确度,本发明方法通过同态加密的方式,实现在服务器上进行密态计算,来保证服务器上计算的安全性,本申请的方法主要是解决数据投毒和不诚实参与者的问题,可以在防止数据投毒和不诚实用户的同时,提高训练的准确度,并且通过同态加密的方式保证了梯度的安全性。
Description
技术领域
本发明属于学习数据安全性技术领域,具体为一种基于聚类分析的安全横向联邦学习方法。
背景技术
联邦学习是一种用来解决数据孤岛、数据集小的机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模,联邦学习在用户各自数据不出本地的前提下,通过加密机制或扰动机制下的参数交换与优化,建立一个共有模型,可是联邦学习中各参与方真的能够诚实的参与计算或则他们的数据是否已经遭到破坏,而且在数据交换和服务器计算的过程中是否存在安全的风险,针对上述存在问题,本发明在横向联邦学习方面,提出了一种基于聚类分析的安全横向联邦学习方法。
发明内容
(一)解决的技术问题
为了克服现有技术的上述缺陷,本发明提供一种基于聚类分析的安全横向联邦学习方法,以克服在联邦学习中遇到的安全性问题、参与者诚实性问题和服务端根据各节点上传的梯度之和推断出各节点的数据隐私的技术问题,本发明能够保障数据的隐私性,能够针对数据投毒进行防御,并提高训练模型的精确度。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:一种基于聚类分析的安全横向联邦学习方法,包括以下步骤:
S1、模型下载:首先用户从服务器下载初始模型;
S2、模型训练:通过初始模型对数据集进行清洗,去除数据集中的空值,然后再进行聚类分析,找出数据集中的离群点,最后进行模型训练得到训练后的参数,从而形成用户训练模型;
S3、数据集分析:用户的进行数据清洗后的数据集进行分析,针对于其分布情况,数据集的集中趋势(众数、中位数、均值)、数据的离散趋势(四分位差、极差、平均差、标准差)、数据的形状(峰度系数、偏度系数);
S4、参数传递:用户把训练完的参数发送到服务器,且用户发送的消息包括:
离群值在数据集中的占比、离群点数量、数据集的大小、模型训练后得到的参数;
数据集的集中趋势(众数、中位数、均值)、数据的离散趋势(四分位差、极差、平均差、标准差)、数据的形状(峰度系数、偏度系数);
模型训练后得到的参数,需进行同态加密,之后再进行传输;
S5、数据集的分布趋势分析:服务器进行数据分析和训练结果的密态加权平均,判断各个用户的数据集的分布趋势一致性,把数据分布趋势相似而且评价值高于60的训练梯度值进行计算,对梯度的处理,主要保证其在密态的情况下,进行加权平均计算;
S6、训练模型更新:用户获取新的参数信息,更新模型,重复S2-S6的步骤,直到训练模型达到训练轮次或者到达到设置的阈值。
作为本发明的进一步方案:所述S2的模型训练中,首先需要进行数据清洗去除其中的空值和零值,然后采用Kmeans聚类算法找出数据集中的离群点和离群簇,模型再拿数据进行训练,得到梯度wi。
作为本发明的进一步方案:所述S3的数据集分析中,主要分析数据集的参数:
集中趋势:众数、中位数、均值;
离散趋势:四分位差、极差、平均差、标准差;
数据集的形状:峰度系数、偏度系数。
作为本发明的进一步方案:所述S4中参与者需要发送给服务器的参数,离群值在数据集中的占比、离群点数量、数据集的大小、模型训练后得到的参数,数据集的集中趋势(众数、中位数、均值)、数据的离散趋势(四分位差、极差、平均差、标准差)、数据集的形状(峰度系数、偏度系数)、加密的梯度值,梯度和数据量的乘积的加密值wij。
作为本发明的进一步方案:所述S5中进行数据分析和梯度的密态加权平均,首先对收到的所有参数的数据进行分类整合,按照参数的重要性设置除了梯度外的每一个参数的评分值,评分规则按照各类型参数的正太的分布范围进行打分,只有数据评分达到60的参与者的梯度值才能参与最后的聚合,在梯度值确定之后,进行梯度值的密态的加权计算,
作为本发明的进一步方案:所述S6中获取到新的参数之后,需要把Δw解密,解密后的再除以新参数中聚合参数的数据量的和,达到新的Δw′,之后进行新一轮的训练,直到训练模型达到训练轮次或者到达到设置的阈值。
(三)有益效果
与现有技术相比,本发明的有益效果在于:本发明通过聚类分析和服务器端参数的分析对比评分机制,来解决横向联邦学习中存在的数据投毒攻击和不诚实参与者问题,这在解决这个问题的同时,还可以在一定程度上提升训练的准确度,本发明方法通过同态加密的方式,实现在服务器上进行密态计算,来保证服务器上计算的安全性,本申请的方法主要是解决数据投毒和不诚实参与者的问题,可以在防止数据投毒和不诚实用户的同时,提高训练的准确度,并且通过同态加密的方式保证了梯度的安全性。
附图说明
图1为本发明的流程示意图;
图2为本发明联邦学习框架的示意框图。
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
实施例:
如图1-2所示,本发明提供一种技术方案:一种基于聚类分析的安全横向联邦学习方法,包括以下步骤:
S1、模型下载:首先用户从服务器下载初始模型,且具体步骤如下:
S101、针对服务器上的安全计算的实施方式,可以从3种方式中选择:第一种是采用加法同态加密,公钥和私钥的产生可以选择从服务器发送一个公共的随机码,所有参与者有相同的公钥和私钥,梯度解密时,可以使用私钥进行解密,第二种是使用多密钥加法同态加密,该方法中每个参与者拥有相同的公钥和不同的私钥,梯度解密时需要所有参与者私钥共同进行解密,第三种是选定一个可信任的第三方来产生同态加密所需要的公钥和私钥,这种情况是基于服务器是不可信的状态,参与者们从三方手中获取公钥私钥,这样服务器是不能对梯度进行解密,此时获得公钥PK、私钥Sk。
S102、参与者第一次是从服务器上获取到模型,训练开始之后,每次从服务器上获取的参数主要是:加密的梯度和、生成密钥随机数、训练数据总数量Sum。
在步骤S1时,需要对梯度的加密方式进行选择,找到符合当前项目的一种加密方式,能够在一定程度上对梯度不同方位起到保护的作用。
S2、模型训练:通过初始模型对数据集进行清洗,去除数据集中的空值,然后再进行聚类分析,找出数据集中的离群点,最后进行模型训练得到训练后的参数,从而形成用户训练模型,且具体步骤如下:
S201、用户需要进行数据清洗,去除掉数据集中的空值和零值,用聚类分析的方法,找出数据集中的离群点或者离群簇,然后去除,具体的聚类算法可以自由选择,如基于距离的聚类算法Kmeans和Kmeans++、基于密度的聚类算法DBSCAN,针对不同的特点的数据集选择具体的聚类算法。
S202、在数据清洗后,进行训练模型,得到梯度值,然后将梯度值和训练的数据量进行相乘得到新的值ω′,使用公钥PK进行加密。
S3、数据集分析:用户的进行数据清洗后的数据集进行分析,针对于其分布情况,数据集的集中趋势(众数、中位数、均值)、数据的离散趋势(四分位差、极差、平均差、标准差)、数据的形状(峰度系数、偏度系数)。
S4、参数传递:用户把训练完的参数发送到服务器,且用户发送的消息包括:
离群值在数据集中的占比、离群点数量、数据集的大小、模型训练后得到的参数。
数据集的集中趋势(众数、中位数、均值)、数据的离散趋势(四分位差、极差、平均差、标准差)、数据的形状(峰度系数、偏度系数)。
模型训练后得到的参数,需进行同态加密,之后再进行传输。
S5、数据集的分布趋势分析:服务器进行数据分析和训练结果的密态加权平均,判断各个用户的数据集的分布趋势一致性,把数据分布趋势相似而且评价值高于60的训练梯度值进行计算,对梯度的处理,主要保证其在密态的情况下,进行加权平均计算,且具体步骤如下:
S501、服务器在收集到所有参与者发送的参数之后,对各类参数进行分类和编号,然后对各个类型的参数性进行分析、评分,进行分析的正太分布函数,公式为:
其中μ为均数,σ为标准差,计算出各类参数的μ和σ,然后根据参数的重要性进行评价,评价以100分为满分,对于离群值的数量和离群值的占比的分值设定为5分和25分,离群值是很重要的一个评价指标分值较高,数据集的集中趋势中众数、中位数、均值分别占5分、5分、10分,数据的离散趋势中四分位差、极差、平均差、标准差分别占5分、5分、5分、5分、5分,数据分布的形状中峰态系数、偏态系数分别占15分、15分,分数的计算分值的公式为:
其中P为分段分值分值,S为该函数的(μ-σ,μ+σ)、(μ-2σ,μ+2σ)、(μ-3σ,μ+4σ)的面积对应范围的面积每个范围对应的分值范围是(70%P+30%P*Qi)、(50%P+20%P*Qi)、(50%P*Qi),Si为某类型参数在正太分布中的面积,Qi为面积范围内的占比,Pi为某一类型的参数具体评分。
S502、在S501得到评分结果后,对评分大于60的参与者的梯度进行聚合,在服务器上,只进行聚合操作,平均操作在参与者获取到聚合的梯度进行解密后,再除以总的数据量,数据量是参与聚合的数据总量。
S6、训练模型更新:用户获取新的参数信息,更新模型,重复S2-S6的步骤,直到训练模型达到训练轮次或者到达到设置的阈值。
S2的模型训练中,首先需要进行数据清洗去除其中的空值和零值,然后采用Kmeans聚类算法找出数据集中的离群点和离群簇,在参与者端完成聚类分析后,需要去除掉数据集中的离群值并统计离群值的数量为Li,其目的是为了提升训练的准确率,在确定该次训练的数据量Si之后进行预先设定模型的训练,得到梯度wi。
其中K值的确定在初始模型中,可以根据两种方式来进行确定:第一种是预先知道训练数据集的种类,设定具体的K值,第二种是给K设定一个范围,取最优结构为K的具体值。
S3的数据集分析中,主要分析数据集的参数:
集中趋势:众数、中位数、均值。
离散趋势:四分位差、极差、平均差、标准差。
数据集的形状:峰度系数、偏度系数。
S4中参与者需要发送给服务器的参数,离群值在数据集中的占比、离群点数量、数据集的大小、模型训练后得到的参数,数据集的集中趋势(众数、中位数、均值)、数据的离散趋势(四分位差、极差、平均差、标准差)、数据集的形状(峰度系数、偏度系数)、加密的梯度值,梯度和数据量的乘积的加密值wij。
S5中进行数据分析和梯度的密态加权平均,首先对收到的所有参数的数据进行分类整合,按照参数的重要性设置除了梯度外的每一个参数的评分值,评分规则按照各类型参数的正太的分布范围进行打分,只有数据评分达到60的参与者的梯度值才能参与最后的聚合,在梯度值确定之后,进行梯度值的密态的加权计算,
S6中获取到新的参数之后,需要把Δw解密,解密后的再除以新参数中聚合参数的数据量的和,达到新的Δw′,之后进行新一轮的训练,直到训练模型达到训练轮次或者到达到设置的阈值。
S3中,数据集的集中趋势需要计算的参数:众数、中位数(对于数据集合,将所有的数值按照它们的大小,从高到低或从低到高进行排序,若数据集合包含的数值个数是基数,那么排在最中间的数值就是该数据集合的中位数,若数据集合的数值个数是偶数,那么取最中间两个数值的算术平均值作为中位数)、均值几何均数(考虑到几何均数在实际情况下数值太大,得不到结果,可以不使用)。
数据集的离散趋势需要计算的参数:四分位差(反映中间50%数据的离散程度,其数值越小,说明中间的数据越集中,其数值越大,说明中间的数据越分散)、极差(是标志值变动的最大范围,是测定标志变动的最简单的指标)、平均差(数据分布中所有原始数据与平均数距离的绝对值的平均)、标准差(一组数据平均值分散程度的一种度量,较大的标准差,代表大部分数值和其平均值之间差异较大,较小的标准差,代表这些数值较接近平均值)。
数据集的分布形状需要计算的参数:偏度系数(描述分布偏离对称性程度的一个特征数,当分布左右对称时,偏度系数为0,当偏度系数大于0时,即重尾在右侧时,称该分布为右偏(正偏态),当偏度系数小于0,即重尾在左侧时,称该分布为左偏(负偏态))、峰度系数(表征概率密度分布曲线在平均值处峰值高低的特征数,峰度反映了峰部的尖度,峰度包括正态分布(峰度值=3),厚尾(峰度值>3),瘦尾(峰度值<3)。
S4中,数据在训练完成后,发送到服务器,服务器对所有参与者发送的参数进行整理、分析喝评价,针对数据集的各项指标的重要程度,进行一个分值的设定,打分的规则可以自行设计,在此主要根据所有参与者的数据指标知否满足正太分布,根据分布的一个范围来进行指标分值的计算,当参与者的参数值在P(μ-σ≤X≤μ+σ)范围,其计算分值在7-10,计算公式:(70%P+30%P*Qi),当参数值在P(μ-2σ≤X≤μ-σ,μ+σ≤X≤μ+2σ)范围,计算分值在5-7,计算公式:(50%P+20%P*Qi),当参数值P(X≤μ-3σ,X≥μ+3σ)时,计算分值在0-5,计算公式:(50%P*Qi),其中P为该参数的评价分数,Qi为该参与者参数的一个占比。
S5中,在服务器计算分析完说有参数,得到的评分结果大于60的参与者的梯度值是可信任的参数,服务器对可信任的参数进行联合平均,采用FedAvg算法,与正常的算法不同的地方在于本方法在服务器上是进行密态的加法运算,保证用户数的安全性。
参与者在获取到新的密态梯度值后,需要进行解密得到梯度值需要除以所有合格参与者的数据总量和,得到真正的平均梯度值,然后进行下一轮的运算,知道训练轮次达到阈值或者达到设定的训练准确率后,训练结束。
本说明书实施例所提供的技术方案,通过对参与者的数据集进行分析来实现对投毒攻击或者恶意用户防御,保证模型的训练效果,通过同态加密的方式,梯度在服务器上进行密态计算,保障了数据的安全性。
综上所得:
本法方法中对于通信效率的考量是根据用户的可接受度和训练设备的环境设定,训练方式可以多种规则存在,如:可以根据训练的准确达到一定的阶段,进行聚合运算,也可以根据达到一定的训练轮次,下一步进行聚合运算,可以根据使用者的真实诉求来进行详细的设定。
本方法本不仅仅是为了安全性,而牺牲掉模型的准确性,相反,数据分析机制和评价机制的存在,反而对于模型准确性是有提升的,而且对于安全性相比之前的方案,安全得到更大的提升。
本方法能够对参与者的数据集进行一定程度的分析,并且通过多参与者结合分析的方式,根据共同任务数据集分布的一致性和相似性,来比较出差异的数据集,找出存在数据投毒攻击或者不诚实的恶意参与者,从而保证训练模型的准确率。
在联邦学习框架下,通常由服务端负责根据节点上传的梯度更新模型参数,并将模型参数下发给节点,由节点基于模型参数与本地训练样本计算梯度,但是梯度若是在传输或者服务器上发生泄漏,那么攻击者很有可能根据获得的梯度值,推断出各个节点的训练样本,服务端也有可能由各节点上传的梯度之和推断出各节点的数据隐私,对于这个问题,本问采用密文计算的方式,让梯度值在密文的情况加进行计算,等计算完毕后在进行解密,这样可以使各个参与者的梯度在传输和服务器的安全性大大提升,能够有效的抵御存在的风险。
上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下作出各种变化。
Claims (6)
1.一种基于聚类分析的安全横向联邦学习方法,其特征在于,包括以下步骤:
S1、模型下载:首先用户从服务器下载初始模型;
S2、模型训练:通过初始模型对数据集进行清洗,去除数据集中的空值,然后再进行聚类分析,找出数据集中的离群点,最后进行模型训练得到训练后的参数,从而形成用户训练模型;
S3、数据集分析:用户的进行数据清洗后的数据集进行分析,针对于其分布情况,数据集的集中趋势(众数、中位数、均值)、数据的离散趋势(四分位差、极差、平均差、标准差)、数据的形状(峰度系数、偏度系数);
S4、参数传递:用户把训练完的参数发送到服务器,且用户发送的消息包括:
离群值在数据集中的占比、离群点数量、数据集的大小、模型训练后得到的参数;
数据集的集中趋势(众数、中位数、均值)、数据的离散趋势(四分位差、极差、平均差、标准差)、数据的形状(峰度系数、偏度系数);
模型训练后得到的参数,需进行同态加密,之后再进行传输;
S5、数据集的分布趋势分析:服务器进行数据分析和训练结果的密态加权平均,判断各个用户的数据集的分布趋势一致性,把数据分布趋势相似而且评价值高于60的训练梯度值进行计算,对梯度的处理,主要保证其在密态的情况下,进行加权平均计算;
S6、训练模型更新:用户获取新的参数信息,更新模型,重复S2-S6的步骤,直到训练模型达到训练轮次或者到达到设置的阈值。
2.根据权利要求1所述的一种基于聚类分析的安全横向联邦学习方法,其特征在于:所述S2的模型训练中,首先需要进行数据清洗去除其中的空值和零值,然后采用Kmeans聚类算法找出数据集中的离群点和离群簇,模型再拿数据进行训练,得到梯度wi。
3.根据权利要求2所述的一种基于聚类分析的安全横向联邦学习方法,其特征在于:所述S3的数据集分析中,主要分析数据集的参数:
集中趋势:众数、中位数、均值;
离散趋势:四分位差、极差、平均差、标准差;
数据集的形状:峰度系数、偏度系数。
4.根据权利要求3所述的一种基于聚类分析的安全横向联邦学习方法,其特征在于:所述S4中参与者需要发送给服务器的参数,离群值在数据集中的占比、离群点数量、数据集的大小、模型训练后得到的参数,数据集的集中趋势(众数、中位数、均值)、数据的离散趋势(四分位差、极差、平均差、标准差)、数据集的形状(峰度系数、偏度系数)、加密的梯度值,梯度和数据量的乘积的加密值wij。
6.根据权利要求5所述的一种基于聚类分析的安全横向联邦学习方法,其特征在于:所述S6中获取到新的参数之后,需要把Δw解密,解密后的再除以新参数中聚合参数的数据量的和,达到新的Δw′,之后进行新一轮的训练,直到训练模型达到训练轮次或者到达到设置的阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210277784.7A CN114611722B (zh) | 2022-03-16 | 2022-03-16 | 一种基于聚类分析的安全横向联邦学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210277784.7A CN114611722B (zh) | 2022-03-16 | 2022-03-16 | 一种基于聚类分析的安全横向联邦学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114611722A true CN114611722A (zh) | 2022-06-10 |
CN114611722B CN114611722B (zh) | 2024-05-24 |
Family
ID=81865573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210277784.7A Active CN114611722B (zh) | 2022-03-16 | 2022-03-16 | 一种基于聚类分析的安全横向联邦学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114611722B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118368053A (zh) * | 2024-06-17 | 2024-07-19 | 山东大学 | 一种基于分片区块链的链上链下协同安全计算方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364943A (zh) * | 2020-12-10 | 2021-02-12 | 广西师范大学 | 一种基于联邦学习的联邦预测方法 |
US11017322B1 (en) * | 2021-01-28 | 2021-05-25 | Alipay Labs (singapore) Pte. Ltd. | Method and system for federated learning |
WO2021169577A1 (zh) * | 2020-02-27 | 2021-09-02 | 山东大学 | 一种基于加权联邦学习的无线业务流量预测方法 |
WO2021179720A1 (zh) * | 2020-10-12 | 2021-09-16 | 平安科技(深圳)有限公司 | 基于联邦学习的用户数据分类方法、装置、设备及介质 |
CN113434873A (zh) * | 2021-06-01 | 2021-09-24 | 内蒙古大学 | 一种基于同态加密的联邦学习隐私保护方法 |
WO2021190638A1 (zh) * | 2020-11-24 | 2021-09-30 | 平安科技(深圳)有限公司 | 基于非均匀分布数据的联邦建模方法及相关设备 |
WO2021223873A1 (en) * | 2020-05-08 | 2021-11-11 | Ecole Polytechnique Federale De Lausanne (Epfl) | System and method for privacy-preserving distributed training of machine learning models on distributed datasets |
WO2022007889A1 (zh) * | 2020-07-08 | 2022-01-13 | 浙江工商大学 | 基于区块链与同态加密的可搜索加密数据共享方法及系统 |
-
2022
- 2022-03-16 CN CN202210277784.7A patent/CN114611722B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021169577A1 (zh) * | 2020-02-27 | 2021-09-02 | 山东大学 | 一种基于加权联邦学习的无线业务流量预测方法 |
WO2021223873A1 (en) * | 2020-05-08 | 2021-11-11 | Ecole Polytechnique Federale De Lausanne (Epfl) | System and method for privacy-preserving distributed training of machine learning models on distributed datasets |
WO2022007889A1 (zh) * | 2020-07-08 | 2022-01-13 | 浙江工商大学 | 基于区块链与同态加密的可搜索加密数据共享方法及系统 |
WO2021179720A1 (zh) * | 2020-10-12 | 2021-09-16 | 平安科技(深圳)有限公司 | 基于联邦学习的用户数据分类方法、装置、设备及介质 |
WO2021190638A1 (zh) * | 2020-11-24 | 2021-09-30 | 平安科技(深圳)有限公司 | 基于非均匀分布数据的联邦建模方法及相关设备 |
CN112364943A (zh) * | 2020-12-10 | 2021-02-12 | 广西师范大学 | 一种基于联邦学习的联邦预测方法 |
US11017322B1 (en) * | 2021-01-28 | 2021-05-25 | Alipay Labs (singapore) Pte. Ltd. | Method and system for federated learning |
CN113434873A (zh) * | 2021-06-01 | 2021-09-24 | 内蒙古大学 | 一种基于同态加密的联邦学习隐私保护方法 |
Non-Patent Citations (3)
Title |
---|
BAGDASARYAN E ET AL: "How To Backdoor Federated Learning", 《INTERNATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE AND STATISTICS. PALERMO:PMLR》, 31 December 2020 (2020-12-31) * |
杨明等: "基于信誉评估机制和区块链的移 动网络联邦学习方案", 《网络与信息安全学报》, vol. 07, no. 06, 31 December 2021 (2021-12-31) * |
董业;侯炜;陈小军;曾帅;: "基于秘密分享和梯度选择的高效安全联邦学习", 计算机研究与发展, no. 10, 9 October 2020 (2020-10-09) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118368053A (zh) * | 2024-06-17 | 2024-07-19 | 山东大学 | 一种基于分片区块链的链上链下协同安全计算方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114611722B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Blockchain and federated learning for collaborative intrusion detection in vehicular edge computing | |
CN111600707B (zh) | 一种在隐私保护下的去中心化联邦机器学习方法 | |
CN112906903A (zh) | 网络安全风险预测方法、装置、存储介质及计算机设备 | |
Reichardt et al. | Partitioning and modularity of graphs with arbitrary degree distribution | |
CN103414711B (zh) | 基于信任的网络群体异常感知方法 | |
CN113806768A (zh) | 基于去中心化安全聚合的轻量级联邦学习隐私保护方法 | |
CN110866263B (zh) | 一种可对抗纵向攻击的用户隐私信息保护方法及系统 | |
Jiang et al. | Federated dynamic graph neural networks with secure aggregation for video-based distributed surveillance | |
CN114611722B (zh) | 一种基于聚类分析的安全横向联邦学习方法 | |
CN115630328A (zh) | 应急物流网络中关键节点的识别方法 | |
CN117521151B (zh) | 一种基于区块链的去中心化联邦学习数据共享方法 | |
Wang et al. | Ranking the key nodes with temporal degree deviation centrality on complex networks | |
CN112560059A (zh) | 一种基于神经通路特征提取的垂直联邦下模型窃取防御方法 | |
CN115293256A (zh) | 一种由区块链辅助的联邦学习无线网络模型 | |
CN117094412A (zh) | 针对非独立同分布医疗场景下的联邦学习方法和装置 | |
Dey et al. | Social network analysis | |
Malladi et al. | Decentralized aggregation design and study of federated learning | |
CN116541831B (zh) | 一种基于区块链与联邦学习的双重防御方法 | |
CN105471844B (zh) | 一种基于信任合成的云服务动态组合方法 | |
CN112085051A (zh) | 基于加权投票的图像分类方法、系统及电子设备 | |
Yang et al. | Dishonest behaviors in online rating systems: cyber competition, attack models, and attack generator | |
CN117151616A (zh) | 一种基于联邦学习的高校精准资助系统及方法 | |
CN116204925A (zh) | 一种强鲁棒性智慧城市边缘计算数据安全系统及方法 | |
CN114862416B (zh) | 一种联邦学习环境下的跨平台信用评价方法 | |
CN108366048B (zh) | 一种基于无监督学习的网络入侵检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |