CN114970886B - 一种基于聚类的自适应鲁棒协作学习方法和装置 - Google Patents
一种基于聚类的自适应鲁棒协作学习方法和装置 Download PDFInfo
- Publication number
- CN114970886B CN114970886B CN202210843405.6A CN202210843405A CN114970886B CN 114970886 B CN114970886 B CN 114970886B CN 202210843405 A CN202210843405 A CN 202210843405A CN 114970886 B CN114970886 B CN 114970886B
- Authority
- CN
- China
- Prior art keywords
- trusted
- local
- credible
- model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 95
- 230000002776 aggregation Effects 0.000 claims description 36
- 238000004220 aggregation Methods 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 abstract description 14
- 238000010586 diagram Methods 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 231100000572 poisoning Toxicity 0.000 description 1
- 230000000607 poisoning effect Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/57—Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种基于聚类的自适应鲁棒协作学习方法和装置,其中,该方法包括:获取多个协作终端上传的局部模型以及多个协作终端训练局部模型的至少部分训练数据,并根据至少部分训练数据训练可信全局模型;以可信全局模型参数为信任引导,根据预先确定的最佳聚类算法分别对局部模型的每个参数维度上进行聚类操作;根据可信局部模型参数和可信全局模型参数的相似度确定可信局部模型参数的权重以对可信全局模型参数进行更新。本发明能够针对性的在协作学习过程中准确区分出良性模型和恶意模型,防御某一个或者某几个局部恶意模型对全局模型以及其他良性协作者的局部良性模型开展恶意攻击,全面提升协作学习的鲁棒性。
Description
技术领域
本发明涉及智能协作中的协作学习安全技术领域,特别涉及一种基于聚类的自适应鲁棒协作学习方法和装置。
背景技术
随着机器学习模型在诸如恶意流量检测、智能拥塞控制、无人驾驶汽车等众多应用领域的普及和应用,数据对于模型表现性能的影响显得越来越重要,能否收集到可靠高质量的数据成为制约机器学习模型表现性能的一个重要因素。在实际应用场景中,出于安全和隐私的考虑,数据在各个行业、组织甚至同一个公司的各个部门之间以“数据孤岛”的形式存在。这极大的限制了机器学习模型在现实生活中的广泛部署与应用。
为此,协作学习在保证数据隐私的基础上可以让多个组织(或者设备,或者个体)的数据一同参与到协作学习过程中,从而得到一个能够适应各种数据的全局模型。具体地,协作学习涉及到多个协作者,每个协作者利用自己本地拥有的数据训练一个局部模型。这些局部模型可以通过中心服务器进行聚合,也可以采用P2P等形式进行聚合,聚合后的模型称为全局模型。随后,全局模型再次分发至所有协作者,供协作者在全局模型的基础上继续利用各自的本地数据再训练协作模型。如此迭代,直至全局模型收敛。作为一种分布式的智能协作框架,协作学习不仅解决了数据孤岛的问题,相比于传统的集中式学习方法,它同时缓解了计算资源和网络传输的压力。
然而,新技术会带来新问题。协作学习虽然解决了数据孤岛的问题,但是出于对每个协作者隐私的保护,中心服务器(或者开展聚合操作的特定协作者)不可能监控每个协作者的训练过程。因此,一些恶意的攻击者可以通过参与协作学习的训练过程或控制协作学习中的良性协作者来产生恶意行为,通过数据投毒的方式使得训练出的全局模型不可用(或者存在安全漏洞)。具体地,投毒攻击、后门攻击等对抗攻击往往通过篡改数据集的方式来实现。恶意攻击者(或者被恶意攻击者控制的协作者)利用篡改后的数据集训练得到的模型称为恶意模型(或者局部恶意模型),良性协作者利用本地未进行任何恶意数据篡改的数据集训练得到的模型称为良性模型(或者局部良性模型)。一旦恶意模型在聚合阶段与其他良性模型一同聚合形成新的全局模型,意味着随后的全局模型以及良性模型遭遇了对抗攻击,将会丧失原有的能力(如高准确度),即丧失了模型的鲁棒性。
因此,研究如何在有恶意协作者参与的情况下实现鲁棒的模型聚合十分必要。一些现存的鲁棒协作学习仅仅是通过距离公式及统计规则来在模型聚合阶段区分可能的恶意协作者或者恶意协作者提供的恶意模型,不能根据不同的任务自适应地改变聚合策略,因此会在不同任务上有不同的性能表现。总的来说,构建一种根据不同任务的自适应鲁棒协作学习方法十分必要。
发明内容
本发明旨至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明提出一种基于聚类的自适应鲁棒协作学习方法和装置,解决了现有的鲁棒协作学习方法仅通过计算距离等方式来区分良性协作者的良性模型和恶意协作者的恶意模型,区分方式不够灵活的缺陷;同时还解决了现有的方法不能针对不同的任务来自适应地调整防御策略,导致在不同任务以及不同的数据类型和规模上表现性能不一样的问题。相比计算距离的方式,利用聚类方法的模式可以更加灵活地区分良性协作者的良性模型和恶意协作者的恶意模型,并通过在不同任务和数据上选择不同的聚类方法来实现针对任务的自适应,以达到在不同任务、不同数据类型和数据规模上均可以表现出最佳性能的目的。
本发明实施例提出了一种基于聚类的自适应鲁棒协作学习方法,包括以下步骤:
获取多个协作终端上传的局部模型以及所述多个协作终端训练所述局部模型的至少部分训练数据,并根据所述至少部分训练数据训练可信全局模型;
以所述可信全局模型的可信全局模型参数为信任引导,根据预先确定的最佳聚类算法分别对所述局部模型的每个参数维度上进行聚类操作,得到可信局部模型和所述可信局部模型的可信局部模型参数;
根据所述可信局部模型参数和可信全局模型参数的相似度确定所述可信局部模型参数的权重,并根据所述可信局部模型参数和所述可信局部模型参数的权重对所述可信全局模型参数进行更新。
另外,根据本发明上述实施例的基于聚类的自适应鲁棒协作学习方法可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,在根据所述至少部分训练数据训练可信全局模型之前,还包括:对所述至少部分训练数据进行检验,将检验结果为恶意信息的训练数据从所述至少部分训练数据中剔除。
进一步地,在本发明的一个实施例中,在根据预先确定的最佳聚类算法分别对所述局部模型的每个参数维度上进行聚类操作之前,还包括:获取候选聚类算法集合;在可信数据集上依次用所述候选聚类算法集合中的聚类算法进行聚类操作,以从所述候选聚类算法集合中确定所述最佳聚类算法。
进一步地,在本发明的一个实施例中,根据所述可信局部模型参数和可信全局模型参数的相似度确定所述可信局部模型参数的权重,包括:根据预先确定的相似度计算方法,得到所述可信局部模型参数与可信全局模型参数的相似度;对所述相似度进行归一化操作得到所述可信局部模型参数的权重。
进一步地,在本发明的一个实施例中,在根据所述可信局部模型参数和所述可信局部模型参数的权重对所述可信全局模型参数进行更新之后,还包括:确定是否达到训练终止条件,在达到所述训练终止条件时,将所述可信全局模型分发给所述多个协作终端,停止训练;在未达到所述训练终止条件时,将所述可信全局模型分发给所述多个协作终端,并继续局部训练和模型聚合。
进一步地,在本发明的一个实施例中,所述训练终止条件包括下述中的任意一种:所述可信全局模型的损失函数值小于预设的损失函数阈值;训练轮数达到预设轮数。
本发明实施例提出一种基于聚类的自适应鲁棒协作学习装置,包括:
全局模型训练模块,用于获取多个协作终端上传的局部模型以及所述多个协作终端训练所述局部模型的至少部分训练数据,并根据所述至少部分训练数据训练可信全局模型;
模型参数聚类模块,用于以所述可信全局模型的可信全局模型参数为信任引导,根据预先确定的最佳聚类算法分别对所述局部模型的每个参数维度上进行聚类操作,得到可信局部模型和所述可信局部模型的可信局部模型参数;
模型参数更新模块,用于根据所述可信局部模型参数和可信全局模型参数的相似度确定所述可信局部模型参数的权重,并根据所述可信局部模型参数和所述可信局部模型参数的权重对所述可信全局模型参数进行更新。
本发明实施例的基于聚类的自适应鲁棒协作学习方法和装置,能够针对性的在协作学习过程中准确区分出良性模型和恶意模型,防御某一个或者某几个局部恶意模型对全局模型以及其他良性协作者的局部良性模型开展恶意攻击,全面提升协作学习的鲁棒性。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例的基于聚类的自适应鲁棒协作学习方法的流程图;
图2为本发明实施例的通过聚类操作确定最佳聚类算法的流程图;
图3为本发明实施例的根据相似度确定可信局部模型参数的权重流程图;
图4为本发明实施例的基于聚类的自适应鲁棒协作学习装置的结构示意图;
图5为本发明实施例的模型参数聚类模块结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参照附图描述根据本发明实施例提出的基于聚类的自适应鲁棒协作学习方法和装置。
图1是本发明实施例的基于聚类的自适应鲁棒协作学习方法的流程图。
步骤S1,获取多个协作终端上传的局部模型以及多个协作终端训练局部模型的至少部分训练数据,并根据至少部分训练数据训练可信全局模型。
具体的,中心服务器(或者开展聚合操作的特定协作者)训练全局模型和所有协作者分别训练各自的局部模型。
可以理解的是,中心服务器(或者开展聚合操作的特定协作者)向每个协作者收集一个小型的数据集来保证随着协作者训练同步训练一个中心服务器(或者开展聚合操作的特定协作者)的可信全局模型,如中心服务器(或者开展聚合操作的特定协作者)随机收集每个协作者1%的数据。
作为一种示例,需要对至少部分训练数据进行检验,将检验结果为恶意信息的训练数据从至少部分训练数据中剔除。
具体的,中心服务器(或者开展聚合操作的特定协作者)对收集到的数据进行检验,以确定每个协作者发送的数据都是不带有恶意信息(比如后门信息)的数据。
进一步地,每个协作者在每一轮的训练过程中用自己拥有的本地数据训练局部模型,并在训练结束后将自己的局部模型参数表示发送给中心服务器(或者开展聚合操作的特定协作者)。其中,表示第个协作者的第j个参数,M表示模型所有参数的总个数,K表示协作者的总个数。特别地,协作者发送的是局部模型是采用参数表示,而不是采用梯度表示。
步骤S2,以可信全局模型的可信全局模型参数为信任引导,根据预先确定的最佳聚类算法分别对局部模型的每个参数维度上进行聚类操作,得到可信局部模型和可信局部模型的可信局部模型参数。
具体的,中心服务器(或者开展聚合操作的特定协作者)通过在可信数据集上测试聚类算法的性能表现来选择针对特定任务和数据的最佳聚类算法。以中心服务器(或者开展聚合操作的特定协作者)的可信全局模型参数表示为信任引导,分别在协作者的每个参数维度上实施聚类操作判断协作者每个维度的模型参数是否可信。
可以理解的是,本发明实施例对所有协作者的局部模型和中心服务器(或者开展聚合操作的特定协作者)的可信全局模型,在每个参数维度j上实施聚类操作X,将和中心服务器(或者开展聚合操作的特定协作者)的可信全局模型的参数分为同一个类别的协作者局部模型的参数认定为可信局部模型参数,也就是说,对于第j个参数,把中心服务器的可信全局模型第j个参数所在的聚类集合记为可信参数集合,对于每个协作者的局部模型的第j个参数,如果,则认为第i个协作者的第j个参数是可信的,否则是不可信的;
图2为本发明实施例所提供的通过聚类操作确定最佳聚类算法的流程图,如图2所示,在一个实施例中,在根据预先确定的最佳聚类算法分别对局部模型的每个参数维度上进行聚类操作之前,包括以下子步骤:
步骤S21,获取候选聚类算法集合。
可以理解的是,根据已知的任务信息、数据信息以及聚类算法需要的参数构建备选聚类算法集合,如常用的聚类算法K-Means、DBSCAN算法、Agglomerative层次聚类、Divisive层次聚类,等等。备选聚类算法集合记为。
步骤S22,在可信数据集上依次用候选聚类算法集合中的聚类算法进行聚类操作,以从候选聚类算法集合中确定最佳聚类算法。
具体的,中心服务器(或者开展聚合操作的特定协作者)在收集的可信数据集(由所有协作者上传的至少部分训练数据共同构成)上依次用备选聚类算法集合中的聚类算法实施聚类操作,并计算每种聚类算法对每个数据的类别判断是否正确,其中,每一类所属类别由类中多数数据所属的真实类别来定义,对每一个聚类方法,计算类别判断精确率为:
其中,代表一种特定的聚类算法,表示在中心服务器(或者开展聚合操作的特定协作者)的数据上聚类算法x类别判断正确的样本个数,N表示中心服务器(或者开展聚合操作的特定协作者)的数据样本总个数;选择类别判断精确率最大的聚类算法记为x,用于后续判断每个协作者的局部模型是否可信。
步骤S3,根据可信局部模型参数和可信全局模型参数的相似度确定可信局部模型参数的权重,并根据可信局部模型参数和可信局部模型参数的权重对可信全局模型参数进行更新。
具体的,对于可信的协作者的可信局部模型以和中心服务器(或者开展聚合操作的特定协作者)的可信全局模型的相似性作为指标为每个可信局部模型参数分配不同的权重,再通过加权求和得到下一轮的可信全局模型。
图3为本发明实施例所提供的根据相似度确定可信局部模型参数的权重,如图3所示,在一个实施例中,根据可信局部模型参数和可信全局模型参数的相似度确定可信局部模型参数的权重,包括以下子步骤:
步骤S31,根据预先确定的相似度计算方法,得到可信局部模型参数与可信全局模型参数的相似度。
其中,表示中心服务器(或者开展聚合操作的特定协作者)的可信全局模型的第j个参数,表示第i个协作者局部模型的第j个参数,表示第i个协作者局部模型的第j个参数与中心服务器(或者开展聚合操作的特定协作者)的可信全局模型第j个参数的相似性,将其作为计算权重的依据。
步骤S32,对相似度进行归一化操作得到可信局部模型参数的权重。
由此,将更新后的可信全局模型分发给所有协作者,并从步骤S1继续执行,直至模型收敛或者达到训练要求的轮数。
进一步地,在根据可信局部模型参数和可信局部模型参数的权重对可信全局模型的参数进行更新之后,确定是否达到训练终止条件,在达到训练终止条件时,将可信全局模型分发给多个协作终端,不在开展训练;在未达到训练终止条件时,将可信全局模型分发给多个协作终端,并继续开展局部训练和模型聚合。
具体的,通过损失函数的变化或者训练轮数来决定模型是否收敛,以此来判断是否应该终止协作学习的训练。如可以设置损失函数的值小于预先设定的L时终止训练,或者当训练论述达到预先设定的E轮时终止训练。
综上所述,本发明能够有效地针对不同任务自适应地调整协作学习模型聚合方法,并准确区分出协作学习过程中潜在的局部恶意模型或者恶意协作者,在模型训练阶段保障协作学习的鲁棒性。相比以往的协作学习聚合方法,本方法从区分元素、区分粒度、区分方法三个方面对聚合方法进行了改进。在区分元素上,使用模型参数本身而不是参数对应的梯度,这是由于参数本身累计了以往的梯度信息,在区分良性模型和恶意模型上具有更加明显和稳定的区分效果。在区分粒度上,针对模型的每个参数分别利用区分方法辨别该参数是服务于良性模型还是服务于恶意模型,这是因为即使是恶意模型,不是每一个模型的参数都带有恶意信息,比如关于文字识别的恶意模型的embedding layer的参数和部分bias参数仍然服务于良性模型。因此,将区分粒度设置为每个参数有助于在保证正确区分每个参数的情况下最大限度的利用每个参数的良性信息。在区分方法上,使用多个聚类算法构成备选聚类算法集合,使得可以针对不同的任务选择不同的聚类算法,来达到针对特定任务的自适应能力,并且,使用聚类算法来区分良性模型和恶意模型,相比于以往的根据计算距离的方式更加灵活。通过以上三点实现了针对任务的自适应鲁棒协作学习聚合方法,能够针对性的在协作学习过程中准确区分出良性模型和恶意模型,防御某一个或者某几个局部恶意模型对全局模型以及其他良性协作者的局部良性模型开展恶意攻击,全面提升协作学习的鲁棒性。
综上本发明的有益效果为:
在协作学习的应用中,出于隐私保护的原因,中心服务器(或者开展聚合操作的特定协作者)不能监控每个协作者的训练数据和训练过程,这让一些恶意协作者有机可乘,恶意协作者可以通过直接参与协作学习训练过程或者控制良性协作者在训练过程中产生恶意行为使得全局模型不可用或者带有特定的后门,从而威胁全局模型的可用性。现有的鲁棒协作学习方法主要是将模型的更新梯度合并成一维向量,通过计算距离来判断协作者的局部模型是否参与到聚合过程中。现有的聚合方法流程固定,不能根据不同的任务自适应地改变,导致在不同任务上性能表现不稳定。除此之外,现有的鲁棒聚合方法将所有参数合成一维的向量,由于即使是恶意协作者的局部恶意模型也不是每个参数都包含恶意信息。因此,现有的合成一维向量,然后统一判断协作者局部模型是否是恶意模型的方式会对判断结果有影响。
根据本发明是实施例的基于聚类的自适应鲁棒协作学习方法,能够针对性的在协作学习过程中准确区分出良性模型和恶意模型,防御某一个或者某几个局部恶意模型对全局模型以及其他良性协作者的局部良性模型开展恶意攻击,全面提升协作学习的鲁棒性。
其次参照附图描述根据本发明实施例提出的基于聚类的自适应鲁棒协作学习装置。
图4是本发明一个实施例的基于聚类的自适应鲁棒协作学习装置的结构示意图。
如图4所示,该装置10包括:全局模型训练模块100、模型参数聚类模块200和模型参数更新模块300。
全局模型训练模块100,用于获取多个协作终端上传的局部模型以及多个协作终端训练局部模型的至少部分训练数据,并根据至少部分训练数据训练可信全局模型;
模型参数聚类模块200,用于以可信全局模型的可信全局模型参数为信任引导,根据预先确定的最佳聚类算法分别对局部模型的每个参数维度上进行聚类操作,得到可信局部模型和可信局部模型的可信局部模型参数;
模型参数更新模块300,用于根据可信局部模型参数和可信全局模型参数的相似度确定可信局部模型参数的权重,并根据可信局部模型参数和可信局部模型参数的权重对可信全局模型参数进行更新。
进一步地,上述全局模型训练模块100,还用于对至少部分训练数据进行检验,将检验结果为恶意信息的训练数据从至少部分训练数据中剔除。
进一步地,上述模型参数聚类模块200,还用于获取候选聚类算法集合,并在可信数据集上依次用候选聚类算法集合中的聚类算法进行聚类操作,以从候选聚类算法集合中确定最佳聚类算法。
进一步地,如图5所示,模型参数聚类模块200,包括:
相似度计算单元201,用于根据预先确定的相似度计算方法,得到可信局部模型参数与可信全局模型参数的相似度;
归一化操作单元202,用于对相似度进行归一化操作得到可信局部模型参数的权重。
进一步地,上述模型参数更新模块300,还用于确定是否达到训练终止条件,在达到训练终止条件时,将可信全局模型分发给多个协作终端,停止训练;在未达到训练终止条件时,将可信全局模型分发给多个协作终端,并继续局部训练和模型聚合。
进一步地,上述训练终止条件包括下述中的任意一种:可信全局模型的损失函数值小于预设的损失函数阈值;训练轮数达到预设轮数。
根据本发明实施例的基于聚类的自适应鲁棒协作学习装置,能够针对性的在协作学习过程中准确区分出良性模型和恶意模型,防御某一个或者某几个局部恶意模型对全局模型以及其他良性协作者的局部良性模型开展恶意攻击,全面提升协作学习的鲁棒性。
需要说明的是,前述对基于聚类的自适应鲁棒协作学习方法实施例的解释说明也适用于该实施例的基于聚类的自适应鲁棒协作学习装置,此处不再赘述。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不是必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (6)
1.一种基于聚类的自适应鲁棒协作学习方法,其特征在于,包括:
获取多个协作终端上传的局部模型以及所述多个协作终端训练所述局部模型的至少部分训练数据,并根据所述至少部分训练数据训练可信全局模型;其中,所述至少部分训练数据是随机收集的;
以所述可信全局模型的可信全局模型参数为信任引导,根据预先确定的最佳聚类算法分别对所述局部模型的每个参数维度上进行聚类操作,得到可信局部模型和所述可信局部模型的可信局部模型参数;
根据所述可信局部模型参数和可信全局模型参数的相似度确定所述可信局部模型参数的权重,并根据所述可信局部模型参数和所述可信局部模型参数的权重对所述可信全局模型参数进行更新;
在根据所述至少部分训练数据训练可信全局模型之前,还包括:
对所述至少部分训练数据进行检验,将检验结果为恶意信息的训练数据从所述至少部分训练数据中剔除;
在根据预先确定的最佳聚类算法分别对所述局部模型的每个参数维度上进行聚类操作之前,还包括:
获取候选聚类算法集合;
在可信数据集上依次用所述候选聚类算法集合中的聚类算法进行聚类操作,以从所述候选聚类算法集合中确定所述最佳聚类算法;
根据所述可信局部模型参数和可信全局模型参数的相似度确定所述可信局部模型参数的权重,包括:
根据预先确定的相似度计算方法,得到所述可信局部模型参数与可信全局模型参数的相似度;
对所述相似度进行归一化操作得到所述可信局部模型参数的权重。
2.根据权利要求1所述的方法,其特征在于,在根据所述可信局部模型参数和所述可信局部模型参数的权重对所述可信全局模型参数进行更新之后,还包括:
确定是否达到训练终止条件,在达到所述训练终止条件时,将所述可信全局模型分发给所述多个协作终端,停止训练;在未达到所述训练终止条件时,将所述可信全局模型分发给所述多个协作终端,并继续局部训练和模型聚合。
3.根据权利要求2所述的方法,其特征在于,所述训练终止条件包括下述中的任意一种:
所述可信全局模型的损失函数值小于预设的损失函数阈值;
训练轮数达到预设轮数。
4.一种基于聚类的自适应鲁棒协作学习装置,其特征在于,包括:
全局模型训练模块,用于获取多个协作终端上传的局部模型以及所述多个协作终端训练所述局部模型的至少部分训练数据,并根据所述至少部分训练数据训练可信全局模型;其中,所述至少部分训练数据是随机收集的;
模型参数聚类模块,用于以所述可信全局模型的可信全局模型参数为信任引导,根据预先确定的最佳聚类算法分别对所述局部模型的每个参数维度上进行聚类操作,得到可信局部模型和所述可信局部模型的可信局部模型参数;
模型参数更新模块,用于根据所述可信局部模型参数和可信全局模型参数的相似度确定所述可信局部模型参数的权重,并根据所述可信局部模型参数和所述可信局部模型参数的权重对所述可信全局模型参数进行更新;
所述全局模型训练模块,还用于对所述至少部分训练数据进行检验,将检验结果为恶意信息的训练数据从所述至少部分训练数据中剔除;
所述模型参数聚类模块,还用于获取候选聚类算法集合,并在可信数据集上依次用所述候选聚类算法集合中的聚类算法进行聚类操作,以从所述候选聚类算法集合中确定所述最佳聚类算法;
所述模型参数聚类模块,包括:
相似度计算单元,用于根据预先确定的相似度计算方法,得到所述可信局部模型参数与可信全局模型参数的相似度;
归一化操作单元,用于对所述相似度进行归一化操作得到所述可信局部模型参数的权重。
5.根据权利要求4所述的装置,其特征在于,所述模型参数更新模块,还用于确定是否达到训练终止条件,在达到所述训练终止条件时,将所述可信全局模型分发给所述多个协作终端,停止训练;在未达到所述训练终止条件时,将所述可信全局模型分发给所述多个协作终端,并继续局部训练和模型聚合。
6.根据权利要求5所述的装置,其特征在于,所述训练终止条件包括下述中的任意一种:
所述可信全局模型的损失函数值小于预设的损失函数阈值;
训练轮数达到预设轮数。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210843405.6A CN114970886B (zh) | 2022-07-18 | 2022-07-18 | 一种基于聚类的自适应鲁棒协作学习方法和装置 |
US18/353,993 US20240020380A1 (en) | 2022-07-18 | 2023-07-18 | Clustering-based adaptive robust collaborative learning method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210843405.6A CN114970886B (zh) | 2022-07-18 | 2022-07-18 | 一种基于聚类的自适应鲁棒协作学习方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114970886A CN114970886A (zh) | 2022-08-30 |
CN114970886B true CN114970886B (zh) | 2022-10-21 |
Family
ID=82968821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210843405.6A Active CN114970886B (zh) | 2022-07-18 | 2022-07-18 | 一种基于聚类的自适应鲁棒协作学习方法和装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20240020380A1 (zh) |
CN (1) | CN114970886B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116521493B (zh) * | 2022-12-02 | 2024-02-13 | 北京小米移动软件有限公司 | 故障检测方法、装置及存储介质 |
CN117009095B (zh) * | 2023-10-07 | 2024-01-02 | 湘江实验室 | 一种隐私数据处理模型生成方法、装置、终端设备及介质 |
CN117150566B (zh) * | 2023-10-31 | 2024-01-23 | 清华大学 | 面向协作学习的鲁棒训练方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113780344B (zh) * | 2021-08-05 | 2023-08-22 | 中山大学 | 一种基于层次聚类的联邦学习方法及系统 |
CN113723617A (zh) * | 2021-08-26 | 2021-11-30 | 清华大学 | 二阶段联邦学习方法、系统 |
CN114186237A (zh) * | 2021-10-26 | 2022-03-15 | 北京理工大学 | 一种基于真值发现的鲁棒性联邦学习模型聚合方法 |
CN114758784A (zh) * | 2022-03-29 | 2022-07-15 | 南京理工大学 | 一种基于聚类算法分配联邦学习中参与者权重的方法 |
-
2022
- 2022-07-18 CN CN202210843405.6A patent/CN114970886B/zh active Active
-
2023
- 2023-07-18 US US18/353,993 patent/US20240020380A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240020380A1 (en) | 2024-01-18 |
CN114970886A (zh) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114970886B (zh) | 一种基于聚类的自适应鲁棒协作学习方法和装置 | |
de Araujo-Filho et al. | Intrusion detection for cyber–physical systems using generative adversarial networks in fog environment | |
CN111652496B (zh) | 基于网络安全态势感知系统的运行风险评估方法及装置 | |
US20230316076A1 (en) | Unsupervised Machine Learning System to Automate Functions On a Graph Structure | |
CN109922032B (zh) | 用于确定登录账户的风险的方法、装置、设备及存储介质 | |
CN107395430B (zh) | 一种云平台动态风险访问控制方法 | |
Criado et al. | Non-iid data and continual learning processes in federated learning: A long road ahead | |
CN108764267B (zh) | 一种基于对抗式决策树集成的拒绝服务攻击检测方法 | |
WO2014101636A1 (zh) | 一种电力通信网风险评估方法 | |
CN114186237A (zh) | 一种基于真值发现的鲁棒性联邦学习模型聚合方法 | |
CN110445801B (zh) | 一种物联网的态势感知方法和系统 | |
CN112422556B (zh) | 一种物联网终端信任模型构建方法及系统 | |
Wang et al. | Blockchain-based federated learning in mobile edge networks with application in internet of vehicles | |
Zhang et al. | A scalable network intrusion detection system towards detecting, discovering, and learning unknown attacks | |
Nalavade et al. | Evaluation of k-means clustering for effective intrusion detection and prevention in massive network traffic data | |
US20240028870A1 (en) | Selective reporting of machine learning parameters for federated learning | |
CN116186629A (zh) | 基于个性化联邦学习的金融客户分类及预测方法、装置 | |
CN116228312A (zh) | 大额积分兑换行为的处理方法和装置 | |
Xu et al. | Reliability prediction for service oriented system via matrix factorization in a collaborative way | |
CN112231571A (zh) | 资讯数据的处理方法、装置、设备及存储介质 | |
CN112801561B (zh) | 用户关系确定方法、装置、存储介质及电子设备 | |
He et al. | A fast security evaluation of support vector machine against evasion attack | |
CN117171786A (zh) | 一种抵御投毒攻击的去中心化联邦学习方法 | |
CN113946758B (zh) | 一种数据识别方法、装置、设备及可读存储介质 | |
CN112671746B (zh) | 一种基于区块链的联邦学习模型中毒检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |