CN114417417B - 一种基于联邦学习的工业物联网隐私保护系统及方法 - Google Patents
一种基于联邦学习的工业物联网隐私保护系统及方法 Download PDFInfo
- Publication number
- CN114417417B CN114417417B CN202210079619.0A CN202210079619A CN114417417B CN 114417417 B CN114417417 B CN 114417417B CN 202210079619 A CN202210079619 A CN 202210079619A CN 114417417 B CN114417417 B CN 114417417B
- Authority
- CN
- China
- Prior art keywords
- client
- data
- global model
- server node
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 37
- 238000004891 communication Methods 0.000 claims abstract description 26
- 230000008569 process Effects 0.000 claims description 18
- 230000002776 aggregation Effects 0.000 claims description 14
- 238000004220 aggregation Methods 0.000 claims description 14
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 claims 2
- 238000010801 machine learning Methods 0.000 abstract description 4
- 238000009826 distribution Methods 0.000 description 7
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y10/00—Economic sectors
- G16Y10/75—Information technology; Communication
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y40/00—IoT characterised by the purpose of the information processing
- G16Y40/50—Safety; Security of things, users, data or systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于机器学习技术领域与分布式系统技术领域,提供了基于联邦学习的工业物联网隐私保护系统及方法。其中该系统包括服务器节点和若干相互通信的客户端节点;服务器节点内预存有初始全局模型,用于根据不同客户端节点上传的自身拥有的数据类别,将工业物联网参与训练的客户端节点划分成不同的组;基于数据类别感知的客户端选择算法,在每一轮通信中向选择不同组的客户端节点下发联邦学习的全局模型;客户端节点用于在本地利用自身数据对接收到的全局模型进行训练,并将训练完成的本地模型上传至服务器节点;服务器节点还用于使用加权平均的策略对若干个本地模型进行聚合并形成新的全局模型,直至达到设定要求,结束迭代。
Description
技术领域
本发明属于机器学习技术领域与分布式系统技术领域,尤其涉及一种基于联邦学习的工业物联网隐私保护系统及方法。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
数据作为工业物联网(Industrial Internet of Things,IIoT)发展的重要资源,其重要价值进一步凸显,但也由此引发了一系列对于数据安全和隐私保护的担忧,数据安全问题已然成为工业物联网全面发展的重要制约瓶颈和亟需突破的关键挑战。在工业物联网时代,如何在保障数据安全和用户隐私的前提下,促进多源数据的碰撞、融合和挖掘,最大限度地释放数据价值,成为当前学术界和工业界面临的最大挑战之一。
为了满足新发展趋势下对工业物联网发展的要求,研究人员早期利用分布式计算,试图通过整合不同来源的数据进行分布式的建模,从而解决数据保护问题。但重量级的分布式系统框架通常会产生巨大的沟通成本,影响数据的传输和处理效率。联邦学习(Federated Learning,FL)给上述难题提供了解决方案。联邦学习是一种关注数据保护的机器学习技术,指在不交换数据样本的情况下,训练算法跨越多个分散的边缘设备或服务器,从而基于分布式的数据训练出全局模型。不同于传统的集中式机器学习技术,不需要把分布式客户端的本地数据集中上传到一台服务器上,可以有效地保护用户隐私。
然而,由于工业物联网环境下互联的终端设备种类丰富,其上的数据标签和数量等属性差异非常大,是非独立同分布的(Non-independent and identicallydistributed),导致不同终端设备在参与联邦学习训练本地模型时,模型参数存在很大差别,而传统的全局模型更新算法可能会忽略与分类相关的重要信息,导致联邦学习得到高精度的全局模型非常耗时,如何提高联邦学习全局模型更新的效率,加快全局模型的收敛速度,对于提升系统整体效率具有重要意义。
目前的联邦学习中,服务器对于联邦学习中各终端设备的发送的本地模型主要通过两种方案进行聚合以更新全局模型。比如,联邦学习服务器采用绝对平均的策略对于收到的模型进行聚合,即对所有模型每个相同位置的参数使用加权因子进行加权(S(t)是第t轮中,服务器收到的模型集合,|·|表示集合的数目),或者联邦学习服务器采用加权平均的策略对于收到的模型进行聚合,即对所有模型每个相同位置的参数使用加权因子进行加权(mi表示索引为i的客户端所拥有的训练数据的数量,n表示参与本次模型聚合的客户端总数)。
然而,联邦学习服务器采用以上两种方法对模型进行聚合,缺乏优化考虑,换言之,联邦学习服务器通过绝对平均或者加权平均的方案没有考虑各终端设备数据分布的特性,导致学习匹配特定特征的能力下降,因此,存在全局模型更新效率低下的问题,从而导致系统在模型训练上耗费大量时间,降低了联邦学习中各终端设备上的模型在联邦模型下的表达。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种基于联邦学习的工业物联网隐私保护系统及方法,其通过对终端设备进行分组,组内模型进行聚合,组间模型进行传递,以使系统更快收敛,在终端设备中数据量和数据类别极不平衡的情况下,高效实现全局模型的更新。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种基于联邦学习的工业物联网隐私保护系统,其包括服务器节点和若干相互通信的客户端节点;所述服务器节点内预存有初始全局模型,所述服务器节点用于:
根据不同客户端节点上传的自身拥有的数据类别,将工业物联网参与训练的客户端节点划分成不同的组;
基于数据类别感知的客户端选择算法,在每一轮通信中向选择不同组的客户端节点下发联邦学习的全局模型;
所述客户端节点用于:在本地利用自身数据对接收到的全局模型进行训练,并将训练完成的本地模型上传至服务器节点;
所述服务器节点,还用于:使用加权平均的策略对若干个本地模型进行聚合并形成新的全局模型,直至达到设定要求,结束全局模型下发、本地模型训练和聚合而形成全局模型这一过程的迭代。
作为一种实施方式,在服务器节点中,基于数据类别感知的客户端选择算法在每一轮全局迭代开始之前,决定选择哪一组客户端节点进行本轮的训练,考虑两个原则:
原则一:整个联邦学习过程选择每个客户端节点的概率应该大致相等;
原则二:在连续的几轮通信中,所有选定客户端节点的数据都应该代表整个数据分布。
作为一种实施方式,在第t轮的通信中,择价值最小的客户端节点组;使用下列公式计算每个客户端节点组的价值
其中,Ct-1[k]表示在过去的t-1轮客户端节点k被选中的次数,|Se|表示集合Se中客户端节点的数量,表示在集合Se中类别为l的样本总数,/>表示集合Se中的样本总数,Ht[l]表示在过去的t轮中被选中类别为l的样本的累计率,Ht-1[l]表示在过去的t-1轮中被选中类别为l的样本的累计率,St表示在第t轮通信中被选中的组。
作为一种实施方式,在每一轮的全局迭代前,所有客户端节点向服务器节点上传自己拥有的数据类别。
作为一种实施方式,服务器节点用于根据客户端节点的数据类别将所有的客户端分成若干组,同一组内的客户端节点拥有相同或相似的数据类别。
作为一种实施方式,服务器节点用于根据客户端节点集合内数据类别的相似度进行合并。
作为一种实施方式,在服务器节点中,当某两个客户端节点集合的数据类别最大相似度低于预定义的阈值时,表明不再存在相似集合,合并迭代结束。
作为一种实施方式,服务器节点用于:如果客户端节点的数据标签集合发生变化,则重新进行客户端节点分组工作。
作为一种实施方式,结束全局模型下发、本地模型训练和聚合而形成全局模型这一过程的迭代的设定要求为:全局模型的精度或联邦学习的通信轮数达到设定的阈值。
本发明的第二个方面提供一种基于联邦学习的工业物联网隐私保护系统的隐私保护方法,其包括:
服务器节点根据不同客户端节点上传的自身拥有的数据类别,将工业物联网参与训练的客户端节点划分成不同的组;基于数据类别感知的客户端选择算法,在每一轮通信中向选择不同组的客户端节点下发联邦学习的全局模型;
客户端节点在本地利用自身数据对接收到的全局模型进行训练,并将训练完成的本地模型上传至服务器节点;
服务器节点使用加权平均的策略对若干个本地模型进行聚合并形成新的全局模型,直至达到设定要求,结束全局模型下发、本地模型训练和聚合而形成全局模型这一过程的迭代。
与现有技术相比,本发明的有益效果是:
(1)本发明实现了对海量工业数据的隐私保护。产品的个性定制涉及到对工业现场制造数据、环境数据和客户需求数据等的分析与利用,传统的数据共享系统需要将数据集中到一个中心服务器上,导致两大问题,一是隐私泄露,二是有的厂商不愿分享自己的数据造成数据孤岛,严重影响了工业物联网平台的交互效率。本发明将联邦学习应用在工业物联网上,深度学习智能模型可以持续迭代,而训练数据仍安全保存在用户的设备中,有效地保护用户隐私。
(2)本发明实现了在客户端节点数据类型和数据量分布极不平衡的情况下,高效、准确的深度学习智能模型训练。不同于先前的工作,本发明提出了基于数据类别感知的客户端节点分组算法和组选择算法,根据不同客户端节点拥有的数据类别的相似度,将客户端节点分为不同的组,模型在组内聚合,在组间传递,加快了模型在客户端节点数据类型和数据量分布极不平衡的情况下的收敛速度。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是传统的中心化联邦学习架构;
图2是本发明实施例中基于数据类别感知的客户端节点分组算法及组选择算法;
图3是本发明实施例中基于联邦学习的工业物联网隐私保护系统架构示意图;
图4是本发明实施例中基于联邦学习的工业物联网隐私保护系统的工作过程示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
本实施例提供了一种基于联邦学习的工业物联网隐私保护系统,其具体包括服务器节点和若干相互通信的客户端节点。
在具体实施过程中,服务器节点可使用云端服务器(如腾讯云、阿里云、华为云或自己搭建的服务器)实现,用于实现模型聚合功能,以及全局模型的存储和分享。
客户端节点可使用工业物联网平台中若干互联互通的终端设备实现。客户端节点实现本地模型训练。
服务器节点与客户端节点之间通过网络传输链路来实现。网络传输链路使用数据上传和数据下发链路实现,用于实现数据的上传和数据的下发。
设联邦学习中客户端节点总数为n个,每轮通信中,在n个客户端节点中任意选择m个参与本轮的模型训练。如图1所示,对于Independently Identically Distribution(IID)的数据,客户端节点任选的策略对模型精度影响不大。但是对于Non-IndependentlyIdentically Distribution(Non-IID)的数据,该策略选出的客户端节点使用加权平均的聚合方法得到的全局模型,各本地模型的特征被削弱,导致全局模型精度低,收敛速度慢。
因此,本实施例基于数据类别感知的客户端选择算法,如图2所示,在每一轮通信中向选择不同组的客户端节点下发联邦学习的全局模型。
其中,在所述服务器节点内预存有初始全局模型,初始全局模型采用深度学习神经网络模型来实现。
所述服务器节点用于:
根据不同客户端节点上传的自身拥有的数据类别,将工业物联网参与训练的客户端节点划分成不同的组;
基于数据类别感知的客户端选择算法,在每一轮通信中向选择不同组的客户端节点下发联邦学习的全局模型。
设联邦学习中客户端节点总数为n个,在联邦学习开始之前,服务器节点根据各客户端节点上传的数据类别对n个客户端节点进行分组,每组内部的客户端节点具有相同或相似的数据类别。注意分组不是均分,是根据数据类别的相似度进行的划分。
在服务器节点中,基于数据类别感知的客户端选择算法在每一轮全局迭代开始之前,决定选择哪一组客户端节点进行本轮的训练,考虑两个原则:
原则一:整个联邦学习过程选择每个客户端节点的概率应该大致相等;
原则二:在连续的几轮通信中,所有选定客户端节点的数据都应该代表整个数据分布。
联邦学习开始之后,在每轮通信中,根据公式(1)和公式(2)计算每个组的价值,选择价值最低的组下发当前的全局模型。价值最低意味着该组客户端节点相比于其他组,在过去的若干轮通信中,参与的训练次数少或者带有相应标签的数据被选择的次数比其他数据要少,甚至两者都有。
在第t轮的通信中,择价值最小的客户端节点组;使用下列公式计算每个客户端节点组的价值
其中,Ct-1[k]表示在过去的t-1轮客户端节点k被选中的次数,|Se|表示集合Se中客户端节点的数量,表示在集合Se中类别为l的样本总数,/>表示集合Se中的样本总数,Ht[l]表示在过去的t轮中被选中类别为l的样本的累计率,Ht-1[l]表示在过去的t-1轮中被选中类别为l的样本的累计率,St表示在第t轮通信中被选中的组。
在具体实施中,在每一轮的全局迭代前,所有客户端节点向服务器节点上传自己拥有的数据类别。
服务器节点用于根据客户端节点的数据类别将所有的客户端分成若干组,同一组内的客户端节点拥有相同或相似的数据类别。
为进一步加快训练速度,对某些客户端集合进行合并,即减少n的大小。
例如:服务器节点用于根据客户端节点集合内数据类别的相似度进行合并。
具体合并过程为:
n个客户端集合和对应的标签集合作为合并算法的输入;
建立一个新的列表该列表由/>初始化,用来计算任意的两个客户端集合数据类别的相似度;
算法迭代寻找两个相似度最大的客户端集合,对于客户端集合,我们将两个集合合并成一个新的集合,删掉旧的多余集合;对于标签集合,保留原始的标签集合以备后续相似度的比较;
在服务器节点中,当某两个客户端节点集合的数据类别最大相似度低于预定义的阈值时,表明不再存在相似集合,合并迭代结束。
算法最终生成的数量较少的集合S和对应的标签集合作为输出,集合S作为最终的客户端分组结果。
如果客户端节点的数据标签集合发生变化,服务器节点需要重新进行客户端节点分组工作。
在具体实施过程中,所述客户端节点用于:在本地利用自身数据对接收到的全局模型进行训练,并将训练完成的本地模型上传至服务器节点。
所述服务器节点,还用于:使用加权平均的策略对若干个本地模型进行聚合并形成新的全局模型,直至达到设定要求,结束全局模型下发、本地模型训练和聚合而形成全局模型这一过程的迭代。
其中,结束全局模型下发、本地模型训练和聚合而形成全局模型这一过程的迭代的设定要求为:全局模型的精度或联邦学习的通信轮数达到设定的阈值。
服务器节点在收到该组所有客户端节点上传的本地模型参数后,使用加权平均策略对收到的模型进行聚合,加权因子为其中,ai表示索引为i的客户端节点所拥有的数据的数量,n表示参与本次模型聚合的客户端节点总数。
服务器节点下发模型、客户端节点本地训练和服务器聚合模型这一流程需要迭代一个固定数,该数被定义为最大迭代次数(maxIteration)。
如图3和图4所示,在工业物联网平台中,将云端服务器映射为中心化联邦学习里的服务器节点,将不同的互联互通的终端设备映射为不同的客户端节点,将云服务器和终端设备之间的网络链路映射为数据上传链路和数据下发链路。
使用基于数据类别感知的客户端节点分组算法将所有的客户端节点划分为不同的组,并使用基于数据类别感知的组选择算法在每轮通信中选择价值最低的组参与本轮的模型训练。
之后全局模型下发至选中的组的客户端节点,客户端节点进行本地训练,完成后,将模型更新上传至服务器节点,服务器节点使用加权平均聚合策略形成新的全局模型,迭代上述步骤,直到模型的精度或联邦学习的通信轮数达到阈值。
本实施例的该基于联邦学习的工业物联网隐私保护系统打造了智能化IIoT平台,充分整合了客户订单信息、企业生产信息、库存和生产线等大规模数据,可以在满足服务质量的情况下,优化产品的制造过程,实现大规模个性化定制。
实施例二
本实施例提供了一种基于联邦学习的工业物联网隐私保护系统的隐私保护方法,其具体包括:
服务器节点根据不同客户端节点上传的自身拥有的数据类别,将工业物联网参与训练的客户端节点划分成不同的组;基于数据类别感知的客户端选择算法,在每一轮通信中向选择不同组的客户端节点下发联邦学习的全局模型;
客户端节点在本地利用自身数据对接收到的全局模型进行训练,并将训练完成的本地模型上传至服务器节点;
服务器节点使用加权平均的策略对若干个本地模型进行聚合并形成新的全局模型,直至达到设定要求,结束全局模型下发、本地模型训练和聚合而形成全局模型这一过程的迭代。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于联邦学习的工业物联网隐私保护系统,其特征在于,包括服务器节点和若干相互通信的客户端节点;所述服务器节点内预存有初始全局模型,所述服务器节点用于:
根据不同客户端节点上传的自身拥有的数据类别,将工业物联网参与训练的客户端节点划分成不同的组;
基于数据类别感知的客户端选择算法,在每一轮通信中向选择不同组的客户端节点下发联邦学习的全局模型;
所述客户端节点用于:在本地利用自身数据对接收到的全局模型进行训练,并将训练完成的本地模型上传至服务器节点;
所述服务器节点,还用于:使用加权平均的策略对若干个本地模型进行聚合并形成新的全局模型,直至达到设定要求,结束全局模型下发、本地模型训练和聚合而形成全局模型这一过程的迭代;
其中,在第t轮的通信中,择价值最小的客户端节点组;使用下列公式计算每个客户端节点组的价值:
= />·/>
=/>
其中,表示在过去的t-1轮客户端节点k被选中的次数,|Se|表示集合/>中客户端节点的数量,/>表示在集合/>中类别为/>的样本总数,/>表示集合/>中的样本总数,/>表示在过去的t轮中被选中类别为/>的样本的累计率,/>表示在过去的t-1轮中被选中类别为/>的样本的累计率,/>表示在第t轮通信中被选中的组;
在每一轮全局迭代开始之前,所有客户端节点向服务器节点上传自己拥有的数据类别;服务器节点用于根据客户端节点的数据类别将所有的客户端分成若干组,同一组内的客户端节点拥有相同或相似的数据类别;最终生成数量较少的集合S和对应的标签集合作为输出,集合S作为最终的客户端分组结果;当客户端节点的数据标签集合发生变化,服务器节点重新进行客户端节点分组工作;
在所述服务器节点用于根据客户端节点的数据类别将所有的客户端分成若干组过程中,服务器节点还用于根据客户端节点集合内数据类别的相似度进行合并;
所述合并的过程为:
n个客户端集合和对应的标签集合作为合并算法的输入;
建立一个新的列表该列表,该列表由/>初始化,计算任意两个客户端集合数据类别的相似度;
算法迭代寻找两个相似度最大的客户端集合,对于客户端集合,将两个集合合并成一个新的集合,删掉旧的多余集合;对于标签集合,保留原始的标签集合,用于相似度的比较;
在服务器节点中,当任意两个客户端节点集合的数据类别最大相似度低于预定义的阈值时,表明不再存在相似集合,合并迭代结束。
2.如权利要求1所述的基于联邦学习的工业物联网隐私保护系统,其特征在于,结束全局模型下发、本地模型训练和聚合而形成全局模型这一过程的迭代的设定要求为:全局模型的精度或联邦学习的通信轮数达到设定的阈值。
3.一种如权利要求1-2中任一项所述的基于联邦学习的工业物联网隐私保护系统的隐私保护方法,其特征在于,包括:
服务器节点根据不同客户端节点上传的自身拥有的数据类别,将工业物联网参与训练的客户端节点划分成不同的组;基于数据类别感知的客户端选择算法,在每一轮通信中向选择不同组的客户端节点下发联邦学习的全局模型;
客户端节点在本地利用自身数据对接收到的全局模型进行训练,并将训练完成的本地模型上传至服务器节点;
服务器节点使用加权平均的策略对若干个本地模型进行聚合并形成新的全局模型,直至达到设定要求,结束全局模型下发、本地模型训练和聚合而形成全局模型这一过程的迭代。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210079619.0A CN114417417B (zh) | 2022-01-24 | 2022-01-24 | 一种基于联邦学习的工业物联网隐私保护系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210079619.0A CN114417417B (zh) | 2022-01-24 | 2022-01-24 | 一种基于联邦学习的工业物联网隐私保护系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114417417A CN114417417A (zh) | 2022-04-29 |
CN114417417B true CN114417417B (zh) | 2024-04-30 |
Family
ID=81277749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210079619.0A Active CN114417417B (zh) | 2022-01-24 | 2022-01-24 | 一种基于联邦学习的工业物联网隐私保护系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114417417B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115034356B (zh) * | 2022-05-09 | 2024-08-23 | 上海大学 | 一种用于横向联邦学习的模型融合方法及系统 |
CN115081002B (zh) * | 2022-06-28 | 2024-05-14 | 西安电子科技大学 | 用于去中心化联邦学习的聚合服务器选择方法 |
CN115328691B (zh) * | 2022-10-14 | 2023-03-03 | 山东大学 | 基于模型差异的故障诊断方法、系统、存储介质及设备 |
CN115329032B (zh) * | 2022-10-14 | 2023-03-24 | 杭州海康威视数字技术股份有限公司 | 基于联邦字典学习数据传输方法、装置、设备及存储介质 |
CN116306986B (zh) * | 2022-12-08 | 2024-01-12 | 哈尔滨工业大学(深圳) | 一种基于动态亲和力聚合的联邦学习方法及相关设备 |
CN116306943B (zh) * | 2023-03-16 | 2023-10-17 | 中国科学院软件研究所 | 一种面向AIoT的多任务本地协同推理方法及系统 |
CN116108491B (zh) * | 2023-04-04 | 2024-03-22 | 杭州海康威视数字技术股份有限公司 | 基于半监督联邦学习的数据泄露预警方法、装置及系统 |
CN117390448B (zh) * | 2023-10-25 | 2024-04-26 | 西安交通大学 | 一种用于云际联邦学习的客户端模型聚合方法及相关系统 |
CN117557870B (zh) * | 2024-01-08 | 2024-04-23 | 之江实验室 | 基于联邦学习客户端选择的分类模型训练方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021190638A1 (zh) * | 2020-11-24 | 2021-09-30 | 平安科技(深圳)有限公司 | 基于非均匀分布数据的联邦建模方法及相关设备 |
CN113609521A (zh) * | 2021-07-27 | 2021-11-05 | 广州大学 | 一种基于对抗训练的联邦学习隐私保护方法及系统 |
CN113705712A (zh) * | 2021-09-02 | 2021-11-26 | 广州大学 | 一种基于联邦半监督学习的网络流量分类方法和系统 |
CN113947156A (zh) * | 2021-10-22 | 2022-01-18 | 河南大学 | 一种健康群智感知系统及其成本优化的联邦学习方法 |
-
2022
- 2022-01-24 CN CN202210079619.0A patent/CN114417417B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021190638A1 (zh) * | 2020-11-24 | 2021-09-30 | 平安科技(深圳)有限公司 | 基于非均匀分布数据的联邦建模方法及相关设备 |
CN113609521A (zh) * | 2021-07-27 | 2021-11-05 | 广州大学 | 一种基于对抗训练的联邦学习隐私保护方法及系统 |
CN113705712A (zh) * | 2021-09-02 | 2021-11-26 | 广州大学 | 一种基于联邦半监督学习的网络流量分类方法和系统 |
CN113947156A (zh) * | 2021-10-22 | 2022-01-18 | 河南大学 | 一种健康群智感知系统及其成本优化的联邦学习方法 |
Non-Patent Citations (3)
Title |
---|
Fast-convergent federated learning with class-weighted aggregation;Ma, Zezhong;《JOURNAL OF SYSTEMS ARCHITECTURE》;全文 * |
多数据源下机器学习的隐私保护研究;张铭凯;范宇豪;夏仕冰;;网络空间安全(第04期);全文 * |
面向大数据隐私保护的联邦学习算法航空应用模型研究;陈涛;郭睿;刘志强;;信息安全与通信保密(第09期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114417417A (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114417417B (zh) | 一种基于联邦学习的工业物联网隐私保护系统及方法 | |
CN112181971A (zh) | 一种基于边缘的联邦学习模型清洗和设备聚类方法、系统、设备和可读存储介质 | |
US9613164B2 (en) | System and method for data management in large data networks | |
CN113946461A (zh) | 一种故障根因分析的方法及装置 | |
CN111339433A (zh) | 基于人工智能的信息推荐方法、装置、电子设备 | |
Guo et al. | Optimization technology in cloud manufacturing | |
CN114091667A (zh) | 一种面向非独立同分布数据的联邦互学习模型训练方法 | |
CN114911823A (zh) | 面向云边端协同查询的深度学习代价估计系统、方法及设备 | |
CN116542322A (zh) | 一种联邦学习方法 | |
Li et al. | Data analytics for fog computing by distributed online learning with asynchronous update | |
CN114116774B (zh) | 日志数据的查询方法及装置 | |
CN113228059A (zh) | 面向跨网络的表示学习算法 | |
CN106650800B (zh) | 基于Storm的马尔可夫等价类模型分布式学习方法 | |
CN104036052A (zh) | 一种基于历史经验的谓词索引匹配方法 | |
CN111368060A (zh) | 对话机器人的自学习方法、装置、系统、电子设备及介质 | |
CN111416848A (zh) | 一种工业云的资源管理机制 | |
CN114298319B (zh) | 联合学习贡献值的确定方法、装置、电子设备及存储介质 | |
Shengdong et al. | Optimal path strategy for the web computing under deep reinforcement learning | |
CN114286304A (zh) | 一种基于二维动态匹配的mec资源分配方法 | |
Bai et al. | An efficient skyline query algorithm in the distributed environment | |
CN112506919A (zh) | 一种结构化的icd生成方法 | |
CN112906745A (zh) | 基于边缘协同的诚信智能网络训练方法 | |
CN113392160A (zh) | 一种人员信息同步方法、装置、设备及存储介质 | |
CN106533756A (zh) | 一种通信特征抽取、流量产生方法及装置 | |
CN109831373A (zh) | 基于FastText算法的邮件系统高精度智能防误判方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |