CN114510741A - 一种基于联邦学习的电力数据安全高效共用方法 - Google Patents

一种基于联邦学习的电力数据安全高效共用方法 Download PDF

Info

Publication number
CN114510741A
CN114510741A CN202210159697.1A CN202210159697A CN114510741A CN 114510741 A CN114510741 A CN 114510741A CN 202210159697 A CN202210159697 A CN 202210159697A CN 114510741 A CN114510741 A CN 114510741A
Authority
CN
China
Prior art keywords
data
power
node
model parameter
power node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210159697.1A
Other languages
English (en)
Inventor
段敬
安毅
禹宁
郝晓伟
武汉伟
张栋
张淑娟
安龙
刘秀
段婕
王艳花
刘海涛
万雪枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi Xingze Huilian Technology Co ltd
Information and Telecommunication Branch of State Grid Shanxi Electric Power Co Ltd
Original Assignee
Shanxi Xingze Huilian Technology Co ltd
Information and Telecommunication Branch of State Grid Shanxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanxi Xingze Huilian Technology Co ltd, Information and Telecommunication Branch of State Grid Shanxi Electric Power Co Ltd filed Critical Shanxi Xingze Huilian Technology Co ltd
Priority to CN202210159697.1A priority Critical patent/CN114510741A/zh
Publication of CN114510741A publication Critical patent/CN114510741A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2107File encryption
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Optimization (AREA)
  • Medical Informatics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Economics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明属于智能电力数据共用的实现方法领域,尤其涉及到一种基于联邦学习的电力数据安全高效共用方法。包括以下步骤:S100~在各电力公司中部署数据采集设备;S200~将各电力结点获取到的交互数据存储在各电力公司的本地数据库中;S300~协调方将初始化的模型参数w发送至各个电力结点;S400~各电力结点通过初始模型参数w对其存储数据进行模型训练,S500~各电力结点将求得的凸损失函数的值与模型参数w进行同态加密和致盲操作,并将其传至协调方;S600~协调方放置汇总得到新的模型参数w;S700~协调方根据计算结果,判断当前新的模型参数w是否收敛。本发明保证各电力公司隐私数据,有效防止敏感数据泄露。

Description

一种基于联邦学习的电力数据安全高效共用方法
技术领域
本发明属于智能电力数据共用的实现方法领域,尤其涉及到一种基于联邦学习的电力数据安全高效共用方法。
背景技术
伴随着物联网技术的高速发展,越来越多的工业系统接入其中,同时由于工业4.0的到来,人工智能领域的相关技术也引入到了工业领域当中,越来越多的工业数据在机器学习模型当中被训练,其中电力能源领域应用更为广泛,但同时,由于各电力公司结点具有相关数据的数据量有限,同时具有隐私保护需求等问题,与广泛应用机器学习技术产生了矛盾,所以针对上述现象,工业界往往引入联邦学习技术进行处理。
联邦学习技术作为一种保护数据隐私的深度学习方法,自2016年被提出以来,受到学术界与工业界的广泛关注。联邦学习是一种关注隐私保护的机器学习技术,在保障源数据不离开本地设备的情况下,多参与方或多计算节点之间开展高效的机器学习。联邦学习是该技术的统称,各数据提供方即电力工业物联网中各个结点构成联邦,共同训练机器学习模型。
联邦学习的基准算法FedSGD与FedAvg算法由McMahan等人于2016年首次提出(McMahan B, Moore E, Ramage D, et al. Communication-Efficient Learning ofDeep Networks from Decentralized Data[C]. // Proc of Machine LearningResearch PMLR, Brookline: Microtome Publishing, 2017: 1273–1282),FedAvg算法相较于FedSGD算法,边缘结点将执行多轮学习,有效减少了协调方与边缘结点的通信轮数。基于这一基准算法,Bonawitz K等人构建了一个可伸缩的联邦学习算法(Bonawitz K ,Eichner H , Grieskamp W , et al. Towards Federated Learning at Scale: SystemDesign[J].2019.),该算法可有效解决不可靠的终端连接与设备突发中断的问题,然而该算法收敛速度慢,且并行效率低下,同时未能解决数据非独立同分布的问题,并不适用于电力能源领域。Xie等人提出了一种异步的联邦学习算法(Xie C , Koyejo S , Gupta I .Asynchronous Federated Optimization[J]. 2019.),并提出了一种时滞模型权重更新方法,但是该算法中若结点上传延迟时间过久,则对最终结果影响较大,不能达到电力领域中数据安全高效共用的需求。基于此,提出一种基于结点聚类的联邦学习方法解决电力领域中因结点数据非独立同分布而无法安全高效共用的问题。
发明内容
本发明为了解决上述问题,提供一种基于联邦学习的电力数据安全高效共用方法。
本发明采取以下技术方案:一种基于联邦学习的电力数据安全高效共用方法,包括以下步骤:
S100~在各电力公司中部署数据采集设备,并选择一个电力公司作为共同信任的协调方;
S200~将各电力结点获取到的交互数据存储在各电力公司的本地数据库中,并通过筛查其中的无用数据、空数据与误报数据,并将数据格式与标准数据格式比对,清除无效数据,达到清洗其中的脏数据;
S300~协调方将初始化的模型参数w发送至各个电力结点;
S400~各电力结点通过初始模型参数w对其存储数据进行模型训练,得到各自的平均梯度,与相应的本地模型参数
Figure 100002_DEST_PATH_IMAGE002
,并求得各工作结点的凸损失函数
Figure 100002_DEST_PATH_IMAGE004
的值,
Figure 100002_DEST_PATH_IMAGE006
表示第t个结点点参与训练的数据的总数量;
Figure 100002_DEST_PATH_IMAGE008
表示第t个电力结点数据集中的第i个特征向量,同理
Figure 100002_DEST_PATH_IMAGE010
表示第t个电力结点数据集中的第i个特征向量
Figure 132351DEST_PATH_IMAGE008
所对应的标签;
S500~各电力结点将求得的凸损失函数的值与模型参数w进行同态加密和致盲操作,并将其传至协调方;
S600~协调方放置汇总得到新的模型参数w,并根据新的模型参数w并计算协方差矩阵
Figure 100002_DEST_PATH_IMAGE012
Figure 100002_DEST_PATH_IMAGE014
S700~协调方根据计算结果,判断当前新的模型参数w是否收敛,若是则将新的模型参数w作为标准模型参数,若未收敛,则将新的模型参数w再传至各电力结点,重复步骤S400到步骤S700中迭代过程,直至模型参数w收敛。
进一步的,电力结点包括控制中心、数据存储中心与特定的数据采集器。
进一步的,步骤S400中,采用联邦模型进行训练,所采用的公式如下所示:
Figure 100002_DEST_PATH_IMAGE016
Figure 100002_DEST_PATH_IMAGE018
其中W代表参与训练的所有电力结点的所有模型参数的集合,即
Figure 100002_DEST_PATH_IMAGE020
Figure 100002_DEST_PATH_IMAGE022
代表第t个电力结点在本轮联邦学习过程中的所有的模型参数;
Figure 100002_DEST_PATH_IMAGE024
是协方差矩阵用于描述不同电力结点之间的关联;m表示参与训练的电力结点的数量;N表示参与训练数据的总数量;
Figure 100002_DEST_PATH_IMAGE026
表示第t个结点点参与训练的数据的总数量;
Figure 100002_DEST_PATH_IMAGE028
表示第t个电力结点数据集中的第i个特征向量,同理
Figure 100002_DEST_PATH_IMAGE030
表示第t个电力结点数据集中的第i个特征向量
Figure 800224DEST_PATH_IMAGE028
所对应的标签;
Figure 100002_DEST_PATH_IMAGE032
为正则化参数,且
Figure 100002_DEST_PATH_IMAGE034
Figure 100002_DEST_PATH_IMAGE036
是第t个电力结点使用机器学习模型训练数据后得到的凸损失函数,
Figure 100002_DEST_PATH_IMAGE038
用于衡量各电力结点数据之间的关联性。
步骤S500的具体过程为:
S501~在电力结点内对模型参数使用Paillier同态加密对模型参数w进行加密;
S502~添加各结点的致盲因子
Figure 100002_DEST_PATH_IMAGE040
,对密文进行致盲操作,得到
Figure 100002_DEST_PATH_IMAGE042
进一步的,步骤S700中,当判断当前新的模型参数w不收敛时,再重复步骤S500时,协调方第m次收敛迭代表述为下式:
Figure 100002_DEST_PATH_IMAGE044
,其保护机制可以表示为
Figure 100002_DEST_PATH_IMAGE046
,其中
Figure 100002_DEST_PATH_IMAGE048
为第m轮收敛迭代中的致盲因子,
Figure 100002_DEST_PATH_IMAGE050
为第m轮收敛迭代中第n个节点执行同态加密后的本地模型参数,
Figure 100002_DEST_PATH_IMAGE052
为参与聚合过程的节点数量,
Figure 100002_DEST_PATH_IMAGE054
为新一轮的联邦学习全局模型。
进一步的,步骤S600中,计算协方差矩阵
Figure 422704DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE055
的过程为:根据式
Figure DEST_PATH_IMAGE057
求得更新后的协方差矩阵
Figure 473706DEST_PATH_IMAGE012
,式中W代表参与训练的所有电力结点的所有模型参数的集合,并在此基础上,使用块对偶坐标下降,得原函数
Figure DEST_PATH_IMAGE059
的对偶问题
Figure DEST_PATH_IMAGE061
并进行求解。
与现有技术相比,本发明具有以下有益效果:
1.本发明引入联邦学习这一机器学习模型,并加入Paillier同态加密和致盲操作的参数保护机制,保证各电力公司隐私数据,有效防止敏感数据泄露。
2.本发明在联邦学习过程中引入了协方差矩阵
Figure DEST_PATH_IMAGE063
,量化了所述各电力结点数据之间的关联性,提高了联邦学习模型的收敛速度。
3.本发明解决了独立实体结点数据小样本问题,相较在保障隐私前提下使用传统机器学习模型对电力数据进行训练,本发明在保证各各参与方隐私的前提下,构建大数据量样本的数据集,提高了机器学习模型的适用性,有效防止因数据量过少,而产生的过拟合现象。
附图说明
图1为本发明的电力结点结构图;
图2为本发明的系统架构图;
图3为本发明的流程示意图。
具体实施方式
以下结合附图通过具体实施例详细说明本发明,但不构成对本发明的限制。
本实施例为一个采用本发明方法的基于联邦学习的电力数据高效安全共用实例。
在本实施例中,各电力公司的工作结点的结构如图1所示,从图中可以看到,本方案所述的电力结点主要由控制中心、数据存储中心与特定的数据采集器构成。电力结点在保证控制中心安全的前提下,将采集到的电力数据传输至数据存储中心。
在本实施例中,本发明引入了联邦学习的机制,相应的系统架构图如图2所示,本实施例引入的联邦学习机制为横向联邦学习模型,各个工作结点在接收到协调方发送的模型参数后使用本地数据进行训练,并将本地数据训练后的模型参数与损失代价通过加入Paillier同态加密和致盲操作的参数保护机制后重传至协调方,协调方重新更改模型参数,并判断是否达到收敛条件,若达到收敛条件则停止训练,若未达到,则将新的模型参数再重新传至各个参与方工作结点,重复上述步骤,直至模型收敛。
详细的工作流程如图3所示,首先各工作结点在达成共识的前提下,选择共同信任的协调方后,协调方发送初始模型参数w至各工作结点,之后各参与方即所述工作结点通过初始模型参数w对本地数据进行训练,根据公式
Figure DEST_PATH_IMAGE065
,可求得该节点更新后的
Figure DEST_PATH_IMAGE067
与相应的损失代价,之后各工作结点对参数添加保护机制后得到
Figure DEST_PATH_IMAGE069
与损失代价,重新传送至协调方,协调方汇总各节点的模型参数后更新模型参数w,并求出新的协方差矩阵
Figure DEST_PATH_IMAGE071
Figure DEST_PATH_IMAGE073
,并根据上述结果判断模型参数w是否达到收敛条件,若未达到收敛条件,则将w重新广播至各参与训练的工作结点,迭代上述步骤,直至更新后的模型参数w达到收敛条件,停止训练,得到最终的机器学习模型。
具体步骤如下:
S100~在各电力公司中部署区域用电量数据采集设备,并选择总公司作为共同信任的协调方。
S200~将各电力公司结点获取到的区域用电量数据存储在各公司的本地数据库中,并通过筛查其中的无用数据,空数据与误报数据,并将数据格式与标准数据格式比对,清除无效数据。
S300~协调方将初始化的模型参数w发送至各个电力公司结点。
S400~各电力公司结点通过初始模型参数w对其存储的区域用电量数据进行联邦模型训练,得到各自的平均梯度,与相应的
Figure 599662DEST_PATH_IMAGE002
,并求得各工作结点的凸损失函数
Figure 77917DEST_PATH_IMAGE004
的值。
其联邦学习机制所采用的公式如下所示:
Figure DEST_PATH_IMAGE074
Figure 548213DEST_PATH_IMAGE018
其中W代表参与训练的所有电力结点的所有模型参数的集合,即
Figure 901440DEST_PATH_IMAGE020
Figure 101477DEST_PATH_IMAGE022
代表第t个电力结点在本轮联邦学习过程中的所有的模型参数;
Figure 298103DEST_PATH_IMAGE024
是协方差矩阵用于描述不同电力结点之间的关联;m表示参与训练的电力结点的数量;N表示参与训练数据的总数量;
Figure 239384DEST_PATH_IMAGE026
表示第t个结点点参与训练的数据的总数量;
Figure 382920DEST_PATH_IMAGE028
表示第t个电力结点数据集中的第i个特征向量,同理
Figure 437464DEST_PATH_IMAGE030
表示第t个电力结点数据集中的第i个特征向量
Figure 601729DEST_PATH_IMAGE028
所对应的标签;
Figure 611DEST_PATH_IMAGE032
为正则化参数,且
Figure 72473DEST_PATH_IMAGE034
Figure 450364DEST_PATH_IMAGE036
是第t个电力结点使用机器学习模型训练数据后得到的凸损失函数,
Figure 192055DEST_PATH_IMAGE038
用于衡量各电力结点数据之间的关联性。
S500~各电力结点将求得的凸损失函数的值与第m轮训练中第n个节点的模型参数w进行同态加密和致盲操作,并将其传至协调方。
为了保证电力结点内数据在共用周期的隐私性,本发明拟提出一种基于Paillier同态加密和致盲操作的参数保护机制。其核心思想在于,在电力结点内对模型参数并使用Paillier同态加密技术对模型参数进行加密并添加致盲因子,从而使得模型参数在上传至协调方的过程中可以有效抵御模型攻击,并且协调方最终只能得到全局参数的密文。
具体步骤如下:S501~在电力结点内对模型参数使用Paillier同态加密对模型参数w进行加密;S502~添加各结点的致盲因子
Figure 452135DEST_PATH_IMAGE040
,对密文进行致盲操作,得到
Figure 452321DEST_PATH_IMAGE042
S600~协调方放置汇总得到新的模型参数W,并根据新的模型参数W计算
Figure 684720DEST_PATH_IMAGE012
Figure 253104DEST_PATH_IMAGE014
S700~协调方根据计算结果,判断当前新的模型参数w是否收敛,若是则将新的模型参数w作为标准模型参数,若未收敛,则将新的模型参数w再传至各电力结点,重复步骤S400到步骤S700中迭代过程,直至模型参数w收敛。
当在步骤S700中,当判断当前新的模型参数w不收敛时,再重复步骤S500时,协调方第m次收敛迭代表述为下式:
Figure 610267DEST_PATH_IMAGE044
,其保护机制可以表示为
Figure 23931DEST_PATH_IMAGE046
,其中
Figure DEST_PATH_IMAGE048A
为第m轮收敛迭代中的致盲因子,
Figure 796322DEST_PATH_IMAGE050
为第m轮收敛迭代中第n个节点执行同态加密后的本地模型参数,
Figure 410974DEST_PATH_IMAGE052
为参与聚合过程的节点数量,
Figure DEST_PATH_IMAGE075
为新一轮的联邦学习全局模型。

Claims (6)

1.一种基于联邦学习的电力数据安全高效共用方法,其特征在于:包括以下步骤,
S100~在各电力公司中部署数据采集设备,并选择一个电力公司作为共同信任的协调方;
S200~将各电力结点获取到的交互数据存储在各电力公司的本地数据库中,并通过筛查其中的无用数据、空数据与误报数据,并将数据格式与标准数据格式比对,清除无效数据,达到清洗其中的脏数据;
S300~协调方将初始化的模型参数w发送至各个电力结点;
S400~各电力结点通过初始模型参数w对其存储数据进行模型训练,得到各自的平均梯度,与相应的本地模型参数
Figure DEST_PATH_IMAGE002
,并求得各工作结点的凸损失函数
Figure DEST_PATH_IMAGE004
的值,
Figure DEST_PATH_IMAGE006
表示第t个结点点参与训练的数据的总数量;
Figure DEST_PATH_IMAGE008
表示第t个电力结点数据集中的第i个特征向量,同理
Figure DEST_PATH_IMAGE010
表示第t个电力结点数据集中的第i个特征向量
Figure 145768DEST_PATH_IMAGE008
所对应的标签;
S500~各电力结点将求得的凸损失函数的值与模型参数w进行同态加密和致盲操作,并将其传至协调方;
S600~协调方放置汇总得到新的模型参数w,并根据新的模型参数w并计算协方差矩阵
Figure DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE014
S700~协调方根据计算结果,判断当前新的模型参数w是否收敛,若是则将新的模型参数w作为标准模型参数,若未收敛,则将新的模型参数w再传至各电力结点,重复步骤S400到步骤S700中迭代过程,直至模型参数w收敛。
2.根据权利要求1所述的基于联邦学习的电力数据安全高效共用方法,其特征在于:所述的电力结点包括控制中心、数据存储中心与特定的数据采集器。
3.根据权利要求1所述的基于联邦学习的电力数据安全高效共用方法,其特征在于:所述的步骤S400中,采用联邦模型进行训练,所采用的公式如下所示:
Figure DEST_PATH_IMAGE016
Figure DEST_PATH_IMAGE018
其中W代表参与训练的所有电力结点的所有模型参数的集合,即
Figure DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE022
代表第t个电力结点在本轮联邦学习过程中的所有的模型参数;
Figure DEST_PATH_IMAGE024
是协方差矩阵用于描述不同电力结点之间的关联;m表示参与训练的电力结点的数量;N表示参与训练数据的总数量;
Figure DEST_PATH_IMAGE026
表示第t个结点点参与训练的数据的总数量;
Figure DEST_PATH_IMAGE028
表示第t个电力结点数据集中的第i个特征向量,同理
Figure DEST_PATH_IMAGE030
表示第t个电力结点数据集中的第i个特征向量
Figure 661325DEST_PATH_IMAGE028
所对应的标签;
Figure DEST_PATH_IMAGE032
为正则化参数,且
Figure DEST_PATH_IMAGE034
Figure DEST_PATH_IMAGE036
是第t个电力结点使用机器学习模型训练数据后得到的凸损失函数,
Figure DEST_PATH_IMAGE038
用于衡量各电力结点数据之间的关联性。
4.根据权利要求1所述的基于联邦学习的电力数据安全高效共用方法,其特征在于:所述的步骤S500的具体过程为:
S501~在电力结点内对模型参数使用Paillier同态加密对模型参数w进行加密;
S502~添加各结点的致盲因子
Figure DEST_PATH_IMAGE040
,对密文进行致盲操作,得到
Figure DEST_PATH_IMAGE042
5.根据权利要求4所述的基于联邦学习的电力数据安全高效共用方法,其特征在于:所述的步骤S700中,当判断当前新的模型参数w不收敛时,再重复步骤S500时,协调方第m次收敛迭代表述为下式:
Figure DEST_PATH_IMAGE044
,其保护机制可以表示为
Figure DEST_PATH_IMAGE046
,其中
Figure DEST_PATH_IMAGE048
为第m轮收敛迭代中的致盲因子,
Figure DEST_PATH_IMAGE050
为第m轮收敛迭代中第n个节点执行同态加密后的本地模型参数,
Figure DEST_PATH_IMAGE052
为参与聚合过程的节点数量,
Figure DEST_PATH_IMAGE054
为新一轮的联邦学习全局模型。
6.根据权利要求1所述的基于联邦学习的电力数据安全高效共用方法,其特征在于:所述的步骤S600中,计算协方差矩阵
Figure 740752DEST_PATH_IMAGE012
Figure 385360DEST_PATH_IMAGE014
的过程为:根据式
Figure DEST_PATH_IMAGE056
求得更新后的协方差矩阵
Figure 405531DEST_PATH_IMAGE012
,式中W代表参与训练的所有电力结点的所有模型参数的集合,并在此基础上,使用块对偶坐标下降,得原函数
Figure DEST_PATH_IMAGE058
的对偶问题
Figure DEST_PATH_IMAGE060
并进行求解。
CN202210159697.1A 2022-02-22 2022-02-22 一种基于联邦学习的电力数据安全高效共用方法 Pending CN114510741A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210159697.1A CN114510741A (zh) 2022-02-22 2022-02-22 一种基于联邦学习的电力数据安全高效共用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210159697.1A CN114510741A (zh) 2022-02-22 2022-02-22 一种基于联邦学习的电力数据安全高效共用方法

Publications (1)

Publication Number Publication Date
CN114510741A true CN114510741A (zh) 2022-05-17

Family

ID=81551593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210159697.1A Pending CN114510741A (zh) 2022-02-22 2022-02-22 一种基于联邦学习的电力数据安全高效共用方法

Country Status (1)

Country Link
CN (1) CN114510741A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330448A (zh) * 2017-06-09 2017-11-07 南京师范大学 一种基于标记协方差和多标记分类的联合学习方法
CN111143308A (zh) * 2019-12-26 2020-05-12 许昌中科森尼瑞技术有限公司 基于联邦学习的高低压电动机数据处理方法、系统及装置
CN112199702A (zh) * 2020-10-16 2021-01-08 鹏城实验室 一种基于联邦学习的隐私保护方法、存储介质及系统
CN113037460A (zh) * 2021-03-03 2021-06-25 北京工业大学 基于同态加密和秘密共享的联邦学习隐私保护方法
CN113128701A (zh) * 2021-04-07 2021-07-16 中国科学院计算技术研究所 面向样本稀疏性的联邦学习方法及系统
CN113553377A (zh) * 2021-07-21 2021-10-26 湖南天河国云科技有限公司 基于区块链和联邦学习的数据共享方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330448A (zh) * 2017-06-09 2017-11-07 南京师范大学 一种基于标记协方差和多标记分类的联合学习方法
CN111143308A (zh) * 2019-12-26 2020-05-12 许昌中科森尼瑞技术有限公司 基于联邦学习的高低压电动机数据处理方法、系统及装置
CN112199702A (zh) * 2020-10-16 2021-01-08 鹏城实验室 一种基于联邦学习的隐私保护方法、存储介质及系统
CN113037460A (zh) * 2021-03-03 2021-06-25 北京工业大学 基于同态加密和秘密共享的联邦学习隐私保护方法
CN113128701A (zh) * 2021-04-07 2021-07-16 中国科学院计算技术研究所 面向样本稀疏性的联邦学习方法及系统
CN113553377A (zh) * 2021-07-21 2021-10-26 湖南天河国云科技有限公司 基于区块链和联邦学习的数据共享方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHAOYANG HE ET AL.: "SpreadGNN: Serverless Multi-task Federated Learning for Graph Neural Networks", ARXIV, 4 June 2021 (2021-06-04), pages 1 - 2 *
YU ZHANG ET AL.: "A Convex Formulation for Learning Task Relationships in Multi-Task Learning", ARXIV, 15 March 2012 (2012-03-15), pages 1 - 2 *
潘少华;文再文;: "低秩稀疏矩阵优化问题的模型与算法", 运筹学学报, no. 03, 15 September 2020 (2020-09-15) *

Similar Documents

Publication Publication Date Title
Li et al. DeepFed: Federated deep learning for intrusion detection in industrial cyber–physical systems
Jithish et al. Distributed anomaly detection in smart grids: a federated learning-based approach
He et al. Cgan-based collaborative intrusion detection for uav networks: A blockchain-empowered distributed federated learning approach
Xie et al. Accurate recovery of missing network measurement data with localized tensor completion
Hu et al. Intelligent anomaly detection of trajectories for IoT empowered maritime transportation systems
Liu et al. Fedgru: Privacy-preserving traffic flow prediction via federated learning
CN112906859B (zh) 一种用于轴承故障诊断的联邦学习方法
CN113780344B (zh) 一种基于层次聚类的联邦学习方法及系统
CN114448660B (zh) 一种物联网数据接入方法
CN115208604B (zh) 一种ami网络入侵检测的方法、装置及介质
CN114707720A (zh) 一种基于纵向联邦学习的航班延误预测方法及系统
CN113326947B (zh) 一种联合学习模型训练方法及系统
CN116523074A (zh) 动态化公平性的隐私保护联邦深度学习方法
Zhou et al. A Network Intrusion Detection Method for Information Systems Using Federated Learning and Improved Transformer
He et al. A Federated Deep Reinforcement Learning-Based Trust Model in Underwater Acoustic Sensor Networks
Liu [Retracted] Privacy Protection Technology Based on Machine Learning and Intelligent Data Recognition
CN114510741A (zh) 一种基于联邦学习的电力数据安全高效共用方法
Zhang et al. How Often Channel Estimation is Required for Adaptive IRS Beamforming: A Bilevel Deep Reinforcement Learning Approach
Guo et al. De-correlation neural network for synchronous implementation of estimation and secrecy
CN114048328B (zh) 基于转换假设和消息传递的知识图谱链接预测方法及系统
CN115423119A (zh) 基于信任度的分散式联邦学习的医疗机构数据共享方法
Zhou et al. Metric Learning-based Few-Shot Malicious Node Detection for IoT Backhaul/Fronthaul Networks
Hua et al. A lightweight trust management mechanism based on conflict adjudication in underwater acoustic sensor networks
Chen et al. A self-adaptive wireless sensor network coverage method for intrusion tolerance based on particle swarm optimization and cuckoo search
Tang et al. Research on Internet of Vehicles Attack Prediction Based on Federated Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination