CN114580011A - 基于联邦隐私训练的电力设施安全态势感知方法及系统 - Google Patents
基于联邦隐私训练的电力设施安全态势感知方法及系统 Download PDFInfo
- Publication number
- CN114580011A CN114580011A CN202210111802.4A CN202210111802A CN114580011A CN 114580011 A CN114580011 A CN 114580011A CN 202210111802 A CN202210111802 A CN 202210111802A CN 114580011 A CN114580011 A CN 114580011A
- Authority
- CN
- China
- Prior art keywords
- distributed protocol
- protocol node
- node
- distributed
- decision tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012549 training Methods 0.000 title claims abstract description 51
- 238000003066 decision tree Methods 0.000 claims abstract description 75
- 238000004364 calculation method Methods 0.000 claims abstract description 14
- 230000005540 biological transmission Effects 0.000 claims abstract description 11
- 230000008447 perception Effects 0.000 claims abstract description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000001360 synchronised effect Effects 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 2
- 238000000926 separation method Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 14
- 238000005516 engineering process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 230000006854 communication Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000000586 desensitisation Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000004931 aggregating effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S40/00—Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them
- Y04S40/20—Information technology specific aspects, e.g. CAD, simulation, modelling, system security
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Small-Scale Networks (AREA)
Abstract
本发明涉及一种基于联邦隐私训练的电力设施安全态势感知方法及系统,其方法包括:S1:以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,网络上各分布式协议节点通过智能合约进行数据传递;S2:在保证各节点数据隐私的前提下获取各个分布式协议节点的网络流量作为训练样本,利用联邦学习训练面向决策树的联邦学习模型,得到决策树;S3:在联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果。本发明提供的方法用于保护多方协作进行电力基础设施相关数据联邦学习时的隐私,防止各部门协作过程中隐私泄露对系统造成的威胁。
Description
技术领域
本发明涉及电力数据隐私保护领域,具体涉及一种基于联邦隐私训练的电力设施安全态势感知方法及系统。
背景技术
随着信息化时代的到来,各行各业的数字化和智能化程度飞速提高,电网系统也不例外。智能电网覆盖电力系统整个生产过程,包括发电、输电、变电、配电、用电及调度等多个环节,它建立在集成的高速双向通信网络的基础上,通过传感和测量技术、设备技术、控制方法等实现了电网的可靠、经济、高效和环境友好等目标,提供满足21 世纪用户需求的电能质量、容许各种不同发电形式的接入、启动电力市场以及资产的优化高效运行等。由于智能电网中大量智能设备的接入,电力用户与信息世界联系越加紧密,通过大数据和机器学习来制定电力利用策略也成为了新的发展方向。而对于电力基础设施的数据进行联合建模,可以有效判断电力系统中的安全风险,感知电力安全态势。随着新技术层出不穷,对多方掌握的不同用户数据进行共享分析、联合建模的需求日益加深,数据共享的安全问题逐渐凸显。电力系统进行大数据分析、联合建模时所采集的数据有天然的分离特点,可以由各方掌握若干条具有同样特征的数据,也可由各方掌握一条数据的不同特征。而直接将原始数据集中到同一服务器汇总进行建模学习势必无法完全保护掌握原始数据的各方的数据隐私安全,也会在很大程度上影响电力系统的计算和通信效率。例如变电站掌握了总的用电量数据,而变化的用电人口的数量则由其他部门或公司掌握,如果发布者在联合分析时直接发布原始数据,而不采取适当的数据保护措施,很可能会泄露敏感信息,进而危害数据所有者。当前流行的多方协作的分布式学习框架并未考虑隐私保护问题,仍采用直接共享原始数据的方式进行学习建模,造成了数据隐私难以管理和保护的情况。
针对上述问题,多方进行不断研究,并结合现有技术进行创新以找寻安全可靠的电力系统联合分析的隐私保护方法。专利《一种基于混合加密算法的电力数据隐私通信方法》(CN112511304A)提供一种基于混合加密算法的电力数据隐私通信方法,通过混合加密,保证数据的机密性和完整性,提高加密和解密速度,同时解决了AES加密算法的密钥管理与分发的问题,优化电力数据通信流程,但仅专注于数据通信保密问题,并未考虑到联合建模的数据使用问题;专利《一种基于电网数据采集的数据脱敏方法及系统》(CN113282961A)涉及一种基于电网数据采集的数据脱敏方法和系统,获取多维电力数据并识别出其中的敏感数据,生成敏感数据的近似分布进行脱敏,但近似数据在联合建模时的有效性无法得到保证。
联邦学习与传统的隐私保护方法不同,可以使得各个部门的数据不离开本地,通过同态加密等加密算法在相应的机制下实现参数的交换,在不违背数据隐私规定的情况下,多个部门建立一个共有的电力系统安全态势模型,从而提升系统整体的安全性。在这个过程中,数据本身是不进行移动,因此对数据的隐私和规范性不会造成影响,进而充分保障了各部门信息的隐私性以及数据的安全性。在训练的过程中,通过两方提供数据以扩展某一条数据的维度的方式,称为纵向联邦学习,纵向联邦学习就是将某一条训练集的不同特征在加密状态下进行聚合,旨在增强、扩充某一条训练集的描述的联邦学习模式。不仅如此,由于联邦学习的模型参数共享与更新大多依赖可信第三方或集中式服务器来协调整个联邦学习系统,可能存在数据泄漏到第三方或集中式服务器的风险。因此,为提高联邦学习过程的可信性与容错性,可引入区块链技术。区块链作为一种去中心化的分布式存储架构,通过密码学知识保证其不可篡改性和不可伪造性,通过近年来联邦学习和区块链技术研究的积累,区块链+联邦学习(BlockFL,BFL)已经在高度隐私行业中有着巨大的应用潜能,将区块链作为联邦学习的底层基础架构,通过在区块链上层设计协议和智能合约来实现分布式模型聚合的任务,并实现电力部门数据的隐私保护是本发明的立足点。
在多方进行联邦学习的过程中,还需要考虑数据以何种训练模型进行训练以形成最终的态势感知预测模型。而决策树模型以其强大的扩展能力,能够轻松应付特征筛选、回归、分类等任务,一直在机器学习领域发挥着重要作用。按照决策树的输入类型可以分为离散特征的决策树和连续特征的决策树,按照决策树的目标可以分为分类决策树 (例如C4.5)和回归树(例如CART树),按照模型的训练方式可以分为Boosting决策树(XGBoost等)和Bagging决策树(随机森林等)。对于离散特征,决策树通常使用信息增益决定树模型分裂的节点,而信息增益存在偏好选择分支较多的特征属性,因此后续有使用信息增益率或者Gini系数作为节点分类依据。对于连续特征,传统的方式即使用均方误差确定决策树的划分节点。单棵决策树的效果往往有限,如果要增加决策树的准确性,通常会增加决策树深度或者增加树的数量。但增加决策树深度往往会导致严重的过拟合,所以决策树的进一步优化通常选择增加决策树数量。多棵决策树的聚合有Bagging和Boosting的方法,本发明所使用的Boosting方法以XGBoost为代表,每生成一棵新的决策树,都是在拟合优化之前所有决策树预测的残差,最终模型是所有决策树结果的加和。XGBoost在提供更高准确率的同时,针对Boosting方法存有的过拟合风险,引用了随机森林中随机采样特征的方法和正则化项来有效防止过拟合。XGBoost 的思想为决策树的准确性带来了极大的提升,后续也有例如lightgbm将缓存在内存中的样本特征值转为样本的分桶值,使用互斥特征捆绑算法减少特征数量;使用leaf-wise的决策树构建策略,减少不必要的计算量并对缓存进行优化,增加cache的命中率等方法,以优化XGBoost的运行内存和计算速度,适应更大的数据量。
总之,现有技术存在以下缺点和不足:1)一些基于传统方式的隐私保护研究,在较大程度上增加了数据交互时的计算成本,不利于联合建模时对数据的使用;2)未在联邦学习时将区块链纳入隐私防护方案的研究中,存在数据内容泄漏至提供聚合服务的第三方或集中式服务器的风险,导致数据隐私无法得到有效的保障。
发明内容
为了解决上述技术问题,本发明提供一种基于联邦隐私训练的电力设施安全态势感知方法及系统。
本发明技术解决方案为:一种基于联邦隐私训练的电力设施安全态势感知方法,包括:
步骤S1:以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,所述联盟区块链网络上各个所述分布式协议节点通过智能合约进行数据传递;
步骤S2:构建面向决策树的联邦学习模型,获取各个所述分布式协议节点的网络流量作为训练样本,根据所述训练样本的数学特征,在保证多方数据隐私的前提下,训练所述面向决策树的联邦学习模型,得到决策树;
步骤S3:在所述联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个所述分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果。
本发明与现有技术相比,具有以下优点:
本发明提供的一种基于联邦隐私训练的电力设施安全态势感知方法,利用区块链技术作为底层框架,利用智能合约实现数据在传递过程中的隐私保护,利用区块链极大地改变了数据访问、存储和检索的方式,及其去中心化、数据共享全流程可靠、可追溯等特性,可以避免数据泄漏到提供聚合服务的第三方或集中式服务器的风险。
本发明提供的方法以决策树为基础,提取原始数据的数学特征,利用同态加密、智能合约和共识机制等实现数据的隐私建模,保证各部门的数据交互过程真实可信的同时不泄露参与者的数据隐私,也为其他未参与部门数据交互的规范性提出保证,提高所构建模型对电力基础设施安全态势的感知能力。
附图说明
图1为本发明实施例中一种基于联邦隐私训练的电力设施安全态势感知方法的流程图;
图2为本发明实施例中联盟区块链网络的构建过程示意图;
图3为本发明实施例中特征桶的生成过程示意图;
图4为本发明实施例中面向决策树的联邦学习模型的建模流程示意图;
图5为本发明实施例中一种基于联邦隐私训练的电力设施安全态势感知系统的结构框图。
具体实施方式
本发明提供了一种基于联邦隐私训练的电力设施安全态势感知方法,保护多方协作进行电力基础设施相关数据联邦学习时的隐私,旨在防止电力部门协作过程中出现隐私泄露对系统造成威胁的现象。
为了使本发明的目的、技术方案及优点更加清楚,以下通过具体实施,并结合附图,对本发明进一步详细说明。
实施例一
如图1所示,本发明实施例提供的一种基于联邦隐私训练的电力设施安全态势感知方法,包括下述步骤:
步骤S1:以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,联盟区块链网络上各个分布式协议节点通过智能合约进行数据传递;
步骤S2:构建面向决策树的联邦学习模型,获取各个分布式协议节点的网络流量作为训练样本,根据训练样本的数学特征,在保证多方数据隐私的前提下,训练面向决策树的联邦学习模型,得到决策树;
步骤S3:在联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果。
在一个实施例中,上述步骤S1:以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,联盟区块链网络上各个分布式协议节点通过智能合约进行数据传递,具体包括:
步骤S11:联盟区块链网络包括:数字身份账本、分布式协议节点以及分布式客户端;其中数字身份账本包括身份标识符和身份凭证,数字身份账本存于分布式账本;
数字身份账本包括身份标识符和身份凭证,其中的身份标识符是作为联盟区块链内实体的唯一标识,身份凭证是与实体相关联的身份属性声明集合,以证明实体身份。
步骤S12:分布式协议节点连接分布式账本和分布式客户端,接收分布式客户端的请求;各个分布式协议节点上运行同一份智能合约,通过数字身份账本,进行业务处理;
步骤S13:用户在分布式客户端自主生成数字身份账本,经由分布式协议节点在对应的分布式账本进行上链存储;不同用户通过分布式客户端可向联盟区块链网络提出联合建模请求,共同利用双方的电力设施数据进行建模。
本发明实施例采用联盟区块链网络作为底层技术选型,更符合电力行业可信交互以及对接需求,有性能较优、监管友好等特性,联盟区块链网络信任分布式身份认证,由可信联盟区块链网络内各协议节点共同行使共识和记账的权利,各协议节点共同维护一份相同的联盟分布式身份账本。
如图2所示,展示了联盟区块链网络的构建过程。
下面通过举例展示在纵向联邦学习模型中,参与联合建模的分布式协议节点A与分布式协议节点B在共享隐私数据过程中如何保证双方隐私数据不被泄露的过程。
在一个实施例中,上述步骤S2:构建面向决策树的联邦学习模型,获取各个分布式协议节点的网络流量作为训练样本,根据训练样本的数学特征,在保证多方数据隐私的前提下,训练面向决策树的联邦学习模型,得到决策树,具体包括:
步骤S21:分布式协议节点A基于同态加密算法生成公钥和私钥,并将公钥和面向决策树的联邦学习模型的参数配置(例如:迭代轮数、决策树的最大深度、叶子节点树等参数)通过智能合约上传至联盟区块链网络中,进而同步给分布式协议节点B;其中,分布式协议节点A的训练样本具有标签,分布式协议节点B的训练样本不具有标签,且二者的训练样本具有不同维度的特征;
分布式协议节点A的训练样本应具备某些维度的特征,及其训练样本对应的标签;而分布式协议节点B的训练样本具备与分布式协议节点A不同维度的特征,且不具备对应的标签,从而可以起到补充分布式协议节点A的训练样本维度的作用。
步骤S22:分布式协议节点A和分布式协议节点B进行数据初始化处理,得到分布式协议节点A的特征数据data_a(分布式协议节点A提供的基础设施安全相关信息,例如针对该基础设施输入的网络流量:出现SYN错误的连接次数、过去的2秒内与当前连接有着相同的目的地址的连接、出现REJ错误的连接次数)和分布式协议节点B的特征数据data_b(分布式协议节点B提供的基础设施安全相关信息,如针对该基础设施输入的网络流量:建立相同服务的连接次数、建立不同服务的连接次数、过去2秒时间内出现和当前连接服务相同的连接次数),对其进行数据分桶和稀疏特征过滤操作,分别生成本地特征桶BinA和BinB;并且分布式协议节点A包含标签信息label_a(label_a 包括:该网络流量表现为正常记录、拒绝服务攻击、监视和其他探测活动、来自远程机器的非法访问以及普通用户对本地超级用户特权的非法访问);
图3展示了特征桶的生成过程示意图;
步骤S23:设置迭代轮数N,若此时生成是第一棵决策树,则只需对分布式协议节点A进行初始化,否则,分布式协议节点A根据上一棵决策树的预测值和标签值label_a,计算上一轮的残差值,以及本轮的残差值Ga和Ha;
步骤S24:分布式协议节点A将Ga和Ha用公钥加密,得到密文残差enc_Ga和 enc_Ha,通过智能合约上传到联盟区块链网络中,进而同步到分布式协议节点B;
步骤S25:分布式协议节点A和分布式协议节点B分别从其决策树的根节点开始递归寻找决策树的每一个最优分裂点,直到所有的节点都是叶子节点,具体包括:
步骤S251:分布式协议节点A和分布式协议节点B判断当前节点是否为叶子节点,即判断决策树的最大深度是否达到阈值,或节点上的数据行数是否小于阈值,再或当前节点上的数据是否不需要再划分;如果不是叶子节点,就继续分裂;若是叶子节点就直接返回,结束递归;
步骤S252:分布式协议节点A和分布式协议节点B同步每个决策树节点划分的节点ID信息;
步骤S253:分布式协议节点A根据本地特征分桶BinA和残差值Ga和Ha,构建明文直方图,并计算基于直方图的每一个分裂位置的信息增益gain,并找到最大信息增益 gain_A的直方图位置作为分布式协议节点A的局部最优分裂点;
步骤S254:分布式协议节点B根据本地特征分桶BinB、密文残差值enc_Ga和enc_Ha和分布式协议节点A生成的公钥构建密文直方图;分布式协议节点B将密文直方图通过智能合约共享至联盟区块链网络网络中,进而发送回到分布式协议节点A;
步骤S255:分布式协议节点A根据私钥解密密文直方图,并计算分布式协议节点B的信息增益,找到分布式协议节点B最大信息增益gain_B位置,做为分布式协议节点B 的局部最优分裂点;
步骤S256:分布式协议节点A比较两个局部最优信息增益gain_A和gain_B,判断全局最优分裂位于分布式协议节点A还是分布式协议节点B;如果位于分布式协议节点 A,则直接根据gain_A对应的分裂位置对节点进行分裂,更新新一轮分裂信息值,并存储;如果位于分布式协议节点B,则分布式协议节点A需要将gain_B对应的分裂位置发回分布式协议节点B。分布式协议节点B根据该位置对节点进行分裂,并存储分裂信息值,并将分裂ID结果同步到分布式协议节点A;分布式协议节点A根据分布式协议节点B同步的结果,划分节点并更新分裂信息,直到所有的节点都是叶子节点,则生成决策树;
步骤S26:分布式协议节点A和分布式协议节点B同步决策树的结构,但是每个分裂点的分裂值信息不同步;最终分布式协议节点A和分布式协议节点B双方各自输出模型结果为N棵树,N为迭代轮数;如果在分布式协议节点A的特征上分裂,则存储于分布式协议节点A,如果在分布式协议节点B的特征上分裂,则存储于分布式协议节点B;叶子节点上存储了分裂到该叶子节点上的预测值;
步骤S27:根据新生成的决策树,计算新一轮的预测值,并输出到下一轮的迭代中,直到完成N轮迭代,分别得到分布式协议节点A的决策树和分布式协议节点B的决策树。
如图4所示,展示了面向决策树的联邦学习模型的建模流程示意图。
在一个实施例中,上述步骤S3:在联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果,具体包括:
步骤S31:合并分布式协议节点A的决策树和分布式协议节点B的决策树,构成最终的决策树,从而得到训练好的面向决策树的联邦学习模型,并将该模型通过智能合约共享到联盟区块链网络中;
步骤S32:联盟区块链网络中各个分布式协议节点可利用训练好的面向决策树的联邦学习模型进行本地计算和预测。
本发明提供的一种基于联邦隐私训练的电力设施安全态势感知方法,利用区块链技术作为底层框架,利用智能合约实现数据在传递过程中的隐私保护,利用区块链极大地改变了数据访问、存储和检索的方式,及其去中心化、数据共享全流程可靠、可追溯等特性,可以避免数据泄漏到提供聚合服务的第三方或集中式服务器的风险。
本发明提供的方法以决策树为基础,提取原始数据的数学特征,利用同态加密、智能合约和共识机制等实现数据的隐私建模,保证各部门的数据交互过程真实可信的同时不泄露参与者的数据隐私,也为其他未参与部门数据交互的规范性提出保证,提高所构建模型对电力基础设施安全态势的感知能力。
实施例二
如图5所示,本发明实施例提供了一种基于联邦隐私训练的电力设施安全态势感知系统,包括下述模块:
构建联盟区块链网络模块41,用于以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,联盟区块链网络上各个分布式协议节点通过智能合约进行数据传递;
训练面向决策树的联邦学习模型模块42,用于构建面向决策树的联邦学习模型,利用待训练的网络流量样本的数学特征,在保证多方数据隐私的前提下,训练面向决策树的联邦学习模型,得到决策树;
共享面向决策树的联邦学习模型模块43,用于在联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果。
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。
Claims (6)
1.一种基于联邦隐私训练的电力设施安全态势感知方法,其特征在于,包括:
步骤S1:以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,所述联盟区块链网络上各个所述分布式协议节点通过智能合约进行数据传递;
步骤S2:构建面向决策树的联邦学习模型,获取各个所述分布式协议节点的网络流量作为训练样本,根据所述训练样本的数学特征,在保证多方数据隐私的前提下,训练所述面向决策树的联邦学习模型,得到决策树;
步骤S3:在所述联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个所述分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果。
2.根据权利要求1所述的基于联邦隐私训练的电力设施安全态势感知方法,其特征在于,所述步骤S1:以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,所述联盟区块链网络上各个所述分布式协议节点通过智能合约进行数据传递,具体包括:
步骤S11:所述联盟区块链网络包括:数字身份账本、分布式协议节点以及分布式客户端;其中所述数字身份账本包括身份标识符和身份凭证,所述数字身份账本存于所述分布式账本;
步骤S12:所述分布式协议节点连接所述分布式账本和所述分布式客户端,接收所述分布式客户端的请求;各个所述分布式协议节点上运行同一份所述智能合约,通过所述数字身份账本,进行业务处理;
步骤S13:用户在所述分布式客户端自主生成所述数字身份账本,经由所述分布式协议节点在对应的所述分布式账本进行上链存储;不同所述用户通过所述分布式客户端可向所述联盟区块链网络提出联合建模请求,共同利用双方的电力设施数据进行建模。
3.根据权利要求1所述的基于联邦隐私训练的电力设施安全态势感知方法,其特征在于,所述步骤S2:构建面向决策树的联邦学习模型,获取各个所述分布式协议节点的网络流量作为训练样本,根据所述训练样本的数学特征,在保证多方数据隐私的前提下,训练所述面向决策树的联邦学习模型,得到决策树,具体包括:
步骤S21:分布式协议节点A基于同态加密算法生成公钥和私钥,并将所述公钥和所述面向决策树的联邦学习模型的参数配置通过所述智能合约上传至所述联盟区块链网络中,进而同步给分布式协议节点B;其中,所述分布式协议节点A的所述训练样本具有标签,所述分布式协议节点B的所述训练样本不具有标签,且二者的训练样本具有不同维度的特征;
步骤S22:分布式协议节点A和分布式协议节点B进行数据初始化处理,得到分布式协议节点A的特征数据data_a和分布式协议节点B的特征数据data_b,对其进行数据分桶和稀疏特征过滤操作,分别生成本地特征桶BinA和BinB;并且分布式协议节点A包含标签信息label_a;
步骤S23:设置迭代轮数N,若此时生成是第一棵决策树,则只需对分布式协议节点A进行初始化,否则,分布式协议节点A根据上一棵决策树的预测值和标签值label_a,计算上一轮的残差值,以及本轮的残差值Ga和Ha;
步骤S24:分布式协议节点A将Ga和Ha用所述公钥加密,得到密文残差enc_Ga和enc_Ha,通过所述智能合约上传到所述联盟区块链网络中,进而同步到分布式协议节点B;
步骤S25:分布式协议节点A和分布式协议节点B分别从其决策树的根节点开始递归寻找所述决策树的每一个最优分裂点,直到所有的节点都是叶子节点;
步骤S26:分布式协议节点A和分布式协议节点B同步决策树的结构,但是每个分裂点的分裂值信息不同步;最终分布式协议节点A和分布式协议节点B双方各自输出模型结果为N棵树,N为迭代轮数;如果在分布式协议节点A的特征上分裂,则存储于分布式协议节点A,如果在分布式协议节点B的特征上分裂,则存储于分布式协议节点B;叶子节点上存储了分裂到该叶子节点上的预测值;
步骤S27:根据新生成的决策树,计算新一轮的预测值,并输出到下一轮的迭代中,直到完成N轮迭代,分别得到分布式协议节点A的决策树和分布式协议节点B的决策树。
4.根据权利要求3所述的基于联邦隐私训练的电力设施安全态势感知方法,其特征在于,所述步骤S25:分布式协议节点A和分布式协议节点B分别从其决策树的根节点开始递归寻找所述决策树的每一个最优分裂点,直到所有的节点都是叶子节点,具体包括:
步骤S251:分布式协议节点A和分布式协议节点B判断当前节点是否为叶子节点,即判断所述决策树的最大深度是否达到阈值,或节点上的数据行数是否小于阈值,再或当前节点上的数据是否不需要再划分;如果不是叶子节点,就继续分裂;若是叶子节点就直接返回,结束递归;
步骤S252:分布式协议节点A和分布式协议节点B同步每个决策树节点划分的节点ID信息;
步骤S253:分布式协议节点A根据本地特征分桶BinA和残差值Ga和Ha,构建明文直方图,并计算基于所述直方图的每一个分裂位置的信息增益gain,并找到最大信息增益gain_A的直方图位置作为分布式协议节点A的局部最优分裂点;
步骤S254:分布式协议节点B根据本地特征分桶BinB、所述密文残差值enc_Ga和enc_Ha和分布式协议节点A生成的公钥构建密文直方图;分布式协议节点B将所述密文直方图通过智能合约共享至联盟区块链网络网络中,进而发送回到分布式协议节点A;
步骤S255:分布式协议节点A根据私钥解密所述密文直方图,并计算分布式协议节点B的信息增益,找到分布式协议节点B最大信息增益gain_B位置,做为分布式协议节点B的局部最优分裂点;
步骤S256:分布式协议节点A比较两个局部最优信息增益gain_A和gain_B,判断全局最优分裂位于分布式协议节点A还是分布式协议节点B;如果位于分布式协议节点A,则直接根据gain_A对应的分裂位置对节点进行分裂,更新新一轮分裂信息值,并存储;如果位于分布式协议节点B,则分布式协议节点A需要将gain_B对应的分裂位置发回分布式协议节点B。分布式协议节点B根据该位置对节点进行分裂,并存储分裂信息值,并将分裂ID结果同步到分布式协议节点A;分布式协议节点A根据分布式协议节点B同步的结果,划分节点并更新分裂信息,直到所有的节点都是叶子节点,则生成决策树。
5.根据权利要求1所述的基于联邦隐私训练的电力设施安全态势感知方法,其特征在于,所述步骤S3:在所述联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个所述分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果,具体包括:
步骤S31:合并分布式协议节点A的决策树和分布式协议节点B的决策树,构成最终的决策树,从而得到训练好的面向决策树的联邦学习模型,并将该模型通过所述智能合约共享到所述联盟区块链网络中;
步骤S32:所述联盟区块链网络中各个所述分布式协议节点可利用所述训练好的面向决策树的联邦学习模型进行本地计算和预测。
6.一种基于联邦隐私训练的电力设施安全态势感知系统,其特征在于,包括下述模块:
构建联盟区块链网络模块,用于以不同电力部门作为分布式协议节点,利用分布式账本构建联盟区块链网络,所述联盟区块链网络上各个所述分布式协议节点通过智能合约进行数据传递;
训练面向决策树的联邦学习模型模块,用于构建面向决策树的联邦学习模型,利用待训练的网络流量样本的数学特征,在保证多方数据隐私的前提下,训练所述面向决策树的联邦学习模型,得到决策树;
共享面向决策树的联邦学习模型模块,用于在所述联盟区块链网络内共享训练好的面向决策树的联邦学习模型,各个所述分布式协议节点均可利用该模型进行本地计算和预测,得到所需预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210111802.4A CN114580011B (zh) | 2022-01-29 | 2022-01-29 | 基于联邦隐私训练的电力设施安全态势感知方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210111802.4A CN114580011B (zh) | 2022-01-29 | 2022-01-29 | 基于联邦隐私训练的电力设施安全态势感知方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114580011A true CN114580011A (zh) | 2022-06-03 |
CN114580011B CN114580011B (zh) | 2024-06-14 |
Family
ID=81769437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210111802.4A Active CN114580011B (zh) | 2022-01-29 | 2022-01-29 | 基于联邦隐私训练的电力设施安全态势感知方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114580011B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117034328A (zh) * | 2023-10-09 | 2023-11-10 | 国网信息通信产业集团有限公司 | 一种改进的基于联邦学习的异常用电检测系统及方法 |
CN117196069A (zh) * | 2023-11-07 | 2023-12-08 | 中电科大数据研究院有限公司 | 联邦学习方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165683A (zh) * | 2018-08-10 | 2019-01-08 | 深圳前海微众银行股份有限公司 | 基于联邦训练的样本预测方法、装置及存储介质 |
WO2019086553A1 (en) * | 2017-10-31 | 2019-05-09 | Twinpeek | Privacy management |
CN109816257A (zh) * | 2019-01-30 | 2019-05-28 | 广东电网有限责任公司 | 一种基于区块链的双源能源互联网交易方法及设备 |
CN113204787A (zh) * | 2021-05-06 | 2021-08-03 | 广州大学 | 基于区块链的联邦学习隐私保护方法、系统、设备和介质 |
CN113901412A (zh) * | 2021-10-18 | 2022-01-07 | 国网山东省电力公司济宁供电公司 | 电能质量扰动检测方法及装置、电子设备、存储介质 |
CN113992360A (zh) * | 2021-10-01 | 2022-01-28 | 浙商银行股份有限公司 | 一种基于区块链跨链的联邦学习方法及设备 |
-
2022
- 2022-01-29 CN CN202210111802.4A patent/CN114580011B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019086553A1 (en) * | 2017-10-31 | 2019-05-09 | Twinpeek | Privacy management |
CN109165683A (zh) * | 2018-08-10 | 2019-01-08 | 深圳前海微众银行股份有限公司 | 基于联邦训练的样本预测方法、装置及存储介质 |
CN109816257A (zh) * | 2019-01-30 | 2019-05-28 | 广东电网有限责任公司 | 一种基于区块链的双源能源互联网交易方法及设备 |
CN113204787A (zh) * | 2021-05-06 | 2021-08-03 | 广州大学 | 基于区块链的联邦学习隐私保护方法、系统、设备和介质 |
CN113992360A (zh) * | 2021-10-01 | 2022-01-28 | 浙商银行股份有限公司 | 一种基于区块链跨链的联邦学习方法及设备 |
CN113901412A (zh) * | 2021-10-18 | 2022-01-07 | 国网山东省电力公司济宁供电公司 | 电能质量扰动检测方法及装置、电子设备、存储介质 |
Non-Patent Citations (4)
Title |
---|
李达;王栋;阮倩昀;柏德胜;许洪华;霍冬冬: "电力供应链场景下智能合约个性化升级方法", 《信息技术与网络安全》, 10 September 2021 (2021-09-10) * |
王林信;杨鹏;江元;侯应龙;廖晓群;: "智能电网大数据隐私保护技术研究与实现", 电力信息与通信技术, no. 12, 25 December 2019 (2019-12-25) * |
谢丰;卞建玲;王楠;郑倩;: "联邦学习在泛在电力物联网人工智能领域的应用", 中国高新科技, no. 23, 1 December 2019 (2019-12-01) * |
陈晟恺: "基于平台智能协调的大规模动态云资源调度方法研究", 《中国博士学位论文全文数据库 信息科技辑》, 15 January 2022 (2022-01-15), pages 139 - 61 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117034328A (zh) * | 2023-10-09 | 2023-11-10 | 国网信息通信产业集团有限公司 | 一种改进的基于联邦学习的异常用电检测系统及方法 |
CN117034328B (zh) * | 2023-10-09 | 2024-03-19 | 国网信息通信产业集团有限公司 | 一种改进的基于联邦学习的异常用电检测系统及方法 |
CN117196069A (zh) * | 2023-11-07 | 2023-12-08 | 中电科大数据研究院有限公司 | 联邦学习方法 |
CN117196069B (zh) * | 2023-11-07 | 2024-01-30 | 中电科大数据研究院有限公司 | 联邦学习方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114580011B (zh) | 2024-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ferrag et al. | Security and privacy for green IoT-based agriculture: Review, blockchain solutions, and challenges | |
Yu et al. | Toward data security in edge intelligent IIoT | |
Jiang et al. | Energy big data: A survey | |
CN111259070A (zh) | 一种业务数据存储、获取的方法及相关装置 | |
Khalil et al. | A literature review on blockchain-enabled security and operation of cyber-physical systems | |
CN114580011B (zh) | 基于联邦隐私训练的电力设施安全态势感知方法及系统 | |
Lu et al. | Blockchain-based distributed energy trading in energy Internet: An SDN approach | |
CN112214544A (zh) | 基于许可区块链的泛在电力物联网边缘数据安全存储方法 | |
CN106375157A (zh) | 一种基于相空间重构的网络流关联方法 | |
CN113708934A (zh) | 异构环境下基于区块链的能源互联网可信交互数据模型 | |
CN112732695A (zh) | 一种基于区块链的云存储数据安全去重方法 | |
CN115037556B (zh) | 一种智慧城市系统中加密数据可授权共享方法 | |
Ma et al. | An Efficient Pairing‐Free Certificateless Searchable Public Key Encryption for Cloud‐Based IIoT | |
CN116366673A (zh) | 一种面向电网信息机房管理的数据分析与共享方法 | |
Erroutbi et al. | Secure and lightweight HMAC mutual authentication protocol for communication between IoT devices and fog nodes | |
Jiang et al. | Research on the application of blockchain in copyright protection | |
Zhong et al. | Data Security Storage Method for Power Distribution Internet of Things in Cyber‐Physical Energy Systems | |
CN111200604A (zh) | 一种基于数据聚合的隐私保护方法及系统 | |
Qiu et al. | Traceability anti-counterfeiting system based on the ownership of edge computing on the blockchain | |
Barbosa et al. | SAFETHINGS: data security by design in the IoT | |
Zhu et al. | A novel covert timing channel based on bitcoin messages | |
Liu et al. | ESA-FedGNN: Efficient secure aggregation for federated graph neural networks | |
Cheng et al. | Ocean data sharing based on blockchain | |
CN116032590A (zh) | 一种ddos攻击的检测模型训练方法及相关装置 | |
Sun et al. | A Novel Block-chain based secure cross-domain interaction Approach for intelligent transportation systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |