CN117763621A - 一种基于联邦学习的能源大数据安全保护方法 - Google Patents

一种基于联邦学习的能源大数据安全保护方法 Download PDF

Info

Publication number
CN117763621A
CN117763621A CN202410195096.5A CN202410195096A CN117763621A CN 117763621 A CN117763621 A CN 117763621A CN 202410195096 A CN202410195096 A CN 202410195096A CN 117763621 A CN117763621 A CN 117763621A
Authority
CN
China
Prior art keywords
data
abnormal
row
frequency domain
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410195096.5A
Other languages
English (en)
Other versions
CN117763621B (zh
Inventor
王世谦
狄立
邵志鹏
张小建
李秋燕
高先周
王圆圆
卜飞飞
费稼轩
贾一博
宋大为
华远鹏
韩丁
董李锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Smart Grid Research Institute Co ltd
Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd
Original Assignee
State Grid Smart Grid Research Institute Co ltd
Qingdao Tatan Technology Service Co ltd
Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Smart Grid Research Institute Co ltd, Qingdao Tatan Technology Service Co ltd, Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd filed Critical State Grid Smart Grid Research Institute Co ltd
Priority to CN202410195096.5A priority Critical patent/CN117763621B/zh
Priority claimed from CN202410195096.5A external-priority patent/CN117763621B/zh
Publication of CN117763621A publication Critical patent/CN117763621A/zh
Application granted granted Critical
Publication of CN117763621B publication Critical patent/CN117763621B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)

Abstract

本发明涉及密钥优化处理技术领域,具体涉及一种基于联邦学习的能源大数据安全保护方法,该方法包括:构建系统能源监控数据矩阵以及电网设备监控数据矩阵;根据两个矩阵每行数据的频域信息构建运行性能同步指数;根据系统能源监控数据矩阵每行数据与预测之后的差异程度获取每行数据的异常模式影响因子;结合两个矩阵之间的运行性能同步指数以及系统能源监控数据矩阵每行数据的异常模式影响因子构建两个矩阵之间的整体异常互影响因子;基于整体异常互影响因子以及预设密钥长度阈值确定密钥长度,优化加密算法,实现能源大数据的安全保护。本发明旨避免子服务器的敏感信息的泄露,保障能源大数据安全。

Description

一种基于联邦学习的能源大数据安全保护方法
技术领域
本申请涉及密钥优化处理技术领域,具体涉及一种基于联邦学习的能源大数据安全保护方法。
背景技术
随着能源行业的数字化转型和大数据的广泛应用,能源大数据的安全性和隐私保护成为亟待解决的重要问题。传统的数据管理方法往往难以有效应对分布式、多源的电力大数据,而在这个背景下,基于联邦学习的方法为分布式的能源大数据提供隐私安全的机制,其目的在于解决数据的协作和隐私保护问题,这一方法不仅满足了当前电力大数据管理的紧迫需求,同时为未来能源领域的智能化、安全化发展提供了强有力的技术支持,助推能源行业朝着更加安全、高效、可持续的方向迈进。
然而,联邦学习的成功依赖于各方的合作和信任,如果有一方恶意参与或者存在安全漏洞,可能影响整个系统的安全性。且联邦学习采用了差分隐私等技术来保护数据隐私,这种方法会引入额外的噪声,在敏感较高的任务中无法兼顾模型准确性以和对隐私数据的保护,需要对此进行改进。
发明内容
为了解决上述技术问题,本发明提供一种基于联邦学习的能源大数据安全保护方法,以解决现有的问题。
本发明的一种基于联邦学习的能源大数据安全保护方法采用如下技术方案:
本发明一个实施例提供了一种基于联邦学习的能源大数据安全保护方法,该方法包括以下步骤:
获取各采集周期的能源数据;基于监测的系统性能以及设备管理数据构建各采集周期的系统能源监控数据矩阵以及电网设备监控数据矩阵;
将系统能源监控数据矩阵和电网设备监控数据矩阵每行数据均转换为频域信号,根据频域信号在每行数据之间的整体频率-幅度对应关系分别构建第一平均频域信号和第二平均频域信号;基于两个平均频域信号的平稳运行过程以及互相关关系获取频域信息;根据频域信息获取两个矩阵之间的运行性能同步指数;
对于系统能源监控数据矩阵每行数据,根据每行数据与预测之后的差异程度获取聚类后各聚类簇的异常模式影响;根据各异常点与所属聚类簇整体的数值位置分布差异以及各聚类簇的异常模式影响获取每行数据的异常模式影响因子;结合两个矩阵之间的运行性能同步指数以及系统能源监控数据矩阵每行数据的异常模式影响因子构建两个矩阵之间的整体异常互影响因子;
基于整体异常互影响因子以及预设密钥长度阈值确定密钥长度,将各采集周期的能源数据根据对应周期的密钥长度进行加密得到密文数据,将所有周期的密文数据进行整合并上传服务器,实现能源大数据的加密优化。
优选的,所述基于监测的系统性能以及设备管理数据构建各采集周期的系统能源监控数据矩阵以及电网设备监控数据矩阵,包括:
将监测系统性能的各种类数据的数据序列组成系统能源监控数据矩阵;所述各种类数据包括但不限于:电力负荷数据、电网状态数据以及能源生产数据;
将电网各设备在不同采集时刻的压力、温度数据分别作为电网设备监控数据矩阵各行向量,其中,同一设备不同采集时刻的压力、温度数据在电网设备监控数据矩阵中为相邻的两个行向量。
优选的,所述将系统能源监控数据矩阵和电网设备监控数据矩阵每行数据均转换为频域信号,包括:
采用快速傅里叶变换分别将系统能源监控数据矩阵、电网设备监控数据矩阵中的每行数据转换为频域信号。
优选的,所述根据频域信号在每行数据之间的整体频率-幅度对应关系分别构建第一平均频域信号和第二平均频域信号,包括:
对于系统能源监控数据矩阵,将所有行之间具有相同频率的幅度计算幅度均值,将所有频率的幅度均值按照频率从小到大组成系统能源监控数据矩阵的平均频域信号,记为第一平均频域信号;
采用与系统能源监控数据矩阵的平均频域信号相同的计算方法构建电网设备监控数据矩阵的平均频域信号,记为第二平均频域信号。
优选的,所述基于两个平均频域信号的平稳运行过程以及互相关关系获取频域信息,包括:
获取两个平均频域信号的功率谱密度,分别记为第一功率谱密度和第二功率谱密度;
将两个矩阵的平均频率信号采用逆傅里叶变换得到互相关函数;获取互相关函数的峰值。
优选的,所述根据频域信息获取两个矩阵之间的运行性能同步指数,包括:
对于矩阵在时域信号下的各采样频率,计算第一功率谱密度与第二功率谱密度在各采样频率下数值的比值;将1与所述比值的差值绝对值的相反数作为指数、将自然常数作为底数构建第一指数函数;计算所有采样频率的所述第一指数函数的计算结果的均值;
将所述峰值的相反数作为指数、将自然常数作为底数构建第二指数函数;将所述第二指数函数的计算结果与所述均值的乘积作为两个矩阵之间的运行性能同步指数。
优选的,所述根据每行数据与预测之后的差异程度获取聚类后各聚类簇的异常模式影响,包括:
采用ARIMA模型对每行数据每个时刻的数据进行预测得到各预测值;计算各时刻数据点的实际值与预测值之间的残差,当数据点的残差大于预设阈值时,将数据点标记为异常点;
将每行数据进行聚类得到各聚类簇;获取各聚类簇内的元素数量和异常点数量;将异常点数量与元素数量的比值作为第一比值;获取各聚类簇内的元素数据均值和异常点数据均值;将异常点数据均值与元素数据均值的比值作为第二比值;
将1与第二比值的差值,乘以第一比值的计算结果作为各聚类簇的异常模式影响。
优选的,所述根据各异常点与所属聚类簇整体的数值位置分布差异以及各聚类簇的异常模式影响获取每行数据的异常模式影响因子,包括:
获取各异常点所属聚类簇内的元素数据均值、最大索引、最小索引;
对于每行数据的各异常点,计算最大索引与最小索引差值的一半;计算异常点索引与差值的一半的差值绝对值;计算差值绝对值与预设调节参数的和值;计算异常点数值与元素数据均值的差值作为第一差值;计算第一差值与和值的比值;
对于每行数据的各聚类簇,计算各聚类簇的异常模式影响与各异常点的比值的乘积,将每行数据的所有聚类簇与所有异常点之间的所述乘积的和值作为每行数据的异常模式影响因子。
优选的,所述结合两个矩阵之间的运行性能同步指数以及系统能源监控数据矩阵每行数据的异常模式影响因子构建两个矩阵之间的整体异常互影响因子,包括:
计算系统能源监控数据矩阵所有行数据的异常模式影响因子的和值;将所述和值与两个矩阵之间的运行性能同步指数的乘积的归一化值作为两个矩阵之间的整体异常互影响因子。
优选的,所述基于整体异常互影响因子以及预设密钥长度阈值确定密钥长度,包括:
当整体异常互影响因子大于0且小于等于第一预设长度阈值时,将密钥长度设置为128;当整体异常互影响因子大于第一预设长度阈值且小于等于第二预设长度阈值时,将密钥长度设置为192;当整体异常互影响因子大于第二预设长度阈值且小于等于1时,将密钥长度设置为256;其中,所述第一预设长度阈值小于第二预设长度阈值。
本发明至少具有如下有益效果:
本发明通过对监测的电力能源大数据的各种数据进行分析,综合采集多源数据使得溯源方法更具全面性、实用性,为电力能源大数据的处理提供更强力的支持;通过将两个矩阵从时域信号转换到频域信号,基于频域信号的特征获取两个矩阵之间的运行性能同步指数,通过分析两个矩阵在频域信号中的表现,挖掘两种不同类型数据组之间的共同频率成分以及时间延迟,从而构建能源大数据变化的特征,用于度量矩阵之间运行的相似情况,协助判断密钥长度的选择,使得改进密钥长度的过程更加全面;
通过对系统能源监控数据矩阵中每行数据的聚类后的异常点的密度分布进行分析,根据聚类簇内异常点的聚集、偏离程度因素衡量异常事件的发生情况,将系统能源监控数据矩阵中的每行数据的综合影响表示出来,即通过每行数据的异常数据反映的异常模式得到每行数据的影响程度因素;本发明将矩阵之间的运行性能同步指数与系统能源监控数据矩阵中每行数据的异常模式影响因子结合起来,共同构建整体异常互影响因子,用来表示矩阵之间的整体异常互影响的概率,揭示两个矩阵发生协同变化的概率情况,挖掘矩阵之间数据变化状态同步表现;本发明通过整体异常互影响因子的大小,改进加密算法的密钥长度,使其可以根据整体数据发生异常事件的情况自适应调整,增强了算法的鲁棒性与安全性,同时确保在基于联邦学习的过程中,不会轻易泄露个别子服务器的敏感信息,保障能源大数据安全。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明提供的一种基于联邦学习的能源大数据安全保护方法的流程图;
图2为密钥长度优化的指标构建流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于联邦学习的能源大数据安全保护方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于联邦学习的能源大数据安全保护方法的具体方案。
本发明一个实施例提供的一种基于联邦学习的能源大数据安全保护方法。
具体的,提供了如下的一种基于联邦学习的能源大数据安全保护方法,请参阅图1,该方法包括以下步骤:
步骤S001,对监测系统的性能以及监控设备管理等非敏感数据进行采集,构建系统能源监控数据矩阵以及电网设备监控数据矩阵。
在电力能源大数据的安全保护中,需要采集各种数据以支持能源大数据的联邦学习分布式模型训练,从而提高用户隐私保护。本实施例综合采集电力负荷、电网状态、能源生产等多样化数据,为基于联邦学习的能源大数据安全保护方法提供必要的信息基础。
以一个地区的供电站为目标,本实施例基于智能电表实时采集设备的电能负荷数据,通过电力设备频率表实时采集供电站电网频率状态数据,利用发电网监测系统采集能源生产数据等等。
设上述地区供电站的系统共采集了种数据,以时间T为周期,在一个周期内均匀采集n次数据,使用鲁棒标准化对上述所采集的所有数据进行标准化,构建系统能源监控数据矩阵K。其中,鲁棒标准化技术为公知技术,本实施例不再赘述。
其中,K表示系统能源监控数据矩阵,表示第/>种数据采集的第n次数据的数值。其中,/>、T、n的取值实施者可根据实际情况自行设定。
之后基于压力传感器和温度传感器采集供电站电网中所有电力设备的温度和压力数据,设电网中共有电力设备b个,以时间T为周期,在一个周期内均匀采集n次数据,使用鲁棒标准化对上述所采集的所有数据进行标准化,构建电网设备监控数据矩阵
其中,D表示电网设备监控数据矩阵,表示第i个设备所采集的第n次温度数据的数值,/>表示第i个设备所采集的第n次压力数据的数值。其中,/>取值为2b,实施者可根据实际情况自行设定。
需要说明的是,构建电网设备监控数据矩阵D时,将同一个设备的温度和压力数据放在相邻两行中,且在一个设备的两行中第一行为设备的温度数据,第二行为设备的压力数据,即电网设备监控数据矩阵D中的第一行和第二行是第一个设备的温度和压力数据,第三行和第四行是第二个设备的温度和压力数据,以此类推,第行和第/>行是第b个设备的温度和压力数据。
至此,可获取系统能源监控数据矩阵以及电网设备监控数据矩阵,便于对电力大数据进行溯源分析。
步骤S002,对两个数据矩阵进行分析,判断两个矩阵之间的同步关系,结合异常现象对AES加密算法的密钥长度进行改进,实现能源大数据的安全保护。
在能源大数据进行传输的过程中,可能会被未经授权的人员或恶意方访问、窃听或篡改,从而导致敏感信息泄露,而且容易受到中间人攻击,其中攻击者可以截获传输中的数据,进行篡改,然后再传递给接收方,使得能源大数据的安全受到影响,因此,需要在对能源大数据进行传输时进行加密处理。
在所采集的数据中,上述系统能源监控数据矩阵K和电网设备监控数据矩阵D中的数据主要包含运行监测、系统性能评估的范畴以及设备的监控管理数据,不包含用户或企业的隐私信息,因此可以被视为公开的非敏感数据。而能源数据中的发电源数据、能源交易数据等包含有关供电站运营商的商业机密,例如生产成本、发电效率等,这些信息通常被视为敏感,而且能源消耗数据可能与终端用户的用电情况直接相关,包含有关用户生活、工作等方面的信息,因此需要受到特殊保护。因此,本实施例通过使用AES加密算法对能源数据进行加密,实现对能源大数据的安全保护。
在系统能源监控数据矩阵K和电网设备监控数据矩阵D中的实时电能负荷、电网频率、能源生产等多方面数据的变化直接影响了能源数据中的发电源、输电信息、能源交易和能源消耗等关键数据。例如,电能负荷的波动可能触发发电系统的调整以满足需求,电网频率状态的改变可能反映供电系统的稳定性,设备状态的变化可能对发电、输电和配电设备性能产生连锁效应等,在进行AES算法加密时,随着时间的推移,计算能力逐渐增强,攻击者能够使用更强大的硬件和算法来进行密码破解,如果最初选择的密钥长度不足以抵御当前计算能力的攻击,那么系统就容易受到密码破解的威胁,因此,本实施例通过对能源大数据进行分析,改进AES算法的密钥长度,提高能源大数据的安全保护性能。
对于系统能源监控数据矩阵,其涉及到整个能源系统的运行状态,而电网设备监控数据矩阵更加关注电力网络中的各种设备。一种是系统电力生产输送的状态,一种是生产输送电力设备的状态,这两者之间存在密切的相互依赖关系,其中一种变化可能会导致另一种发生响应的反映。例如:某个设备发生故障可能会引起电力传输的故障,分析协同性就是判断两者之间的协同模式,越大就代表受到一个外部因素导致两个矩阵发生协同变化的概率越高,两个矩阵数据变化状态越同步,导致两个矩阵中的数据趋于同步,会引起配电信息、能源消耗信息等重要能源数据重复模式的增加,因此需要加长密钥长度,从而提高能源大数据的安全保护。通过分析两个矩阵在频域信号中的表现,从而挖掘符合能源大数据变化的特征,用于度量矩阵之间运行的相似情况,从而协助判断密钥长度的选择。
以系统能源监控数据矩阵K和电网设备监控数据矩阵D中的每一行为输入,使用快速傅里叶变换将所有行从时域转化为频域信号,对于系统能源监控数据矩阵K中每一行的频域信号,对个频谱信号的每个相同频率点的幅度进行平均操作,具体为对实部和虚部分别进行平均,然后再合成为新的复数频谱,得到监控数据矩阵K的平均频域信号/>。同理,使用相同的操作得到电网设备监控数据矩阵D的平均频域信号/>。其中,快速傅里叶变换为公知技术,本实施例不再赘述。
获取平均频域信号、/>的功率谱密度/>、/>,其中,对于平均频域信号和/>在频率为i时的功率谱密度/>和/>。同时,对两个平均频域信号/>和/>进行逆傅里叶变换得到互相关函数,在互相关函数中找到峰值/>。其中,功率谱密度与逆傅里叶变换均为公知技术,本实施例不再赘述。
根据系统能源监控数据矩阵K与电网设备监控数据矩阵D从时域转换到频域上的相关信息,构建矩阵K和D之间的运行性能同步指数
其中,为矩阵K和D之间的运行性能同步指数,从频域信号揭示了时域信号下,两种不同类型数据组之间的共同频率成分以及时间延迟,/>为自然常数,/>为互相关函数中的峰值,n为时域信号的采集次数,T为时域信号的周期,/>为时域信号的采样率,和/>分别为平均频域信号/>和/>在频率为i时的功率谱密度。
需要说明的是,用于表征两个信号在频域上的相似性,即它们在某个频率上的相对强度,因为互相关实际上在不同时间点上将两个信号相乘并求和,当信号对齐时,乘积最大,从而峰值出现,所以/>可以代表两个信号的时间延迟,其值越大,同步性越低,越小;/>代表了两个信号在频率i处的功率谱之间的相对强度关系,反映了信号在频域上的相对能量分布,其值越接近于1则代表两个信号在频率i处的功率相对平衡,强度相似,此时/>越大,/>越大,反之/>越小。
通过将两个矩阵从时域信号转换到频域信号之后,便于分析矩阵特征在频域信号的表现,挖掘两个矩阵之间相同的频率变化特征,从而将矩阵之间的相关变化情况表示出来,使得改进密钥长度的过程更加全面。
对于系统能源监控数据矩阵K,其中每一行的数据都代表了地区供电站某一种类型的能源监控数据在该周期内的变化情况,在供电站电力系统的长期供电中,系统的故障和异常行为是不可避免的。
以系统能源监控数据矩阵K中的每一行为输入,使用ARIMA差分自回归移动平均模型对每行数据每个时刻未来的数据进行预测,得到其下一时刻的预测数据,计算每一时刻的实际观测值与模型预测值之间的残差。以第i行数据标准差的三倍为预设阈值,如果残差超出预设阈值/>,将其视为异常值,对所有异常值进行标记。
设第i行数据中检测到了个异常点,记录所有异常点的位置下标/>。之后使用DBSCAN密度聚类算法,其中,最少点MinPts以及邻域半径/>的取值由实施者根据实际情况自行设定,DBSCAN密度聚类算法为公知技术,本实施例不再赘述。以系统能源监控数据矩阵K中的每一行为输入对每行数据进行聚类,设第i行数据有/>个簇,对于每个簇,遍历簇中数据点,检查其是否为标记异常点,并记录每个簇所含有的异常点数量与大小,记录异常点均值/>,且记录每个簇左右边界的下标/>和/>。根据上述分析构建第i行数据的异常模式影响因子/>
其中,为系统能源监控数据矩阵第i行数据的异常模式影响因子,其作用为分析第i行数据异常模式的综合影响,/>为系统能源监控数据矩阵第i行数据的异常点个数,为系统能源监控数据矩阵第i行数据的簇的个数,/>为系统能源监控数据矩阵第q个簇的异常模式影响,/>为系统能源监控数据矩阵第i行第p个异常点的数据值,/>为第p个异常点所在簇的簇内数据均值,/>为系统能源监控数据矩阵第i行第p个异常点的索引,/>分别为第p个异常点所在簇的最小值、最大值对应的最小索引、最大索引,/>为预设调节参数,防止分母为0,本实施例取值为极小正数,/>为第q个簇的簇内异常点个数,/>为第q个簇的簇内数据总个数,/>为第q个簇的簇内异常点均值,/>为第q个簇的簇内数据均值。
的计算中,通过计算第q个簇的异常模式影响/>,以/>为权重,表示第q个簇的簇内异常点个数与簇内数据总个数的比值,衡量了簇内异常点的相对密度,其值越大,代表第q个簇的异常点密度越大,说明该段时间内异常事件发生越频繁,/>越大;而描述了第q个簇的异常点均值相对于整个簇的均值的差异,即异常点大小的平均偏离程度,其值越大,代表第q个簇的异常点偏离程度越大,即该段时间内异常事件的异常程度越严重,/>越大。
的计算中,/>表示异常点的数值与其所在簇内均值的差异,其值越大代表第p个异常点所引起的异常事件造成的影响越大,/>越大,/>表示异常点距离其所在簇中心的相对距离,其值越大,代表异常点距离其所在簇的中心点较远,这种情况下因为它与簇中心的距离较大,对簇内数据的整体影响分布不均匀,异常点对簇的整体影响较小,/>越小,反之代表异常点距离其所在簇的中心点较近,对簇内数据的整体影响集中,/>越大,结合/>之后求和,可以反映出第i行数据的异常数据反映的异常模式对整个第i行数据的影响程度。
越大时,代表矩阵K和D之间的运行相关同步性较高,此时矩阵K受到异常模式的影响导致数据异常也会对矩阵D的数据产生影响,对此,构建矩阵K和D的整体异常互影响因子/>
其中,为矩阵K和D的整体异常互影响因子,/>为sigmoid函数,/>为矩阵K和D之间的运行性能同步指数,/>为系统能源监控数据矩阵中的数据种类数量,/>为系统能源监控数据矩阵第u行数据的异常模式影响因子。
公式将作为权重,表达了矩阵K和D的相似同步性,其值越大权重越大,/>越大,/>代表了矩阵K计算得来的整体异常模式影响,其值越大/>越大,两者相乘之后归一化可以表示矩阵K和D的整体异常互影响的概率,即其中一个外部因素导致两个矩阵发生协同变化的概率越大,说明两个矩阵数据变化状态越同步。
之后设置密钥长度阈值,分别为第一预设长度阈值和第二预设长度阈值/>,本实施例对/>和/>的取值由实施者根据实际情况自行设定,当/>的值在/>时,则将AES算法的密钥长度设置为128位,当/>的值在/>时,则将AES算法的密钥长度设置为192位,当/>的值在/>时,则将AES算法的密钥长度设置为256位。其中,密钥长度优化的指标构建流程图如图2所示。
最后使用改进后的AES算法中的密钥长度分别对每个采集周期的能源数据进行加密,设总共采集了G个周期的矩阵K、D和能源数据,则对G个能源数据分别进行上述自适应密钥长度的AES加密,将其加密为G个密文数据,矩阵K、D中的数据则以明文方式储存传输。其中,AES算法为公知技术,本实施例不再赘述。
之后,将G个密文数据放入总服务器中,使用联邦学习使得子服务器可以在不对密文数据解密的情况下通过根据总服务器对能源数据进行读取和计算,确保数据的安全性与完整性。
在联邦学习的过程中,使用改进后的AES加密确保了在模型更新阶段不会泄露个别子服务器的敏感信息,确保了在总服务器中存储的数据仍然是加密状态,从而保障了数据的安全性,完成对电力能源大数据的安全保护。
至此,本实施例完成。
综上所述,本发明实施例通过对监测的电力能源大数据的各种数据进行分析,综合采集多源数据使得溯源方法更具全面性、实用性,为电力能源大数据的处理提供更强力的支持;通过将两个矩阵从时域信号转换到频域信号,基于频域信号的特征获取两个矩阵之间的运行性能同步指数,通过分析两个矩阵在频域信号中的表现,挖掘两种不同类型数据组之间的共同频率成分以及时间延迟,从而构建能源大数据变化的特征,用于度量矩阵之间运行的相似情况,协助判断密钥长度的选择,使得改进密钥长度的过程更加全面;
通过对系统能源监控数据矩阵中每行数据的聚类后的异常点的密度分布进行分析,根据聚类簇内异常点的聚集、偏离程度因素衡量异常事件的发生情况,将系统能源监控数据矩阵中的每行数据的综合影响表示出来,即通过每行数据的异常数据反映的异常模式得到每行数据的影响程度因素;本发明实施例将矩阵之间的运行性能同步指数与系统能源监控数据矩阵中每行数据的异常模式影响因子结合起来,共同构建整体异常互影响因子,用来表示矩阵之间的整体异常互影响的概率,揭示两个矩阵发生协同变化的概率情况,挖掘矩阵之间数据变化状态同步表现;本发明实施例通过整体异常互影响因子的大小,改进加密算法的密钥长度,使其可以根据整体数据发生异常事件的情况自适应调整,增强了算法的鲁棒性与安全性,同时确保在基于联邦学习的过程中,不会轻易泄露个别子服务器的敏感信息,保障能源大数据安全。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于联邦学习的能源大数据安全保护方法,其特征在于,该方法包括以下步骤:
获取各采集周期的能源数据;基于监测的系统性能以及设备管理数据构建各采集周期的系统能源监控数据矩阵以及电网设备监控数据矩阵;
将系统能源监控数据矩阵和电网设备监控数据矩阵每行数据均转换为频域信号,根据频域信号在每行数据之间的整体频率-幅度对应关系分别构建第一平均频域信号和第二平均频域信号;基于两个平均频域信号的平稳运行过程以及互相关关系获取频域信息;根据频域信息获取两个矩阵之间的运行性能同步指数;
对于系统能源监控数据矩阵每行数据,根据每行数据与预测之后的差异程度获取聚类后各聚类簇的异常模式影响;根据各异常点与所属聚类簇整体的数值位置分布差异以及各聚类簇的异常模式影响获取每行数据的异常模式影响因子;结合两个矩阵之间的运行性能同步指数以及系统能源监控数据矩阵每行数据的异常模式影响因子构建两个矩阵之间的整体异常互影响因子;
基于整体异常互影响因子以及预设密钥长度阈值确定密钥长度,将各采集周期的能源数据根据对应周期的密钥长度进行加密得到密文数据,将所有周期的密文数据进行整合并上传服务器,实现能源大数据的加密优化。
2.如权利要求1所述的一种基于联邦学习的能源大数据安全保护方法,其特征在于,所述基于监测的系统性能以及设备管理数据构建各采集周期的系统能源监控数据矩阵以及电网设备监控数据矩阵,包括:
将监测系统性能的各种类数据的数据序列组成系统能源监控数据矩阵;所述各种类数据包括但不限于:电力负荷数据、电网状态数据以及能源生产数据;
将电网各设备在不同采集时刻的压力、温度数据分别作为电网设备监控数据矩阵各行向量,其中,同一设备不同采集时刻的压力、温度数据在电网设备监控数据矩阵中为相邻的两个行向量。
3.如权利要求2所述的一种基于联邦学习的能源大数据安全保护方法,其特征在于,所述将系统能源监控数据矩阵和电网设备监控数据矩阵每行数据均转换为频域信号,包括:
采用快速傅里叶变换分别将系统能源监控数据矩阵、电网设备监控数据矩阵中的每行数据转换为频域信号。
4.如权利要求2所述的一种基于联邦学习的能源大数据安全保护方法,其特征在于,所述根据频域信号在每行数据之间的整体频率-幅度对应关系分别构建第一平均频域信号和第二平均频域信号,包括:
对于系统能源监控数据矩阵,将所有行之间具有相同频率的幅度计算幅度均值,将所有频率的幅度均值按照频率从小到大组成系统能源监控数据矩阵的平均频域信号,记为第一平均频域信号;
采用与系统能源监控数据矩阵的平均频域信号相同的计算方法构建电网设备监控数据矩阵的平均频域信号,记为第二平均频域信号。
5.如权利要求1所述的一种基于联邦学习的能源大数据安全保护方法,其特征在于,所述基于两个平均频域信号的平稳运行过程以及互相关关系获取频域信息,包括:
获取两个平均频域信号的功率谱密度,分别记为第一功率谱密度和第二功率谱密度;
将两个矩阵的平均频率信号采用逆傅里叶变换得到互相关函数;获取互相关函数的峰值。
6.如权利要求5所述的一种基于联邦学习的能源大数据安全保护方法,其特征在于,所述根据频域信息获取两个矩阵之间的运行性能同步指数,包括:
对于矩阵在时域信号下的各采样频率,计算第一功率谱密度与第二功率谱密度在各采样频率下数值的比值;将1与所述比值的差值绝对值的相反数作为指数、将自然常数作为底数构建第一指数函数;计算所有采样频率的所述第一指数函数的计算结果的均值;
将所述峰值的相反数作为指数、将自然常数作为底数构建第二指数函数;将所述第二指数函数的计算结果与所述均值的乘积作为两个矩阵之间的运行性能同步指数。
7.如权利要求2所述的一种基于联邦学习的能源大数据安全保护方法,其特征在于,所述根据每行数据与预测之后的差异程度获取聚类后各聚类簇的异常模式影响,包括:
采用ARIMA模型对每行数据每个时刻的数据进行预测得到各预测值;计算各时刻数据点的实际值与预测值之间的残差,当数据点的残差大于预设阈值时,将数据点标记为异常点;
将每行数据进行聚类得到各聚类簇;获取各聚类簇内的元素数量和异常点数量;将异常点数量与元素数量的比值作为第一比值;获取各聚类簇内的元素数据均值和异常点数据均值;将异常点数据均值与元素数据均值的比值作为第二比值;
将1与第二比值的差值,乘以第一比值的计算结果作为各聚类簇的异常模式影响。
8.如权利要求7所述的一种基于联邦学习的能源大数据安全保护方法,其特征在于,所述根据各异常点与所属聚类簇整体的数值位置分布差异以及各聚类簇的异常模式影响获取每行数据的异常模式影响因子,包括:
获取各异常点所属聚类簇内的元素数据均值、最大索引、最小索引;
对于每行数据的各异常点,计算最大索引与最小索引差值的一半;计算异常点索引与差值的一半的差值绝对值;计算差值绝对值与预设调节参数的和值;计算异常点数值与元素数据均值的差值作为第一差值;计算第一差值与和值的比值;
对于每行数据的各聚类簇,计算各聚类簇的异常模式影响与各异常点的比值的乘积,将每行数据的所有聚类簇与所有异常点之间的所述乘积的和值作为每行数据的异常模式影响因子。
9.如权利要求1所述的一种基于联邦学习的能源大数据安全保护方法,其特征在于,所述结合两个矩阵之间的运行性能同步指数以及系统能源监控数据矩阵每行数据的异常模式影响因子构建两个矩阵之间的整体异常互影响因子,包括:
计算系统能源监控数据矩阵所有行数据的异常模式影响因子的和值;将所述和值与两个矩阵之间的运行性能同步指数的乘积的归一化值作为两个矩阵之间的整体异常互影响因子。
10.如权利要求1所述的一种基于联邦学习的能源大数据安全保护方法,其特征在于,所述基于整体异常互影响因子以及预设密钥长度阈值确定密钥长度,包括:
当整体异常互影响因子大于0且小于等于第一预设长度阈值时,将密钥长度设置为128;当整体异常互影响因子大于第一预设长度阈值且小于等于第二预设长度阈值时,将密钥长度设置为192;当整体异常互影响因子大于第二预设长度阈值且小于等于1时,将密钥长度设置为256;其中,所述第一预设长度阈值小于第二预设长度阈值。
CN202410195096.5A 2024-02-22 一种基于联邦学习的能源大数据安全保护方法 Active CN117763621B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410195096.5A CN117763621B (zh) 2024-02-22 一种基于联邦学习的能源大数据安全保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410195096.5A CN117763621B (zh) 2024-02-22 一种基于联邦学习的能源大数据安全保护方法

Publications (2)

Publication Number Publication Date
CN117763621A true CN117763621A (zh) 2024-03-26
CN117763621B CN117763621B (zh) 2024-06-04

Family

ID=

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020155755A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于谱聚类的异常点比例优化方法、装置及计算机设备
CN114401107A (zh) * 2021-12-08 2022-04-26 国网浙江省电力有限公司信息通信分公司 一种能源互联网数据安全处理系统及方法
US20220140995A1 (en) * 2020-10-29 2022-05-05 EMC IP Holding Company LLC Detection of Unauthorized Encryption Using Key Length Evaluation
WO2023093177A1 (zh) * 2021-11-29 2023-06-01 新智我来网络科技有限公司 设备故障诊断方法、装置、电子设备及存储介质
CN116523074A (zh) * 2023-05-16 2023-08-01 许昌学院 动态化公平性的隐私保护联邦深度学习方法
CN116707675A (zh) * 2023-08-03 2023-09-05 兰州交通大学 无线电信号的检测、无线电信号的异常检测方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020155755A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于谱聚类的异常点比例优化方法、装置及计算机设备
US20220140995A1 (en) * 2020-10-29 2022-05-05 EMC IP Holding Company LLC Detection of Unauthorized Encryption Using Key Length Evaluation
WO2023093177A1 (zh) * 2021-11-29 2023-06-01 新智我来网络科技有限公司 设备故障诊断方法、装置、电子设备及存储介质
CN114401107A (zh) * 2021-12-08 2022-04-26 国网浙江省电力有限公司信息通信分公司 一种能源互联网数据安全处理系统及方法
CN116523074A (zh) * 2023-05-16 2023-08-01 许昌学院 动态化公平性的隐私保护联邦深度学习方法
CN116707675A (zh) * 2023-08-03 2023-09-05 兰州交通大学 无线电信号的检测、无线电信号的异常检测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
向春玲;吴震;饶金涛;王敏;杜之波;: "针对一种AES掩码算法的频域相关性能量分析攻击", 计算机工程, no. 10, 15 October 2016 (2016-10-15) *
茹叶棋;周斌;吴亦贝;李俊娥;袁凯;刘开培;: "考虑网络攻击因素的电网信息物理系统业务可靠性分析", 电力建设, no. 05, 1 May 2017 (2017-05-01) *

Similar Documents

Publication Publication Date Title
Wang et al. Detection of power grid disturbances and cyber-attacks based on machine learning
Yao et al. Energy theft detection with energy privacy preservation in the smart grid
Li et al. DDOA: A Dirichlet-based detection scheme for opportunistic attacks in smart grid cyber-physical system
Jiang et al. Energy-theft detection issues for advanced metering infrastructure in smart grid
Ye et al. Robustness of the Markov-chain model for cyber-attack detection
Ye et al. EWMA forecast of normal system activity for computer intrusion detection
CN103607388A (zh) 一种apt威胁预测方法及系统
Tian et al. Data-driven and low-sparsity false data injection attacks in smart grid
Jain et al. Intelligent energy cyber physical systems (iECPS) for reliable smart grid against energy theft and false data injection
Dogaru et al. Cyber security of smart grids in the context of big data and machine learning
CN116684182A (zh) 一种基于异常流量识别的信息拦截方法及系统
Ibrahem Privacy-preserving and efficient electricity theft detection and data collection for AMI using machine learning
Singh et al. Statistical machine learning defensive mechanism against cyber intrusion in smart grid cyber-physical network
CN117557270B (zh) 移动终端安全支付管理方法及系统
Yazdinejad et al. Hybrid privacy preserving federated learning against irregular users in Next-generation Internet of Things
Haider et al. Threat modeling of wireless attacks on advanced metering infrastructure
CN114298862A (zh) 一种基于区块链的智能电网隐私保护及窃电检测方法
CN117763621B (zh) 一种基于联邦学习的能源大数据安全保护方法
CN111784404B (zh) 一种基于行为变量预测的异常资产识别方法
Xia et al. Confidence-aware collaborative detection mechanism for false data attacks in smart grids
CN113225331A (zh) 基于图神经网络的主机入侵安全检测方法、系统及装置
CN117763621A (zh) 一种基于联邦学习的能源大数据安全保护方法
Shahbaz Pervez et al. A comparative analysis of artificial neural network technologies in intrusion detection systems
Li et al. Research on intrusion detection based on neural network optimized by genetic algorithm
Wu et al. Deep learning-based defense and detection scheme against eavesdropping and typical cyber-physical attacks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20240508

Address after: 1-10 / F, C building, No.87 courtyard, Songshan South Road, Erqi District, Zhengzhou City, Henan Province

Applicant after: ECONOMIC TECHNOLOGY RESEARCH INSTITUTE OF STATE GRID HENAN ELECTRIC POWER Co.

Country or region after: China

Applicant after: State Grid Smart Grid Research Institute Co.,Ltd.

Address before: 266000 room 310-312, Qingdao International Ocean Sensor Research Institute, Jimo District, Qingdao City, Shandong Province

Applicant before: Qingdao Tatan Technology Service Co.,Ltd.

Country or region before: China

Applicant before: ECONOMIC TECHNOLOGY RESEARCH INSTITUTE OF STATE GRID HENAN ELECTRIC POWER Co.

Applicant before: State Grid Smart Grid Research Institute Co.,Ltd.

GR01 Patent grant