CN114116733B - 配电自动化系统数据异常操作检测和追溯系统及方法 - Google Patents

配电自动化系统数据异常操作检测和追溯系统及方法 Download PDF

Info

Publication number
CN114116733B
CN114116733B CN202210090380.7A CN202210090380A CN114116733B CN 114116733 B CN114116733 B CN 114116733B CN 202210090380 A CN202210090380 A CN 202210090380A CN 114116733 B CN114116733 B CN 114116733B
Authority
CN
China
Prior art keywords
data
power distribution
server
abnormal
chain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210090380.7A
Other languages
English (en)
Other versions
CN114116733A (zh
Inventor
杨珂
王栋
周磊
陈帅
苏展
韩少勤
史伟
杨晓林
潘晓婷
王鹏霞
罗招权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Blockchain Technology Beijing Co ltd
State Grid Digital Technology Holdings Co ltd
State Grid Corp of China SGCC
Changzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Blockchain Technology Beijing Co ltd
State Grid Corp of China SGCC
Changzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
State Grid E Commerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Blockchain Technology Beijing Co ltd, State Grid Corp of China SGCC, Changzhou Power Supply Co of State Grid Jiangsu Electric Power Co Ltd, State Grid E Commerce Co Ltd filed Critical State Grid Blockchain Technology Beijing Co ltd
Priority to CN202210090380.7A priority Critical patent/CN114116733B/zh
Publication of CN114116733A publication Critical patent/CN114116733A/zh
Application granted granted Critical
Publication of CN114116733B publication Critical patent/CN114116733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Computing Systems (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供的配电自动化系统数据异常操作检测和追溯系统及方法,配电站服务器获取配电数据并上链至主链服务器;主链服务器通过监听器监听所上链的配电数据的数据波动,以检测数据操作行为,如果该数据操作行为属于正常行为,则将该配电数据记录至影链服务器,反之,则对配电站服务器执行版本回退,生成异常信息记录至影链服务器。基于本发明,在原始区块链的主链结构上增加影链构成双链结构,将配电数据记录至主链和影链实现可溯源、可验证,将异常信息记录至影链实现异常操作追溯。

Description

配电自动化系统数据异常操作检测和追溯系统及方法
技术领域
本发明涉及电力系统技术领域,更具体地说,涉及一种配电自动化系统数据异常操作检测和追溯系统及方法。
背景技术
现阶段,配电数据存储在配电站服务器中,服务器间数据共享主要采用数据库拷贝的方式,数据共享成本高、传输效率低且数据安全得不到保障。
采用区块链技术对配电数据进行记录,可实现分布式服务器间的数据共享,但并不具备对于配电自动化系统异常数据操作的检测和追溯能力。配电自动化系统数据异常操作会对电网负荷及传输效率产生负面影响,甚至对需求侧用户造成严重的用电安全隐患。
对此,如何对配电自动化系统数据异常检测及追溯,以提升风险防控能力,成为亟需解决的问题。
发明内容
有鉴于此,为解决上述问题,本发明提供一种配电自动化系统数据异常操作检测和追溯系统及方法,技术方案如下:
一种配电自动化系统数据异常操作检测和追溯系统,所述系统包括:主链服务器、影链服务器、以及配电站服务器,所述主链服务器中设置有监听器;
所述配电站服务器,用于获取配电数据;上传所述配电数据至所述主链服务器;
所述主链服务器,用于将所述配电数据存储至相应的区块链中,并通过所述监听器监听所述区块链中当前存储的所述配电数据的数据波动,以检测数据操作行为;如果所述数据操作行为属于正常行为,则将所述配电数据发送至所述影链服务器;如果所述数据操作行为属于异常行为,则对所述配电站服务器执行版本回退,并生成异常信息发送至所述影链服务器;
所述影链服务器,用于将所述配电数据/所述异常信息存储至相应的影链中。
优选的,所述系统还包括:与所述配电站服务器对应的备份服务器;
所述配电站服务器,还用于同步所述配电数据至所述备份服务器中;
所述主链服务器,还用于通过所述监听器监听所述配电站服务器的版本回退次数,并在所述版本回退次数大于对应的阈值的情况下,向所述配电站服务器发送替换指令,以使所述备份服务器替换所述配电站服务器。
优选的,用于通过所述监听器监听所述区块链中当前存储的所述配电数据的数据波动,以检测数据操作行为的所述主链服务器,具体用于:
基于主成分分析与孤立森林算法处理历史配电数据,以获得与所述历史配电数据相匹配的孤立森林下的异常值阈值;通过所述监听器运行所述主成分分析,确定所述区块链中当前存储的所述配电数据在所述孤立森林下的异常值;如果所述异常值小于所述异常值阈值,则确定数据操作行为属于正常行为;如果所述异常值不小于所述异常值阈值,则确定数据操作行为属于异常行为。
优选的,用于基于主成分分析与孤立森林算法处理历史配电数据,以获得与所述历史配电数据相匹配的孤立森林下的异常值阈值的所述主链服务器,具体用于:
对所述历史配电数据处理得到历史数据集;运行所述主成分分析和所述孤立森林算法,确定所述历史数据集对应的孤立森林,所述孤立森林由孤立树组成;对于所述孤立森林中的每棵孤立树,对该棵孤立树执行测试得到正常行为路径长度和异常行为路径长度,并根据所述正常行为路径长度和所述异常行为路径长度确定该棵孤立树对应的初始异常值阈值;基于所述孤立森林中所有孤立树对应的初始异常值阈值确定所述孤立森林下的异常值阈值。
一种配电自动化系统数据异常操作检测和追溯方法,所述方法应用于主链服务器,所述方法包括:
接收配电站服务器上传的配电数据,所述配电数据是所述配电站服务器所获取的;
将所述配电数据存储至相应的区块链中,并通过监听器监听所述区块链中当前存储的所述配电数据的数据波动,以检测数据操作行为;
如果所述数据操作行为属于正常行为,则将所述配电数据发送至影链服务器,以使所述影链服务器将所述配电数据存储至相应的影链中;
如果所述数据操作行为属于异常行为,则对所述配电站服务器执行版本回退,并生成异常信息发送至所述影链服务器,以使所述影链服务器将所述异常信息存储至相应的影链中。
优选的,所述方法还包括:
通过所述监听器监听所述配电站服务器的版本回退次数,并在所述版本回退次数大于对应的阈值的情况下,向所述配电站服务器发送替换指令,以使所述配电站服务器对应的备份服务器替换所述配电站服务器,所述配电站服务器已同步所述配电数据至所述备份服务器中。
优选的,所述通过所述监听器监听所述区块链中当前存储的所述配电数据的数据波动,以检测数据操作行为,包括:
基于主成分分析与孤立森林算法处理历史配电数据,以获得与所述历史配电数据相匹配的孤立森林下的异常值阈值;
通过所述监听器运行所述主成分分析,确定所述区块链中当前存储的所述配电数据在所述孤立森林下的异常值;
如果所述异常值小于所述异常值阈值,则确定数据操作行为属于正常行为;
如果所述异常值不小于所述异常值阈值,则确定数据操作行为属于异常行为。
优选的,所述基于主成分分析与孤立森林算法处理历史配电数据,以获得与所述历史配电数据相匹配的孤立森林下的异常值阈值,包括:
对所述历史配电数据处理得到历史数据集;
运行所述主成分分析和所述孤立森林算法,确定所述历史数据集对应的孤立森林,所述孤立森林由孤立树组成;
对于所述孤立森林中的每棵孤立树,对该棵孤立树执行测试得到正常行为路径长度和异常行为路径长度,并根据所述正常行为路径长度和所述异常行为路径长度确定该棵孤立树对应的初始异常值阈值;
基于所述孤立森林中所有孤立树对应的初始异常值阈值确定所述孤立森林下的异常值阈值。
相较于现有技术,本发明实现的有益效果为:
本发明提供的配电自动化系统异常处理系统及方法,配电站服务器获取配电数据并上链至主链服务器;主链服务器通过监听器监听所上链的配电数据的数据波动,以检测数据操作行为,如果该数据操作行为属于正常行为,则将该配电数据记录至影链服务器,反之,则对配电站服务器执行版本回退,生成异常信息记录至影链服务器。基于本发明,在原始区块链的主链结构上增加影链构成双链结构,将配电数据记录至主链和影链实现可溯源、可验证,将异常信息记录至影链实现异常操作追溯。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为传统配电数据操作共享与追溯的示意图;
图2为本发明实施例提供的配电自动化系统异常处理系统的系统架构图;
图3为本发明实施例提供的配电自动化系统异常处理系统的另一系统架构图;
图4为本发明实施例提供的配电自动化系统异常处理方法的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
区块链(Blockchain):是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。其是一项分布式账本技术,其本质是去中心化、分布式结构的数据存储、传输和证明的方法。
影链:是在数据来源上满足可靠性和有效性约束,在存储方法上满足数据不可篡改的特性,并满足附加性约束条件的日志存储系统。其中,数据来源是指通过监听数据库(主链)上的数据读取行为而产生的日志数据。数据来源的可靠性是指在监听了所有的数据读取行为的前提下,产生的所有日志数据都能被存储到影链中。数据来源的有效性是指所有产生的日志数据是真实有效的,而不能是无中生有或篡改后的假数据。存储方法上的数据不可篡改的特性是指数据在存储过程中无法被篡改。
主成分分析(Principal Component Analysis,PCA):是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
孤立森林算法:是一种基于隔离异常原理的无监督学习异常检测算法,它取代了最常用的正常点轮廓提取技术。在统计学中,异常(又称离群值)是一种观察或事件,它与其他事件的偏差如此之大,以至于引起人们怀疑它是由不同的平均值产生的。孤立森林算法能够很好的对离群点进行检测。
异常行为监测:使用异常检测算法,将新的用户操作行为与正常行为规则库进行匹配,如果产生较大偏差,则认为用户操作行为异常。
参见图1,图1为传统配电数据操作共享与追溯的示意图。配电数据存储在配电站服务器中,服务器间数据共享主要采用数据库拷贝的方式,数据共享成本高、传输效率低且数据安全得不到保障。
现有的异常数据操作检测与追溯方案,其通常使用深度学习算法理论。而实际应用中标签覆盖率低且异常样本数量极少,欠拟合条件下的深度模型实际检测效果欠佳。不平衡数据集测试结果准确率高而召回率低,因此并不完全适用于异常电力数据检测。部分研究中,主要使用基于准确率驱动的优化识别模型,权重较低的异常样本容易被忽略而导致召回率低,也达不到有效检出异常样本的效果。
另外,传统的异常数据操作检测及追溯方案使用传统的中心数据库结构,数据共享是通过数据库间的拷贝,系统健壮性差,当存在操作员的误操作和来自内、外部的恶意篡改时,配电系统没有抵御能力,将会对电网负荷及传输效率产生负面影响。
针对这些缺点,本发明从数据存储、数据共享和安全检验方面都提出了新的构想,通过双链结构和异常检测算法对传统异常数据操作检测及追溯方案进行改进,实现对异常操作和恶意操作的识别与防护,增强配电系统操作数据的可追溯性。
本发明在原始区块链的主链结构上增加影链构成双链结构,将配电数据记录至主链和影链实现可溯源、可验证,将异常信息记录至影链实现异常操作追溯。
参见图2,图2为本发明实施例提供的配电自动化系统异常处理系统的系统架构图。该配电自动化系统异常处理系统包括主链服务器10、影链服务器20、以及配电站服务器30,主链服务器10中设置有监听器。
配电站服务器30,用于获取配电数据;上传配电数据至主链服务器10。
主链服务器10,用于将配电数据存储至相应的区块链中,并通过监听器监听区块链中当前存储的配电数据的数据波动,以检测数据操作行为;如果数据操作行为属于正常行为,则将配电数据发送至影链服务器20;如果数据操作行为属于异常行为,则对配电站服务器30执行版本回退,并生成异常信息发送至影链服务器20。
影链服务器20,用于将配电数据/异常信息存储至相应的影链中。
本发明实施例中,操作员操作配电站数据库产生实时的配电数据,配电站服务器30响应操作员的输入操作获取该配电数据,其一方面将配电数据存储至本地数据库,另一方面对配电数据进行加密,如图1所示的采用哈希hash加密将哈希加密的结果以hash请求的方式发送至主链服务器10,以完成将加密的配电数据上传至主链服务器10。
主链服务器10接收配电站服务器30的上链请求,将加密的配电数据存储至相应的区块链中。进一步,对于当前上链的配电数据,可以进一步解密得到明文的配电数据,通过监听器监听当前存储的配电数据的数据波动,以检测相应的数据操作行为是否属于正常行为,排除误操作或恶意操作等异常行为。
若数据操作行为属于正常行为,则将该配电数据发送至影链服务器20,由影链服务器20将该配电数据存储至相应的影链中,管理员可通过影链服务器20追溯配电操作。若数据操作行为属于异常行为,则监听器可以确定该配电数据所属的配电站服务器30,进而将该配电站服务器30的本地数据库进行版本回退,以将其本地数据库中的数据回退至存储该配电数据之前的历史数据(即回退到异常行为之前的配电记录),并生成异常信息发送至影链服务器20,由影链服务器20将该异常信息存储至相应的影链中,该异常信息中包含该配电数据和异常行为、以及诸如检测时间等日志信息。由此,双链结构有利于对系统数据异常操作的监测和追溯,能够帮助配电中心更好地进行配电调度。
需要说明的是,在一些场景中,监听器可以定期对主链服务器10存储的配电数据进行数据操作行为的监测。
另外,在监听器监听区块链中当前存储的配电数据的数据波动,以检测数据操作行为的过程中,本发明可以通过主成分分析和孤立森林算法生成正常行为数据集,并将其运用于数据操作行为的检测。孤立森林算法能够有效实现单一异常样本的检测;对配电数据中的电流电压数据离散化后使用主成分分析减少冗余数据属性,采用二叉树作为基本孤立树单元运用孤立森林算法对异常行为进行检测,实际应用效果大大提高。
参见图3,图3为本发明实施例提供的配电自动化系统异常处理系统的另一系统架构图。该配电自动化系统异常处理系统还包括:与配电站服务器30对应的备份服务器40。需要说明的是,图3中一个配电站服务器对应两个备份服务器,两个备份服务器可以作为冗余备份,符合配电业务要求,提高可靠性,当然还可以根据需求设置一个或多个备份服务器,本发明实施例对于一个配电站服务器所对应的备份服务器的数量并不限定。
配电站服务器30,还用于同步配电数据至备份服务器40中。
主链服务器10,还用于通过监听器监听配电站服务器30的版本回退次数,并在版本回退次数大于对应的阈值的情况下,向配电站服务器30发送替换指令,以使备份服务器40替换配电站服务器30。
本发明实施例中,配电站服务器30在获取到配电数据后,在将该配电数据上链的同时,还可以将该配电数据同步至相应的备份服务器40中,由备份服务器40将配电数据记录至其本地数据库中。
主链服务器10中的监听器还可以定期监听配电站服务器30的版本回退次数,由于版本回退一次表示相应配电站服务器30的数据操作行为出现异常一次,则配电站服务器30的版本回退次数可以代表该配电站服务器30异常操作频率。如果配电站服务器30的版本回退次数大于对应的阈值,即次数阈值,则可以向该配电站服务器30下发替换指令,使得该配电站服务器30与其备份服务器40进行业务切换,由备份服务器40替换该配电站服务器30工作,为实时的配电数据继续提供上链服务,以此来保障配电系统的安全。
此外,具体实现过程中,用于通过监听器监听区块链中当前存储的配电数据的数据波动,以检测数据操作行为的主链服务器10,具体用于:
基于主成分分析与孤立森林算法处理历史配电数据,以获得与历史配电数据相匹配的孤立森林下的异常值阈值;通过监听器运行主成分分析,确定区块链中当前存储的配电数据在孤立森林下的异常值;如果异常值小于异常值阈值,则确定数据操作行为属于正常行为;如果异常值不小于异常值阈值,则确定数据操作行为属于异常行为。
本发明实施例中,在监听器开始启动之前,需要收集以往的配电数据,即历史配电数据并进行人工检验、剔除异常等操作,进而基于主成分分析与孤立森林算法处理历史配电数据,得到与该历史配电数据相匹配的孤立森林下的异常值阈值,该孤立森林能够表征历史配电数据中正常行为数据和异常行为数据的路径长度,从而以此确定异常值阈值。对于监听到的区块链中当前存储的配电数据,通过监听器运行主成分分析确定其在孤立森林下的异常值,比对该异常值与异常值阈值,如果异常值小于异常值阈值,则表示区块链中当前存储的配电数据的数据操作行为属于正常行为,反之,则属于异常行为,由此可以识别出误操作或者恶意操作。
而主链服务器10基于主成分分析与孤立森林算法处理历史配电数据,以获得与历史配电数据相匹配的孤立森林下的异常值阈值的过程,可以采用如下步骤:
对历史配电数据处理得到历史数据集;运行主成分分析和孤立森林算法,确定历史数据集对应的孤立森林,孤立森林由孤立树组成;对于孤立森林中的每棵孤立树,对该棵孤立树执行测试得到正常行为路径长度和异常行为路径长度,并根据正常行为路径长度和异常行为路径长度确定该棵孤立树对应的初始异常值阈值;基于孤立森林中所有孤立树对应的初始异常值阈值确定孤立森林下的异常值阈值。
本发明实施例中,主成分分析通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,由于配电数据结构多样,通过主成分分析可以将系配电数据转换成有限特征的结构数据。孤立森林算法是一种适用于连续数据的无监督异常检测机器学习算法,本发明将该算法的思想应用至作为离散数据的历史配电数据集。基于异常检测识别离群点,实现对配电自动化系统异常数据的检测。
通过监听器收集配电自动化系统的历史配电数据形成历史数据集,对历史数据集进行主成分分析,提取相应的数据特征;
假设用于异常数据检测算法的数据集共有
Figure 101101DEST_PATH_IMAGE001
条历史配电数据,每条历史配电数据 具有包含电流、电压数据在内的
Figure 159187DEST_PATH_IMAGE002
个属性,每个属性的正常数据值均符合正态分布,异常数 据点分布无规律。
对这
Figure 470083DEST_PATH_IMAGE001
Figure 819287DEST_PATH_IMAGE002
维历史配电数据
Figure 40183DEST_PATH_IMAGE003
进行中心化得到:
Figure 393804DEST_PATH_IMAGE004
,即
Figure 316630DEST_PATH_IMAGE005
通过投影正交变换得到新的坐标系
Figure 781109DEST_PATH_IMAGE006
,其中
Figure 856513DEST_PATH_IMAGE007
是标准正交基,即
Figure 381035DEST_PATH_IMAGE008
,该正交基底的正交向量并不代表历史配电数据的电流电压属性, 而是相应电流电压属性的结合。
目标投影维度为
Figure 292621DEST_PATH_IMAGE009
,需要舍弃原坐标系的正交基底,构成新的坐标系
Figure 232896DEST_PATH_IMAGE010
,配电数据
Figure 287439DEST_PATH_IMAGE011
Figure 373076DEST_PATH_IMAGE009
维坐标系中的投影为:
Figure 145860DEST_PATH_IMAGE012
其中,
Figure 827508DEST_PATH_IMAGE013
Figure 2137DEST_PATH_IMAGE011
在低维坐标系里第
Figure 494561DEST_PATH_IMAGE014
维的坐标。
Figure 489062DEST_PATH_IMAGE015
为标准正交基底矩阵,则用
Figure 974401DEST_PATH_IMAGE016
表示的原始数据为:
Figure 3537DEST_PATH_IMAGE017
主成分分析的优化目标要求所有样本到新的正交基底的距离最近,目标优化函数如下:
Figure 430976DEST_PATH_IMAGE018
(1)
利用原始维度和目标维度的转换公式进行推导,通过平方和公式、矩阵转置公式、合并同类项与矩阵的迹整理形成优化函数,可得:
Figure 584877DEST_PATH_IMAGE019
(2)
则主成分分析的目标可转变为:
Figure 998540DEST_PATH_IMAGE020
(3)
利用拉格朗日函数后求导可得:
Figure 502422DEST_PATH_IMAGE021
(4)
Figure 976129DEST_PATH_IMAGE022
(5)
同理,对原始
Figure 820588DEST_PATH_IMAGE001
条配电数据进行最大投影方差整理得到优化函数:
Figure 506784DEST_PATH_IMAGE023
(6)
由此,通过主成分分析可以提取历史数据集的数据特征,进一步,通过孤立森林算法对历史数据集的数据特征构建相应的孤立森林,该孤立森林由孤立树所组成,对每棵孤立树执行测试过程,记录其对应的正常行为路径长度(即正常行为数据的路径长度)和异常行为路径长度(即异常行为数据的路径长度)。具体的:
通过主成分分析后得到了电流电压属性精简后的
Figure 635146DEST_PATH_IMAGE024
条配电数据,即
Figure 951858DEST_PATH_IMAGE024
条配电数据 的数据特征,进而从
Figure 611509DEST_PATH_IMAGE024
条配电数据的数据特征随机选择
Figure 789812DEST_PATH_IMAGE025
条训练构建一颗孤立树,随机指 定其中一个数据特征并在该数据特征的最大值和最小值限制内随机生成切割点
Figure 382467DEST_PATH_IMAGE026
。随机生 成的切割点将
Figure 73343DEST_PATH_IMAGE025
条配电数据的数据特征分成两个子空间,在新生成的子空间中按照上述切 割操作不断构造叶子节点,直到叶子节点无法分割或孤立树已经生成到指定高度。
另外,由于历史数据集中每条配电数据均具有标签,该标签表征所属的配电数据 的数据操作行为,包括正常行为标签和异常行为标签。因此对于每棵孤立树来说,均可以对 其对应的
Figure 17028DEST_PATH_IMAGE025
条配电数据记录相应的路径长度,以确定具有正常行为标签的配电数据(即正 常行为数据)的路径长度,即正常行为路径长度、以及具有异常行为标签的配电数据(即异 常行为数据)的路径长度,即异常行为路径长度。
进一步,对于每棵孤立树来说,可以将其正常行为路径长度的最小值对应的异常值、或者异常行为路径长度的最大值对应的异常值、或者正常行为路径长度的最小值对应的异常值与异常行为路径长度的最大值对应的异常值两者的平均值作为该棵孤立树的异常值阈值,即初始异常值阈值。需要说明的是,异常值与路径长度成反比,可以参加以下公式(7)。
在对配电自动化系统实时的配电数据(即区块链中当前存储的配电数据)进行分 析时,由监听器对区块链当前存储的配电数据进行主成分分析,提取其数据特征。进一步, 按照如下公司计算其异常值
Figure 700819DEST_PATH_IMAGE027
Figure 147981DEST_PATH_IMAGE028
(7)
其中,
Figure 744179DEST_PATH_IMAGE029
表示区块链中当前存储的配电数据,
Figure 597996DEST_PATH_IMAGE030
表示
Figure 695265DEST_PATH_IMAGE029
在每棵孤立树的路径长 度,
Figure 403458DEST_PATH_IMAGE031
表示
Figure 295191DEST_PATH_IMAGE029
在所有孤立树的路径长度的均值,
Figure 338102DEST_PATH_IMAGE032
表示样本数为
Figure 973483DEST_PATH_IMAGE033
时的平均路径长 度、其为定值。
本发明和传统异常数据操作追溯方法的区别在于引入双向监听的影链结构和异常操作检测与防护功能。传统的异常数据操作追溯方法没有对于异常数据操作的检测和防护功能。对于操作员出现误操作、配电记录遭受恶意篡改、恶意删除、无权限用户非法访问配电记录等安全问题,传统异常数据操作追溯方法均不能较好的解决。而本发明中由于监听器的存在,能够完美地解决上述安全问题,通过建立正常行为数据集和异常检测函数,异常的数据操作行为被识别并对配电站服务器的数据库进行回滚操作,保障了数据的安全性;而当主链服务器受到攻击、某配电站服务器出现高频率的异常行为时,该发明提出的副本替换机制能够保障当前配电站仍然能够参与到主链的运维中。
传统的异常数据操作追溯方法将配电数据操作记录都存储在主链服务器中,数据存储成本高、数据安全得不到保障。本发明将配电数据和异常信息分离存储:配电信息加密后存储在主链服务器和影链服务器上,异常信息则存储在影链中,数据安全性更高,且为异常操作检测奠定了基础。本发明利用了区块链的特性,保障影链服务器中数据来源的绝对可靠性。因为影链中的数据全部由监听器检测后产生,因此即使主链服务器受到攻击也可以保障影链数据的安全。
综上,本发明采用孤立森林算法对配电数据进行分析,能够很好地检测异常的数据操作行为并对数据库进行回滚;监听器与影链服务器之间双向信息传递,影链服务器可以记录配电数据及异常信息,监听器则可以对影链中的配电数据进行分析,判断是否有配电站服务器遭受攻击,若遭受攻击则进行副本替换,保证数据库的安全。采用双链结构进行配电数据操作的检测和追溯,利用了区块链天然不可篡改的特性,可追根溯源,同时具有透明性。通过将配电数据与异常信息记录分离存储,优化了配电操作的追溯过程,提高了存储效率。
由此,本发明解决了如下问题:
1.异常配电数据操作检测及防护的问题,包括配电操作员出现误操作,配电记录遭受恶意篡改、恶意删除,无权限用户非法访问配电记录等安全问题。采用孤立森林算法对配电数据操作进行分析,对配电站服务器进行监督,提升了整个配电系统的安全性。
2.解决了难以追溯历史配电数据操作记录的问题。采用双链结构,设计了双向监听的监听器,将配电信息和配电数据操作记录分离存储,更容易进行配电操作的追溯。
3.解决了配电信息泄露的问题。原始方法中,服务器间的数据共享采用数据拷贝的方式,数据安全得不到保障。区块链的引入和监听器的设置使得服务器间数据共享成本更低、安全性更高。
基于上述实施例提供的配电自动化系统异常处理系统,本发明实施例则对应提供一种配电自动化系统异常处理方法,该配电自动化系统异常处理方法应用于主链服务器,方法流程图如图4所示,包括如下步骤:
S10,接收配电站服务器上传的配电数据,配电数据是配电站服务器所获取的。
S20,将配电数据存储至相应的区块链中,并通过监听器监听区块链中当前存储的配电数据的数据波动,以检测数据操作行为。
S30,如果数据操作行为属于正常行为,则将配电数据发送至影链服务器,以使影链服务器将配电数据存储至相应的影链中。
S40,如果数据操作行为属于异常行为,则对配电站服务器执行版本回退,并生成异常信息发送至影链服务器,以使影链服务器将异常信息存储至相应的影链中。
可选的,上述方法还包括:
通过监听器监听配电站服务器的版本回退次数,并在版本回退次数大于对应的阈值的情况下,向配电站服务器发送替换指令,以使配电站服务器对应的备份服务器替换配电站服务器,配电站服务器已同步配电数据至备份服务器中。
可选的,通过监听器监听区块链中当前存储的配电数据的数据波动,以检测数据操作行为,包括:
基于主成分分析与孤立森林算法处理历史配电数据,以获得与历史配电数据相匹配的孤立森林下的异常值阈值;
通过监听器运行主成分分析,确定区块链中当前存储的配电数据在孤立森林下的异常值;
如果异常值小于异常值阈值,则确定数据操作行为属于正常行为;
如果异常值不小于异常值阈值,则确定数据操作行为属于异常行为。
可选的,基于主成分分析与孤立森林算法处理历史配电数据,以获得与历史配电数据相匹配的孤立森林下的异常值阈值,包括:
对历史配电数据处理得到历史数据集;
运行主成分分析和孤立森林算法,确定历史数据集对应的孤立森林,孤立森林由孤立树组成;
对于孤立森林中的每棵孤立树,对该棵孤立树执行测试得到正常行为路径长度和异常行为路径长度,并根据正常行为路径长度和异常行为路径长度确定该棵孤立树对应的初始异常值阈值;
基于孤立森林中所有孤立树对应的初始异常值阈值确定孤立森林下的异常值阈值。
需要说明的是,本发明实施例中各步骤的细化实现,可以参见上述配电自动化系统异常处理系统对应公开部分,在此不再赘述。
以上对本发明所提供的一种配电自动化系统异常处理系统及方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素,或者是还包括为这些过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种配电自动化系统数据异常检测和追溯系统,其特征在于,所述系统包括:主链服务器、影链服务器、以及配电站服务器,所述主链服务器中设置有监听器;
所述配电站服务器,用于获取配电数据;上传所述配电数据至所述主链服务器;
所述主链服务器,用于将所述配电数据存储至相应的区块链中,并通过所述监听器监听所述区块链中当前存储的所述配电数据的数据波动,以检测数据操作行为;如果所述数据操作行为属于正常行为,则将所述配电数据发送至所述影链服务器;如果所述数据操作行为属于异常行为,则对所述配电站服务器执行版本回退,以将所述配电站服务器本地数据库中的数据回退至存储该配电数据之前的历史数据,并生成异常信息发送至所述影链服务器;其中,用于通过所述监听器监听所述区块链中当前存储的所述配电数据的数据波动,以检测数据操作行为,具体用于:通过所述监听器监听所述区块链中当前存储的所述配置数据中的异常值,以检测数据操作行为;
所述影链服务器,用于将所述配电数据/所述异常信息存储至相应的影链中。
2.根据权利要求1所述的系统,其特征在于,所述系统还包括:与所述配电站服务器对应的备份服务器;
所述配电站服务器,还用于同步所述配电数据至所述备份服务器中;
所述主链服务器,还用于通过所述监听器监听所述配电站服务器的版本回退次数,并在所述版本回退次数大于对应的阈值的情况下,向所述配电站服务器发送替换指令,以使所述备份服务器替换所述配电站服务器。
3.根据权利要求1所述的系统,其特征在于,用于通过所述监听器监听所述区块链中当前存储的所述配电数据的数据波动,以检测数据操作行为的所述主链服务器,具体用于:
基于主成分分析与孤立森林算法处理历史配电数据,以获得与所述历史配电数据相匹配的孤立森林下的异常值阈值;通过所述监听器运行所述主成分分析,确定所述区块链中当前存储的所述配电数据在所述孤立森林下的异常值;如果所述异常值小于所述异常值阈值,则确定数据操作行为属于正常行为;如果所述异常值不小于所述异常值阈值,则确定数据操作行为属于异常行为。
4.根据权利要求3所述的系统,其特征在于,用于基于主成分分析与孤立森林算法处理历史配电数据,以获得与所述历史配电数据相匹配的孤立森林下的异常值阈值的所述主链服务器,具体用于:
对所述历史配电数据处理得到历史数据集;运行所述主成分分析和所述孤立森林算法,确定所述历史数据集对应的孤立森林,所述孤立森林由孤立树组成;对于所述孤立森林中的每棵孤立树,对该棵孤立树执行测试得到正常行为路径长度和异常行为路径长度,并根据所述正常行为路径长度和所述异常行为路径长度确定该棵孤立树对应的初始异常值阈值;基于所述孤立森林中所有孤立树对应的初始异常值阈值确定所述孤立森林下的异常值阈值。
5.一种配电自动化系统数据异常操作检测和追溯方法,其特征在于,所述方法应用于主链服务器,所述方法包括:
接收配电站服务器上传的配电数据,所述配电数据是所述配电站服务器所获取的;
将所述配电数据存储至相应的区块链中,并通过监听器监听所述区块链中当前存储的所述配电数据的数据波动,以检测数据操作行为;其中,用于通过所述监听器监听所述区块链中当前存储的所述配电数据的数据波动,以检测数据操作行为,具体用于:通过所述监听器监听所述区块链中当前存储的所述配置数据中的异常值,以检测数据操作行为;
如果所述数据操作行为属于正常行为,则将所述配电数据发送至影链服务器,以使所述影链服务器将所述配电数据存储至相应的影链中;
如果所述数据操作行为属于异常行为,则对所述配电站服务器执行版本回退,以将所述配电站服务器本地数据库中的数据回退至存储该配电数据之前的历史数据,并生成异常信息发送至所述影链服务器,以使所述影链服务器将所述异常信息存储至相应的影链中。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
通过所述监听器监听所述配电站服务器的版本回退次数,并在所述版本回退次数大于对应的阈值的情况下,向所述配电站服务器发送替换指令,以使所述配电站服务器对应的备份服务器替换所述配电站服务器,所述配电站服务器已同步所述配电数据至所述备份服务器中。
7.根据权利要求5所述的方法,其特征在于,所述通过所述监听器监听所述区块链中当前存储的所述配电数据的数据波动,以检测数据操作行为,包括:
基于主成分分析与孤立森林算法处理历史配电数据,以获得与所述历史配电数据相匹配的孤立森林下的异常值阈值;
通过所述监听器运行所述主成分分析,确定所述区块链中当前存储的所述配电数据在所述孤立森林下的异常值;
如果所述异常值小于所述异常值阈值,则确定数据操作行为属于正常行为;
如果所述异常值不小于所述异常值阈值,则确定数据操作行为属于异常行为。
8.根据权利要求7所述的方法,其特征在于,所述基于主成分分析与孤立森林算法处理历史配电数据,以获得与所述历史配电数据相匹配的孤立森林下的异常值阈值,包括:
对所述历史配电数据处理得到历史数据集;
运行所述主成分分析和所述孤立森林算法,确定所述历史数据集对应的孤立森林,所述孤立森林由孤立树组成;
对于所述孤立森林中的每棵孤立树,对该棵孤立树执行测试得到正常行为路径长度和异常行为路径长度,并根据所述正常行为路径长度和所述异常行为路径长度确定该棵孤立树对应的初始异常值阈值;
基于所述孤立森林中所有孤立树对应的初始异常值阈值确定所述孤立森林下的异常值阈值。
CN202210090380.7A 2022-01-26 2022-01-26 配电自动化系统数据异常操作检测和追溯系统及方法 Active CN114116733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210090380.7A CN114116733B (zh) 2022-01-26 2022-01-26 配电自动化系统数据异常操作检测和追溯系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210090380.7A CN114116733B (zh) 2022-01-26 2022-01-26 配电自动化系统数据异常操作检测和追溯系统及方法

Publications (2)

Publication Number Publication Date
CN114116733A CN114116733A (zh) 2022-03-01
CN114116733B true CN114116733B (zh) 2022-04-19

Family

ID=80361427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210090380.7A Active CN114116733B (zh) 2022-01-26 2022-01-26 配电自动化系统数据异常操作检测和追溯系统及方法

Country Status (1)

Country Link
CN (1) CN114116733B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116073378B (zh) * 2023-03-07 2023-06-16 深圳市超业电力科技有限公司 配电管理方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767583A (zh) * 2020-07-02 2020-10-13 创新链科技有限公司 基于区块链的企业内部信息安全保障方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI650725B (zh) * 2017-05-23 2019-02-11 第一商業銀行股份有限公司 審查商家營運狀況方法及金融伺服單元
EP3900301A4 (en) * 2018-12-17 2022-08-24 Xeniro MULTI-ACCESS EDGE COMPUTING NOTES WITH DISTRIBUTED LEDGER
CN112258252A (zh) * 2020-11-23 2021-01-22 国网能源研究院有限公司 一种基于区块链的数据资产价值评估装置方法、装置
CN113157472A (zh) * 2021-03-15 2021-07-23 京东数科海益信息科技有限公司 一种服务信息处理方法、装置、设备及计算机存储介质
CN113660092B (zh) * 2021-07-30 2024-01-23 国网天津市电力公司 一种基于零知识证明的电力数据上传系统和方法
CN113961434A (zh) * 2021-09-29 2022-01-21 西安交通大学 一种分布式区块链系统用户异常行为监测方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767583A (zh) * 2020-07-02 2020-10-13 创新链科技有限公司 基于区块链的企业内部信息安全保障方法及系统

Also Published As

Publication number Publication date
CN114116733A (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
CN111931860B (zh) 异常数据检测方法、装置、设备及存储介质
KR101538709B1 (ko) 산업제어 네트워크를 위한 비정상 행위 탐지 시스템 및 방법
JP4050497B2 (ja) ログ情報管理装置及びログ情報管理プログラム
CN102918534A (zh) 查询管道
US20180357214A1 (en) Log analysis system, log analysis method, and storage medium
Han et al. Unsupervised cross-system log anomaly detection via domain adaptation
US11159564B2 (en) Detecting zero-day attacks with unknown signatures via mining correlation in behavioral change of entities over time
CN105721198A (zh) 一种视频监控系统日志安全审计方法
CN110011990B (zh) 内网安全威胁智能分析方法
CN113704328B (zh) 基于人工智能的用户行为大数据挖掘方法及系统
CN114116733B (zh) 配电自动化系统数据异常操作检测和追溯系统及方法
CN112181840A (zh) 一种数据库状态的确定方法及装置、设备、存储介质
CN111274218A (zh) 一种电力信息系统多源日志数据处理方法
Hu et al. An anomaly detection model of user behavior based on similarity clustering
CN113704772B (zh) 基于用户行为大数据挖掘的安全防护处理方法及系统
CN113672912A (zh) 基于计算机硬件指征和行为分析的网络安全监控系统
CN111506672B (zh) 实时分析环保监测数据的方法、装置、设备及存储介质
US10223529B2 (en) Indexing apparatus and method for search of security monitoring data
CN111431884A (zh) 一种基于dns分析的主机失陷检测方法及装置
CN115796607A (zh) 一种基于用电信息分析的采集终端安全画像评估方法
CN110661795A (zh) 一种向量级威胁情报自动生产、分发系统及方法
JP6501159B2 (ja) コンピュータ装置の動作記録の解析、翻訳を行い、監査に対する情報の出力及びシステムの傾向分析装置。
CN111475380A (zh) 一种日志分析方法和装置
Li Redundancy evaluation method of massive heterogeneous data in Internet of things based on attributes and relations
CN117220992B (zh) 一种支持商用密码算法的云安全管理监控方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 5016, 5 / F, building 7, Guangyi street, Xicheng District, Beijing 100053

Patentee after: State Grid blockchain Technology (Beijing) Co.,Ltd.

Patentee after: State Grid Digital Technology Holdings Co.,Ltd.

Patentee after: STATE GRID JIANGSU ELECTRIC POWER Co.,Ltd. CHANGZHOU POWER SUPPLY BRANCH

Patentee after: STATE GRID CORPORATION OF CHINA

Address before: 5016, 5 / F, building 7, Guangyi street, Xicheng District, Beijing 100053

Patentee before: State Grid blockchain Technology (Beijing) Co.,Ltd.

Patentee before: STATE GRID ELECTRONIC COMMERCE Co.,Ltd.

Patentee before: STATE GRID JIANGSU ELECTRIC POWER Co.,Ltd. CHANGZHOU POWER SUPPLY BRANCH

Patentee before: STATE GRID CORPORATION OF CHINA