CN114861774B - 一种电网中虚假数据识别方法及系统 - Google Patents

一种电网中虚假数据识别方法及系统 Download PDF

Info

Publication number
CN114861774B
CN114861774B CN202210410643.8A CN202210410643A CN114861774B CN 114861774 B CN114861774 B CN 114861774B CN 202210410643 A CN202210410643 A CN 202210410643A CN 114861774 B CN114861774 B CN 114861774B
Authority
CN
China
Prior art keywords
identified
sequence
data
sample
reconstruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210410643.8A
Other languages
English (en)
Other versions
CN114861774A (zh
Inventor
安世超
王玉峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202210410643.8A priority Critical patent/CN114861774B/zh
Publication of CN114861774A publication Critical patent/CN114861774A/zh
Application granted granted Critical
Publication of CN114861774B publication Critical patent/CN114861774B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S40/00Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them
    • Y04S40/20Information technology specific aspects, e.g. CAD, simulation, modelling, system security

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Water Supply & Treatment (AREA)
  • Molecular Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Public Health (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本发明公开了一种电网中虚假数据识别方法及系统,其中方法包括:获取待识别样本;预处理获取的待识别样本,获得待识别样本序列;将待识别样本序列输入训练好的自动编码器模型获得重构数据Ⅰ,并计算重构数据Ⅰ与待识别样本序列的重构误差Ⅰ;判断重构误差Ⅰ与预设的动态阈值序列的大小,若重构误差Ⅰ大于等于动态阈值序列中对应的阈值,则输出虚假数据告警信号;所述预设的动态阈值序列包括全天各采样时刻对应的阈值。本发明能够实时识别检测电力系统中的虚假数据。

Description

一种电网中虚假数据识别方法及系统
技术领域
本发明涉及一种电网中虚假数据识别方法及系统,属于电力系统技术领域。
背景技术
电网是包含多种发电源、传输线路以及配电变电站的复杂系统,现代电网使用智能仪表来实现对电网运行状态的远程监视与实时控制,并通过通信网络进行数据状态信息的传输与更新。然而信息通信技术依赖于容易遭受攻击入侵的共享基础设施,虚假数据攻击是一种被设计用来突破智能仪表中异常数据监测功能的攻击手段,虚假数据攻击会影响智能仪表对电网运行情况的判断,从而误导系统运行与控制。
为了高效可靠地检测出虚假数据攻击,从而保护电网的运行安全,本申请提出一种电网中虚假数据识别方法及系统。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种电网中虚假数据识别方法及系统,能够实时识别检测电力系统中的虚假数据。
为达到上述目的,本发明是采用下述技术方案实现的:
一方面,本发明提供一种电网中虚假数据识别方法,其特征在于,包括:
获取待识别样本;
预处理获取的待识别样本,获得待识别样本序列;
将待识别样本序列输入训练好的自动编码器模型获得重构数据Ⅰ,并计算重构数据Ⅰ与待识别样本序列的重构误差Ⅰ;
判断重构误差Ⅰ与预设的动态阈值序列的大小,若重构误差Ⅰ大于等于动态阈值序列中对应的阈值,则输出虚假数据告警信号;
所述预设的动态阈值序列包括全天各采样时刻对应的阈值。
进一步地,所述获取待识别样本包括多组待识别时间序列,各组待识别时间序列包括多个采样时刻的待识别数据。
进一步地,所述预处理获取的待识别样本,获得待识别样本序列包括:
顺次设置多个滑动窗口Ⅰ,相邻滑动窗口Ⅰ相互重叠一半,各滑动窗口Ⅰ覆盖待识别样本中的b个待识别数据;
计算各滑动窗口Ⅰ的幅度特征和时序变化特征,并根据各滑动窗口Ⅰ的幅度特征和时序变化特征计算统计参数;
基于各幅度特征和时序变化特征以及统计参数,获得待识别样本序列。
进一步地,所述自动编码器模型训练的方法包括:
获取测量样本;
预处理获取的测量样本,获得测量样本序列;
循环迭代以下步骤,当相邻两次循环迭代的重构误差Ⅱ相同时,迭代循环过程终止,自动编码器模型训练完成:
将测量样本序列输入自动编码器模型获得重构数据Ⅱ,并计算重构数据Ⅱ与测量样本序列的重构误差Ⅱ;
基于反向传播算法,根据重构误差Ⅱ调整自动编码器模型参数。
进一步地,所述测量样本包括多组测量时间序列,各组测量时间序列包括多个采样时刻的检测数据,各检测数据均为未受影响的干净数据。
进一步地,所述动态阈值序列的预设方法包括:
连续获取检测设备N天各采样时刻的检测数据,各检测数据均为未受影响的干净数据;
预处理获取的检测数据,获得检测数据序列;
将检测数据序列输入训练好的自动编码器模型获得重构数据Ⅲ,并计算重构数据Ⅲ与检测数据序列的重构误差Ⅲ;
逐一将各采样时刻每日对应的重构误差Ⅲ绘制成累积概率分布曲线;
基于PR曲线和预设的虚假警示率,逐一根据各采样时刻的累积概率分布曲线获得对应的阈值,并按照采样时刻顺序将各阈值集成动态阈值序列。
另一方面,本发明提供一种电网中虚假数据检测系统,包括:
采样模块,用于获取待识别样本;
预处理模块,用于预处理获取的待识别样本,获得待识别样本序列;
模型输入模块,用于将待识别样本序列输入训练好的自动编码器模型获得重构数据Ⅰ,并计算重构数据Ⅰ与待识别样本序列的重构误差Ⅰ;
判断模块,用于判断重构误差Ⅰ与预设的动态阈值序列的大小,若重构误差Ⅰ大于等于动态阈值序列中对应的阈值,则输出虚假数据告警信号。
与现有技术相比,本发明所达到的有益效果:
本发明通过预设包括全天各采样时刻对应的阈值的动态阈值序列,能够针对不同采样时刻的待识别数据提供不同的阈值,不仅能够实时识别检测电力系统中的虚假数据,还能够提高识别的准确率。
附图说明
图1所示为本发明电网中虚假数据识别方法的一种实施例流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例1
本实施例提供一种电网中虚假数据识别方法,包括以下步骤:
S1获取待识别样本。
应用中,检测设备用于检测电网各支路上的电压参数。本实施例基于检测设备获取待识别样本,待识别样本包括多组待识别时间序列,各组待识别时间序列包括多个连续采样时刻的待识别数据。
本实施例应用时,根据实际情况设置各采样时刻的间隔时间,根据实际需求设置各组待识别时间序列中连续采样时刻的数量,以及根据电网支路的数量设置待识别样本中待识别时间序列的组数。
S2预处理获取的待识别样本,获得待识别样本序列。
应用中,丰富待识别样本的特征,获得特征丰富的待识别样本序列,以加快自动编码器的训练速度,提高自动编码器的训练效果。
S3将待识别样本序列输入训练好的自动编码器模型获得重构数据Ⅰ,并计算重构数据Ⅰ与待识别样本序列的重构误差Ⅰ。
应用中,电网中包括m条支路,待识别样本中包括N个待识别数据,则本实施例将待识别样本序列输入训练好的自动编码器模型,获得N个重构数据Ⅰ,并根据重构数据Ⅰ与待识别样本序列,获得N/m个重构误差Ⅰ,如下式:
其中,为重构误差Ⅰ,m为电网中支路总数,zi为电网中当前采样时刻i支路的待识别数据,为电网中当前采样时刻i支路的重构数据Ⅰ。
S4判断重构误差Ⅰ与预设的动态阈值序列的大小,若重构误差Ⅰ大于等于动态阈值序列中对应的阈值,则输出虚假数据告警信号。
应用中,预设的动态阈值序列包括全天各采样时刻对应的阈值。逐一判断各重构误差Ⅰ与动态阈值序列中对应采样时刻的阈值的大小,若重构误差Ⅰ小于动态阈值序列中对应采样时刻的阈值,则重构误差Ⅰ对应的待识别数据属于未受影响的干净数据;若重构误差Ⅰ大于等于动态阈值序列中对应采样时刻的阈值,则重构误差Ⅰ对应的待识别数据属于虚假数据,并输出虚假数据告警信号。
本发明通过预设包括全天各采样时刻对应的阈值的动态阈值序列,能够针对不同采样时刻的待识别数据提供不同的阈值,不仅能够实时识别检测电力系统中的虚假数据,还能够提高识别的准确率。
实施例2
在实施例1的基础上,本实施例详细介绍了预处理待识别样本的方法。
预处理获取的待识别样本,获得待识别样本序列包括以下步骤:
S21顺次设置多个滑动窗口Ⅰ,相邻滑动窗口Ⅰ相互重叠一半,各滑动窗口Ⅰ覆盖待识别样本中的b个待识别数据。
S22计算各滑动窗口Ⅰ的幅度特征和时序变化特征,并根据各滑动窗口Ⅰ的幅度特征和时序变化特征计算统计参数。
应用中,S221通过下式计算各滑动窗口Ⅰ中各待识别数据之间的欧氏距离(EuclidDistance),以捕捉各滑动窗口Ⅰ中各待识别数据的幅度特征:
其中,为滑动窗口Ⅰ的幅度特征,为涵盖电网m支路中采样时刻起点为ti的b个连续待识别数据的滑动窗口Ⅰ,Z为待识别数据。
S222基于幅度特征的差异性,通过下式计算相邻滑动窗口Ⅰ的时序变化特征:
其中,为滑动窗口Ⅰ的时序变化特征,为滑动窗口Ⅰ的幅度特征。
S223基于各滑动窗口Ⅰ的幅度特征和时序变化特征,通过下式获得待识别样本序列:
T=<G1,G2,…,GC′>
其中,T为待识别样本序列,Gi为d*k维矩阵,d为2,k为5。
S224顺次设置多个滑动窗口Ⅱ,相邻滑动窗口Ⅱ相互重叠一半,各滑动窗口Ⅱ覆盖待识别样本序列中的f个向量。
S225基于各滑动窗口Ⅱ中各向量包括幅度特征和时序变化特征,计算各向量的统计参数,统计参数包括8组统计数据,分别为:平均值、最小值、最大值、25%四分位数、50%四分位数、75%四分位数、标准差和峰-峰值。
S23基于各幅度特征和时序变化特征以及统计参数,通过下式更新待识别样本序列:
T=<E1,E2,…,EC″>
其中,Ei为e*d*k维矩阵,e为8。
实施例3
在实施例1或2的基础上,本实施例详细介绍了训练自动编码器模型的方法。
自动编码器模型的训练方法,包括以下步骤:
S31获取测量样本。
应用中,测量样本包括多组测量时间序列,各组测量时间序列包括多个采样时刻的检测数据,各检测数据均为未受影响的干净数据。
S32预处理获取的测量样本,获得测量样本序列。
S33循环迭代以下步骤,当相邻两次循环迭代的重构误差Ⅱ相同时,迭代循环过程终止,自动编码器模型训练完成:
将测量样本序列输入自动编码器模型获得重构数据Ⅱ,并计算重构数据Ⅱ与测量样本序列的重构误差Ⅱ;
基于反向传播算法,根据重构误差Ⅱ调整自动编码器模型参数。
应用中,自动编码器模型具有注意力机制层,能够在小范围的特征空间内有效地捕捉测量样本序列的代表性特征,能够提高自动编码器模型对测量样本序列的数据特征的学习深度。
实施例4
在实施例1的基础上,本实施例详细介绍了预设动态阈值序列的方法。
动态阈值序列的预设方法,包括以下步骤:
S41连续获取检测设备N天各采样时刻的检测数据,各检测数据均为未受影响的干净数据。
应用中,从检测设备已知健康的历史数据中,获取最近连续365天电网各支路各采样时刻的检测数据。
S42预处理获取的检测数据,获得检测数据序列。
S43将检测数据序列输入训练好的自动编码器模型获得重构数据Ⅲ,并计算重构数据Ⅲ与检测数据序列的重构误差Ⅲ。
S44逐一将各采样时刻每日对应的重构误差Ⅲ绘制成累积概率分布曲线。
应用中,采样时刻的时间间隔为t0,本实施例获得(24*60)/t0条累积概率分布曲线。
S45基于PR曲线((Precision-recall curve))和预设的虚假警示率,逐一根据各采样时刻的累积概率分布曲线获得对应的阈值,并按照采样时刻顺序将各阈值集成动态阈值序列。
应用中,各条累积概率分布曲线的横坐标为重构误差Ⅲ,纵坐标为该采样时刻各重构误差Ⅲ的累积概率,如下式:
其中,F(μ)为累积概率分布曲线函数,μ为重构误差Ⅲ,α和β分别为累积概率分布曲线函数的参数。
基于PR曲线,逐一拟合累积概率分布曲线,以确定累积概率分布曲线的参数;
基于预设的虚假警示率,根据拟合的累积概率分布曲线,通过下式确定全天各采样时刻的阈值,以预先设置动态阈值序列:
其中,FAR为虚假警示率,为阈值。
实施例5
本实施例提供一种电网中虚假数据检测系统,包括:
采样模块,用于获取待识别样本;
预处理模块,用于预处理获取的待识别样本,获得待识别样本序列;
模型输入模块,用于将待识别样本序列输入训练好的自动编码器模型获得重构数据Ⅰ,并计算重构数据Ⅰ与待识别样本序列的重构误差Ⅰ;
判断模块,用于判断重构误差Ⅰ与预设的动态阈值序列的大小,若重构误差Ⅰ大于等于动态阈值序列中对应的阈值,则输出虚假数据告警信号。
上述各模块的具体功能实现参照实施例1-4方法中的相关内容。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (4)

1.一种电网中虚假数据识别方法,其特征在于,包括:
获取待识别样本;
预处理获取的待识别样本,获得待识别样本序列;
将待识别样本序列输入训练好的自动编码器模型获得重构数据Ⅰ,并计算重构数据Ⅰ与待识别样本序列的重构误差Ⅰ;
判断重构误差Ⅰ与预设的动态阈值序列的大小,若重构误差Ⅰ大于等于动态阈值序列中对应的阈值,则输出虚假数据告警信号;
所述预设的动态阈值序列包括全天各采样时刻对应的阈值;
所述获取待识别样本包括多组待识别时间序列,各组待识别时间序列包括多个采样时刻的待识别数据;
所述预处理获取的待识别样本,获得待识别样本序列包括:
顺次设置多个滑动窗口Ⅰ,相邻滑动窗口Ⅰ相互重叠一半,各滑动窗口Ⅰ覆盖待识别样本中的b个待识别数据;
计算各滑动窗口Ⅰ的幅度特征和时序变化特征,并根据各滑动窗口Ⅰ的幅度特征和时序变化特征计算统计参数;
基于各幅度特征和时序变化特征以及统计参数,获得待识别样本序列;
所述动态阈值序列的预设方法包括:
连续获取检测设备N天各采样时刻的检测数据,各检测数据均为未受影响的干净数据;
预处理获取的检测数据,获得检测数据序列;
将检测数据序列输入训练好的自动编码器模型获得重构数据Ⅲ,并计算重构数据Ⅲ与检测数据序列的重构误差Ⅲ;
逐一将各采样时刻每日对应的重构误差Ⅲ绘制成累积概率分布曲线;
基于PR曲线和预设的虚假警示率,逐一根据各采样时刻的累积概率分布曲线获得对应的阈值,并按照采样时刻顺序将各阈值集成动态阈值序列。
2.根据权利要求1所述的电网中虚假数据识别方法,其特征在于,所述自动编码器模型训练的方法包括:
获取测量样本;
预处理获取的测量样本,获得测量样本序列;
循环迭代以下步骤,当相邻两次循环迭代的重构误差Ⅱ相同时,迭代循环过程终止,自动编码器模型训练完成:
将测量样本序列输入自动编码器模型获得重构数据Ⅱ,并计算重构数据Ⅱ与测量样本序列的重构误差Ⅱ;
基于反向传播算法,根据重构误差Ⅱ调整自动编码器模型参数。
3.根据权利要求2所述的电网中虚假数据识别方法,其特征在于,所述测量样本包括多组测量时间序列,各组测量时间序列包括多个采样时刻的检测数据,各检测数据均为未受影响的干净数据。
4.一种电网中虚假数据检测系统,其特征在于,包括:
采样模块,用于获取待识别样本;
预处理模块,用于预处理获取的待识别样本,获得待识别样本序列;
模型输入模块,用于将待识别样本序列输入训练好的自动编码器模型获得重构数据Ⅰ,并计算重构数据Ⅰ与待识别样本序列的重构误差Ⅰ;
判断模块,用于判断重构误差Ⅰ与预设的动态阈值序列的大小,若重构误差Ⅰ大于等于动态阈值序列中对应的阈值,则输出虚假数据告警信号;
所述预设的动态阈值序列包括全天各采样时刻对应的阈值;
所述获取待识别样本包括多组待识别时间序列,各组待识别时间序列包括多个采样时刻的待识别数据;
所述预处理获取的待识别样本,获得待识别样本序列包括:
顺次设置多个滑动窗口Ⅰ,相邻滑动窗口Ⅰ相互重叠一半,各滑动窗口Ⅰ覆盖待识别样本中的b个待识别数据;
计算各滑动窗口Ⅰ的幅度特征和时序变化特征,并根据各滑动窗口Ⅰ的幅度特征和时序变化特征计算统计参数;
基于各幅度特征和时序变化特征以及统计参数,获得待识别样本序列;
所述动态阈值序列的预设方法包括:
连续获取检测设备N天各采样时刻的检测数据,各检测数据均为未受影响的干净数据;
预处理获取的检测数据,获得检测数据序列;
将检测数据序列输入训练好的自动编码器模型获得重构数据Ⅲ,并计算重构数据Ⅲ与检测数据序列的重构误差Ⅲ;
逐一将各采样时刻每日对应的重构误差Ⅲ绘制成累积概率分布曲线;
基于PR曲线和预设的虚假警示率,逐一根据各采样时刻的累积概率分布曲线获得对应的阈值,并按照采样时刻顺序将各阈值集成动态阈值序列。
CN202210410643.8A 2022-04-19 2022-04-19 一种电网中虚假数据识别方法及系统 Active CN114861774B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210410643.8A CN114861774B (zh) 2022-04-19 2022-04-19 一种电网中虚假数据识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210410643.8A CN114861774B (zh) 2022-04-19 2022-04-19 一种电网中虚假数据识别方法及系统

Publications (2)

Publication Number Publication Date
CN114861774A CN114861774A (zh) 2022-08-05
CN114861774B true CN114861774B (zh) 2024-07-05

Family

ID=82631578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210410643.8A Active CN114861774B (zh) 2022-04-19 2022-04-19 一种电网中虚假数据识别方法及系统

Country Status (1)

Country Link
CN (1) CN114861774B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116455074B (zh) * 2023-04-19 2024-02-20 贵州电网有限责任公司 一种应用于电网调度的数据处理方法、装置及电子设备
CN116992389B (zh) * 2023-09-26 2023-12-29 河北登浦信息技术有限公司 一种物联网虚假数据检测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765454A (zh) * 2019-10-22 2020-02-07 深圳大学 一种电力系统的运行状态重构方法及终端
CN113657644A (zh) * 2021-07-09 2021-11-16 南京邮电大学 智能电网中虚假数据检测方法、装置、设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3809220B1 (en) * 2019-10-14 2023-01-18 Honda Research Institute Europe GmbH Method and system for semi-supervised deep anomaly detection for large-scale industrial monitoring systems based on time-series data utilizing digital twin simulation data
CN114265882A (zh) * 2021-12-24 2022-04-01 中冶赛迪重庆信息技术有限公司 时序信号点异常检测方法、系统、设备及介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765454A (zh) * 2019-10-22 2020-02-07 深圳大学 一种电力系统的运行状态重构方法及终端
CN113657644A (zh) * 2021-07-09 2021-11-16 南京邮电大学 智能电网中虚假数据检测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN114861774A (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN114861774B (zh) 一种电网中虚假数据识别方法及系统
CN111914873B (zh) 一种两阶段云服务器无监督异常预测方法
CN109492193B (zh) 基于深度机器学习模型的异常网络数据生成与预测方法
CN111127517B (zh) 一种基于监控视频的生产线产品定位方法
CN106888205B (zh) 一种非侵入式基于功耗分析的plc异常检测方法
CN106371939A (zh) 一种时序数据异常检测方法及其系统
CN112987675A (zh) 一种异常检测的方法、装置、计算机设备和介质
CN112766429B (zh) 一种异常检测的方法、装置、计算机设备和介质
CN110717552B (zh) 一种输电线路通道可视化机械类连续告警的确定方法
CN110287827B (zh) 一种基于数据关联性的桥梁应变数据异常值识别方法
CN113589230B (zh) 一种基于联合优化网络的目标声源定位方法及系统
CN116708038B (zh) 基于资产测绘的工业互联网企业网络安全威胁识别方法
CN117591857A (zh) 一种基于深度学习的电机检测方法
CN117346743A (zh) 一种基于机器学习模型的水情遥测站智能监测巡检系统
CN115307943A (zh) 一种旋转机械设备多工况运行状态异常检测方法及系统
CN109142979B (zh) 一种配电网异常状态的检测方法及装置
CN114912355A (zh) 输电线路短期覆冰预测方法、装置和存储介质
CN114004996A (zh) 异音检测方法、装置、电子设备及介质
CN117171655A (zh) 一种基于频谱分析的煤矿生产状态智能判别方法及装置
CN111885084A (zh) 一种入侵检测方法、装置及电子设备
CN111934903A (zh) 一种基于时序演化基因的Docker容器故障智能预测方法
CN113552444A (zh) 一种泄漏电流特征阈值在线整定方法及装置
CN114064396A (zh) 一种kpi数据异常分数确定方法、异常检测方法及系统
CN114022305A (zh) 地下水动态监测方法及装置
CN109412901B (zh) 基于时域处理的采集数据连续性检测方法及检测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant