CN111598179A - 电力监控系统用户异常行为分析方法、存储介质和设备 - Google Patents
电力监控系统用户异常行为分析方法、存储介质和设备 Download PDFInfo
- Publication number
- CN111598179A CN111598179A CN202010435964.4A CN202010435964A CN111598179A CN 111598179 A CN111598179 A CN 111598179A CN 202010435964 A CN202010435964 A CN 202010435964A CN 111598179 A CN111598179 A CN 111598179A
- Authority
- CN
- China
- Prior art keywords
- user
- layer
- behavior
- abnormal
- monitoring system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010000117 Abnormal behaviour Diseases 0.000 title claims abstract description 41
- 238000012544 monitoring process Methods 0.000 title claims abstract description 36
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000004458 analytical method Methods 0.000 title description 7
- 230000006399 behavior Effects 0.000 claims abstract description 75
- 238000000034 method Methods 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 54
- 230000002159 abnormal effect Effects 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 34
- 238000003062 neural network model Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 9
- 238000013145 classification model Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 238000009825 accumulation Methods 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims 1
- 239000002994 raw material Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004880 explosion Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000008034 disappearance Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电力监控系统用户异常行为分析方法、存储介质和设备,采集电力监控系统中反映用户行为的数据;对采集到的反映用户行为的数据进行预处理生成待识别的用户行为数据;通过预先离线训练构建的强分类器对待识别的用户行为数据进行在线识别,识别出用户异常行为并发出告警。本发明对电力监控系统用户异常行为进行在线识别,识别精度高。
Description
技术领域
本发明涉及电力系统信息安全检测与防御技术领域,具体涉及一种电力监控系统用户异常行为分析方法、存储介质和设备。
背景技术
近年来随着各类网络化应用的不断拓展和深化,计算机病毒、木马、黑客攻击等恶意网络攻击行为日益猖獗,网络安全事件进入了高发期,网络信息战和网络恐怖行动等国家、集团性网络攻击行为对全社会的生产生活都造成严重影响。电力监控系统作为电力系统的关键信息基础设施,已被不少国家视为“网络战”的首选攻击目标。近年来,以色列、乌克兰等国家相继发生了电力监控系统被入侵而导致电力供应中断的事件,给当地人民群众的生产生活造成了极大损失。
随着能源互联网的全面推进,作为电网调度控制中枢的电力监控系统的智能化、网络化水平不断提升,同时以高级持续性网络攻击(APT)为代表的网络攻击行为新变种层出不穷,其威胁也日益严重,给电力监控系统安全防护工作带来了严峻挑战。早期人们通常采用端口扫描、报文特征字段匹配等方法对电力监控系统用户异常行为进行分析和检测,随着网络攻击行为的不断变化,依靠人工对用户异常行为进行分析以获取特征的代价越来越高昂甚至不可行。随着人工智能技术的发展,机器学习技术更多地被用于从网络数据中自动计算异常行为模式、提取其特征、自动产生检测规则,大大降低了用户异常行为的检测代价。根据是否需要对样本数据进行人工标记,基于机器学习的用户异常行为检测方法大致分为:(1)基于无监督学习的方法,如聚类、SOM(自组织图)等方法,但是该类方法存在模型可读性差导致准确性低以及训练开销过高等不足;(2)监督学习方法,如隐马尔科夫模型、贝叶斯网络、决策树及SVM支持向量机等,在准确性、模型可读性等方面优于无监督学习,但其训练样本需要全部进行人工标记,开销巨大;(3)半监督学习又称协同学习方法,相比前两者,可以使用部分标记的训练样本数据,通过生成的若干成员分类器进行协作,挖掘蕴含在无标记训练样本中的信息,从而在降低标记训练样本数据的开销前提下兼顾检测准确性。半监督学习方法多采用支持向量机、决策树等传统机器学习方法作为核心分类模型来构建分类器,在处理大规模数据集时模型训练会遇到性能瓶颈,识别准确率无法得到进一步提高。
近年来,以神经网络为代表的深度学习技术发展较快,应用于大规模数据时,模型识别准确率明显优于其他机器学习模型,但是却面临着收敛速度慢的问题。深度神经网络模型为了提升识别准确率,需要有足够的网络深度。然而,随着网络深度的增大,梯度值在网络中传递时会出现指数级增长或消减,从而导致有效信息被过分夸大或隐瞒,出现梯度爆炸或梯度消失等问题,严重影响深度神经网络模型的识别精度与收敛速度,导致识别电力监控系统用户异常行为的准确率不高。
发明内容
为解决现有技术中的不足,本发明提供一种电力监控系统用户异常行为分析方法、存储介质和设备,解决了电力监控系统用户异常行为在线识别不准确的问题。
为了实现上述目标,本发明采用如下技术方案:一种电力监控系统用户异常行为分析方法,包括步骤:
采集电力监控系统中反映用户行为的数据;
对采集到的反映用户行为的数据进行预处理生成待识别的用户行为数据;
通过预先离线训练构建的强分类器对待识别的用户行为数据进行在线识别,识别出用户异常行为并发出告警。
进一步的,强分类器离线训练构建过程为:
1)构建多级残差全连接神经网络模型;
2)基于多级残差全连接神经网络模型进行弱分类器集群的初始化构建;
3)采用加权多数表决法将弱分类器集群线性组合成强分类器。
进一步的,所述多级残差全连接神经网络模型包括:输入层、残差全连接层、输出层与Softmax层;
输入层用于将有标记的训练样本数据作为输入向量;
残差全连接层的层数有一个或者多个,每个残差全连接层对应一个一级残差块;每个一级残差块内包括三个二级残差块,第三个二级残差块的输入由第一个二级残差块的输入与第二个二级残差块的输出构成;
每个二级残差块内包括三个隐含层和一个批标准化BN层;
输出层根据残差全连接层的输出结果,分别计算训练样本数据与不同类型用户行为的匹配值并输出;
Softmax层根据输出层的计算结果,计算训练样本数据中的每一条记录分别对应用户正常行为和用户异常行为的概率值。
进一步的,所述二级残差块内的四个层的数据处理公式如下所示:
BN层:O=BN[a[3]] (4)
其中,x为第一隐含层的输入,w[i]为第i隐含层的权重矩阵,b[i]为第i隐含层的偏置向量,z[i]为第i隐含层对其输入向量进行线性连接操作的结果,a[i]为第i隐含层的输出,BN[]表示对第三隐含层的输出进行归一化处理,O表示经过BN层进行归一化处理后的结果;
leaky_ReLU()为激活函数:
m为激活函数的变量;
所述训练样本数据与不同类型用户行为的匹配值,计算公式如下所示:
P=w[p]·a[h]+b[p] (5)
其中,a[h]为残差全连接层的输出结果,w[p]为输出层的权重矩阵,b[p]为输出层的偏置向量,P的维度为2,其中,第一维向量P0表示训练样本数据与用户正常行为的匹配值,第二维向量P1表示训练样本数据与用户异常行为的匹配值;
所述训练样本数据中的每一条记录分别对应用户正常行为和用户异常行为的概率值的计算公式如下所示:
其中,Sj表示输入的训练样本数据中每一条用户行为数据对应用户正常行为和用户异常行为的概率值,j=0表示用户正常行为,j=1表示用户异常行为,e为自然常数。
进一步的,所述基于多级残差全连接神经网络模型进行弱分类器集群的初始化构建,包括:
基于识别用户行为的训练样本数据,以多级残差全连接神经网络模型为核心分类模型,选取不同的训练样本子集、设置不同的残差全连接层层数,对该核心分类模型进行离线训练,生成多个具有差异性的弱分类器,得到弱分类器集群。
进一步的,所述采用加权多数表决法将弱分类器集群线性组合成强分类器包括:
基于相同的测试样本数据集分别计算训练后的每一个弱分类器的分类误差率,第k个弱分类器Gk(y)的分类误差率rk为分类错误的测试样本数据条数与测试样本数据总条数的比值,则第k个弱分类器Gk(y)的投票表决权重ck的计算公式为:
ck=log((1-rk)/rk)/2 (7)
基于投票表决权重将多个弱分类器线性组合成一个强分类器E(y):
其中,K表示组成强分类器的弱分类器个数,将所有弱分类器判断为用户正常行为的概率值和判断为用户异常行为的概率值分别与投票表决权重相乘后线性累加的结果最大值对应的用户行为类型作为识别结果输出。
进一步的,所述反映用户行为的数据至少包括流量特征、系统日志、系统告警数据。
进一步的,所述预处理包括数据清洗、删除含有缺失值和异常值的记录。
一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行前述的电力监控系统用户异常行为分析方法中的任一方法。
一种计算设备,包括,
一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行电力监控系统用户异常行为分析方法中的任一方法的指令。
本发明所达到的有益效果:本发明基于电力监控系统的流量特征、系统日志、系统告警等能够反映用户行为的原始数据构建训练样本,构建多级残差全连接神经网络模型,在此基础上采用混合扰动方法构建初始弱分类器集群,计算各弱分类的识别误差率,通过加权多数表决法将弱分类器线性组合成强分类器,用于对电力监控系统用户异常行为进行在线识别,识别精度高。
附图说明
图1是本发明具体实施方式中的分析方法流程图;
图2是本发明具体实施方式中的多级残差全连接神经网络模型结构示意图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,一种电力监控系统用户异常行为分析方法,包括步骤:
步骤1,采集电力监控系统中反映用户行为的数据,反映用户行为的数据至少包括流量特征、系统日志、系统告警三类数据的组合;
步骤2,对采集到的反映用户行为的数据进行预处理,包括数据清洗,删除含有缺失值和异常值的记录,生成待识别的用户行为数据;
步骤3,基于用户行为识别样本数据,通过预先离线训练构建的强分类器对待识别的用户行为数据中的用户异常行为进行在线识别,识别出用户异常行为并发出告警。
强分类器离线训练构建过程为:
1)构建多级残差全连接神经网络模型;
如图2所示,多级残差全连接神经网络模型包括:输入层、残差全连接层、输出层与Softmax层;
输入层负责将有标记的训练样本数据作为输入向量,以便后续残差全连接层进行训练处理。
有标记的训练样本数据为:对采集的电力监控系统中反映用户行为的数据预处理后打上正常或者异常行为标记;
残差全连接层是整个模型识别精度的根本保证。残差全连接层层数越多,模型对不同用户行为特征的抽象提取越细致,相应模型的识别准确率就会越高,可以根据需要设置不同的层数。为了解决梯度消失、梯度爆炸等问题,本模型引入残差思想,以残差块为基本单位构建残差全连接层。残差块采用二级结构,实现残差块嵌套的目的是使信息在层与层之间的交互更加充分。
如图2所示,有两个残差全连接层,每个残差全连接层对应一个一级残差块;每个一级残差块内包括三个二级残差块,第三个二级残差块的输入由第一个二级残差块的输入与第二个二级残差块的输出构成,即一级残差块的残差跨度是二级残差块的3倍。
每个二级残差块内由三个隐含层和一个批标准化(Batch Normalizaiton,BN)层构成,二级残差块内的四个层的数据处理公式如公式(1)至(4)所示:
BN层:O=BN[a[3]] (4)
其中,x为第一隐含层的输入,可以来自输入层,也可以来自二级残差块的输出,w[i]为第i隐含层的权重矩阵,b[i]为第i隐含层的偏置向量,z[i]为第i隐含层对其输入向量进行线性连接操作的结果,a[i]为第i隐含层的输出,BN[]表示对第三隐含层的输出进行归一化处理,O表示经过BN层进行归一化处理后的结果;
leaky_ReLU()为激活函数,实现对输入参数的非线性转换,如下所示:
m为激活函数的变量;
模型训练的目标就是找到最佳的(w,b)组合,使得模型拥有较高的识别准确率。
由于训练样本数据具有一定的波动性,如果不加处理,层与层之间的训练存在级联关系,相互影响较大,从而导致训练过程出现震荡现象,模型无法得到快速收敛。为此,本发明在每一个二级残差块内加上一个BN层,对输出数据做归一化处理,使每一个二级残差块的输出数据在固定的[-1,1]区间内进行波动,从而削弱残差块之间的级联影响,使得各残差块能够相对独立的进行训练,从而加快收敛速度。
输出层根据残差全连接层的输出结果,分别计算训练样本数据与不同类型用户行为的匹配值并输出,如公式(5)所示:
P=w[p]·a[h]+b[p] (5)
其中,a[h]为残差全连接层的输出结果,w[p]为输出层的权重矩阵,b[p]为输出层的偏置向量,P的维度为2,其中,第一维向量P0表示训练样本数据与用户正常行为的匹配值,第二维向量P1表示训练样本数据与用户异常行为的匹配值。
Softmax层根据输出层的计算结果,计算训练样本数据中的每一条记录分别对应用户正常行为和用户异常行为的概率值,并输出,其计算公式如公式(6)所示:
其中,Sj表示输入的训练样本数据中每一条用户行为数据对应用户正常行为和用户异常行为的概率值,j=0表示用户正常行为,j=1表示用户异常行为,e为自然常数。
对于模型直观的理解是:该模型采用一个具有18层隐含层的深度神经网络进行细致的特征抽象与提取从而保证模型拥有较高的识别准确率;同时采用由两级残差块构成的神经网络进行梯度传播,避免梯度消失梯度爆炸,提高模型的收敛速度。
2)基于多级残差全连接神经网络模型进行弱分类器集群的初始化构建;
以多级残差全连接神经网络模型为核心分类模型,采用混合扰动的方法对该核心分类模型进行离线训练,生成多个具有差异性的弱分类器G(y),得到弱分类器集群,其中y表示用于识别用户行为的训练样本数据。所谓混合扰动就是在弱分类器构建时,通过选取不同的训练样本子集、设置不同的残差全连接层层数,训练生成多个弱分类器,并保证生成的弱分类器对相同用户行为数据的识别结果具有一定差异性,以确保在弱分类器组合成强分类器进行集成学习时提升集体决策的准确性。
3)采用加权多数表决法将弱分类器集群线性组合成强分类器,。
在弱分类器生成以后,采用加权多数表决法将多个弱分类器线性组合成一个强分类器,具体实现过程如下:
首先,基于相同的测试样本数据集分别计算训练后的每一个弱分类器的分类误差率,第k个弱分类器Gk(y)的分类误差率rk为分类错误的测试样本数据条数与测试样本数据总条数的比值,则第k个弱分类器Gk(y)的投票表决权重ck的计算公式如公式(7)所示:
ck=log((1-rk)/rk)/2 (7)
其意义是:弱分类器误差率越小识别结果越可靠,相应的投票权重越大,反之,投票权重越小。
各弱分类器的投票表决权重计算好以后,基于投票表决权重将多个弱分类器线性组合成一个强分类器E(y),如公式(8)所示:
其中,K表示组成强分类器的弱分类器个数,公式(8)意义是将所有弱分类器对用户行为识别样本数据y的识别结果(即将其判断为用户正常行为的概率值和判断为用户异常行为的概率值)分别乘以该弱分类器的投票表决权重后累加。
将所有弱分类器判断为用户正常行为的概率值和判断为用户异常行为的概率值分别线性累加的结果最大值对应的用户行为类型作为识别结果输出。
采用TensorFlow、SKlean、Numpy等机器学习开源框架构建基于残差全连接神经网络的电力监控系统用户异常行为分析方法,通过引入深度学习方法显著提高用户异常行为的识别准确率。
与现有技术相比,本发明具有以下有益效果:
(1)采用多级残差思想,对传统全连接神经网络模型进行改进,在保证模型识别精度的前提下,解决因模型深度过大导致的梯度消失和梯度爆炸问题,加快模型训练时的收敛速度,快速进行分类器集群的初始化构建。
(2)采用混合扰动的方法生成多个具有差异性的弱分类器,提高在弱分类器组合成强分类器进行集成学习时做出的集体决策的准确性。
(3)将各弱分类器正确率/误差率比值的对数函数值作为其投票权重,采用加权多数表决法将弱分类器集群线性组合成强分类器,实现电力监控系统用户异常行为的在线识别。
一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行前述的电力监控系统用户异常行为分析方法中的任一方法。
一种计算设备,包括,
一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行电力监控系统用户异常行为分析方法中的任一方法的指令。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (10)
1.一种电力监控系统用户异常行为分析方法,其特征在于:包括步骤:
采集电力监控系统中反映用户行为的数据;
对采集到的反映用户行为的数据进行预处理生成待识别的用户行为数据;
通过预先离线训练构建的强分类器对待识别的用户行为数据进行在线识别,识别出用户异常行为并发出告警。
2.根据权利要求1所述的一种电力监控系统用户异常行为分析方法,其特征是:强分类器离线训练构建过程为:
1)构建多级残差全连接神经网络模型;
2)基于多级残差全连接神经网络模型进行弱分类器集群的初始化构建;
3)采用加权多数表决法将弱分类器集群线性组合成强分类器。
3.根据权利要求2所述的一种电力监控系统用户异常行为分析方法,其特征是:所述多级残差全连接神经网络模型包括:输入层、残差全连接层、输出层与Softmax层;
输入层用于将有标记的训练样本数据作为输入向量;
残差全连接层的层数有一个或者多个,每个残差全连接层对应一个一级残差块;每个一级残差块内包括三个二级残差块,第三个二级残差块的输入由第一个二级残差块的输入与第二个二级残差块的输出构成;
每个二级残差块内包括三个隐含层和一个批标准化BN层;
输出层根据残差全连接层的输出结果,分别计算训练样本数据与不同类型用户行为的匹配值并输出;
Softmax层根据输出层的计算结果,计算训练样本数据中的每一条记录分别对应用户正常行为和用户异常行为的概率值。
4.根据权利要求3所述的一种电力监控系统用户异常行为分析方法,其特征是:所述二级残差块内的四个层的数据处理公式如下所示:
BN层:O=BN[a[3]] (4)
其中,x为第一隐含层的输入,w[i]为第i隐含层的权重矩阵,b[i]为第i隐含层的偏置向量,z[i]为第i隐含层对其输入向量进行线性连接操作的结果,a[i]为第i隐含层的输出,BN[]表示对第三隐含层的输出进行归一化处理,O表示经过BN层进行归一化处理后的结果;
leaky_ReLU()为激活函数:
m为激活函数的变量;
所述训练样本数据与不同类型用户行为的匹配值,计算公式如下所示:
P=w[p]·a[h]+b[p] (5)
其中,a[h]为残差全连接层的输出结果,w[p]为输出层的权重矩阵,b[p]为输出层的偏置向量,P的维度为2,其中,第一维向量P0表示训练样本数据与用户正常行为的匹配值,第二维向量P1表示训练样本数据与用户异常行为的匹配值;
所述训练样本数据中的每一条记录分别对应用户正常行为和用户异常行为的概率值的计算公式如下所示:
其中,Sj表示输入的训练样本数据中每一条用户行为数据对应用户正常行为和用户异常行为的概率值,j=0表示用户正常行为,j=1表示用户异常行为,e为自然常数。
5.根据权利要求3所述的一种电力监控系统用户异常行为分析方法,其特征是:所述基于多级残差全连接神经网络模型进行弱分类器集群的初始化构建,包括:
基于识别用户行为的训练样本数据,以多级残差全连接神经网络模型为核心分类模型,选取不同的训练样本子集、设置不同的残差全连接层层数,对该核心分类模型进行离线训练,生成多个具有差异性的弱分类器,得到弱分类器集群。
6.根据权利要求3所述的一种电力监控系统用户异常行为分析方法,其特征是:所述采用加权多数表决法将弱分类器集群线性组合成强分类器包括:
基于相同的测试样本数据集分别计算训练后的每一个弱分类器的分类误差率,第k个弱分类器Gk(y)的分类误差率rk为分类错误的测试样本数据条数与测试样本数据总条数的比值,则第k个弱分类器Gk(y)的投票表决权重ck的计算公式为:
ck=log((1-rk)/rk)/2 (7)
基于投票表决权重将多个弱分类器线性组合成一个强分类器E(y):
其中,K表示组成强分类器的弱分类器个数,将所有弱分类器判断为用户正常行为的概率值和判断为用户异常行为的概率值分别与投票表决权重相乘后线性累加的结果最大值对应的用户行为类型作为识别结果输出。
7.根据权利要求1所述的一种电力监控系统用户异常行为分析方法,其特征是:所述反映用户行为的数据至少包括流量特征、系统日志、系统告警数据。
8.根据权利要求1所述的一种电力监控系统用户异常行为分析方法,其特征是:所述预处理包括数据清洗、删除含有缺失值和异常值的记录。
9.一种存储一个或多个程序的计算机可读存储介质,其特征在于:所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至8所述的方法中的任一方法。
10.一种计算设备,其特征在于:包括,
一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1至8所述的方法中的任一方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010435964.4A CN111598179B (zh) | 2020-05-21 | 2020-05-21 | 电力监控系统用户异常行为分析方法、存储介质和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010435964.4A CN111598179B (zh) | 2020-05-21 | 2020-05-21 | 电力监控系统用户异常行为分析方法、存储介质和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111598179A true CN111598179A (zh) | 2020-08-28 |
CN111598179B CN111598179B (zh) | 2022-10-04 |
Family
ID=72190591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010435964.4A Active CN111598179B (zh) | 2020-05-21 | 2020-05-21 | 电力监控系统用户异常行为分析方法、存储介质和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111598179B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112118259A (zh) * | 2020-09-17 | 2020-12-22 | 四川长虹电器股份有限公司 | 一种基于提升树的分类模型的越权漏洞检测方法 |
CN113079150A (zh) * | 2021-03-26 | 2021-07-06 | 深圳供电局有限公司 | 一种电力终端设备入侵检测方法 |
CN113075498A (zh) * | 2021-03-09 | 2021-07-06 | 华中科技大学 | 一种基于残差聚类的配电网行波故障定位方法和系统 |
CN113822240A (zh) * | 2021-11-22 | 2021-12-21 | 广东电网有限责任公司中山供电局 | 一种电力现场作业视频数据提取异常行为的方法及装置 |
CN114254716A (zh) * | 2022-03-02 | 2022-03-29 | 浙江鹏信信息科技股份有限公司 | 一种基于用户行为分析的高危操作识别方法及系统 |
CN116579472A (zh) * | 2023-05-05 | 2023-08-11 | 国网黑龙江省电力有限公司齐齐哈尔供电公司 | 一种大数据环境下用户异常行为检测分析系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110930377A (zh) * | 2019-11-18 | 2020-03-27 | 福州大学 | 一种基于多任务学习的排水管道异常类型自动检测方法 |
CN111027440A (zh) * | 2019-12-03 | 2020-04-17 | 北京师范大学珠海分校 | 一种基于神经网络的人群异常行为检测装置和检测方法 |
-
2020
- 2020-05-21 CN CN202010435964.4A patent/CN111598179B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110930377A (zh) * | 2019-11-18 | 2020-03-27 | 福州大学 | 一种基于多任务学习的排水管道异常类型自动检测方法 |
CN111027440A (zh) * | 2019-12-03 | 2020-04-17 | 北京师范大学珠海分校 | 一种基于神经网络的人群异常行为检测装置和检测方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112118259A (zh) * | 2020-09-17 | 2020-12-22 | 四川长虹电器股份有限公司 | 一种基于提升树的分类模型的越权漏洞检测方法 |
CN112118259B (zh) * | 2020-09-17 | 2022-04-15 | 四川长虹电器股份有限公司 | 一种基于提升树的分类模型的越权漏洞检测方法 |
CN113075498A (zh) * | 2021-03-09 | 2021-07-06 | 华中科技大学 | 一种基于残差聚类的配电网行波故障定位方法和系统 |
CN113079150A (zh) * | 2021-03-26 | 2021-07-06 | 深圳供电局有限公司 | 一种电力终端设备入侵检测方法 |
CN113822240A (zh) * | 2021-11-22 | 2021-12-21 | 广东电网有限责任公司中山供电局 | 一种电力现场作业视频数据提取异常行为的方法及装置 |
CN114254716A (zh) * | 2022-03-02 | 2022-03-29 | 浙江鹏信信息科技股份有限公司 | 一种基于用户行为分析的高危操作识别方法及系统 |
CN116579472A (zh) * | 2023-05-05 | 2023-08-11 | 国网黑龙江省电力有限公司齐齐哈尔供电公司 | 一种大数据环境下用户异常行为检测分析系统 |
CN116579472B (zh) * | 2023-05-05 | 2024-02-02 | 国网黑龙江省电力有限公司齐齐哈尔供电公司 | 一种大数据环境下用户异常行为检测分析系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111598179B (zh) | 2022-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111598179B (zh) | 电力监控系统用户异常行为分析方法、存储介质和设备 | |
Tesfahun et al. | Intrusion detection using random forests classifier with SMOTE and feature reduction | |
CN111585948B (zh) | 一种基于电网大数据的网络安全态势智能预测方法 | |
CN111901340B (zh) | 一种面向能源互联网的入侵检测系统及其方法 | |
Chang et al. | Anomaly detection for industrial control systems using k-means and convolutional autoencoder | |
CN113242259B (zh) | 网络异常流量检测方法及装置 | |
CN112910859B (zh) | 基于c5.0决策树和时序分析的物联网设备监测预警方法 | |
CN109902740B (zh) | 一种基于多算法融合并行的再学习工业控制入侵检测方法 | |
CN112087442B (zh) | 基于注意力机制的时序相关网络入侵检测方法 | |
CN112738014A (zh) | 一种基于卷积时序网络的工控流量异常检测方法及系统 | |
CN113067798B (zh) | Ics入侵检测方法、装置、电子设备和存储介质 | |
CN113918367A (zh) | 一种基于注意力机制的大规模系统日志异常检测方法 | |
CN113595998A (zh) | 基于Bi-LSTM的电网信息系统漏洞攻击检测方法及装置 | |
CN115811440B (zh) | 一种基于网络态势感知的实时流量检测方法 | |
CN116633601A (zh) | 一种基于网络流量态势感知的检测方法 | |
Chadha et al. | Hybrid genetic fuzzy rule based inference engine to detect intrusion in networks | |
CN113609480B (zh) | 基于大规模网络流的多路学习入侵检测方法 | |
Thanh et al. | An approach to reduce data dimension in building effective network intrusion detection systems | |
CN117938430A (zh) | 基于Bert模型的Webshell检测方法 | |
US20230095966A1 (en) | Intrusion detection method based on improved immune network algorithm, and application thereof | |
CN114915496B (zh) | 基于时间权重和深度神经网络的网络入侵检测方法和装置 | |
Cui et al. | Using EBGAN for anomaly intrusion detection | |
CN115426194A (zh) | 数据处理方法及装置、存储介质及电子设备 | |
CN114969761A (zh) | 一种基于lda主题特征的日志异常检测方法 | |
CN115189939A (zh) | 一种基于hmm模型的电网网络入侵检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |