CN111597411B - 一种电力规约数据帧的区分识别方法及系统 - Google Patents
一种电力规约数据帧的区分识别方法及系统 Download PDFInfo
- Publication number
- CN111597411B CN111597411B CN202010401451.1A CN202010401451A CN111597411B CN 111597411 B CN111597411 B CN 111597411B CN 202010401451 A CN202010401451 A CN 202010401451A CN 111597411 B CN111597411 B CN 111597411B
- Authority
- CN
- China
- Prior art keywords
- protocol
- data frame
- library
- type
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 129
- 238000007621 cluster analysis Methods 0.000 claims abstract description 127
- 230000008569 process Effects 0.000 claims abstract description 71
- 238000012549 training Methods 0.000 claims description 67
- 238000004422 calculation algorithm Methods 0.000 claims description 64
- 238000003064 k means clustering Methods 0.000 claims description 17
- 238000011161 development Methods 0.000 abstract description 5
- 238000004806 packaging method and process Methods 0.000 abstract description 5
- 239000010410 layer Substances 0.000 description 141
- 238000003860 storage Methods 0.000 description 43
- 238000005457 optimization Methods 0.000 description 36
- 238000012544 monitoring process Methods 0.000 description 28
- 241000272814 Anser sp. Species 0.000 description 27
- 230000009467 reduction Effects 0.000 description 17
- 239000003795 chemical substances by application Substances 0.000 description 16
- 238000004891 communication Methods 0.000 description 16
- 238000001514 detection method Methods 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 14
- 230000009466 transformation Effects 0.000 description 12
- 238000009825 accumulation Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000005538 encapsulation Methods 0.000 description 6
- 238000004146 energy storage Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000032683 aging Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000010248 power generation Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000007123 defense Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000009545 invasion Effects 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000002346 layers by function Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Communication Control (AREA)
Abstract
本发明提供了一种电力规约数据帧的区分识别方法及系统,包括以下步骤:S1输入待区分的数据帧,根据规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库判断所述数据帧属于的规约数据帧类型;S2分别对基于规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库的判断结果赋予不同的表决权重;S3根据表决权重确定所述数据帧的最终规约数据帧类型。其能减少电力规约识别过程中数据的封装与解封装层数,兼顾准确性与时效性,满足设备的互联互通、即插即用、互操作和功能协同需求,更好地实现电力系统的安全、可靠、经济、高效运行,促进清洁智慧的能源互联网发展。
Description
技术领域
本发明是关于一种电力规约数据帧的区分识别方法及系统,属于电力系统技术领域。
背景技术
国际标准化组织(International Organization for Standardization,ISO)于1984年发布了著名的ISO/IEC 7498-1标准,即开放式系统互联通信参考模型(Open SystemInterconnection Reference Model,OSI),简称为OSI模型或ISO七层参考模型。ISO七层参考模型从下到上分别为:第1层物理层、第2层数据链路层、第3层网络层、第4层传输层、第5层会话层、第6层表示层和第7层应用层,每一层使用其下层提供的服务,并向其上层提供服务;同一节点内相邻层之间通过接口通信;不同节点的同等层按照协议实现对等层之间的通信。第7、6、5、4层定义了应用程序的功能,下面3层即第3、2、1层主要面向通过网络的端到端的数据流。
数据发送时,每个层次接收到上层传递过来的数据后都要将本层次的控制信息加入数据单元的头部,一些层次还要将校验和等信息附加到数据单元的尾部,这个过程叫做封装。这个从上层到下层的过程,逐层执行直至将本端应用层报文封装入物理层比特流,并经过物理层传输通道,发送给接收端的物理层。
当数据到达接收端时,每一层读取相应的控制信息根据控制信息中的内容向上层传递数据单元,在向上层传递之前去掉本层的控制头部信息和尾部信息(如果有的话),此过程叫做解封装。这个从下层到上层的过程,逐层执行直至将对端发送来的应用层产生的数据传输给本端的相应的应用进程。
ISO七层参考模型中,每层封装后的数据单元的叫法不同,在第7层即应用层、第6层即表示层、第5层即会话层的协议数据单元统称为报文;第4层即传输层的协议数据单元称为数据段即segment,对应TCP/IP四层参考模型的第3层即运输层,TCP的数据单元称为报文段即segments,而UDP协议的数据单元称为数据报即datagrams;第3层即网络层的协议数据单元称为数据包或分组即packet;第2层即数据链路层的协议数据单元称为数据帧即frame;第1层即物理层的协议数据单元称为比特流即bits。
TCP/IP四层参考模型是ISO七层参考模型的简化,第4层应用层对应于OSI七层参考模型的上3层即第7层应用层、第6层表示层和第5层会话层,第3层运输层对应于OSI七层参考模型的第4层即传输层,第2层网际层对应于OSI七层参考模型的第3层网络层,第1层网络接口层适配于OSI七层参考模型的第2层数据链路层和第1层物理层。
调度端和厂站端通过远程通信实现两者之间的信息交换。在通信网中,通信双方在发送和接收数据时,必须遵循一些既定的规程,以保证数据的正确、可靠传输。这些规程就简称为通信规约。通信规约包括的主要内容有代码(数据编码)、传输控制字符、传输报文格式、呼叫和应答方式、差错控制步骤、通信方式(指单工、半双工、全双工通信方式)、同步方式及传输速率等。
电力规约,包括传统的IEC60870标准系列规约、目前和未来电力自动化系统最重要的通信规约之一IEC 61850电力自动化通信网络和系统系列标准等等,都遵循ISO七层参考模型。
随着能源互联网发展,电力系统的电源、电网、负荷、储能、销售、服务等向一体化聚合体的清洁智慧能源系统迈进,带来了许多技术需求和挑战,包括:促使多种自动化系统之间的无缝通信和互操作、实现不同智能电子设备(Intelligent Electronic Device,IED)之间的互操作与功能联合,以及解决异构终端的接入、数据通信和即插即用等问题,其核心技术问题之一,就是如何兼顾准确性与时效性的电力规约的区分识别。现有技术中的电力规约区分识别方法通常为完全基于OSI七层参考模型的第7层之上的电力业务数据或完全基于OSI七层参考模型的第7层应用层报文,此种识别方法无法满足目前电力系统的电力规约对准确性和时效性的要求。
发明内容
针对上述现有技术的不足,本发明的目的是提供了一种电力规约数据帧的区分识别方法及系统,其基于OSI七层参考模型的第2层即数据链路层的数据帧进行数据帧区分识别,能减少电力数据识别过程中数据的封装与解封装层数,兼顾准确性与时效性,满足电力业务面临的更高安全性、互联互通性以及实时性等方面的要求,更好地实现电力系统的安全、可靠、经济、高效运行,促进电力系统的电源、电网、负荷、储能、销售、服务等向一体化聚合体的清洁智慧能源系统迈进。
为实现上述目的,本发明提供了一种电力规约数据帧的区分识别方法,包括以下步骤:S1输入待区分的数据帧,根据预先建立的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库判断数据帧属于的规约数据帧类型;S2分别对基于规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库的判断结果赋予不同的表决权重;S3根据表决权重确定数据帧的最终规约数据帧类型。
进一步,根据表决权重确定数据帧的最终的规约数据帧类型的方法为:将判断结果相同的表决权重相加,获得表决权重最高的规约数据帧类型,若规约数据帧类型的表决权重大于或等于表决权重阈值,则判断数据帧为规约数据帧类型,若规约数据帧类型的表决权重小于表决权重阈值,则识别结果为不确定。
进一步,在能够判断数据帧类型时,输出区分识别结果;若识别结果为不确定时,通过写入错误列表,将数据帧属于的电力规约类别判断结果反馈至规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库。
进一步,表决权重阈值通过以下方法获得:将基于规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库获得的判断结果的表决权重相加,获得总表决权重,将总表决权重除以二,保留整数位,在整数位加一获得表决权重阈值。
进一步,表决权重通过以下方式进行更新优选:输入规约数据帧类型已知的数据帧,经过步骤S1-S3,获取数据帧的规约数据帧类型,判断获取的规约数据帧类型与已知的规约数据帧类型是否相同,若相同,则直接输出当前各判断结果对应的表决权重;若不相同,则对各判断结果的表决权重进行调整,直至获取的规约数据帧类型与已知的规约数据帧类型相同为止。
进一步,表决权重取自斐波那契数列。
进一步,规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库通过将已知规约数据帧类型的数据帧输入初始规约特征字段库、初始规约结构格式规则库、初始规约聚类分析参数库和初始规约频域特征库中进行预训练获得。
进一步,预训练的学习过程为:根据初始的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库判断已知规约数据帧类型的数据帧的规约类型,并将判断结果与已知的规约数据帧类型进行对比,若相同则将此时的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库作为最终输出结果;若不相同则修改规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库,直到判断结果与已知的规约数据帧类型相同为止。
本发明公开了一种电力规约数据帧的区分识别系统,包括:预判断模块,用于输入待区分的数据帧,根据预先建立的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库判断数据帧属于的规约数据帧类型;表决权重确定模块,用于分别对基于规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库的判断结果赋予不同的表决权重;判断结果输出模块,用于根据表决权重确定数据帧的最终规约数据帧类型。
进一步,预判断模块包括规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块和规约频域特征识别模块,规约特征字段识别模块,使用蛮力匹配算法,进行关键字符串匹配识别;规约结构格式规则识别模块,针对输入数据帧,去除该帧的帧头部和帧尾部,解析数据帧的数据字段内容格式,并根据数据字段内容格式进行结构格式模式识别;规约聚类分析参数识别模块,使用K均值聚类算法,进行聚类分析,进行聚类分析参数识别;规约频域特征识别模块,使用离散傅里叶变换算法,进行频域特征识别。
本发明由于采取以上技术方案,其具有以下优点:
1、本发明专注对数据链路层的电力规约数据帧区分识别,数据链路层是国际标准化组织即OSI的七层参考模型的第2层,更靠近第1层物理层,面向网络的端到端的数据流,能减少电力数据规约识别过程中数据的封装与解封装,快捷且准确地对电力规约数据帧进行区分识别。
2、本发明中的关键字符串匹配识别模块、结构格式模式识别模块、聚类分析模块分别从3个空间维度提取电力规约数据帧的空间特征,对电力规约数据帧进行区分识别,能够更加准确的对电力规约数据帧进行区分识别。
3、本发明中的时频变换的特征识别模块,取相邻数据帧之间的时间间隔构成时域序列,采用离散傅里叶的正变换与逆变换,提取时域特征和频域特征,能够从更加全面的视角,对电力规约数据帧的区分识别。
4、本发明中的区分识别决策,采用加权赋值的决策参数,区分识别结果类型的判定阈值取均值,通过多数得票表决法;若同类累加后的得票数最大者大于均值,则数据帧的区分识别结果为同类累加后的得票数最大的数据帧类;若同类累加后的得票数最大者不大于均值,则数据帧的区分识别结果为不确定;并且,在工程优化的学习过程,具备自动调整优化的功能特点,在实现方法中适用性强,区分识别结果准确性高。
5、本发明在关键字符串匹配识别、结构格式模式识别、聚类分析、时频变换的特征识别等4个方面多维度与多视角地进行电力规约数据帧的区分识别,保证计算逻辑的准确性与功能层面的精确度;而且上述4个方面采用并行方式进行电力规约数据帧的区分识别,保证完成任务的时间限定性和响应事件的实时性,即时效性,具备非功能层面的快速性与实时性之特点,而且同时兼顾时效性与准确性。
6、本发明包括依次进行的3个过程,即预训练的学习过程、在线推理的预测过程、工程优化的学习过程,具备实用、可靠、便捷、可操作的特点。
7、本发明能够应用于多个领域:如应用于电力系统网络与信息安全防护领域,解决区分识别数据链路层的数据帧的类别问题,准确且实时地区分识别电力规约数据帧及其它数据帧(包括误用数据帧、虚假数据帧、恶意入侵数据帧等),及时识别非法访问或恶意入侵事件,提升入侵检测技术的主动防御能力,强化电力系统的本质安全,支撑国家能源安全;应用于电力系统调度控制领域,解决区分识别数据链路层的数据帧的类别问题,准确且实时地区分识别电力规约数据帧,提升发电调度、频率控制、电压安全、电能质量控制以及运行经济性等的快速协同能力,更好地保障电力系统的安全、可靠、经济、高效运行;应用于虚拟发电厂领域,解决区分识别数据链路层的数据帧的类别问题,正确快速地区分识别电力规约数据帧,保证电源、电网、负荷、储能、销售、服务等的一体化聚合体的数据交互与共享,赋能虚拟发电厂分布式协同控制网络内智能体代理,强力支撑智慧城市建设;应用于综合能源利用领域,解决区分识别数据链路层的数据帧的类别问题,正确快速地区分识别电力规约数据帧,保障多种能源及时互济互补的数据交互与共享,促进清洁智慧的能源互联网发展;应用于规约转换领域,解决区分识别数据链路层的数据帧的类别问题,正确快速地区分识别电力规约数据帧,减少不必要的数据封装处理与解封装处理,提升规约转换技术的实时性,促进电力规约转换技术的智能化,更好地满足设备的即插即用、终端之间的互操作等需求,支撑万物互联,促使地球更加智慧。
8、从整体效果方面而言,本发明基于机器学习中的深度强化学习理论,从空间和时序的多维度与多视角的特征出发,解决对数据链路层的电力规约数据帧区分识别问题,能减少电力数据规约识别过程中数据的封装与解封装层数,兼顾准确性与时效性,满足设备的互联互通、即插即用、互操作和功能协同需求,更好地实现电力系统的安全、可靠、经济、高效运行,促进清洁智慧的能源互联网发展。
附图说明
图1是本发明一实施例中电力规约数据帧的区分识别方法的流程图;
图2是本发明一实施例中数据库预训练的学习过程的流程图;
图3是本发明一实施例中工程优化的学习过程的流程图;
图4是本发明一实施例中电力规约数据帧的区分识别方法的结构示意图;
图5是本发明一实施例中电力规约数据帧的区分识别系统示意图;
图6是某地级市电网调度自动化数据采集与监控网的入侵检测系统中数据帧的区分识别方法流程示意图。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方向,通过具体实施例对本发明进行详细的描绘。然而应当理解,具体实施方式的提供仅为了更好地理解本发明,它们不应该理解成对本发明的限制。在本发明的描述中,需要理解的是,所用到的术语仅仅是用于描述的目的,而不能理解为指示或暗示相对重要性。
实施例一
本发明提供了一种电力规约数据帧的区分识别方法,如图1所示,包括以下步骤:
S1输入待区分的数据帧,根据预先建立的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库判断数据帧属于的规约数据帧类型;
其中,规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库,是通过将已知规约数据帧类型的数据帧输入初始规约特征字段库、初始规约结构格式规则库、初始规约聚类分析参数库和初始规约频域特征库中,进行预训练而获得。
预训练的学习过程,如图2所示,是通过已知规约数据帧类型的数据帧作为训练集数据样本,通过预训练,对规约特征字段库、规约结构格式规则库、规约聚类分析参数库、规约频域特征库进行优化。训练集数据样本建议:1种已知类型的电力规约的数据帧数量≥256,则C种已知类型的电力规约的数据帧数量≥256×C,1个训练轮数为依次训练的C种已知类型的电力规约的数据帧,其训练集数据样本数据帧数量≥256×C。具体过程是,以已知类型的电力规约的数据帧为输入训练样本,同时输入至上述4个库的训练模块,该4个库的训练模块并行处理后,分别得到经过优化的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库。
规约特征字段库训练模块中,基于蛮力匹配算法的规约特征字段识别单元和对比数据帧的规约类型单元同时接收1个已知类型的电力规约的数据帧;基于蛮力匹配算法的规约特征字段识别单元识别该数据帧,其识别结果发送给对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于蛮力匹配算法的规约特征字段识别单元的识别结果与接收的输入训练样本的数据帧的规约数据帧类型,判断二者是否一致。若是则告知规约特征字段库单元,若否则请求修改规约特征字段库并告知规约特征字段库单元;规约特征字段库单元与基于蛮力匹配算法的规约特征字段识别单元之间信息交互,相互交换电力规约数据帧的特征字段信息。
其中,蛮力匹配算法基本流程如下:
输入:主串S=[s1,s2,…,sn],匹配串T=[t1,t2,…,tm],主串和匹配串的长度分别为n、m,n>m;
算法过程:
#1初始化起始匹配位置Pos=0,主串的起始位置为i=0,匹配串起始位置为j=0;
#2如果i和j对应串的位置字符相同,则继续比较下一字符;
#3如果不同,则回溯到主串Pos++的位置重新匹配,i=index,j=0;
#4重复步骤#2和#3,直到主串或者匹配串的所有字符匹配完毕;
#5若匹配成功,则返回模式串起始位置在主串中的位置index;若匹配失败,返回0;
输出:T在S中的位置index,index≠0表示主串S中在位置index处包含匹配串T,index=0表示主串S中不包含匹配串T。
规约结构格式规则库训练模块中,基于帧数据字段内容格式的规约结构格式规则识别单元和对比数据帧的规约类型单元同时接收1个已知类型的电力规约的数据帧;基于帧数据字段内容格式的规约结构格式规则识别单元,去除该帧的帧头部和帧尾部,解析其中的帧数据字段内容,识别该数据帧,其识别结果送至对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于帧数据字段内容格式的规约结构格式规则识别单元的识别结果与接收的输入训练样本的数据帧已知类型,判断二者是否一致,若是则告知规约结构格式规则库单元,若否则请求修改规约结构格式规则库并告知规约结构格式规则库单元,规约结构格式规则库单元与基于帧数据字段内容格式的规约结构格式规则识别单元之间信息交互,相互交换电力规约数据帧的规约结构格式规则信息。
规约聚类分析参数库训练模块中,基于K均值聚类算法的规约聚类分析单元和对比数据帧的规约类型单元同时接收1个已知类型的电力规约的数据帧;基于K均值聚类算法的规约聚类分析单元识别该数据帧,其识别结果送给对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于K均值聚类算法的规约聚类分析单元的识别结果与接收的输入训练样本的数据帧已知类型,判断二者是否一致,若是则告知规约聚类分析参数库单元,若否则请求修改规约聚类分析参数库的聚类簇数、初始聚类中心和阈值,并告知规约聚类分析参数库单元;规约聚类分析参数库单元与基于K均值聚类算法的规约聚类分析单元之间信息交互,相互交换电力规约数据帧的规约聚类分析参数信息。
其中,K均值聚类算法基本流程如下:
输入:样本集D={x1,x2,…,xm},聚类簇数k;
算法过程:
#1从D={x1,x2,…,xm}中随机选择k个样本作为初始均值向量{μ1,μ2,…,μk},为每个聚类选择一个初始聚类中心;
#2将样本集D={x1,x2,…,xm}的m个数据通过欧氏距离最小分配到最近聚类,为欧氏距离:
#3通过每个簇的数据均值计算新的聚类中心:
#4均值向量更新为{μ′1,μ'2,…,μ'k};
#5重复步骤#2到#4,直到目标函数收敛,当前均值向量均未更新:
输出:k个簇,簇划分C={C1,C2,…,Ck};
规约频域特征库训练模块中,基于离散傅里叶变换算法的规约频域特征识别单元和对比数据帧的规约类型单元同时接收(N+1)个已知同类型的电力规约的数据帧,取N≥254;基于离散傅里叶变换算法的规约频域特征识别单元将该(N+1)个数据帧相邻数据帧之间的时间间隔定义为N个时域序列:x(0),x(1),x(2),…,x(N-1),即x(n)为相邻数据帧之间的时间间隔,其中n=0,1,2,…,(N-1),离散傅里叶正变换与离散傅里叶逆变换分别为DFT与IDFT,X(k)为包含N个点的有限长频域序列,即有限长频域序列为X(0),X(1),X(2),…,X(N-1);规约频域特征库单元得到X(k)和/>基于离散傅里叶变换算法的规约频域特征识别单元根据DFT与IDFT运算得到的X(k)和识别该(N+1)个数据帧中的第(N+1)个数据帧的类型,其识别结果送给对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于离散傅里叶变换算法的规约频域特征识别单元的识别结果与接收的输入训练样本的数据帧已知类型,判断二者是否一致,若是则告知规约频域特征库单元,若否则请求修改规约频域特征库并告知规约频域特征库单元;规约频域特征库单元与基于离散傅里叶变换算法的规约频域特征识别单元之间信息交互,相互交换电力规约数据帧的规约频域特征信息;其中,规约频域特征库训练模块起始工作时,针对首批(N+1)个数据帧的前N个数据帧,基于离散傅里叶变换算法的规约频域特征识别单元的输出为0,即结果不确定或无结果,即基于离散傅里叶变换算法的规约频域特征识别单元起始工作接收了第(N+1)个数据帧,才开始有结果输出。
S2分别对基于规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库的判断结果赋予不同的表决权重;
S3根据表决权重确定数据帧的最终规约数据帧类型。
其具体过程为:将输出结果相同的识别模块的表决权重相加,获得表决权重最高的规约数据帧类型,若规约数据帧类型的表决权重大于或等于表决权重阈值,则判断数据帧为规约数据帧类型,若规约数据帧类型的表决权重小于表决权重阈值,则识别结果为不确定。在能够判断数据帧类型时,通过控制协调存储模块输出区分识别结果;若识别结果为不确定时,通过控制协调存储模块写入错误列表,控制协调存储模块将数据帧属于的电力规约类别判断结果反馈至规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块和规约频域特征识别模块。表决权重阈值通过以下方法获得:将规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块和规约频域特征识别模块的表决权重相加,获得总表决权重,将总表决权重除以二,保留整数位,在整数位加一获得表决权重阈值。
具体举例如下,规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块和规约频域特征识别模块的输出结果的表决权重的初始值,分别为5、3、2和1,权重阈值D为:
若上述4个模块中某两个、三个或四个模块的输出结果相同,则将其表决权重相加,输出结果不相同的表决权重不相加。举例说明,如第一模块和第三模块的输出结果相同为第一类型的电力规约;第二模块的输出结果为第二类型的电力规约,第四模块的输出结果为其它类型的电力规约,即得到第一类型的电力规约的表决权重为5+2=7,第二类型的电力规约的表决权重为3,其它类型的电力规约的表决权重为1。
计算输出结果中每一类型的电力规约对应的表决权重,找到表决权重最高的规约数据帧类型,比如在上面的例子中,第一类型的电力规约的表决权重最高。将该电力规约对应的表决权重和权重阈值D进行比较,若该表决权重大于等于权重阈值D,则认定该结果,即认定数据帧为该规约数据帧类型;若该该表决权重少于权重阈值D,则不认定该结果,即数据帧的区分识别结果为不确定,并写入错误列表。对于上面的例子,第一类型的电力规约的表决权重为7,大于权重阈值6,故这个例子中的数据帧为第一类型的数据帧。但如果每个模块的输出结果都不相同,或者只有第三模块和第四模块的输出结果相同,则表决权重最高的规约数据帧类型的表决权重就会小于权重阈值6,这时就要认为识别结果不确定。
由于初始化的表决权重不能很好反应实际工程中各个模块的重要性次序,故需要引入工程优化的学习过程,对表决权重进行重新赋值。
如图3所示,输入规约数据帧类型已知的数据帧,将该数据帧同时输入到规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块和对比数据帧的类型模块;该数据帧经过上述步骤S1-S3即在线推理预测过程后,输出结果,即获取了该数据帧的规约数据帧类型,判断获取的规约数据帧类型与已知的规约数据帧类型是否相同,若相同,则直接在控制协调存储模块中输出当前各识别模块对应的表决权重;若不相同,则对各识别模块的表决权重进行调整,直至获取的规约数据帧类型与已知的规约数据帧类型相同为止。将重新赋值的表决权重反馈至控制协调存储模块进行更新,同时更新表决权重阈值D。完成工程优化的学习过程。
其中,不论是初始的表决权重还是重新赋值的表决权重均取自斐波那契数列,斐波那契数列为1,1,2,3,5,8,13,21,34……。
例如1,当四个模块的表决权重分别取5、3、2、1时,D值取6,即:
例如2,当四个模块的表决权重分别取8、5、3、2时,D值取10,即:
例如3,当四个模块的表决权重分别取13、8、5、3时,D值取15,即:
实施例二
基于相同的发明构思,本实施例还公开了一种电力规约数据帧的区分识别方法的组成结构,如图4所示,包括:规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块和控制协调存储模块;
规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块与控制协调存储模块双向连接;规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块同时接收输入电力数据帧,上述四个模块对电力数据帧并行处理,处理完成后,通过控制协调存储模块输出,输出结果为输入的电力数据帧的规约数据帧类型。
规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块和规约频域特征识别模块分别根据规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库判断数据帧属于的规约数据帧类型;
控制协调存储模块分别对规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块和规约频域特征识别模块的输出结果赋予不同的表决权重,并根据表决权重确定数据帧的最终的规约数据帧类型。
实施例三
基于相同的发明构思,本实施例还公开了一种电力规约数据帧的区分识别系统,如图5所示,包括:
预判断模块,用于输入待区分的数据帧,根据预先建立的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库判断数据帧属于的规约数据帧类型;
表决权重确定模块,用于分别对基于规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库的判断结果赋予不同的表决权重;
判断结果输出模块,用于根据表决权重确定数据帧的最终规约数据帧类型。
其中,预判断模块包括规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块和规约频域特征识别模块,规约特征字段识别模块,使用蛮力匹配算法,进行关键字符串匹配识别;规约结构格式规则识别模块,针对输入数据帧,去除该帧的帧头部和帧尾部,解析数据帧的数据字段内容格式,并根据数据字段内容格式进行结构格式模式识别;规约聚类分析参数识别模块,使用K均值聚类算法,进行聚类分析,进行聚类分析参数识别;规约频域特征识别模块,使用离散傅里叶变换算法,进行频域特征识别。
实施例四
为了更好的说明本发明的方案,本实施例以某地级市电网调度自动化数据采集与检测系统为例进行说明。
在传统的电力调度自动化网路信息安全防护当中,网络加密、网络隔离、访问控制、身份鉴别、防病毒等信息安全技术得到了大量的应用。随着网络技术和信息安全技术的发展和演绎,入侵检测技术作为一种主动防御方法受到关注。
入侵检测系统(Intrusion Detection System,IDS)自动地挖掘网络和计算机系统中出现的非法访问或恶意入侵事件。入侵检测系统能够对网络或计算机系统内部、外部提供实时的安全防护,对不同的入侵数据采取不同的应对策略从而实现全面的检测。其中的关键技术方法是对数据帧的区分识别方法。
电力调度自动化的数据采集与监控网路中,针对OSI模型的第2层:数据链路层(data link layer)的数据帧的区分识别问题,入侵检测系统面临同时兼顾准确性与实时性的挑战。
本实施例中的一种电力规约数据帧的区分识别方法及系统,能够在同时兼顾准确性与实时性的基础上,解决电力调度自动化的数据采集与监控(SCADA)数据帧的区分识别问题。
某地级市电网调度自动化数据采集与监控网络涉及的电力规约包括:IEC60870-5-104(等价于DL/T 634.5104)利用标准协议子集的IEC60870-5-101网络访问规约、IEC60870-5-101基本远动任务配套标准规约(等价于DL/T 634.5101)。其网络入侵检测系统对入侵行为检测过程中,要在OSI模型的数据链路层识别各种规约数据帧,快速并正确地区分识别出IEC60870-5-101规约数据帧、IEC60870-5-104规约数据帧及其它数据帧(包括误用数据帧、虚假数据帧、恶意入侵数据帧等)。
一种电力规约数据帧的区分识别方法及系统,包括依次进行的预训练的学习过程、在线推理的预测过程和工程优化的学习过程。
预训练的学习过程:
先进行预训练,通过预训练的学习过程,利用已知的IEC60870-5-101规约数据帧、IEC60870-5-104规约数据帧及其它数据帧(包括误用数据帧、虚假数据帧、恶意入侵数据帧等)作为训练集数据样本,经过数据预处理、特征提取、特征表示,训练轮数≥256×2=512,预训练得到规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库。
在线推理的预测过程:
再应用本发明,通过在线推理的预测过程,推理轮数≥512×2=1024,初始化电力规约数据帧的区分识别方法与系统。针对某地级市电网调度自动化数据采集与监控网络中的数据帧实时进行区分识别。
某地级市电网调度自动化数据采集与监控网络中使用了IEC60870-5-101规约和IEC60870-5-104规约这2种电力规约,在OSI模型的数据链路层,网络的数据帧有IEC60870-5-101规约数据帧、IEC60870-5-104规约数据帧及其它数据帧(包括误用数据帧、虚假数据帧、恶意入侵数据帧等)等3类数据帧。网络的入侵检测系统面临的关键问题之一是如何准确快速地区分识别网络中的数据帧,发现包括误用数据帧、虚假数据帧、恶意入侵数据帧等的其它数据帧,及时采取应对措施,保护电力调度自动化数据采集与监控网络的正常安全运行。
本发明能够准确快速地解决网络数据帧的区分识别问题,图6为某地级市电网调度自动化数据采集与监控网的入侵检测系统中数据帧的区分识别方法流程示意图。
输入量为电力调度自动化的数据采集与监控网络的1个数据帧,经过规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块4个模块,并行处理后,再经过控制协调存储模块输出,数据帧的区分识别结果为输出量。当数据帧的区分识别结果为不确定时,写入错误列表;当数据帧的区分识别结果为确定时,区分识别结果认定该输入数据帧属于IEC60870-5-101规约数据帧、IEC60870-5-104规约数据帧及其它数据帧(包括误用数据帧、虚假数据帧、恶意入侵数据帧等)之中的某一类。
其中,如图6所示,规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块和控制协调存储模块的具体工作方式如下:
1、规约特征字段识别模块:
1.1规约特征字段识别,以电力调度自动化的数据采集与监控网络的1个数据帧为输入量,比对规约特征字段库中IEC60870-5-101规约数据帧宿源MAC地址字段12字节的内容,进行规约特征字段识别,得到输出结果;
其中规约特征字段识别采用蛮力匹配算法即BF匹配算法,进行关键字符串匹配识别,主串为1个电力规约数据帧,匹配串为规约特征字段,具体使用IEC60870-5-101规约数据帧宿源MAC地址字段12字节为匹配串;
1.2判断输出结果是否为IEC60870-5-101规约数据帧,若是则输入的数据帧为IEC60870-5-101规约数据帧,若否则进入下一步;
1.3规约特征字段识别,以电力调度自动化的数据采集与监控网络的1个数据帧为输入量,比对规约特征字段库中IEC60870-5-104规约数据帧宿源MAC地址字段12字节的内容,进行规约特征字段识别,得到输出结果;其中,规约特征字段识别采用蛮力匹配算法,具体使用IEC60870-5-104规约数据帧宿源MAC地址字段12字节为匹配串;
1.4判断输出结果是否为IEC60870-5-104规约数据帧?若是则输入的数据帧为IEC60870-5-104规约数据帧,若否则输入的数据帧为其它数据帧;
1.5关键字符串匹配识别结果:将步骤1.2和步骤1.4中的结果输出给控制协调存储模块;
1.6控制协调存储模块将输出结果反馈至规约特征字段库,规约特征字段库根据反馈信息进行调整,并为规约特征字段识别提供相关特征字段。
2、规约结构格式规则识别模块:
2.1规约结构格式规则识别,以电力调度自动化的数据采集与监控网络的1个数据帧为输入量,去除该帧的帧头部和帧尾部,解析其中的帧数据字段内容,比对规约结构格式规则库中IEC60870-5-101规约FT1.2帧的格式内容,以及IEC60870-5-101规约中串口通信协议的格式内容,进行规约结构格式规则识别,得到输出结果;
2.2判断结果是否为IEC60870-5-101规约数据帧?若是则输入数据帧为IEC60870-5-101规约数据帧,若否则进入下一步;
2.3规约结构格式规则识别,以电力调度自动化的数据采集与监控网络的1个数据帧为输入量,去除该帧的帧头部和帧尾部,解析其中的帧数据字段内容,比对规约结构格式规则库中IEC60870-5-104规约的OSI模型传输层传输控制协议(TCP)报文段格式的内容,进行规约结构格式规则识别,得到输出结果;
2.4判断结果是否为IEC60870-5-104规约数据帧吗?若是则输入的数据帧为IEC60870-5-104规约数据帧,若否则输入的数据帧为其它数据帧;
2.5结构格式模式识别结果:将步骤2.2和步骤2.4中的结果输出给控制协调存储模块;
2.6控制协调存储模块将输出结果反馈至规约结构格式规则库,规约结构格式规则库根据反馈信息进行调整,并为规约结构格式规则识别提供相关结构格式规则。
3、规约聚类分析参数识别模块:
3.1规约聚类分析参数识别,以电力调度自动化的数据采集与监控网络的1个数据帧为输入量,比对规约聚类分析参数库中关于IEC60870-5-101规约数据帧的聚类簇数、初始聚类中心和阈值等参数特征信息,进行规约聚类分析,得到输出结果;
3.2判断结果是否为IEC60870-5-101规约数据帧?若是则输入的数据帧为IEC60870-5-101规约数据帧,若否则进入下一步;
3.3规约聚类分析参数识别,以电力调度自动化的数据采集与监控网络的1个数据帧为输入量,比对规约聚类分析参数库中关于IEC60870-5-104规约数据帧的聚类簇数、初始聚类中心和阈值等参数特征信息,进行规约聚类分析,得到输出结果;其规约聚类分析采用K均值聚类算法,取聚类簇数k=3;
3.4判断结果是否为IEC60870-5-104规约数据帧吗?若是则输入的数据帧为IEC60870-5-104规约数据帧,若否则输入的数据帧为其它数据帧;
3.5聚类分析参数识别结果:将步骤3.2和步骤3.4中的结果输出给控制协调存储模块;
3.6控制协调存储模块将输出结果反馈至规约聚类分析参数库,规约聚类分析参数库根据反馈信息进行调整,并为规约聚类分析参数识别提供相关聚类分析参数。
4、规约频域特征识别模块:
4.1规约频域特征识别,以电力调度自动化的数据采集与监控网络的(N+2)个数据帧为输入量数据序列,其前(N+1)个数据帧相邻数据帧之间的时间间隔定义为时域序列:x(0),x(1),x(2),…,x(N-1),x(n)为相邻数据帧之间的时间间隔,其中n=0,1,2,…,(N-1);比对规约频域特征库,针对电力调度自动化的数据采集与监控网络的(N+2)个数据帧的最后1个数据帧即第(N+2)个数据帧,进行规约频域特征识别,得到输出结果;规约频域特征识别模块起始工作时,针对电力调度自动化的数据采集与监控网络的首批(N+2)个数据帧的前(N+1)个数据帧,频域的特征识别模块的输出为0,即结果不确定或无结果,规约频域特征识别模块开始工作后,直到接收了第(N+2)个数据帧,才开始有结果输出;
其中,规约频域特征识别,在识别阶段,实施案例输入数据序列离散傅里叶正变换得到频域序列X(k),再离散傅里叶逆变换得到特征时域序列/>使用IEC60870-5-101规约数据帧的训练序列进行离散傅里叶正变换和离散傅里叶逆变换,得到X1’(k)和/>使用IEC60870-5-104规约数据帧的训练序列进行离散傅里叶正变换和离散傅里叶逆变换,得到X’2(k)和/>使用离散傅里叶正变换与离散傅里叶逆变换的线性性、对称性、时效特性和频移特性,比对序列X(k)与规约频域特征库内的X’1(k)、X’2(k),比对序列x(n)与规约频域特征库内的/>针对IEC60870-5-101规约数据帧,进行x(N)的规约频域特征识别,得到电力调度自动化的数据采集与监控网络的(N+2)个数据帧的最后2个数据帧即第(N+1)个数据帧与第(N+2)个数据帧之间的时间间隔x(N)的规约频域特征;根据x(N)的规约频域特征,推断识别电力调度自动化的数据采集与监控网络的(N+2)个数据帧的最后1个数据帧即第(N+2)个数据帧,得到输出结果;在本实施例中,为便于工程计算,离散傅里叶正变换和离散傅里叶逆变换优选使用快速离散傅里叶正变换与快速离散傅里叶逆变换;在本实施例中优选N≥256;
4.2针对第(N+2)个数据帧,判断规约频域特征识别结果是否为IEC60870-5-101规约数据帧?若是则输入的数据帧为IEC60870-5-101规约数据帧,若否则进入下一步;
4.3规约频域特征识别,以电力调度自动化的数据采集与监控网络的(N+2)个数据帧为输入量数据序列,其前(N+1)个数据帧相邻数据帧之间的时间间隔定义为时域序列:x(0),x(1),x(2),…,x(N-1),x(n)为相邻数据帧之间的时间间隔,其中n=0,1,2,…,(N-1);使用IEC60870-5-104规约数据帧的训练序列进行离散傅里叶正变换和离散傅里叶逆变换,得到X’2(k)和使用傅里叶变换与逆傅里叶变换的线性性、对称性、时效特性和频移特性,比对序列X(k)与规约频域特征库内的X’2(k),比对序列x(n)与规约频域特征库内的针对IEC60870-5-104规约数据帧,进行x(N)的规约频域特征识别,得到电力调度自动化的数据采集与监控网络的(N+2)个数据帧的最后2个数据帧即第(N+1)个数据帧与第(N+2)个数据帧之间的时间间隔x(N)的规约频域特征;再根据x(N)的规约频域特征,推断识别电力调度自动化的数据采集与监控网络的(N+2)个数据帧的最后1个数据帧即第(N+2)个数据帧,得到输出结果;
4.4针对第(N+2)个数据帧,判断规约频域特征识别结果是否为IEC60870-5-104规约数据帧?若是则输入的数据帧为IEC60870-5-104规约数据帧,若否则输入的数据帧为其它数据帧;
4.5频域的特征识别结果:将步骤4.2和步骤4.4中的结果输出给控制协调存储模块;
4.6控制协调存储模块将输出结果反馈至规约频域特征库,规约频域特征库根据反馈信息进行调整,并为规约频域特征识别提供相关频域特征。
5、控制协调存储模块:
5.1接收来自规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块并行处理的输出结果,将该4个模块的输出结果分别赋予5票、3票、2票、1票的表决权重,则表决权重阈值D为:
5.2计算IEC60870-5-101规约数据帧、IEC60870-5-104规约数据帧和其它数据帧对应的表决权重,累计上述4个模块的输出结果相同的模块的表决权重,不相同的不累加,按照同类累加后的表决权重大小,将表决权重由大到小进行排序,得到表决权重最大的电力规约数据帧类型;
5.3表决权重最大的规约数据帧类型的表决权重是否大于等于6票?若是则进入步骤5.4,若否则进入步骤5.5;
5.4数据帧的区分识别结果为同类累加后的表决权重最大的数据帧类型,即IEC60870-5-101规约数据帧、IEC60870-5-104规约数据帧、其它数据这3类数据帧之中表决权重最大的数据帧类型;
5.5数据帧的区分识别结果为不确定,并写入错误列表;
5.6数据帧的区分识别结果输出,并同时将输出结果分别反馈给规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库。
针对IEC60870-5-101规约数据帧、IEC60870-5-104规约数据帧、其它数据帧这3类数据帧,按照同类累加后的表决权重由大到小排序,其中,最大表决权重≥6的情况有8种,即11=5+3+2+1,10=5+3+2,9=5+3+1,8=5+2+1,8=5+3,7=5+2,6=3+2+1,6=5+1。
数据帧的区分识别结果为表决权重最大的数据帧类,即IEC60870-5-101规约数据帧、IEC60870-5-104规约数据帧、其它数据帧这3类数据帧之中最大表决权重≥6的数据帧类;最大表决权重<6的数据帧的区分识别结果为不确定,并写入错误列表。
例1,来自规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块的并行处理结果,都认定某个数据帧为其它数据帧,按照同类累加后,最大表决权重为11=5+3+2+1≥6,数据帧的区分识别结果输出为其它数据帧,为保护电力调度自动化数据采集与监控网络的正常安全运行,及时采取应对措施,处理发现的其它数据帧。其中,其它数据帧可能是误用数据帧、虚假数据帧、恶意入侵数据帧等。
例2,来自规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块的并行处理结果,规约特征字段识别模块和规约频域特征识别模块都认定某个数据帧为IEC60870-5-104规约数据帧,按照同类累加后,最大表决权重为6=5+1≥6,数据帧的区分识别结果输出为IEC60870-5-104规约数据帧。
例3,来自规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块的并行处理结果,规约特征字段识别模块认定数据帧为IEC60870-5-104规约数据帧,规约频域特征识别模块认定数据帧为其它数据帧,规约结构格式规则识别模块和规约聚类分析参数识别模块都认定数据帧为IEC60870-5-101规约数据帧,按照同类累加后,IEC60870-5-104规约数据帧的表决权重为5、其它数据帧的表决权重为1、IEC60870-5-101规约数据帧的表决权重为3+2=5票,最大表决权重为5<6,该数据帧的区分识别结果为不确定,并写入错误列表。
工程优化的学习过程:
根据某地级市电网调度自动化数据采集与监控网的入侵检测系统的工程实际场景,采用已知的电力规约数据帧作为输入,将该数据帧同时输入到规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块和对比数据帧的类型模块;该数据帧经过上述步骤S1-S3后,输出结果,即获取了该数据帧的规约数据帧类型,判断获取的规约数据帧类型与已知的规约数据帧类型是否相同,若是,则将当前的表决权重,输出给控制协调存储模块,更新表决权重和表决权重阈值D,即调优决策参数,获得优化的表决权重和表决权重阈值,完成1轮工程优化的学习过程,若每一种类型的数据帧工程优化轮数≥576时则完成了工程优化的学习过程,若每一种类型的数据帧工程优化轮数小于576则需要进行下一轮工程优化的学习过程;
若否,则调整表决权重,将调整后的表决权重反馈给控制协调存储模块,需要进行下一轮工程优化的学习过程,每一种类型的数据帧工程优化轮数大于576,直至获取的规约数据帧类型与已知的规约数据帧类型相同为止。
其中,不论是初始的表决权重还是重新赋值的表决权重均取自斐波那契数列,斐波那契数列为1,1,2,3,5,8,13,21,34……。
总之,通过预训练的学习过程,训练轮数≥512,得到规约特征字段库、规约结构格式规则库、规约聚类分析参数库、规约频域特征库;通过在线推理进行数据帧类型预测,推理轮数≥1024,初始化电力规约数据帧的区分识别方法与系统;再进行工程优化的学习过程,调整表决权重,将调整后的表决权重反馈给控制协调存储模块;每一种类型的数据帧工程优化轮数≥576,合计调优轮数≥576×3=1728,得到优化后的表决权重,输出至控制协调存储模块,更新表决权重,即调优决策参数,完成工程优化的学习过程。
本实施例中的电力规约数据帧的区分识别方法及系统,包括依次进行的3个过程,即预训练的学习过程、在线推理的预测过程、工程优化的学习过程。依次完成该3个过程后,即可实际工程应用于某地级市电网调度自动化数据采集与监控网的入侵检测系统中数据帧的区分识别。
实施例五
为了更好的说明本发明的方案,本实施例以某智慧城市虚拟发电厂分布式协同控制网络中智能体代理的IEC 61850电力规约数据帧的区分识别方法及系统为例进行说明。
虚拟发电厂(Virtual Power Plant,VPP)是可控的、柔性的整体发电系统,并能代表区域内接入的分布式能源对外参与电力市场的交易。所谓虚拟,体现在它并不具有实体存在的电厂形式,却具有一个电厂的功能,而且是远超传统实体电厂的功能,因为它打破了传统电力系统中发电厂之间、发电侧和用电侧之间的物理界限。它是互联网+源网荷储售服一体化(即电源、电网、负荷、储能、销售、服务的聚合体)的清洁智慧能源管理系统,是对多种分布式能源进行聚合、优化控制和管理,为电网提供调频、调峰等辅助服务,并能够参与电力市场交易的技术和商业模式。虚拟电厂是一个看不见的电厂,是一个分散的能源聚合体,在这个聚合体中,电力用户是消费者,也可能是生产者。
分布式协同控制网络是虚拟发电厂的中枢神经,其中的智能体代理是关键的神经元。
电力自动化通信网络和系统IEC 61850Ed2.0系列标准的应用领域涵盖变电站内部,变电站之间、变电站与控制中心之间、发电厂、清洁能源、分布式能源、输变电设备监测以及配电自动化系统等电力自动化各个领域的信息建模和通信映射。IEC61850标准规约建立了三种服务信息模型:采样值(Sample Value,SV)、通用面向变电站事件对象(GenericObject Oriented Substation Event,GOOSE)、制造报文规范(Manufacturing MessageSpecification,MMS)。其中,SV报文主要包括了合并单元和保护单元采集的基本数据;GOOSE报文包含了变电站中的控制信息和状态信息;同步报文用于变电站的网络同步,保证信息传输的可靠性;MMS报文用于站控层的数据传输,定义到了读取状态、定义对象、设置参数和执行程序等多种信息。
IEC 61850标准的SV报文和GOOSE报文从应用层都直接基于数据链路层传输,采用ISO/IEC 8802-3的以太网数据帧结构,其中,对应长度为2字节的以太网类型,SV报文和GOOSE报文的以太网类型分别为0x88BA即十六进制88BA和0x88B8即十六进制88B8。
IEC 61850标准的MMS报文通过TCP/IP封装后,进入数据链路层传输,采用ISO/IEC8802-3的以太网数据帧结构,其中,对应长度为2字节的以太网类型为0x8800即十六进制8800。
IEC 61850标准的IEC61588时间同步报文即对时信息报文通过UDP/IP封装后,进入数据链路层传输,采用ISO/IEC 8802-3的以太网数据帧结构,其中,对应长度为2字节的以太网类型为0x88F7即十六进制88F7。
对应OSI七层模型的第4层传输层(Transport layer),TCP/IP模型中TCP协议的数据单元称为段或报文段(segments),而TCP/IP模型中UDP协议的数据单元称为数据报(datagrams)。对应OSI七层模型的第3层网络层(Network layer),TCP/IP模型中IP协议的数据单元称为分组或数据包(Packet)。
电力自动化通信网络和系统IEC 61850Ed2.0系列标准的四类报文,即GOOSE报文、SV报文、MMS报文和对时信息报文,分别对应GOOSE规约、SV规约、MMS规约和对时规约等四类传输规约。
基于IEC 61850电力规约的电源、电网、储能、负荷等动态实时相互协调互动,能实现多种能源互补,提高效率,降低成本。所以,虚拟发电厂的智能体代理需要对IEC 61850电力规约数据帧的区分识别,满足电力业更高实时性、互联互通性以及安全性等方面的要求,实现跨专业的数据共享和数据的“一次采集、多次使用”。
以某智慧城市的虚拟发电厂分布式协同控制网络中智能体代理的IEC 61850电力规约数据帧的区分识别为例,本实施例针对OSI模型的第2层:数据链路层(data linklayer)的数据帧的区分识别问题,能够在同时兼顾准确性与实时性的基础上,解决智慧城市中虚拟发电厂分布式协同控制网络内智能体代理的IEC 61850电力规约数据帧的区分识别问题,具体是区分识别GOOSE规约、SV规约、MMS规约和对时规约四类传输规约。在OSI模型的数据链路层识别各种规约数据帧,快速并正确地区分识别出GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧、对时规约数据帧、其它数据帧(包括误用数据帧、虚假数据帧、恶意入侵数据帧等)。
一种电力规约数据帧的区分识别方法及系统,包括依次进行的3个过程,即预训练的学习过程、在线推理的预测过程、工程优化的学习过程。
预训练的学习过程:
先进行预训练,通过预训练的学习过程,利用已知的IEC 61850标准的GOOSE规约、SV规约、MMS规约和对时规约四类传输规约数据帧及其它数据帧(包括误用数据帧、虚假数据帧、恶意入侵数据帧等)作为训练集数据样本,经过数据预处理、特征提取、特征表示,预训练得到规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库。其中,训练轮数≥256×4=1024。
在线推理的预测过程:
再应用本发明,通过在线推理的预测过程,推理轮数≥512×4=2048,初始化电力规约数据帧的区分识别方法与系统。针对某智慧城市虚拟发电厂的分布式协同控制网络中的数据帧实时进行区分识别。输入量为某智慧城市虚拟发电厂的分布式协同控制网络的数据帧,经过规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块,并行处理后,再经过控制协调存储模块输出,数据帧的区分识别结果为输出量。当数据帧的区分识别结果为不确定时,写入错误列表;当数据帧的区分识别结果为确定的规约数据帧类型时,区分识别结果认定输入的数据帧属于GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧、对时规约数据帧、其它数据帧(包括误用数据帧、虚假数据帧、恶意入侵数据帧等)中的一种。
其中,规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块和控制协调存储模块的具体工作方式如下:
1、规约特征字段识别模块:
1.1规约特征字段识别,以某智慧城市虚拟发电厂分布式协同控制网络中智能体代理的1个数据帧为输入量,比对规约特征字段库内ISO/IEC 8802-3的以太网数据帧结构中以太网类型2字节的位置和内容,进行规约特征字段识别,得到输出结果;
其中,规约特征字段识别采用蛮力匹配算法即BF匹配算法,进行关键字符串匹配识别,主串为1个IEC 61850电力规约数据帧,匹配串为规约特征字段,具体使用ISO/IEC8802-3的以太网数据帧结构中以太网类型2字节为匹配串;
1.2判断输出结果是否为数据帧首尾顺序的ISO/IEC 8802-3的以太网数据帧结构中以太网类型2字节的位置?若是则进入步骤1.3,若否则输入的数据帧为其它数据帧;
1.3根据内容的规约数据帧类别的识别:将数据帧首尾顺序的ISO/IEC 8802-3的以太网数据帧结构中以太网类型2字节的内容,与规约特征字段库内ISO/IEC 8802-3的以太网数据帧结构中以太网类型2字节的内容进行比对,判断以太网类型2字节的十六进制的内容是否为88B8、88BA、8800或88F7?若是则根据该内容分别对应的将数据帧识别为:GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧和对时规约数据帧,若否则输入的数据帧为其它数据帧;
1.4关键字符串匹配识别结果:将步骤1.2和步骤1.3中的结果输出给控制协调存储模块;
1.5控制协调存储模块将输出结果反馈至规约特征字段库,规约特征字段库根据反馈信息进行调整,并为规约特征字段识别提供相关特征字段。
2、规约结构格式规则识别模块:
2.1规约结构格式规则识别,以某智慧城市虚拟发电厂分布式协同控制网络中智能体代理的1个数据帧为输入量,去除该帧的帧头部和帧尾部,解析其中的帧数据字段内容格式,比对规约结构格式规则库中MMS规约数据帧和对时规约数据帧的帧数据字段内具有IP协议层数据包格式规则,进行规约结构格式规则识别,得到输出结果;
2.2判断结果是否具有IP协议层数据包格式规则?若是则进入步骤2.3,若否则进入步骤2.4;
2.3去除该IP协议层数据包的头部和尾部,解析其中的数据字段内容格式,比对规约结构格式规则库中MMS规约报文TCP/IP封装的格式规则和对时规约报文UDP/IP封装的格式规则,判断是否为TCP报文段或UDP数据报?若是则输入的数据帧为MMS规约数据帧或对时规约数据帧,若否则判断输入的数据帧为其它数据帧;
2.4比对规约结构格式规则库中格式规则:GOOSE报文的2字节长度的APPID字段十六进制取值范围为0000~3FFF、SV报文的2字节长度的APPID字段十六进制取值范围为4000~7FFF、GOOSE报文的格式类型为1或1A、SV报文的格式类型为4,根据报文2字节长度和格式类型,判断输入的数据帧是否为GOOSE规约或SV规约?若是则输入的数据帧为GOOSE规约数据帧或SV规约数据帧,若否则判断输入的数据帧为其它数据帧;
2.5规约结构格式规则识别结果:将步骤2.3和步骤2.4中的结果输出给控制协调存储模块;
2.6控制协调存储模块将输出结果反馈至规约结构格式规则库,规约结构格式规则库根据反馈信息进行调整,并为规约结构格式规则识别提供相关结构格式规则。
3、规约聚类分析参数识别模块:
3.1规约聚类分析参数识别,以某智慧城市虚拟发电厂分布式协同控制网络中智能体代理的1个数据帧为输入量,比对规约聚类分析参数库中关于GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧和对时规约数据帧四类IEC 61850电力规约数据帧的聚类簇数、初始聚类中心和阈值等参数特征信息,进行规约聚类分析,得到结果;
3.2判断输出结果是否为GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧或对时规约数据帧?若是则输入的数据帧为GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧或对时规约数据帧,若否则输入的数据帧为其它数据帧;
3.3聚类分析参数识别结果:将步骤3.3中的结果输出给控制协调存储模块;
3.4控制协调存储模块将输出结果反馈至规约聚类分析参数库,规约聚类分析参数库根据反馈信息进行调整,并为规约聚类分析参数识别提供相关聚类分析参数。
4、规约频域特征识别模块:
4.1规约频域特征识别,以某智慧城市虚拟发电厂分布式协同控制网络中的(N+2)个数据帧为智能体代理的输入量数据序列,其前(N+1)个数据帧相邻数据帧之间的时间间隔定义为时域序列:x(0),x(1),x(2),…,x(N-1),x(n)为相邻数据帧之间的时间间隔,其中n=0,1,2,…,(N-1);比对规约频域特征库,针对某智慧城市虚拟发电厂分布式协同控制网络的(N+2)个数据帧的最后1个数据帧即第(N+2)个数据帧,进行规约频域特征识别,得到输出结果;频域的特征识别模块起始工作时,针对电力调度自动化的数据采集与监控网络的首批(N+2)个数据帧的前(N+1)个数据帧,频域的特征识别模块的输出为0,即结果不确定或无结果,规约频域特征识别模块开始工作后,直到接收了第(N+2)个数据帧,才开始有结果输出;
其中,规约频域特征识别,在识别阶段,实施案例输入数据序列离散傅里叶正变换得到频域序列X(k),再离散傅里叶逆变换得到特征时域序列/>分别使用GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧、对时规约数据帧的训练序列进行离散傅里叶正变换和离散傅里叶逆变换,得到X’i(k)和/>其中1、2、3、4分别对应于GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧、对时规约数据帧。使用离散傅里叶正变换与离散傅里叶逆变换的线性性、对称性、时效特性和频移特性,比对序列X(k)与规约频域特征库内的X’1(k)、X’2(k)、X’3(k)、X’4(k),比对序列x(n)与规约频域特征库内的/>行x(N)的规约频域特征识别,得到某智慧城市虚拟发电厂分布式协同控制网络中的(N+2)个数据帧的最后2个数据帧即第(N+1)个数据帧与第(N+2)个数据帧之间的时间间隔x(N)的规约频域特征;根据x(N)的规约频域特征,推断识别某智慧城市虚拟发电厂分布式协同控制网络中的(N+2)个数据帧的最后1个数据帧即第(N+2)个数据帧的类型,得到输出结果。在本实施例中,为便于工程计算,离散傅里叶正变换和离散傅里叶逆变换优选使用快速离散傅里叶变换与快速离散傅里叶逆变换;在本实施例中优选N≥256。
4.2针对第(N+2)个数据帧,判断规约频域特征识别结果是否为GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧或对时规约数据帧中的一种?若是则输入的数据帧为GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧或对时规约数据帧,若否则输入的数据帧为其它数据帧;
4.3频域的特征识别结果:将步骤4.2中的结果输出给控制协调存储模块;
4.4控制协调存储模块将输出结果反馈至规约频域特征库,规约频域特征库根据反馈信息进行调整,并为规约频域特征识别提供相关频域特征。
5、控制协调存储模块:
5.1接收来自规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块并行处理的输出结果,将该4个模块的输出结果分别赋予5票、3票、2票、1票的表决权重,则表决权重阈值D为:
5.2计算GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧、对时规约数据帧、其它数据帧对应的表决权重,累计上述4个模块的输出结果相同的模块的表决权重,不相同的不累加,按照同类累加后的表决权重大小,将表决权重由大到小进行排序,得到表决权重最大的电力规约数据帧类型;
5.3表决权重最大的规约数据帧类型的表决权重是否大于等于6票?若是则进入步骤5.4,若否则进入步骤5.5;
5.4数据帧的区分识别结果为同类累加后的表决权重最大的数据帧类型,即GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧、对时规约数据帧、其它数据帧这5类数据帧之中表决权重最大的数据帧类型;
5.5数据帧的区分识别结果为不确定,并写入错误列表;
5.6数据帧的区分识别结果输出,并同时将输出结果分别反馈给规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库。
针对GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧、对时规约数据帧和其它数据帧这5类数据帧,按照同类累加后的表决权重由大到小排序,其中,最大表决权重≥6的情况有8种,即11=5+3+2+1,10=5+3+2,9=5+3+1,8=5+2+1,8=5+3,7=5+2,6=3+2+1,6=5+1。
数据帧的区分识别结果为表决权重最大的数据帧类,即GOOSE规约数据帧、SV规约数据帧、MMS规约数据帧、对时规约数据帧、其它数据帧这5类数据帧之中最大表决权重≥6的数据帧类;最大表决权重<6的数据帧的区分识别结果为不确定,并写入错误列表。
例1,来自规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块的并行处理结果,都认定某个数据帧为其它数据帧,按照同类累加后,最大表决权重为11=5+3+2+1≥6,数据帧的区分识别结果输出为其它数据帧,为保护某智慧城市虚拟发电厂的分布式协同控制网络的正常安全运行,及时采取应对措施,处理发现的其它数据帧。其中,其它数据帧可能是误用数据帧、虚假数据帧、恶意入侵数据帧等。
例2,来自规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块的并行处理结果,规约特征字段识别模块和规约频域特征识别模块都认定某个数据帧为SV规约数据帧,按照同类累加后,最大表决权重为6=5+1≥6,数据帧的区分识别结果输出为SV规约数据帧。
例3,来自规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块的并行处理结果,规约特征字段识别模块认定数据帧为SV规约数据帧,规约频域特征识别模块认定数据帧为其它数据帧,规约结构格式规则识别模块和规约聚类分析参数识别模块都认定数据帧为GOOSE规约数据帧,按照同类累加后,SV规约数据帧的表决权重为5、其它数据帧的表决权重为1、GOOSE规约数据帧的表决权重为3+2=5,最大表决权重为5<6,该数据帧的区分识别结果为不确定,并写入错误列表。
工程优化的学习过程:
根据某智慧城市虚拟发电厂分布式协同控制网络中智能体代理的工程实际场景,采用已知的IEC 61850电力规约数据帧作为输入,将该数据帧同时输入到规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块和对比数据帧的类型模块;该数据帧经过上述步骤S1-S3后,输出结果,即获取了该数据帧的规约数据帧类型,判断获取的规约数据帧类型与已知的规约数据帧类型是否相同,若是,则将当前的表决权重,输出给控制协调存储模块,更新表决权重和表决权重阈值D,即调优决策参数,获得优化的表决权重和表决权重阈值,完成1轮工程优化的学习过程,若每一种类型的数据帧工程优化轮数≥576时则完成了工程优化的学习过程,若每一种类型的数据帧工程优化轮数小于576则需要进行下一轮工程优化的学习过程;
若否,则调整表决权重,将调整后的表决权重反馈给控制协调存储模块,需要进行下一轮工程优化的学习过程,每一种类型的数据帧工程优化轮数大于576,直至获取的规约数据帧类型与已知的规约数据帧类型相同为止。
其中,不论是初始的表决权重还是重新赋值的表决权重均取自斐波那契数列,斐波那契数列为1,1,2,3,5,8,13,21,34……。
若规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块、规约频域特征识别模块的表决权重分别取13、8、3、5时,表决权重阈值为:
总之,通过预训练的学习过程,训练轮数≥1024,得到规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库;通过在线推理进行数据帧类型预测,推理轮数≥2048,初始化电力规约数据帧的区分识别方法与系统;再进行工程优化的学习过程,调整表决权重,将调整后的表决权重反馈给协调存储模块;每一种类型的数据帧工程优化轮数≥576,合计调优轮数≥576×5=2880,得到优化后的表决权重,输出至控制协调存储模块,更新表决权重,即调优决策参数,完成工程优化的学习过程。
本实施例中的电力规约数据帧的区分识别方法及系统,包括依次进行的3个过程,即预训练的学习过程、在线推理的预测过程、工程优化的学习过程。依次完成该3个过程后,即可实际工程应用于某智慧城市虚拟发电厂分布式协同控制网络中智能体代理的IEC61850电力规约数据帧的区分识别。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (6)
1.一种电力规约数据帧的区分识别方法,其特征在于,包括以下步骤:
S1输入待区分的数据帧,根据预先建立的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库判断所述数据帧属于的规约数据帧类型;
S2分别对基于所述规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库的判断结果赋予不同的表决权重;
S3根据所述表决权重确定所述数据帧的最终规约数据帧类型;
基于蛮力匹配算法的规约特征字段识别单元和对比数据帧的规约类型单元同时接收1个已知类型的电力规约的数据帧;基于蛮力匹配算法的规约特征字段识别单元识别该数据帧,其识别结果发送给对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于蛮力匹配算法的规约特征字段识别单元的识别结果与接收的输入训练样本的数据帧的规约数据帧类型,判断二者是否一致,若是则告知规约特征字段库单元,若否则请求修改规约特征字段库并告知规约特征字段库单元;规约特征字段库单元与基于蛮力匹配算法的规约特征字段识别单元之间信息交互,相互交换电力规约数据帧的特征字段信息;
基于帧数据字段内容格式的规约结构格式规识别单元和对比数据帧的规约类型单元同时接收1个已知类型的电力规约的数据帧;基于帧数据字段内容格式的规约结构格式规则识别单元,去除该帧的帧头部和帧尾部,解析其中的帧数据字段内容,识别该数据帧,其识别结果送至对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于帧数据字段内容格式的规约结构格式规则识别单元的识别结果与接收的输入训练样本的数据帧已知类型,判断二者是否一致,若是则告知规约结构格式规则库单元,若否则请求修改规约结构格式规则库并告知规约结构格式规则库单元,规约结构格式规则库单元与基于帧数据字段内容格式的规约结构格式规则识别单元之间信息交互,相互交换电力规约数据帧的规约结构格式规则信息;
基于K均值聚类算法的规约聚类分析单元和对比数据帧的规约类型单元同时接收1个已知类型的电力规约的数据帧;基于K均值聚类算法的规约聚类分析单元识别该数据帧,其识别结果送给对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于K均值聚类算法的规约聚类分析单元的识别结果与接收的输入训练样本的数据帧已知类型,判断二者是否一致,若是则告知规约聚类分析参数库单元,若否则请求修改规约聚类分析参数库的聚类簇数、初始聚类中心和阈值,并告知规约聚类分析参数库单元;规约聚类分析参数库单元与基于K均值聚类算法的规约聚类分析单元之间信息交互,相互交换电力规约数据帧的规约聚类分析参数信息;
基于离散傅里叶变换算法的规约频域特征识别单元和对比数据帧的规约类型单元同时接收(N+1)个已知同类型的电力规约的数据帧,取N≥254;基于离散傅里叶变换算法的规约频域特征识别单元将该(N+1)个数据帧相邻数据帧之间的时间间隔定义为N个时域序列:x(0),x(1),x(2),…,x(N-1),即x(n)为相邻数据帧之间的时间间隔,其中n=0,1,2,…,(N-1),离散傅里叶正变换与离散傅里叶逆变换分别为DFT与IDFT,X(k)为包含N个点的有限长频域序列,即有限长频域序列为X(0),X(1),X(2),…,X(N-1);规约频域特征库单元得到X(k)和/>基于离散傅里叶变换算法的规约频域特征识别单元根据DFT与IDFT运算得到的X(k)和/>识别该(N+1)个数据帧中的第(N+1)个数据帧的类型,其识别结果送给对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于离散傅里叶变换算法的规约频域特征识别单元的识别结果与接收的输入训练样本的数据帧已知类型,判断二者是否一致,若是则告知规约频域特征库单元,若否则请求修改规约频域特征库并告知规约频域特征库单元;规约频域特征库单元与基于离散傅里叶变换算法的规约频域特征识别单元之间信息交互,相互交换电力规约数据帧的规约频域特征信息;其中,规约频域特征库训练模块起始工作时,针对首批(N+1)个数据帧的前N个数据帧,基于离散傅里叶变换算法的规约频域特征识别单元的输出为0,即结果不确定或无结果,即基于离散傅里叶变换算法的规约频域特征识别单元起始工作接收了第(N+1)个数据帧,才开始有结果输出;
根据所述表决权重确定所述数据帧的最终的规约数据帧类型,包括:将所述判断结果相同的表决权重相加,获得表决权重最高的规约数据帧类型,若所述规约数据帧类型的表决权重大于或等于表决权重阈值,则判断所述数据帧为所述规约数据帧类型,若所述规约数据帧类型的表决权重小于表决权重阈值,则识别结果为不确定;
在能够判断数据帧类型时,输出区分识别结果;若识别结果为不确定时,通过写入错误列表,将数据帧属于的电力规约类别判断结果反馈至所述规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库;
所述表决权重阈值通过以下方法获得:将基于所述规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库获得的判断结果的表决权重相加,获得总表决权重,将所述总表决权重除以二,保留整数位,在所述整数位加一获得所述表决权重阈值。
2.如权利要求1所述的电力规约数据帧的区分识别方法,其特征在于,所述表决权重通过以下方式进行更新:输入规约数据帧类型已知的数据帧,经过步骤S2-S4,获取所述数据帧的规约数据帧类型,判断获取的规约数据帧类型与已知的规约数据帧类型是否相同,若相同,则直接输出当前各判断结果对应的表决权重;若不相同,则对各判断结果的表决权重进行调整,直至获取的规约数据帧类型与已知的规约数据帧类型相同为止。
3.如权利要求2所述的电力规约数据帧的区分识别方法,其特征在于,所述表决权重取自斐波那契数列。
4.如权利要求1-3任一项所述的电力规约数据帧的区分识别方法,其特征在于,所述规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库通过将已知规约数据帧类型的数据帧输入初始规约特征字段库、初始规约结构格式规则库、初始规约聚类分析参数库和初始规约频域特征库中进行预训练获得。
5.如权利要求4所述的电力规约数据帧的区分识别方法,其特征在于,所述预训练的学习过程为:根据初始的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库判断已知规约数据帧类型的数据帧的规约类型,并将判断结果与已知的规约数据帧类型进行对比,若相同则将此时的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库作为最终输出结果;若不相同则修改所述规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库,直到判断结果与已知的规约数据帧类型相同为止。
6.一种电力规约数据帧的区分识别系统,其特征在于,包括:
预判断模块,用于输入待区分的数据帧,根据预先建立的规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库判断所述数据帧属于的规约数据帧类型;
表决权重确定模块,用于分别对基于所述规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库的判断结果赋予不同的表决权重;
判断结果输出模块,用于根据所述表决权重确定所述数据帧的最终规约数据帧类型;
所述预判断模块包括规约特征字段识别模块、规约结构格式规则识别模块、规约聚类分析参数识别模块和规约频域特征识别模块,
所述规约特征字段识别模块,使用蛮力匹配算法,进行关键字符串匹配识别;
所述规约结构格式规则识别模块,针对输入数据帧,去除该帧的帧头部和帧尾部,解析所述数据帧的数据字段内容格式,并根据所述数据字段内容格式进行结构格式模式识别;
所述规约聚类分析参数识别模块,使用K均值聚类算法,进行聚类分析,进行聚类分析参数识别;
所述规约频域特征识别模块,使用离散傅里叶变换算法,进行频域特征识别
规约特征字段库训练模块中,基于蛮力匹配算法的规约特征字段识别单元和对比数据帧的规约类型单元同时接收1个已知类型的电力规约的数据帧;基于蛮力匹配算法的规约特征字段识别单元识别该数据帧,其识别结果发送给对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于蛮力匹配算法的规约特征字段识别单元的识别结果与接收的输入训练样本的数据帧的规约数据帧类型,判断二者是否一致,若是则告知规约特征字段库单元,若否则请求修改规约特征字段库并告知规约特征字段库单元;规约特征字段库单元与基于蛮力匹配算法的规约特征字段识别单元之间信息交互,相互交换电力规约数据帧的特征字段信息;
规约结构格式规则库训练模块中,基于帧数据字段内容格式的规约结构格式规识别单元和对比数据帧的规约类型单元同时接收1个已知类型的电力规约的数据帧;基于帧数据字段内容格式的规约结构格式规则识别单元,去除该帧的帧头部和帧尾部,解析其中的帧数据字段内容,识别该数据帧,其识别结果送至对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于帧数据字段内容格式的规约结构格式规则识别单元的识别结果与接收的输入训练样本的数据帧已知类型,判断二者是否一致,若是则告知规约结构格式规则库单元,若否则请求修改规约结构格式规则库并告知规约结构格式规则库单元,规约结构格式规则库单元与基于帧数据字段内容格式的规约结构格式规则识别单元之间信息交互,相互交换电力规约数据帧的规约结构格式规则信息;
规约聚类分析参数库训练模块中,基于K均值聚类算法的规约聚类分析单元和对比数据帧的规约类型单元同时接收1个已知类型的电力规约的数据帧;基于K均值聚类算法的规约聚类分析单元识别该数据帧,其识别结果送给对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于K均值聚类算法的规约聚类分析单元的识别结果与接收的输入训练样本的数据帧已知类型,判断二者是否一致,若是则告知规约聚类分析参数库单元,若否则请求修改规约聚类分析参数库的聚类簇数、初始聚类中心和阈值,并告知规约聚类分析参数库单元;规约聚类分析参数库单元与基于K均值聚类算法的规约聚类分析单元之间信息交互,相互交换电力规约数据帧的规约聚类分析参数信息;
规约频域特征库训练模块中,基于离散傅里叶变换算法的规约频域特征识别单元和对比数据帧的规约类型单元同时接收(N+1)个已知同类型的电力规约的数据帧,取N≥254;基于离散傅里叶变换算法的规约频域特征识别单元将该(N+1)个数据帧相邻数据帧之间的时间间隔定义为N个时域序列:x(0),x(1),x(2),…,x(N-1),即x(n)为相邻数据帧之间的时间间隔,其中n=0,1,2,…,(N-1),离散傅里叶正变换与离散傅里叶逆变换分别为DFT与IDFT,X(k)为包含N个点的有限长频域序列,即有限长频域序列为X(0),X(1),X(2),…,X(N-1);规约频域特征库单元得到X(k)和/>基于离散傅里叶变换算法的规约频域特征识别单元根据DFT与IDFT运算得到的X(k)和/>识别该(N+1)个数据帧中的第(N+1)个数据帧的类型,其识别结果送给对比数据帧的规约类型单元;对比数据帧的规约类型单元对比基于离散傅里叶变换算法的规约频域特征识别单元的识别结果与接收的输入训练样本的数据帧已知类型,判断二者是否一致,若是则告知规约频域特征库单元,若否则请求修改规约频域特征库并告知规约频域特征库单元;规约频域特征库单元与基于离散傅里叶变换算法的规约频域特征识别单元之间信息交互,相互交换电力规约数据帧的规约频域特征信息;其中,规约频域特征库训练模块起始工作时,针对首批(N+1)个数据帧的前N个数据帧,基于离散傅里叶变换算法的规约频域特征识别单元的输出为0,即结果不确定或无结果,即基于离散傅里叶变换算法的规约频域特征识别单元起始工作接收了第(N+1)个数据帧,才开始有结果输出;
根据所述表决权重确定所述数据帧的最终的规约数据帧类型,包括:将所述判断结果相同的表决权重相加,获得表决权重最高的规约数据帧类型,若所述规约数据帧类型的表决权重大于或等于表决权重阈值,则判断所述数据帧为所述规约数据帧类型,若所述规约数据帧类型的表决权重小于表决权重阈值,则识别结果为不确定;
在能够判断数据帧类型时,输出区分识别结果;若识别结果为不确定时,通过写入错误列表,将数据帧属于的电力规约类别判断结果反馈至所述规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库;
所述表决权重阈值通过以下方法获得:将基于所述规约特征字段库、规约结构格式规则库、规约聚类分析参数库和规约频域特征库获得的判断结果的表决权重相加,获得总表决权重,将所述总表决权重除以二,保留整数位,在所述整数位加一获得所述表决权重阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010401451.1A CN111597411B (zh) | 2020-05-13 | 2020-05-13 | 一种电力规约数据帧的区分识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010401451.1A CN111597411B (zh) | 2020-05-13 | 2020-05-13 | 一种电力规约数据帧的区分识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111597411A CN111597411A (zh) | 2020-08-28 |
CN111597411B true CN111597411B (zh) | 2024-03-19 |
Family
ID=72192240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010401451.1A Active CN111597411B (zh) | 2020-05-13 | 2020-05-13 | 一种电力规约数据帧的区分识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111597411B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113110351A (zh) * | 2021-04-28 | 2021-07-13 | 广东省科学院智能制造研究所 | 一种工业生产现场异构状态数据采集系统及方法 |
CN114615344B (zh) * | 2022-02-08 | 2023-07-28 | 广东智有盈能源技术有限公司 | 一种电力仪表智能规约转换方法与装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013198037A (ja) * | 2012-03-22 | 2013-09-30 | Sumitomo Electric Ind Ltd | 通信システム |
CN105653616A (zh) * | 2015-12-25 | 2016-06-08 | 长沙威胜信息技术有限公司 | 电力系统主站的通信规约转换方法 |
CN107465667A (zh) * | 2017-07-17 | 2017-12-12 | 全球能源互联网研究院有限公司 | 基于规约深度解析的电网工控安全协同监测方法及装置 |
CN109714320A (zh) * | 2018-12-10 | 2019-05-03 | 南京南瑞继保电气有限公司 | 支持宽带多频数据传输的pmu数据帧和规约扩展方法 |
-
2020
- 2020-05-13 CN CN202010401451.1A patent/CN111597411B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013198037A (ja) * | 2012-03-22 | 2013-09-30 | Sumitomo Electric Ind Ltd | 通信システム |
CN105653616A (zh) * | 2015-12-25 | 2016-06-08 | 长沙威胜信息技术有限公司 | 电力系统主站的通信规约转换方法 |
CN107465667A (zh) * | 2017-07-17 | 2017-12-12 | 全球能源互联网研究院有限公司 | 基于规约深度解析的电网工控安全协同监测方法及装置 |
CN109714320A (zh) * | 2018-12-10 | 2019-05-03 | 南京南瑞继保电气有限公司 | 支持宽带多频数据传输的pmu数据帧和规约扩展方法 |
Non-Patent Citations (2)
Title |
---|
基于多规约的电网实时监测主站系统的设计;周莲英;穆鑫;;计算机工程与设计(第14期);全文 * |
电力系统实时动态监测系统传输规约;王英涛;张道农;谢晓冬;何江;于跃海;王兆家;;电网技术(第13期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111597411A (zh) | 2020-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110380989B (zh) | 网络流量指纹特征二阶段多分类的物联网设备识别方法 | |
CN110011931B (zh) | 一种加密流量类别检测方法及系统 | |
CN110933072B (zh) | 基于区块链的数据传输方法、装置及电子设备 | |
CN111597411B (zh) | 一种电力规约数据帧的区分识别方法及系统 | |
CN111953757B (zh) | 基于云计算和智能设备交互的信息处理方法及云端服务器 | |
CN107360145A (zh) | 一种多节点蜜罐系统及其数据分析方法 | |
CN110166344B (zh) | 一种身份标识识别方法、装置以及相关设备 | |
CN110034966B (zh) | 一种基于机器学习的数据流分类方法及系统 | |
CN109606151B (zh) | 一种基于云端优化调度的自动充电方法及系统 | |
CN111654538B (zh) | 基于区块链及大数据的通信处理方法及云边端计算服务器 | |
CN102915423A (zh) | 一种基于粗糙集和基因表达式的电力业务数据过滤系统及方法 | |
CN114064471A (zh) | 一种基于生成对抗网络的Ethernet/IP协议模糊测试方法 | |
CN105812280B (zh) | 一种分类方法及电子设备 | |
CN101360090A (zh) | 应用层协议识别方法 | |
CN113329358B (zh) | 一种基于risc-v指令集的aiot多制式边缘网关通信系统及设备 | |
CN114584522A (zh) | 一种物联网设备的识别方法、系统、介质及终端 | |
Haddaji et al. | A transfer learning based intrusion detection system for internet of vehicles | |
CN116346434A (zh) | 电力系统网络攻击行为监测准确度提升方法及系统 | |
CN113114465B (zh) | 归属权限的处理方法及装置、存储介质、电子装置 | |
CN112887132B (zh) | 一种变电站整定式过程层免配置的goose自适应探针方法 | |
CN114567613A (zh) | 一种真实ip识别方法、装置、电子设备及存储介质 | |
CN112469034A (zh) | 能安全认证物理感知设备的物联网网关装置及其接入方法 | |
Adeke et al. | An efficient approach based on parameter optimization for network traffic classification using machine learning | |
CN109740320A (zh) | 一种基于区块链的身份认证方法及终端设备 | |
CN109194700A (zh) | 一种流量管控方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |