CN113938410A - 一种终端协议的识别方法及装置 - Google Patents

一种终端协议的识别方法及装置 Download PDF

Info

Publication number
CN113938410A
CN113938410A CN202111198624.5A CN202111198624A CN113938410A CN 113938410 A CN113938410 A CN 113938410A CN 202111198624 A CN202111198624 A CN 202111198624A CN 113938410 A CN113938410 A CN 113938410A
Authority
CN
China
Prior art keywords
data
clustering
protocol
terminal
terminal protocol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111198624.5A
Other languages
English (en)
Other versions
CN113938410B (zh
Inventor
江霖
曹安瑛
何伟
付博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Zhuhai Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Zhuhai Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Zhuhai Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202111198624.5A priority Critical patent/CN113938410B/zh
Publication of CN113938410A publication Critical patent/CN113938410A/zh
Application granted granted Critical
Publication of CN113938410B publication Critical patent/CN113938410B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/18Protocol analysers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/18Multiprotocol handlers, e.g. single devices capable of handling multiple protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Communication Control (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种终端协议的识别方法及装置,其方法包括:获取待测的终端协议数据集,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据,得到聚类矩阵数据,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求,若是,则确定并校验所述对应的待测终端协议数据的所属协议类别,若否,则将所述对应的待测终端协议数据划分为新增类别数据。本发明通过一种终端协议的识别方法,有效满足了电力数据安全接入和有效识别的需求,提高了资源配置的经济性和实用性。

Description

一种终端协议的识别方法及装置
技术领域
本发明涉及识别智能终端协议的领域,尤其涉及一种终端协议的识别方法及装置。
背景技术
随着智能电网的发展,当前构成电力系统源网荷储的各部分对象的特征均发生了重要变化,业务的深度和广度不断延伸,体现为业务类型的丰富性、参与主体的多元性和监控设备的海量性。电力智能终端需要通过数据协议识别和解析来获取各类电力业务的数据信息,进而为各电力业务分配合理的通信资源和计算资源,缓解主站层的通信压力。另一方面,提高电力数据传输和处理的安全性,识别和预防异常恶意流量入侵是电力智能终端亟需具备的功能。
现有电力业务在传统IEC 60870-101、IEC 60870-104,IEC67850等电力专用协议的基础上加入了大量的物联网协议,比如LoRaWAN、MQTT和CoAP等,各类协议规定了数据传输的交互机制、封装格式等特性。然而为了提高电力数据传输和处理的安全性,电力企业多采用加密的方式进行数据传输,采集终端无法直接读取数据采用的协议以及包含的信息内容,需要上送到主站层进行集中处理,这样对电力传输网络造成了极大的传输压力。另一方面,现有电力数据采集终端的软硬件强耦合,在实现多功能时资源配置冗余,经济性和实用性较低。
因此,为了提高资源配置的经济性和实用性,解决目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题,亟需构建一种终端协议的识别方法。
发明内容
本发明提供了一种终端协议的识别方法及装置,解决了目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题。
第一方面,本发明提供了一种终端协议的识别方法,包括:
获取待测的终端协议数据集;
基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据;
计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类别数据。
可选地,获取待测的终端协议数据集,包括:
获取终端协议的待测数据;
转化所述待测数据转化为适用于协议识别的数据,得到所述待测的终端协议数据集;
可选地,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据,包括:
根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据;
通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
可选地,通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据,包括:
通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
可选地,所述确定并校验所述对应的待测终端协议数据的所属协议类别之后,还包括:
利用所述预设的参考协议标准的解析方法,解析所述对应的终端协议数据。
第二方面,本发明提供了一种终端协议的识别装置,包括:
获取模块,用于获取待测的终端协议数据集;
聚类模块,用于基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据;
计算模块,用于计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
判断模块,用于根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类别数据。
可选地,所述获取模块包括:
获取子模块,用于获取终端协议的待测数据;
转化子模块,用于转化所述待测数据转化为适用于协议识别的数据,得到所述待测的终端协议数据集;
可选地,所述聚类模块包括:
提取子模块,用于根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据;
聚类子模块,用于通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
可选地,所述聚类子模块包括:
计算单元,用于通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
聚类单元,用于基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
可选地,所述装置还包括:
解析模块,用于利用所述预设的参考协议标准的解析方法,解析所述对应的终端协议数据。
从以上技术方案可以看出,本发明具有以下优点:本发明提供了一种终端协议的识别方法,通过获取待测的终端协议数据集,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据,得到聚类矩阵数据,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求,若是,则确定并校验所述对应的待测终端协议数据的所属协议类别,若否,则将所述对应的待测终端协议数据划分为新增类别数据,通过一种终端协议的识别方法,解决了目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题,有效满足了电力数据安全接入和有效识别的需求,提高了资源配置的经济性和实用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明的一种终端协议的识别方法实施例一的流程步骤图;
图2为本发明的一种终端协议的识别方法实施例二的流程步骤图;
图3为本发明的一种智能终端系统的结构框图;
图4为本发明的一种终端协议的识别装置实施例的结构框图。
具体实施方式
本发明实施例提供了一种终端协议的识别方法及装置,用于解决目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一,请参阅图1,图1为本发明的一种终端协议的识别方法实施例一的流程步骤图,包括:
步骤S101,获取待测的终端协议数据集;
步骤S102,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据,得到聚类矩阵数据;
步骤S103,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
步骤S104,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类型数据。
在本发明实施例所提供的一种终端协议的识别方法,通过获取待测的终端协议数据集,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据,得到聚类矩阵数据,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求,若是,则确定并校验所述对应的待测终端协议数据的所属协议类别,若否,则将所述对应的待测终端协议数据划分为新增类别数据,通过一种终端协议的识别方法,解决了目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题,有效满足了电力数据安全接入和有效识别的需求,提高了资源配置的经济性和实用性。
实施例二,请参阅图2,图2为本发明的一种终端协议的识别方法的流程步骤图,所述方法应用于智能终端系统;请参阅图3,图3为本发明的一种智能终端系统的结构框图,其中,301为,301为数据采集,302为数据聚类,303为历史数据库,304为数据分类,305为网桥,306为容器,307为虚拟交换机,308为物理网卡。
智能终端系统存在数据采集、聚类、分类以及历史数据库管理等功能,每个容器进行单独的数据处理,实现数据隔离,并通过网桥进行数据交互,保证了数据协议识别的安全性;所述系统包括:
数据采集微服务,用于将采集的电力数据进行镜像存储,为下一步的数据聚类进行预处理;
数据聚类微服务,用于提取数据流的多维特征,并对数据进行聚类,将数据流分为多种数据流类型;
历史数据库,用于提供一些已知的电力标准数据协议作为初始的数据协议类型,为数据分类提供初始设定参考;
数据分类微服务,用于在数据聚类的基础上,根据已知电力数据协议标准进行数据分类,从而实现数据协议识别。
所述方法包括:
步骤S201,获取终端协议的待测数据;
在本发明实施例中,获取终端协议的待测数据;
在具体实现中,提取数据的流特征,数据的流特征主要描述数据的大小、流向和持续时间等属性,不涉及数据的具体内容,对于进行加密数据流的识别具有良好的适应性。采用不同协议,作用各异的数据流一般具有不同的流特性,因此,可以基于数据的流特征进行数据的分类。
数据采集容器在镜像待识别数流后,形成待识别分类的数据集合DF,设其包含I条数据流,数据的流特性采用八个特征进行描述,对于第i条数据流DFi,可表示为:
Figure BDA0003304044770000061
其中各维数据的意义为:
1)数据流中数据包总数S:即一条数据流中的数据包数目;
2)数据流持续时间T:即智能终端接收配用电数据流DFi从初始数据包到最后一个数据包之间的间隔:
Figure BDA0003304044770000062
3)数据流中数据包间的平均间隔t:一定程度反映报文的发送频率:
Figure BDA0003304044770000063
4)数据流中数据包间隔标准差σt:指一条数据流的数据包包间间隔对于平均大小的分散程度,反映报文发送的周期性:
Figure BDA0003304044770000064
5)数据流中数据包平均大小
Figure BDA0003304044770000071
Figure BDA0003304044770000072
其中,PL(j)代表第j个数据包的长度。
6)数据流中数据包大小标准差σB:
Figure BDA0003304044770000073
7)数据流单向流动、双向流动表征值K:当K=0时,数据流是单向流动的;当K=1时,数据流是双向流动的
Figure BDA0003304044770000074
8)数据流中数据包包头信息V:配用电数据流在应用层对数据包进行加密后,再通过网络层和数据链路层封装后进行传输,数据包包含的载荷是加密的,无法从中进行分析识别,但数据包包头包含了网络层和数据链路层封装的信息,比如协议开放的窗口大小、端口号和时间戳等。
步骤S202,转化所述待测数据转化为适用于协议识别的数据,得到待测的终端协议数据集;
在本发明实施例中,将格式不统一和存在异常数据记录的原始数据转化为适用于协议识别的数据集。
步骤S203,根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成多维特征矩阵数据;
在本发明实施例中,根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据。
在具体实现中,提取电数据流特征,其各维数据对识别聚类的影响程度不同,因此,需要对各维数据进行加权处理,以体现各维数据的差异性。
对于第i条数据流DFi,取其前七维特征数据进行聚类分析,对于I条数据流,形成特征矩阵:
Figure BDA0003304044770000081
对矩阵ADF每一列数据进行正向标准化,并采用熵权法求取每一维度的权重,形成加权标准化特征矩阵
Figure BDA0003304044770000082
Figure BDA0003304044770000083
矩阵
Figure BDA0003304044770000084
中:
Figure BDA0003304044770000085
wj为采用熵权法确定的第j维特征的权重,hjmax为矩阵ADF中第j列的最大值,hjmin为矩阵ADF中第j列的最小值。
步骤S204,通过k均值聚类算法,聚类所述多维特征矩阵数据,得到聚类矩阵数据;
在一个可选实施例中,通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据,包括:
通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
在本发明实施例中,通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数,基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
在具体实现中,采用k均值聚类算法(k-means算法)将该I条数据流划分为若干子区间DF1,DF2,…,DFk;表示为DF(k)=(DF1,DF2,…,DFk);
通过计算并比较不同k取值下的k-means算法轮廓系数,来确定样本空间的最优聚类数kopt,并完成聚类中心为kopt的聚类分析,步骤如下:
第一步:令k=2,对I条输入数据流构成的样本空间启动k-means算法,所划分的子区间集合为DF(2)={DF1,DF2}。对所有样本i∈DFa(a∈k),轮廓系数si的计算方法:
Figure BDA0003304044770000091
Figure BDA0003304044770000092
Figure BDA0003304044770000093
dis(i,j)是指数据流样本i和数据流样本j之间的距离。对于子区间集合DF(k),计算并存储其轮廓系数sD(K),计算公式表示如下:
Figure BDA0003304044770000094
其中,n是指所有位于子区间DF(k)中的对象。
第二步:令k=k+1,迭代计算并存储k在该取值时,子区间集合DF(k)的轮廓系数sD(k)。重复若干次,取sD(k)最大时的k作为最优聚类数kopt
第三步:取k=kopt进行k-means聚类求解,将I条输入数据流划分为kopt个子类DF(kopt)={DF1,DF2,…,DFkopt}。
经过步骤S203和步骤S204,可将输入的配用电数据流,基于流特性分为kopt个类。
步骤S205,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
在本发明实施例中,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离。
在具体实现中,基于聚类中心的数据流匹配方法:
1)从历史数据库获取已知的标准数据流类型,共P个,形成参考矩阵R:
Figure BDA0003304044770000095
2)针对步骤S204中形成的数据流聚类子区间集合DF(kopt)={DF1,…,DFkopt},取每个类的中心数据流的特征,形成聚类特征矩阵U:
Figure BDA0003304044770000101
矩阵U中,每一行表示子区间集合DF(kopt)中各个类的中心数据流;
对于矩阵U,对每一维特征数据,即每一列数据,求取其标准差,得各维数据的标准差向量为D=(d1,d2,………,d7):
3)对于矩阵U中的第g行,即第g个聚类中心数据流,求取其与R中每一行,即每个标准数据流的欧氏距离的最小值:
Figure BDA0003304044770000102
其中,d为标准差向量,S、T、K为数据。
步骤S206,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类型数据;
在本发明实施例中,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类型数据。
在具体实现中,对于第g个聚类中心数据流,判断DISTg是否小于阈值DISref,若判断结果为“Yes”,则将其划分到最小加权欧氏距离所对应的标准数据流类型中,采用该种标准数据流的解析方式对第g个类的数据流进行解析;否则,将该数据流加入数据库中,作为新增的数据流类型。
步骤S207,利用所述预设的参考协议标准的解析方法,解析已确定所属协议类别的待测终端协议数据。
在本发明实施例所提供的一种终端协议的识别方法,通过获取待测的终端协议数据集,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据,得到聚类矩阵数据,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求,若是,则确定并校验所述对应的待测终端协议数据的所属协议类别,若否,则将所述对应的待测终端协议数据划分为新增类别数据,通过一种终端协议的识别方法,解决了目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题,有效满足了电力数据安全接入和有效识别的需求,提高了资源配置的经济性和实用性。
请参阅图4,图4为本发明的一种终端协议的识别装置实施例的结构框图,包括:
获取模块401,用于获取待测的终端协议数据集;
聚类模块402,用于基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据;
计算模块403,用于计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
判断模块404,用于根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类别数据。
在一个可选实施例中,所述获取模块401包括:
获取子模块,用于获取终端协议的待测数据;
转化子模块,用于转化所述待测数据转化为适用于协议识别的数据,得到所述待测的终端协议数据集;
在一个可选实施例中,所述聚类模块402包括:
提取子模块,用于根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据;
聚类子模块,用于通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
在一个可选实施例中,所述聚类子模块包括:
计算单元,用于通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
聚类单元,用于基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
在一个可选实施例中,所述装置还包括:
解析模块,用于利用所述预设的参考协议标准的解析方法,解析所述对应的终端协议数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,本发明所揭露的方法及装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种终端协议的识别方法,其特征在于,包括:
获取待测的终端协议数据集;
基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据;
计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类别数据。
2.根据权利要求1所述的终端协议的识别方法,其特征在于,获取待测的终端协议数据集,包括:
获取终端协议的待测数据;
转化所述待测数据转化为适用于协议识别的数据,得到所述待测的终端协议数据集。
3.根据权利要求1所述的终端协议的识别方法,其特征在于,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据,包括:
根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据;
通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
4.根据权利要求3所述的终端协议的识别方法,其特征在于,通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据,包括:
通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
5.根据权利要求1-4任一所述的终端协议的识别方法,其特征在于,所述确定并校验所述对应的待测终端协议数据的所属协议类别之后,还包括:
利用所述预设的参考协议标准的解析方法,解析所述对应的终端协议数据。
6.一种终端协议的识别装置,其特征在于,包括:
获取模块,用于获取待测的终端协议数据集;
聚类模块,用于基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据;
计算模块,用于计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
判断模块,用于根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类别数据。
7.根据权利要求6所述的终端协议的识别装置,其特征在于,所述获取模块包括:
获取子模块,用于获取终端协议的待测数据;
转化子模块,用于转化所述待测数据转化为适用于协议识别的数据,得到所述待测的终端协议数据集。
8.根据权利要求6所述的终端协议的识别装置,其特征在于,所述聚类模块包括:
提取子模块,用于根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据;
聚类子模块,用于通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
9.根据权利要求8所述的终端协议的识别装置,其特征在于,所述聚类子模块包括:
计算单元,用于通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
聚类单元,用于基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
10.根据权利要求6-9任一所述的终端协议的识别装置,其特征在于,所述装置还包括:
解析模块,用于利用所述预设的参考协议标准的解析方法,解析所述对应的终端协议数据。
CN202111198624.5A 2021-10-14 2021-10-14 一种终端协议的识别方法及装置 Active CN113938410B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111198624.5A CN113938410B (zh) 2021-10-14 2021-10-14 一种终端协议的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111198624.5A CN113938410B (zh) 2021-10-14 2021-10-14 一种终端协议的识别方法及装置

Publications (2)

Publication Number Publication Date
CN113938410A true CN113938410A (zh) 2022-01-14
CN113938410B CN113938410B (zh) 2023-05-23

Family

ID=79279518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111198624.5A Active CN113938410B (zh) 2021-10-14 2021-10-14 一种终端协议的识别方法及装置

Country Status (1)

Country Link
CN (1) CN113938410B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023202499A1 (zh) * 2022-04-22 2023-10-26 华为技术有限公司 数据传输方法及相关装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101714952A (zh) * 2009-12-22 2010-05-26 北京邮电大学 一种接入网的流量识别方法和装置
CN105024993A (zh) * 2015-05-25 2015-11-04 上海南邮实业有限公司 一种基于向量运算的协议比对方法
WO2018125053A1 (en) * 2016-12-27 2018-07-05 Intel IP Corporation Framework for iot protocol identification and management
CN109714311A (zh) * 2018-11-15 2019-05-03 北京天地和兴科技有限公司 一种基于聚类算法的异常行为检测的方法
CN110061931A (zh) * 2019-04-23 2019-07-26 广东技术师范大学 工控协议的聚类方法、装置、系统及计算机存储介质
CN110290022A (zh) * 2019-06-24 2019-09-27 中国人民解放军陆军工程大学 一种基于自适应聚类的未知应用层协议识别方法
EP3627877A1 (en) * 2018-09-21 2020-03-25 British Telecommunications public limited company Cellular telecommunications network
CN111817982A (zh) * 2020-07-27 2020-10-23 南京信息工程大学 一种面向类别不平衡下的加密流量识别方法
CN112348084A (zh) * 2020-11-08 2021-02-09 大连大学 改进k-means的未知协议数据帧分类方法
CN112788015A (zh) * 2020-12-31 2021-05-11 天津大学 一种基于工业网关的工控协议识别与解析方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101714952A (zh) * 2009-12-22 2010-05-26 北京邮电大学 一种接入网的流量识别方法和装置
CN105024993A (zh) * 2015-05-25 2015-11-04 上海南邮实业有限公司 一种基于向量运算的协议比对方法
WO2018125053A1 (en) * 2016-12-27 2018-07-05 Intel IP Corporation Framework for iot protocol identification and management
EP3627877A1 (en) * 2018-09-21 2020-03-25 British Telecommunications public limited company Cellular telecommunications network
CN109714311A (zh) * 2018-11-15 2019-05-03 北京天地和兴科技有限公司 一种基于聚类算法的异常行为检测的方法
CN110061931A (zh) * 2019-04-23 2019-07-26 广东技术师范大学 工控协议的聚类方法、装置、系统及计算机存储介质
CN110290022A (zh) * 2019-06-24 2019-09-27 中国人民解放军陆军工程大学 一种基于自适应聚类的未知应用层协议识别方法
CN111817982A (zh) * 2020-07-27 2020-10-23 南京信息工程大学 一种面向类别不平衡下的加密流量识别方法
CN112348084A (zh) * 2020-11-08 2021-02-09 大连大学 改进k-means的未知协议数据帧分类方法
CN112788015A (zh) * 2020-12-31 2021-05-11 天津大学 一种基于工业网关的工控协议识别与解析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WU WEISEN等: "Protocol Reverse Engineering by Analysis of the Probability Distribution of Messages" *
赵凯等: "基于聚类分析的P2P流量识别", 《长沙理工大学学报(自然科学版)》 *
黄笑言等: "基于字节熵矢量加权指纹的二进制协议识别", 《计算机应用研究》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023202499A1 (zh) * 2022-04-22 2023-10-26 华为技术有限公司 数据传输方法及相关装置

Also Published As

Publication number Publication date
CN113938410B (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
CN110445637B (zh) 事件监控方法、系统、计算机设备和存储介质
CN109831392B (zh) 半监督网络流量分类方法
CN111859384A (zh) 异常事件监控方法、装置、计算机设备及存储介质
EP3716547B1 (en) Data stream recognition method and apparatus
CN115412371B (zh) 基于物联网的大数据安全防护方法、系统及云平台
CN114257428A (zh) 一种基于深度学习的加密网络流量识别及分类方法
CN114218322A (zh) 基于密文传输的数据展示方法、装置、设备及介质
CN113938410B (zh) 一种终端协议的识别方法及装置
CN113868509A (zh) 基于云计算的科技政策数据信息咨询服务系统
Yan et al. Principal Component Analysis Based Network Traffic Classification.
CN116150688A (zh) 智能家居中轻量级的物联网设备识别方法与装置
CN117171711B (zh) 一种基于云平台的企业内外部数据融合共享方法及系统
CN111339050A (zh) 一种基于大数据平台集中安全审计的方法及系统
CN115426363B (zh) 智能板材加工工厂的数据采集方法及终端
CN110781232A (zh) 数据处理方法、装置、计算机设备和存储介质
CN112087448B (zh) 安全日志提取方法、装置和计算机设备
CN116232696A (zh) 基于深度神经网络的加密流量分类方法
Hu et al. Classification of Abnormal Traffic in Smart Grids Based on GACNN and Data Statistical Analysis
CN112804239B (zh) 一种流量安全分析建模方法和系统
CN115484044A (zh) 一种数据状态的监控方法及系统
CN114329516A (zh) 一种智慧交通数据保护方法及系统
CN113037551A (zh) 一种基于流量切片的涉敏业务快速识别定位方法
CN113762374B (zh) 一种基于改进密度峰值聚类的异常轨迹检测方法
CN117033889B (zh) 一种智慧园区生产数据统计方法及相关装置
CN114625786B (zh) 一种基于风控技术的动态数据挖掘方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant