CN113938410B - 一种终端协议的识别方法及装置 - Google Patents
一种终端协议的识别方法及装置 Download PDFInfo
- Publication number
- CN113938410B CN113938410B CN202111198624.5A CN202111198624A CN113938410B CN 113938410 B CN113938410 B CN 113938410B CN 202111198624 A CN202111198624 A CN 202111198624A CN 113938410 B CN113938410 B CN 113938410B
- Authority
- CN
- China
- Prior art keywords
- data
- terminal protocol
- protocol
- clustering
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/18—Protocol analysers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/18—Multiprotocol handlers, e.g. single devices capable of handling multiple protocols
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Security & Cryptography (AREA)
- Communication Control (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种终端协议的识别方法及装置,其方法包括:获取待测的终端协议数据集,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据,得到聚类矩阵数据,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求,若是,则确定并校验所述对应的待测终端协议数据的所属协议类别,若否,则将所述对应的待测终端协议数据划分为新增类别数据。本发明通过一种终端协议的识别方法,有效满足了电力数据安全接入和有效识别的需求,提高了资源配置的经济性和实用性。
Description
技术领域
本发明涉及识别智能终端协议的领域,尤其涉及一种终端协议的识别方法及装置。
背景技术
随着智能电网的发展,当前构成电力系统源网荷储的各部分对象的特征均发生了重要变化,业务的深度和广度不断延伸,体现为业务类型的丰富性、参与主体的多元性和监控设备的海量性。电力智能终端需要通过数据协议识别和解析来获取各类电力业务的数据信息,进而为各电力业务分配合理的通信资源和计算资源,缓解主站层的通信压力。另一方面,提高电力数据传输和处理的安全性,识别和预防异常恶意流量入侵是电力智能终端亟需具备的功能。
现有电力业务在传统IEC 60870-101、IEC 60870-104,IEC67850等电力专用协议的基础上加入了大量的物联网协议,比如LoRaWAN、MQTT和CoAP等,各类协议规定了数据传输的交互机制、封装格式等特性。然而为了提高电力数据传输和处理的安全性,电力企业多采用加密的方式进行数据传输,采集终端无法直接读取数据采用的协议以及包含的信息内容,需要上送到主站层进行集中处理,这样对电力传输网络造成了极大的传输压力。另一方面,现有电力数据采集终端的软硬件强耦合,在实现多功能时资源配置冗余,经济性和实用性较低。
因此,为了提高资源配置的经济性和实用性,解决目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题,亟需构建一种终端协议的识别方法。
发明内容
本发明提供了一种终端协议的识别方法及装置,解决了目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题。
第一方面,本发明提供了一种终端协议的识别方法,包括:
获取待测的终端协议数据集;
基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据;
计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类别数据。
可选地,获取待测的终端协议数据集,包括:
获取终端协议的待测数据;
转化所述待测数据转化为适用于协议识别的数据,得到所述待测的终端协议数据集;
可选地,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据,包括:
根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据;
通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
可选地,通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据,包括:
通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
可选地,所述确定并校验所述对应的待测终端协议数据的所属协议类别之后,还包括:
利用所述预设的参考协议标准的解析方法,解析所述对应的终端协议数据。
第二方面,本发明提供了一种终端协议的识别装置,包括:
获取模块,用于获取待测的终端协议数据集;
聚类模块,用于基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据;
计算模块,用于计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
判断模块,用于根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类别数据。
可选地,所述获取模块包括:
获取子模块,用于获取终端协议的待测数据;
转化子模块,用于转化所述待测数据转化为适用于协议识别的数据,得到所述待测的终端协议数据集;
可选地,所述聚类模块包括:
提取子模块,用于根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据;
聚类子模块,用于通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
可选地,所述聚类子模块包括:
计算单元,用于通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
聚类单元,用于基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
可选地,所述装置还包括:
解析模块,用于利用所述预设的参考协议标准的解析方法,解析所述对应的终端协议数据。
从以上技术方案可以看出,本发明具有以下优点:本发明提供了一种终端协议的识别方法,通过获取待测的终端协议数据集,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据,得到聚类矩阵数据,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求,若是,则确定并校验所述对应的待测终端协议数据的所属协议类别,若否,则将所述对应的待测终端协议数据划分为新增类别数据,通过一种终端协议的识别方法,解决了目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题,有效满足了电力数据安全接入和有效识别的需求,提高了资源配置的经济性和实用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明的一种终端协议的识别方法实施例一的流程步骤图;
图2为本发明的一种终端协议的识别方法实施例二的流程步骤图;
图3为本发明的一种智能终端系统的结构框图;
图4为本发明的一种终端协议的识别装置实施例的结构框图。
具体实施方式
本发明实施例提供了一种终端协议的识别方法及装置,用于解决目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一,请参阅图1,图1为本发明的一种终端协议的识别方法实施例一的流程步骤图,包括:
步骤S101,获取待测的终端协议数据集;
步骤S102,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据,得到聚类矩阵数据;
步骤S103,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
步骤S104,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类型数据。
在本发明实施例所提供的一种终端协议的识别方法,通过获取待测的终端协议数据集,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据,得到聚类矩阵数据,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求,若是,则确定并校验所述对应的待测终端协议数据的所属协议类别,若否,则将所述对应的待测终端协议数据划分为新增类别数据,通过一种终端协议的识别方法,解决了目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题,有效满足了电力数据安全接入和有效识别的需求,提高了资源配置的经济性和实用性。
实施例二,请参阅图2,图2为本发明的一种终端协议的识别方法的流程步骤图,所述方法应用于智能终端系统;请参阅图3,图3为本发明的一种智能终端系统的结构框图,其中,301为,301为数据采集,302为数据聚类,303为历史数据库,304为数据分类,305为网桥,306为容器,307为虚拟交换机,308为物理网卡。
智能终端系统存在数据采集、聚类、分类以及历史数据库管理等功能,每个容器进行单独的数据处理,实现数据隔离,并通过网桥进行数据交互,保证了数据协议识别的安全性;所述系统包括:
数据采集微服务,用于将采集的电力数据进行镜像存储,为下一步的数据聚类进行预处理;
数据聚类微服务,用于提取数据流的多维特征,并对数据进行聚类,将数据流分为多种数据流类型;
历史数据库,用于提供一些已知的电力标准数据协议作为初始的数据协议类型,为数据分类提供初始设定参考;
数据分类微服务,用于在数据聚类的基础上,根据已知电力数据协议标准进行数据分类,从而实现数据协议识别。
所述方法包括:
步骤S201,获取终端协议的待测数据;
在本发明实施例中,获取终端协议的待测数据;
在具体实现中,提取数据的流特征,数据的流特征主要描述数据的大小、流向和持续时间等属性,不涉及数据的具体内容,对于进行加密数据流的识别具有良好的适应性。采用不同协议,作用各异的数据流一般具有不同的流特性,因此,可以基于数据的流特征进行数据的分类。
数据采集容器在镜像待识别数流后,形成待识别分类的数据集合DF,设其包含I条数据流,数据的流特性采用八个特征进行描述,对于第i条数据流DFi,可表示为:
其中各维数据的意义为:
1)数据流中数据包总数S:即一条数据流中的数据包数目;
2)数据流持续时间T:即智能终端接收配用电数据流DFi从初始数据包到最后一个数据包之间的间隔:
3)数据流中数据包间的平均间隔t:一定程度反映报文的发送频率:
4)数据流中数据包间隔标准差σt:指一条数据流的数据包包间间隔对于平均大小的分散程度,反映报文发送的周期性:
其中,PL(j)代表第j个数据包的长度。
6)数据流中数据包大小标准差σB:
7)数据流单向流动、双向流动表征值K:当K=0时,数据流是单向流动的;当K=1时,数据流是双向流动的
8)数据流中数据包包头信息V:配用电数据流在应用层对数据包进行加密后,再通过网络层和数据链路层封装后进行传输,数据包包含的载荷是加密的,无法从中进行分析识别,但数据包包头包含了网络层和数据链路层封装的信息,比如协议开放的窗口大小、端口号和时间戳等。
步骤S202,转化所述待测数据转化为适用于协议识别的数据,得到待测的终端协议数据集;
在本发明实施例中,将格式不统一和存在异常数据记录的原始数据转化为适用于协议识别的数据集。
步骤S203,根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成多维特征矩阵数据;
在本发明实施例中,根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据。
在具体实现中,提取电数据流特征,其各维数据对识别聚类的影响程度不同,因此,需要对各维数据进行加权处理,以体现各维数据的差异性。
对于第i条数据流DFi,取其前七维特征数据进行聚类分析,对于I条数据流,形成特征矩阵:
wj为采用熵权法确定的第j维特征的权重,hjmax为矩阵ADF中第j列的最大值,hjmin为矩阵ADF中第j列的最小值。
步骤S204,通过k均值聚类算法,聚类所述多维特征矩阵数据,得到聚类矩阵数据;
在一个可选实施例中,通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据,包括:
通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
在本发明实施例中,通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数,基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
在具体实现中,采用k均值聚类算法(k-means算法)将该I条数据流划分为若干子区间DF1,DF2,…,DFk;表示为DF(k)=(DF1,DF2,…,DFk);
通过计算并比较不同k取值下的k-means算法轮廓系数,来确定样本空间的最优聚类数kopt,并完成聚类中心为kopt的聚类分析,步骤如下:
第一步:令k=2,对I条输入数据流构成的样本空间启动k-means算法,所划分的子区间集合为DF(2)={DF1,DF2}。对所有样本i∈DFa(a∈k),轮廓系数si的计算方法:
dis(i,j)是指数据流样本i和数据流样本j之间的距离。对于子区间集合DF(k),计算并存储其轮廓系数sD(K),计算公式表示如下:
其中,n是指所有位于子区间DF(k)中的对象。
第二步:令k=k+1,迭代计算并存储k在该取值时,子区间集合DF(k)的轮廓系数sD(k)。重复若干次,取sD(k)最大时的k作为最优聚类数kopt。
第三步:取k=kopt进行k-means聚类求解,将I条输入数据流划分为kopt个子类DF(kopt)={DF1,DF2,…,DFkopt}。
经过步骤S203和步骤S204,可将输入的配用电数据流,基于流特性分为kopt个类。
步骤S205,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
在本发明实施例中,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离。
在具体实现中,基于聚类中心的数据流匹配方法:
1)从历史数据库获取已知的标准数据流类型,共P个,形成参考矩阵R:
2)针对步骤S204中形成的数据流聚类子区间集合DF(kopt)={DF1,…,DFkopt},取每个类的中心数据流的特征,形成聚类特征矩阵U:
矩阵U中,每一行表示子区间集合DF(kopt)中各个类的中心数据流;
对于矩阵U,对每一维特征数据,即每一列数据,求取其标准差,得各维数据的标准差向量为D=(d1,d2,………,d7):
3)对于矩阵U中的第g行,即第g个聚类中心数据流,求取其与R中每一行,即每个标准数据流的欧氏距离的最小值:
其中,d为标准差向量,S、T、K为数据。
步骤S206,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类型数据;
在本发明实施例中,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类型数据。
在具体实现中,对于第g个聚类中心数据流,判断DISTg是否小于阈值DISref,若判断结果为“Yes”,则将其划分到最小加权欧氏距离所对应的标准数据流类型中,采用该种标准数据流的解析方式对第g个类的数据流进行解析;否则,将该数据流加入数据库中,作为新增的数据流类型。
步骤S207,利用所述预设的参考协议标准的解析方法,解析已确定所属协议类别的待测终端协议数据。
在本发明实施例所提供的一种终端协议的识别方法,通过获取待测的终端协议数据集,基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据,得到聚类矩阵数据,计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离,根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求,若是,则确定并校验所述对应的待测终端协议数据的所属协议类别,若否,则将所述对应的待测终端协议数据划分为新增类别数据,通过一种终端协议的识别方法,解决了目前存在的加密传输数据的方式导致资源配置的经济性和实用性较低的技术问题,有效满足了电力数据安全接入和有效识别的需求,提高了资源配置的经济性和实用性。
请参阅图4,图4为本发明的一种终端协议的识别装置实施例的结构框图,包括:
获取模块401,用于获取待测的终端协议数据集;
聚类模块402,用于基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据;
计算模块403,用于计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
判断模块404,用于根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类别数据。
在一个可选实施例中,所述获取模块401包括:
获取子模块,用于获取终端协议的待测数据;
转化子模块,用于转化所述待测数据转化为适用于协议识别的数据,得到所述待测的终端协议数据集;
在一个可选实施例中,所述聚类模块402包括:
提取子模块,用于根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据;
聚类子模块,用于通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
在一个可选实施例中,所述聚类子模块包括:
计算单元,用于通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
聚类单元,用于基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据。
在一个可选实施例中,所述装置还包括:
解析模块,用于利用所述预设的参考协议标准的解析方法,解析所述对应的终端协议数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,本发明所揭露的方法及装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (6)
1.一种终端协议的识别方法,其特征在于,包括:
获取待测的终端协议数据集;
基于终端协议数据的多维特征和k均值聚类算法,其中,所述终端协议数据的多维特征为流特征,包括:数据流中数据包总数、数据流持续时间、数据流中数据包间的平均间隔、数据流中数据包间隔标准差、数据流中数据包平均大小、数据流中数据包大小标准差、数据流单向流动、双向流动表征以及数据流中数据包包头信息,聚类所述终端协议数据集,得到聚类矩阵数据,包括:
根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据;
通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据,具体包括:
通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据;
计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类别数据。
2.根据权利要求1所述的终端协议的识别方法,其特征在于,获取待测的终端协议数据集,包括:
获取终端协议的待测数据;
转化所述待测数据转化为适用于协议识别的数据,得到所述待测的终端协议数据集。
3.根据权利要求1-2任一所述的终端协议的识别方法,其特征在于,所述确定并校验所述对应的待测终端协议数据的所属协议类别之后,还包括:
利用所述预设的参考协议标准的解析方法,解析所述对应的终端协议数据。
4.一种终端协议的识别装置,其特征在于,包括:
获取模块,用于获取待测的终端协议数据集;
聚类模块,用于基于终端协议数据的多维特征和k均值聚类算法,聚类所述终端协议数据集,得到聚类矩阵数据;所述聚类模块包括:
提取子模块,用于根据所述终端协议数据的多维特征,对所述待测数据集进行提取,形成所述多维特征矩阵数据;
聚类子模块,用于通过所述k均值聚类算法,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据;所述聚类子模块包括:
计算单元,用于通过所述k均值聚类算法,对所述多维特征矩阵数据进行计算,得到轮廓系数;
聚类单元,用于基于所述轮廓系数,聚类所述多维特征矩阵数据,得到所述聚类矩阵数据
计算模块,用于计算得到所述聚类矩阵数据与预设的参考矩阵之间的最小加权欧式距离;
判断模块,用于根据所述最小加权欧式距离的数值与预设阈值的大小关系,判断所述最小加权欧式距离对应的待测终端协议数据是否符合预设的参考协议标准的要求;若是,则确定并校验所述对应的待测终端协议数据的所属协议类别;若否,则将所述对应的待测终端协议数据划分为新增类别数据。
5.根据权利要求4所述的终端协议的识别装置,其特征在于,所述获取模块包括:
获取子模块,用于获取终端协议的待测数据;
转化子模块,用于转化所述待测数据转化为适用于协议识别的数据,得到所述待测的终端协议数据集。
6.根据权利要求4所述的终端协议的识别装置,其特征在于,所述装置还包括:
解析模块,用于利用所述预设的参考协议标准的解析方法,解析所述对应的终端协议数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111198624.5A CN113938410B (zh) | 2021-10-14 | 2021-10-14 | 一种终端协议的识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111198624.5A CN113938410B (zh) | 2021-10-14 | 2021-10-14 | 一种终端协议的识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113938410A CN113938410A (zh) | 2022-01-14 |
CN113938410B true CN113938410B (zh) | 2023-05-23 |
Family
ID=79279518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111198624.5A Active CN113938410B (zh) | 2021-10-14 | 2021-10-14 | 一种终端协议的识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113938410B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116980972A (zh) * | 2022-04-22 | 2023-10-31 | 华为技术有限公司 | 数据传输方法及相关装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018125053A1 (en) * | 2016-12-27 | 2018-07-05 | Intel IP Corporation | Framework for iot protocol identification and management |
CN109714311A (zh) * | 2018-11-15 | 2019-05-03 | 北京天地和兴科技有限公司 | 一种基于聚类算法的异常行为检测的方法 |
EP3627877A1 (en) * | 2018-09-21 | 2020-03-25 | British Telecommunications public limited company | Cellular telecommunications network |
CN111817982A (zh) * | 2020-07-27 | 2020-10-23 | 南京信息工程大学 | 一种面向类别不平衡下的加密流量识别方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101714952B (zh) * | 2009-12-22 | 2012-03-07 | 北京邮电大学 | 一种接入网的流量识别方法和装置 |
CN105024993A (zh) * | 2015-05-25 | 2015-11-04 | 上海南邮实业有限公司 | 一种基于向量运算的协议比对方法 |
CN110061931B (zh) * | 2019-04-23 | 2022-08-30 | 广东技术师范大学 | 工控协议的聚类方法、装置、系统及计算机存储介质 |
CN110290022B (zh) * | 2019-06-24 | 2021-02-26 | 中国人民解放军陆军工程大学 | 一种基于自适应聚类的未知应用层协议识别方法 |
CN112348084A (zh) * | 2020-11-08 | 2021-02-09 | 大连大学 | 改进k-means的未知协议数据帧分类方法 |
CN112788015B (zh) * | 2020-12-31 | 2022-08-09 | 天津大学 | 一种基于工业网关的工控协议识别与解析方法 |
-
2021
- 2021-10-14 CN CN202111198624.5A patent/CN113938410B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018125053A1 (en) * | 2016-12-27 | 2018-07-05 | Intel IP Corporation | Framework for iot protocol identification and management |
EP3627877A1 (en) * | 2018-09-21 | 2020-03-25 | British Telecommunications public limited company | Cellular telecommunications network |
CN109714311A (zh) * | 2018-11-15 | 2019-05-03 | 北京天地和兴科技有限公司 | 一种基于聚类算法的异常行为检测的方法 |
CN111817982A (zh) * | 2020-07-27 | 2020-10-23 | 南京信息工程大学 | 一种面向类别不平衡下的加密流量识别方法 |
Non-Patent Citations (1)
Title |
---|
Wu Weisen等.Protocol Reverse Engineering by Analysis of the Probability Distribution of Messages.2020 International Conference on Computer Engineering and Intelligent Control (ICCEIC).2021,全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN113938410A (zh) | 2022-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20080066653A (ko) | 완전한 네트워크 변칙 진단을 위한 방법 및 장치와 트래픽피쳐 분포를 사용하여 네트워크 변칙들을 검출하고분류하기 위한 방법 | |
CN110061931B (zh) | 工控协议的聚类方法、装置、系统及计算机存储介质 | |
CN113938410B (zh) | 一种终端协议的识别方法及装置 | |
CN115442375A (zh) | 一种基于云边协同技术的物业数字化管理系统 | |
CN116366374B (zh) | 基于大数据的电网网络管理的安全评估方法、系统及介质 | |
CN114257428A (zh) | 一种基于深度学习的加密网络流量识别及分类方法 | |
CN114915575B (zh) | 一种基于人工智能的网络流量检测装置 | |
CN111224998B (zh) | 一种基于极限学习机的僵尸网络识别方法 | |
CN113923026A (zh) | 一种基于TextCNN的加密恶意流量检测模型及其构建方法 | |
CN112702339A (zh) | 基于深度迁移学习的异常流量监测与分析方法和装置 | |
Yan et al. | Principal Component Analysis Based Network Traffic Classification. | |
CN116150688A (zh) | 智能家居中轻量级的物联网设备识别方法与装置 | |
Zhang et al. | Unsupervised IoT fingerprinting method via variational auto-encoder and K-means | |
CN110851414B (zh) | 一种以聚类法进行边界数据分析的方法及其系统 | |
CN117633627A (zh) | 一种基于证据不确定性评估的深度学习未知网络流量分类方法及系统 | |
CN112087450A (zh) | 一种异常ip识别方法、系统及计算机设备 | |
CN113750538A (zh) | 一种基于大数据的手游安全平台构建方法及系统 | |
CN112688897A (zh) | 一种流量识别的方法、装置、存储介质及电子设备 | |
CN116232696A (zh) | 基于深度神经网络的加密流量分类方法 | |
CN115408702A (zh) | Stacking接口运行风险等级评估方法及其应用 | |
CN109299365A (zh) | 一种基于数据流的异常用户检索系统 | |
CN114666273A (zh) | 一种面向应用层未知网络协议的流量分类方法 | |
Jiang et al. | P2P traffic identification research based on the SVM | |
CN112087448A (zh) | 安全日志提取方法、装置和计算机设备 | |
CN113037551A (zh) | 一种基于流量切片的涉敏业务快速识别定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |