CN116112263A - 一种报文处理方法、电子设备及存储介质 - Google Patents

一种报文处理方法、电子设备及存储介质 Download PDF

Info

Publication number
CN116112263A
CN116112263A CN202310113356.5A CN202310113356A CN116112263A CN 116112263 A CN116112263 A CN 116112263A CN 202310113356 A CN202310113356 A CN 202310113356A CN 116112263 A CN116112263 A CN 116112263A
Authority
CN
China
Prior art keywords
session
historical
data set
processed
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310113356.5A
Other languages
English (en)
Other versions
CN116112263B (zh
Inventor
李峰
高长忠
张睿
杜兆福
杨振勇
王勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sinopec Shared Services Co ltd
Shandong Yuntian Safety Technology Co ltd
Original Assignee
Sinopec Shared Services Co ltd
Shandong Yuntian Safety Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sinopec Shared Services Co ltd, Shandong Yuntian Safety Technology Co ltd filed Critical Sinopec Shared Services Co ltd
Priority to CN202310113356.5A priority Critical patent/CN116112263B/zh
Publication of CN116112263A publication Critical patent/CN116112263A/zh
Application granted granted Critical
Publication of CN116112263B publication Critical patent/CN116112263B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请提供一种报文处理方法、电子设备及存储介质,包括:对每一历史会话的历史会话数据集进行第一特征提取处理,得到每一历史会话数据集对应的历史会话向量列表LT;根据LT,获取相关度列表集XG;根据XG,获取特征权重列表W;对待处理会话的待处理会话数据集进行第一特征提取处理,得到所述待处理会话的待处理会话向量A;根据W确定A对应的会话特征值VA,以根据VA确定所述待处理会话是否为异常会话。本申请通过A与W确定出A对应的会话特征值VA,使得可以通过VA的大小确定待处理回话是否为异常会话,从而实现了根据会话对应的报文确定出会话是否为异常会话。

Description

一种报文处理方法、电子设备及存储介质
背景技术
IEC104是一种广泛应用于电力工控等领域的通讯协议。能够用于主控设备(如上位机等)和被控设备(如采样器或可编程逻辑控制器等)之间的通讯。二者进行通讯时可以采用长连接进行报文的发送,如S帧报文、U帧报文和I帧报文等。而一次长连接中的通讯过程称为一次session会话。
现在有很多恶意攻击者,会通过中间人攻击等方式对工控系统的入侵,从而破坏工控系统的正常运行。但这种攻击方式很难通过例如杀毒软件的方式进行识别,所以亟需一种可以通过对报文进行识别检测异常的方法。
发明内容
有鉴于此,本申请提供一种报文处理方法、电子设备及存储介质,至少部分解决现有技术中存在的问题。
在本申请的一方面,提供一种报文处理方法,包括:
S100,对每一历史会话的历史会话数据集进行第一特征提取处理,得到每一历史会话数据集对应的历史会话向量列表LT=(LT1,LT2,…,LTj,…,LTm),j=1,2,…,m;其中,每一所述历史会话数据集中包括属于同一历史会话的若干S帧报文、U帧报文和I帧报文,每一I帧报文包括其对应的数据类型;m为所述历史会话数据集的数量,LTj为第j个历史会话数据集对应的历史会话向量,LTj=(NumSj,NumUj,NumIj,Fj1,Fj2,…,Fji,…,Fjn),i=1,2,…,n;NumSj为第j个历史会话数据集中S帧报文的数量,NumUj为第j个历史会话数据集中U帧报文的数量,NumIj为第j个历史会话数据集中I帧报文的数量,n为预设的数据类型的数量,Fji为第j个历史会话数据集的第i种数据类型的类型标识,若Fji=1,表示第j个历史会话数据集中包含第i种数据类型的I帧报文,若Fji=2,表示第j个历史会话数据集中不包含第i种数据类型的I帧报文。
S200,根据LT,获取相关度列表集XG=(XG1,XG2,…,XGy,…,XGx),y=1,2,…,x;XGy=(XGy1,XGy2,…,XGyq,…,XGyp),q=1,2,…,p;其中,x为XG中相关度列表的数量,x=n+3,XGy为每一历史会话向量列表中第y个特征维度对应的相关度列表;p为每一相关度列表中相关度的数量,p=n+3;XGyq为每一历史会话向量列表中第y个特征维度和第q个特征维度之间的相关度,XGyq符合以下条件:
Figure BDA0004077699330000021
其中,Ky为第y个特征维度对应的特征值列表,Ky=(Ky1,Ky2,…,Kyj,…,Kym),Kyj为第j个历史会话向量中第y个特征维度的特征值;Kq为第q个特征维度对应的特征值列表,Kq=(Kq1,Kq2,…,Kqj,…,Kqm);Kqj为第j个历史会话向量中第q个特征维度的特征值,avg()为预设的均值确定函数。
S300,根据XG,获取特征权重列表W=(W1,W2,…,Wy,…,Wx);其中,Wy为根据XGy得到的第y个特征维度对应的特征权重。
S400,对待处理会话的待处理会话数据集进行第一特征提取处理,得到所述待处理会话的待处理会话向量A。
S500,根据W确定A对应的会话特征值VA,以根据VA确定所述待处理会话是否为异常会话。
在本申请的另一方面,提供一种电子设备,包括处理器和存储器。
所述处理器通过调用所述存储器存储的程序或指令,用于执行上述任一项所述方法的步骤。
在本申请的另一方面,提供一种非瞬时性计算机可读存储介质,所述非瞬时性计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行上述任一项所述方法的步骤。
本申请提供的报文处理方法,通过历史会话数据集进行第一特征提取处理得到每一历史会话数据集的历史会话向量,历史会话向量中包含了对应的历史会话数据集中U帧报文数量、I帧报文的数量、S帧报文的数量以及对应的历史会话数据集中包含哪些数据类型的I帧报文,使得历史会话向量可以体现出对应的历史会话中的报文的特征。经研究发现,在工控系统中,由于大量的通讯工作都是重复性的,故而各个通讯环节中其报文特征相对较为统一。
故而,本申请中,通过确定历史会话向量中任意两个特征维度之间的相关度,其中,若相关度为正数,则说明对应的两个特征维度之间正相关,若相关度为0,则说明对应的两个特征维度之间不具有相关关系,若相关度为负数,则说明对应的两个特征维度之间负相关。如此,根据每一特征维度与其他所有特征维度之间的相关性,即可确定出每一特征维度对应的特征权重。且本申请中,相同的两个特征维度之间的相关度设置为0,以避免自身与自身的相关度影响确定出的特征权重的准确性。
最终,本申请通过A与W确定出A对应的会话特征值VA,使得可以通过VA的大小确定待处理回话是否为异常会话,从而实现了根据会话对应的报文确定出会话是否为异常会话。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种报文处理方法的流程图。
具体实施方式
下面结合附图对本申请实施例进行详细描述。
需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合;并且,基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
名词解释:
IEC104:IEC104协议是一个广泛应用于电力、城市轨道交通等行业的国际标准。IEC104协议由国际电工委员会制定。IEC104协议把IEC101的应用服务数据单元(ASDU)用网络协议TCP/IP进行传输的标准,该标准为远动信息的网络传输提供了通信协议依据。采用104协议组合101协议的ASDU的方式后,可很好的保证协议的标准化和通信的可靠性。
IEC104协议的报文格式有三种,具体为I帧报文、U帧报文和S帧报文。
I帧报文为数据帧报文,用于传输数据,且内部具有数据类型ID,数据类型ID用于表示其携带的数据的数据类型。其中,数据类型可以通过实际所在的工控系统的需求进行设定,一般数据类型的数量为50种到255种。
U帧报文为控制帧报文,用于控制启动、停止和测试等。
S帧报文为确认帧报文,用于确认接收的I帧报文等。
请参考图1,在本申请的一方面,提供一种报文处理方法,包括以下步骤:
S100,对每一历史会话的历史会话数据集进行第一特征提取处理,得到每一历史会话数据集对应的历史会话向量列表LT=(LT1,LT2,…,LTj,…,LTm),j=1,2,…,m;其中,每一所述历史会话数据集中包括属于同一历史会话的若干S帧报文、U帧报文和I帧报文,每一I帧报文包括其对应的数据类型;m为所述历史会话数据集的数量,LTj为第j个历史会话数据集对应的历史会话向量,LTj=(NumSj,NumUj,NumIj,Fj1,Fj2,…,Fji,…,Fjn),i=1,2,…,n;NumSj为第j个历史会话数据集中S帧报文的数量,NumUj为第j个历史会话数据集中U帧报文的数量,NumIj为第j个历史会话数据集中I帧报文的数量,n为预设的数据类型的数量,Fji为第j个历史会话数据集的第i种数据类型的类型标识,若Fji=1,表示第j个历史会话数据集中包含第i种数据类型的I帧报文,若Fji=2,表示第j个历史会话数据集中不包含第i种数据类型的I帧报文。
其中,一次历史会话指IEC104协议中的一次会话,即一次长连接或多个长连接组成的一次完整通讯过程。具体的可参考IEC104协议中对session会话的定义。I帧报文中可以具有对应的typeID字段,用于记录对应的数据类型ID,从而可以通过数据类型ID确定该I帧报文对应的数据类型。
本实施例中,历史会话向量能够体现出对应的历史会话数据集中各类型帧报文的特征,从而可以用于后续确定每一特征维度的相关度。
具体的,第一特征提取处理,可以是对对应的会话数据集(如历史会话数据集)中每一报文进行遍历,确定每一报文的帧类型,从而确定出S帧报文的数量、U帧报文的数量和I帧报文的数量。以及,针对I帧报文,获取其typeID字段中的数据类型ID,从而确定出每一I帧报文对应的数据类型,以确定出Fj1,Fj2,…,Fji,…,Fjn的具体特征值。
S200,根据LT,获取相关度列表集XG=(XG1,XG2,…,XGy,…,XGx),y=1,2,…,x;XGy=(XGy1,XGy2,…,XGyq,…,XGyp),q=1,2,…,p;其中,x为XG中相关度列表的数量,x=n+3,XGy为每一历史会话向量列表中第y个特征维度对应的相关度列表;p为每一相关度列表中相关度的数量,p=n+3;XGyq为每一历史会话向量列表中第y个特征维度和第q个特征维度之间的相关度,XGyq符合以下条件:
Figure BDA0004077699330000041
其中,Ky为第y个特征维度对应的特征值列表,Ky=(Ky1,Ky2,…,Kyj,…,Kym),Kyj为第j个历史会话向量中第y个特征维度的特征值;Kq为第q个特征维度对应的特征值列表,Kq=(Kq1,Kq2,…,Kqj,…,Kqm);Kqj为第j个历史会话向量中第q个特征维度的特征值,avg()为预设的均值确定函数。
S300,根据XG,获取特征权重列表W=(W1,W2,…,Wy,…,Wx);其中,Wy为根据XGy得到的第y个特征维度对应的特征权重。
S400,对待处理会话的待处理会话数据集进行第一特征提取处理,得到所述待处理会话的待处理会话向量A。A=(NumS,NumU,NumI,F1,F2,…,Fi,…,Fn);其中,NumS为所述待处理会话数据集中S帧报文的数量,NumU为所述待处理会话数据集中U帧报文的数量,NumI为所述待处理会话数据集中I帧报文的数量,Fi为第i种数据类型的类型标识。
S500,根据W确定A对应的会话特征值VA,以根据VA确定所述待处理会话是否为异常会话。
本实施例中,通过待处理会话数据集进行第一特征提取处理得到待处理会话向量A,A中包含了待处理会话数据集中U帧报文数量、I帧报文的数量、S帧报文的数量以及每一数据类型的I帧报文的数量,使得A可以体现出待处理会话中的报文的特征。通过对历史会话数据集和待处理会话数据集进行相同的第一特征提取,使得提取到的历史会话向量与待处理会话向量A的向量形式相同。如向量的特征维度数量均为n+3,且相同特征维度的特征值表示的含义相同。
本实施例提供的报文处理方法,通过历史会话数据集进行第一特征提取处理得到每一历史会话数据集的历史会话向量,历史会话向量中包含了对应的历史会话数据集中U帧报文数量、I帧报文的数量、S帧报文的数量以及每一数据类型的I帧报文的数量,使得历史会话向量可以体现出对应的历史会话中的报文的特征。经研究发现,在工控系统中,由于大量的通讯工作都是重复性的,故而各个通讯环节中其报文特征相对较为统一。
故而,本实施例中,通过确定历史会话向量中任意两个特征维度之间的相关度,其中,若相关度为正数,则说明对应的两个特征维度之间正相关,若相关度为0,则说明对应的两个特征维度之间不具有相关关系,若相关度为负数,则说明对应的两个特征维度之间负相关。且相关度的绝对值的数值越大,则标识相关度越大。如此,根据每一特征维度与其他所有特征维度之间的相关性,即可确定出每一特征维度对应的特征权重。且本实施例中,相同的两个特征维度之间的相关度设置为0,以避免自身与自身的相关度影响确定出的特征权重的准确性。
最终,本实施例通过A与W确定出A对应的会话特征值VA,使得可以通过VA的大小确定待处理回话是否为异常会话,从而实现了根据会话对应的报文确定出会话是否为异常会话。
在本申请的一种示例性实施例中,所述步骤S300,包括:
S310,遍历XGy,若y≠q,则将|XGyq|作为中间权重,以得到中间权重列表集ZW=(ZW1,ZW2,…,ZWy,…,ZWx),ZWy=(ZWy1,ZWy2,…,ZWyh,…,ZWyH),h=1,2,…,H,H=n+2;其中,ZWy为XGy对应的中间权重列表,ZWyh为ZWy中第h个中间权重。
S320,根据ZW,获取W=(W1,W2,…,Wy,…,Wx);Wy符合以下条件:
Figure BDA0004077699330000061
其中,max()为预设的最大值确定函数,min()为预设的最小值确定函数。
由于本申请中的相关度具有正值和负值,若直接将同一特征维度对应的所有相关度的均值确定为特征权重,会发生相互抵消的情况,导致特征权重的值偏小,从而影响后续处理的准确性。故而,本实施例中,通过步骤S310,将所有的相关度转换为正数的中间权重,且将自身与自身的相关度去除,然后通过
Figure BDA0004077699330000062
使得确定出的特征权重最终归一化为0到1之间的正数,从而用于后续的处理计算,且避免了正值的相关度与负值的相关度之间的相互抵消。
在本申请的一种示例性实施例中,所述步骤S500,包括:
S510,获取VA=W1*NumS+W2*NumU+W3*NumI+W4*F1+W5*F2+…+W(i+3)*Fi+…+Wx*Fn。
S520,若|BT1-VA|<|BT2-VA|,则将所述待处理会话确定为正常会话,否则,将所述待处理会话确定为异常会话;其中,BT1为标准正常会话特征值,BT2为标准异常会话特征值。
BT1和BT2通过以下步骤得到:
S501,从若干历史会话数据集中确定出若干历史正常会话数据集和若干历史异常会话数据集。
具体的,历史会话数据集可以通过所在的工控系统的日志进行获取。日志中记录了历史中每一会话的报文的相关数据。进一步的,其中历史正常会话数据集和历史异常会话数据集,可以是工作人员对对应的会话数据集进行标记确定的。同时,历史异常会话数据集也可以是工作人员工作进行对工控系统的模拟攻击从而获取的。
S502,对每一历史正常会话数据集和每一历史异常会话数据集进行第一特征提取处理,得到若干历史正常会话向量和若干历史异常会话向量。
S503,根据W确定每一历史正常会话向量的历史正常会话特征值。
S504,根据每一历史正常会话特征值确定BT1。
所述步骤S504,包括:
S5041,将若干历史正常会话特征值的均值确定为BT1。
S505,根据W确定每一历史异常会话向量的历史异常会话特征值。
所述步骤S505,包括:
S5051,将若干历史异常会话特征值的均值确定为BT2。
S506,根据每一历史异常会话特征值确定BT2。
本实施例中,构建上述的待处理会话向量A,使得可以通过W和A,确定目标会话特征值VA时,能够考虑到不同的会话中不同类型的报文的数量和同一会话中包含哪些数据类型之间对应的相关性,从而输出能够体现待处理会话的会话特征的VA。
同时,标准正常会话特征值BT1以及标准异常会话特征值BT2是根据历史正常会话向量对应的特征值和历史异常会话向量对应的特征值得到的,故而,BT1和BT2可以理解为所有历史正常会话向量和历史异常会话向量的特征值重心,因此本实施例通过比较|BT1-VA|与|BT2-VA|之间的大小可以确定出待处理会话是否为异常会话,从而实现了根据会话对应的报文确定出会话是否为异常会话。
在本申请的一种示例性实施例中,在所述步骤S500之后,所述方法还包括:
S600,若所述待处理会话为正常会话,则使用所述待处理会话数据集替换所述若干历史正常会话数据集中的任一历史正常会话数据集。
S610,使用替换后的若干历史正常会话数据集更新BT1。
S700,若所述待处理会话为异常会话,则将所述待处理会话数据集添加至所述若干历史正常会话数据集中。
S710,使用添加后的若干历史异常会话数据集更新BT2。
其中,更新BT1和更新BT2,可以理解为对修改后的若干会话数据集进行步骤S502-S506。
周知的,获取正常数据的难度要远小于获取异常数据的难度,故而在实际实施中,获取到的历史异常会话数据集的数量会远小于历史正常会话数据集的数量。这也会导致起始阶段得到的BT2不够精准。故而,本申请中,在待处理会话为正常会话时,仅会替换若干历史正常会话数据集中任一历史正常会话数据集,并根据替换后的历史正常会话数据集更新BT1,从而维持历史正常会话数据集的数量不变,并在待处理会话为异常会话时,将待处理会话数据集作为历史异常会话数据集添加进若干历史异常会话数据集内,并根据添加后的历史异常会话数据集更新BT2,以使得用于确定BT2的历史异常会话数据集的数量不断增加,使得历史正常会话数据集的数量和历史异常会话数据集的数量逐渐趋同,从而提高了对待处理会话的识别结果的准确性。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
根据本申请的这种实施方式的电子设备。电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:上述至少一个处理器、上述至少一个储存器、连接不同系统组件(包括储存器和处理器)的总线。
其中,所述储存器存储有程序代码,所述程序代码可以被所述处理器执行,使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
储存器可以包括易失性储存器形式的可读介质,例如随机存取储存器(RAM)和/或高速缓存储存器,还可以进一步包括只读储存器(ROM)。
储存器还可以包括具有一组(至少一个)程序模块的程序/实用工具,这样的程序模块包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线可以为表示几类总线结构中的一种或多种,包括储存器总线或者储存器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
电子设备也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口进行。并且,电子设备还可以通过网络适配器与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器通过总线与电子设备的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本申请的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本申请示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种报文处理方法,其特征在于,包括:
S100,对每一历史会话的历史会话数据集进行第一特征提取处理,得到每一历史会话数据集对应的历史会话向量列表LT=(LT1,LT2,…,LTj,…,LTm),j=1,2,…,m;其中,每一所述历史会话数据集中包括属于同一历史会话的若干S帧报文、U帧报文和I帧报文,每一I帧报文包括其对应的数据类型;m为所述历史会话数据集的数量,LTj为第j个历史会话数据集对应的历史会话向量,LTj=(NumSj,NumUj,NumIj,Fj1,Fj2,…,Fji,…,Fjn),i=1,2,…,n;NumSj为第j个历史会话数据集中S帧报文的数量,NumUj为第j个历史会话数据集中U帧报文的数量,NumIj为第j个历史会话数据集中I帧报文的数量,n为预设的数据类型的数量,Fji为第j个历史会话数据集的第i种数据类型的类型标识,若Fji=1,表示第j个历史会话数据集中包含第i种数据类型的I帧报文,若Fji=2,表示第j个历史会话数据集中不包含第i种数据类型的I帧报文;
S200,根据LT,获取相关度列表集XG=(XG1,XG2,…,XGy,…,XGx),y=1,2,…,x;XGy=(XGy1,XGy2,…,XGyq,…,XGyp),q=1,2,…,p;其中,x为XG中相关度列表的数量,x=n+3,XGy为每一历史会话向量列表中第y个特征维度对应的相关度列表;p为每一相关度列表中相关度的数量,p=n+3;XGyq为每一历史会话向量列表中第y个特征维度和第q个特征维度之间的相关度,XGyq符合以下条件:
Figure FDA0004077699320000011
其中,Ky为第y个特征维度对应的特征值列表,Ky=(Ky1,Ky2,…,Kyj,…,Kym),Kyj为第j个历史会话向量中第y个特征维度的特征值;Kq为第q个特征维度对应的特征值列表,Kq=(Kq1,Kq2,…,Kqj,…,Kqm);Kqj为第j个历史会话向量中第q个特征维度的特征值,avg()为预设的均值确定函数;
S300,根据XG,获取特征权重列表W=(W1,W2,…,Wy,…,Wx);其中,Wy为根据XGy得到的第y个特征维度对应的特征权重;
S400,对待处理会话的待处理会话数据集进行第一特征提取处理,得到所述待处理会话的待处理会话向量A;
S500,根据W确定A对应的会话特征值VA,以根据VA确定所述待处理会话是否为异常会话。
2.根据权利要求1所述的报文处理方法,其特征在于,所述步骤S300,包括:
S310,遍历XGy,若y≠q,则将|XGyq|作为中间权重,以得到中间权重列表集ZW=(ZW1,ZW2,…,ZWy,…,ZWx),ZWy=(ZWy1,ZWy2,…,ZWyh,…,ZWyH),h=1,2,…,H,H=n+2;其中,ZWy为XGy对应的中间权重列表,ZWyh为ZWy中第h个中间权重;
S320,根据ZW,获取W=(W1,W2,…,Wy,…,Wx);Wy符合以下条件:
Figure FDA0004077699320000021
其中,max()为预设的最大值确定函数,min()为预设的最小值确定函数。
3.根据权利要求1所述的报文处理方法,其特征在于,A=(NumS,NumU,NumI,F1,F2,…,Fi,…,Fn);其中,NumS为所述待处理会话数据集中S帧报文的数量,NumU为所述待处理会话数据集中U帧报文的数量,NumI为所述待处理会话数据集中I帧报文的数量,Fi为第i种数据类型的类型标识;
所述步骤S500,包括:
S510,获取VA=W1*NumS+W2*NumU+W3*NumI+W4*F1+W5*F2+…+W(i+3)*Fi+…+Wx*Fn;
S520,若|BT1-VA|<|BT2-VA|,则将所述待处理会话确定为正常会话,否则,将所述待处理会话确定为异常会话;其中,BT1为标准正常会话特征值,BT2为标准异常会话特征值。
4.根据权利要求3所述的报文处理方法,其特征在于,BT1和BT2通过以下步骤得到:
S501,从若干历史会话数据集中确定出若干历史正常会话数据集和若干历史异常会话数据集;
S502,对每一历史正常会话数据集和每一历史异常会话数据集进行第一特征提取处理,得到若干历史正常会话向量和若干历史异常会话向量;
S503,根据W确定每一历史正常会话向量的历史正常会话特征值;
S504,根据每一历史正常会话特征值确定BT1;
S505,根据W确定每一历史异常会话向量的历史异常会话特征值;
S506,根据每一历史异常会话特征值确定BT2。
5.根据权利要求4所述的报文处理方法,其特征在于,所述步骤S504,包括:
S5041,将若干历史正常会话特征值的均值确定为BT1;
所述步骤S505,包括:
S5051,将若干历史异常会话特征值的均值确定为BT2。
6.根据权利要求5所述的报文处理方法,其特征在于,在所述步骤S500之后,所述方法还包括:
S600,若所述待处理会话为正常会话,则使用所述待处理会话数据集替换所述若干历史正常会话数据集中的任一历史正常会话数据集;
S610,使用替换后的若干历史正常会话数据集更新BT1。
7.根据权利要求6所述的报文处理方法,其特征在于,在所述步骤S500之后,所述方法还包括:
S700,若所述待处理会话为异常会话,则将所述待处理会话数据集添加至所述若干历史正常会话数据集中;
S710,使用添加后的若干历史异常会话数据集更新BT2。
8.一种电子设备,其特征在于,包括处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如权利要求1至7任一项所述方法的步骤。
9.一种非瞬时性计算机可读存储介质,其特征在于,所述非瞬时性计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如权利要求1至7任一项所述方法的步骤。
CN202310113356.5A 2023-02-13 2023-02-13 一种报文处理方法、电子设备及存储介质 Active CN116112263B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310113356.5A CN116112263B (zh) 2023-02-13 2023-02-13 一种报文处理方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310113356.5A CN116112263B (zh) 2023-02-13 2023-02-13 一种报文处理方法、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN116112263A true CN116112263A (zh) 2023-05-12
CN116112263B CN116112263B (zh) 2023-10-27

Family

ID=86259512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310113356.5A Active CN116112263B (zh) 2023-02-13 2023-02-13 一种报文处理方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116112263B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016106592A1 (zh) * 2014-12-30 2016-07-07 华为技术有限公司 一种特征信息分析方法及装置
CN109167762A (zh) * 2018-08-14 2019-01-08 杭州迪普科技股份有限公司 一种iec104报文校验方法及装置
CN113612814A (zh) * 2021-06-28 2021-11-05 深圳震有科技股份有限公司 一种会话信息的筛选方法、装置、终端及存储介质
WO2021243663A1 (zh) * 2020-06-04 2021-12-09 深圳市欢太科技有限公司 一种会话检测方法、装置、检测设备及计算机存储介质
CN114997629A (zh) * 2022-05-25 2022-09-02 北京明略昭辉科技有限公司 用户会话的异常监测方法、装置、电子设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016106592A1 (zh) * 2014-12-30 2016-07-07 华为技术有限公司 一种特征信息分析方法及装置
CN109167762A (zh) * 2018-08-14 2019-01-08 杭州迪普科技股份有限公司 一种iec104报文校验方法及装置
WO2021243663A1 (zh) * 2020-06-04 2021-12-09 深圳市欢太科技有限公司 一种会话检测方法、装置、检测设备及计算机存储介质
CN113612814A (zh) * 2021-06-28 2021-11-05 深圳震有科技股份有限公司 一种会话信息的筛选方法、装置、终端及存储介质
CN114997629A (zh) * 2022-05-25 2022-09-02 北京明略昭辉科技有限公司 用户会话的异常监测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN116112263B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
CN116112271B (zh) 一种会话数据处理方法、电子设备及存储介质
CN109714230B (zh) 一种流量监控方法、装置和计算设备
CN114448830B (zh) 一种设备检测系统及方法
CN111277602A (zh) 网络数据包的识别处理方法、装置、电子设备及存储介质
CN114726633B (zh) 流量数据处理方法及装置、存储介质及电子设备
CN116192494B (zh) 一种确定异常数据的方法、电子设备及存储介质
CN116112263B (zh) 一种报文处理方法、电子设备及存储介质
CN114036533A (zh) 日志的传输方法及装置、电子设备和存储介质
CN116318872B (zh) 一种通过报文确定异常会话的方法、电子设备及存储介质
CN116305129A (zh) 一种基于vsto的文档检测方法及装置、设备及介质
CN116112266B (zh) 一种识别会话数据的方法、电子设备及存储介质
CN116112265B (zh) 一种异常会话的确定方法、电子设备及存储介质
CN115987637A (zh) 一种Webshell文件检测方法、装置、设备及存储介质
CN113691310A (zh) 光纤链路的故障监测方法、装置、设备和存储介质
CN117040938B (zh) 一种异常ip检测方法及装置、电子设备及存储介质
CN116781389B (zh) 一种异常数据列表的确定方法、电子设备及存储介质
CN117688342B (zh) 一种基于模型的设备状态预测方法、电子设备及存储介质
CN116760644B (zh) 一种终端异常判定方法、系统、存储介质及电子设备
CN116910756B (zh) 一种恶意pe文件的检测方法
CN116595529B (zh) 一种信息安全检测方法、电子设备及存储介质
CN115576852B (zh) 模糊测试用例的质量评估方法、装置、设备以及存储介质
CN116400988B (zh) 一种目标参数的回传方法、存储介质及电子设备
CN114389855B (zh) 异常网际互联协议ip地址的确定方法及装置
CN116915506B (zh) 一种异常流量检测方法、装置、电子设备及存储介质
CN115600216B (zh) 检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant