WO2023071714A1

WO2023071714A1 - 报文的分段解析方法、装置、设备和存储介质

Info

Publication number: WO2023071714A1
Application number: PCT/CN2022/123455
Authority: WO
Inventors: 谢友玲; 韩一漫; 姜珊
Original assignee: 中移(苏州)软件技术有限公司; 中国移动通信集团有限公司
Priority date: 2021-10-25
Filing date: 2022-09-30
Publication date: 2023-05-04
Also published as: CN116033044A

Abstract

本公开涉及一种报文的分段解析方法、装置、设备和存储介质。本公开通过根据解析配置信息对报文包括的报头进行第n阶段解析得到第n阶段解析结果，当第n阶段解析结果包括的待解析的下一层报头类型不是第n+1阶段解析的报头类型时，跳过对报头的第n+1阶段解，并进入到第n+2阶段解析，当待解析的下一层报头类型是第n+1阶段解析的报头类型时，根据第n阶段解析结果包括的下一阶段的偏移地址对报头进行第n+1阶段解析，以及当完成第N阶段解析或前N-1层协议解析确定跳过第N阶段解析时，停止对报头的本次分段解析。

Description

报文的分段解析方法、装置、设备和存储介质

本公开是基于申请号为：202111242584.X、申请日为2021年10月25的中国在先专利申请提出的，并且要求该中国在先专利申请的优先权，该中国在先专利申请的全部内容在此引入本公开作为参考。

技术领域

本公开涉及网络技术领域但不限于网络技术领域，尤其涉及一种报文的分段解析方法、装置、设备和存储介质。

背景技术

对于多层网络结构，其不同层完成不同功能，每层有众多协议组成。正确解析数据包是数据传输中的重要一环，无论是数据处理还是数据转发都需要解析数据包，获取该数据包相应的报头信息，如MAC(medium access control，介质访问控制)地址、网络协议(Internet Protocol，IP)协议、IP地址等。

目前主流的解析数据包的方法是：根据数据类型，开发特定的解析模块，其中数据格式和数据长度固定，如需处理多类型的数据包需要添加多个解析模块。这类解析方法通用性低，适用于数据复杂度低的应用场景。此外，这类解析方法由于每层所需要处理的数据是包含全部的数据报文，导致所需要处理的数据长度较长，降低了系统的解析速度，对于数据包传输类型不同的通信系统来说并不是很灵活，这将大大降低系统解析的处理速度。

发明内容

本公开实施例提供一种报文的分段解析方法、装置、设备和存储介质。

本公开的技术方案是这样实现的：

第一方面，提供了一种报文的分段解析方法，待解析的报文包括：报头；所述方法包括：

根据解析配置信息，对所述报头进行第n阶段解析得到第n阶段解析结果，其中，当所述n小于N时，所述第n阶段解析结果包括：所述第n阶段解析出的报头信息、所述报文内待解析的下一层报头类型及下一阶段解析的偏移地址；其中，所述N为所述报头的最大解析阶段数；

当所述下一层报头类型不是第n+1阶段解析的报头类型，跳过对所述报头的第n+1阶段解析，并进入到第n+2阶段解析；

当所述下一层报头类型是第n+1阶段解析的报头类型，根据所述偏移地址对所述报头进行第n+1阶段解析；

当完成所述第N阶段解析或前N-1层协议解析确定跳过第N阶段解析时，停止对所述报头的本次分段解析。

第二方面，提供了一种报文的分段解析装置，待解析的报文包括：报头；所述装置包括阶段解析模块；所述阶段解析模块被配置为：

当所述下一层报头类型不是第n+1阶段解析的报头类型，跳过对所述报头的第n+1阶段解，并进入到第n+2阶段解析；

第三方面，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现第一方面任一项所述报文的分段解析方法的步骤。

第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现第一方面任一项所述报文的分段解析方法的步骤。

本公开实施例所提供的报文的分段解析方法、装置、设备和存储介质，通过根据解析配置信息对报文包括的报头进行第n阶段解析得到第n阶段解析结果，当第n阶段解析结果包括的待解析的下一层报头类型不是第n+1阶段解析的报头类型时，跳过对报头的第n+1阶段解析，并进入到第n+2阶段解析，当待解析的下一层报头类型是第n+1阶段解析的报头类型时，根据第n阶段解析结果包括的下一阶段的偏移地址对报头进行第n+1阶段解析，以及当完成第N阶段解析或前N-1层协议解析确定跳过第N阶段解析时，停止对报头的本次分段解析。如此，一方面，不管当前报文携带哪些阶段能够解析的报头，都能够被解析到，故针对携带不同类型报头的报文在不同阶段都可以采用通用解析方式，这样，在分段解析多类型的数据包时，无需添加多个解析模块，只需编写一个解析模块，每个阶段的解析代码都是相同的，由此减少了解析代码的开发量，增加了通用性。另一方面，在没有携带对应阶段的报头时跳过对应阶段，节省不必要阶段报头的解析消耗。又一方面，跳过了不必要解析的报头阶段，能够极大地提高数据解析速度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开实施例。

附图说明

图1为本公开实施例提供的报文的分段解析方法的一个流程示意图；

图2为本公开实施例提供的报文的分段解析方法的另一个流程示意图；

图3为本公开实施例提供的报文的分段解析方法的又一个流程示意图；

图4为本公开实施例提供的报文的分段解析方法的再一个流程示意图；

图5为本公开实施例提供的报文的分段解析方法的再一个流程示意图；

图6为本公开实施例提供的报文的分段解析方法的具体示例流程图；

图7为本公开实施例提供的报文的分段解析装置的一个结构示意图；

图8为图7所示装置中的阶段解析模块的具体结构示意图；

图9为本公开实施例提供的计算机设备的结构示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚明白，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

可以理解的是，本公开对各个实施例的描述着重强调各个实施例之间的不同之处，其相同或相似之处可以相互参考，为了简洁，不再一一赘述。

在网络中传输数据时，数据包包括报头和正文。当数据包到达其目标时，因为该数据包是以每个协议层的对应相反顺序处理和解包的，需要将数据报头解析出来。

主流的数据解析方法时，往往选用数据格式和数据长度固定的解析模块，对数据包的报头信息进行解析。如根据以太网报头、ARP(Address Resolution Protocol，地址解析协议)报头、ICMP(Internet Control Message Protocol，网际控制报文协议)等报头的结构体，分别编写对应的解析模块，这类解析方式通用性低，适用于数据复杂度低的应用场景。

另外，根据开放式系统互联七层结构由低到高的顺序，依次对网络数据报文的头部字段中与每层对应协议的数据包头执行分层解析步骤，能够达到通用化的目的。但随着VXLAN(virtual extensible local area network，虚拟扩展局域网)等重叠隧道协议、OpenFlow(开放流)、虚拟化开放流交换机(Open vSwitch，OVS)等虚拟交换技术和QinQ技术的引入，使得网络中数据平面的复杂性急剧增加，解析的复杂度和升级难度上升，这种解析的方法，已经无法满足这些复杂应用场景的数据报头解析。例如QinQ技术基于以太网协议，会有多个VLAN TAG(虚拟局域网标签)，这种解析方法则无法根据协议类型进一步解析。

此外，由于上述解析方法每层所需要处理的数据是包含全部的数据报文，每个阶段所需要处理的数据长度较长，降低了系统的解析速度，对于数据包传输类型不同的通信系统来说并不是很灵活，这将大大降低系统解析的处理速度。

为此，本公开实施例提供了一种报文的分段解析方法，参阅图1所示，该报文的分段解析方法可以包括：

101，根据解析配置信息，对报文包括的报头进行第n阶段解析得到第n阶段解析结果，其中，当n小于N时，第n阶段解析结果包括：第n阶段解析出的报头信息、报文内待解析的下一层报头类型及下一阶段解析的偏移地址；其中，N为报头的最大解析阶段数。

第n阶段用于对应解析网络分层架构中的第n层的协议报头。根据网络分层架构，可以对报文依次由外到内进行分阶段解析。每个阶段能够解析多种协议报头。网络分层架构的分层方式包括OSI(Open System Interconnect，开放式系统互联)七层模型和TCP/IP(Transmission Control Protocol/Internet Protocol，传输控制协议/网际协议)四层模型。

每一阶段分别预先配置有对应的解析配置信息，解析配置信息也称为阶段预设信息。各个阶段的解析配置信息保存在阶段预设信息表中。第n阶段的解析配置信息，用于对报文包括的报头进行第n阶段解析得到第n阶段解析结果。

下一层报头类型是指下一层报头的协议类型。这里，需要说明的是，第n阶段解析结果包括的报文内待解析的下一层报头类型，是指报文内的第n+1层至第N层中的任意一层的报头类型。例如，当下一层报头类型是第n+2层能够解析的报头类型时，报文进入第n+1阶段后不做处理，直接流转到第n+2阶段解析。

下一阶段的偏移地址是指下一阶段的报头偏移量，用于指向数据包中的下一层协议报头的起始位置。

可以理解的是，第n阶段解析结果除了包括报文内待解析的下一层报头类型及下一阶段解析的偏移地址之外，还包括第n层的报头信息及关键信息，比如针对以太网报头，其关键信息包括源MAC地址和目的MAC地址，等等。

需要说明的是，每当一个阶段完成解析，会将该阶段的阶段解析结果，例如获取的报头信息以及关键信息存储到相应的位置，然后跳转到下一个阶段。

102，当下一层报头类型不是第n+1阶段解析的报头类型，跳过对报头的第n+1阶段解析，并进入到第n+2阶段解析。

在一些示例中，当下一层报头类型未包含在第n+1阶段的阶段预设信息中，确定下一层报头类型不是第n+1阶段解析的报头类型。

103，当下一层报头类型是第n+1阶段解析的报头类型，根据偏移地址对报头进行第n+1阶段解析。

在一些示例中，当下一层报头类型包含在第n+1阶段的预设信息表中，确定下一层报头类型是第n+1阶段解析的报头类型。

104，当完成第N阶段解析或前N-1层协议解析确定跳过第N阶段解析时，停止对报头的本次分段解析。

本公开实施例所提供的报文的分段解析方法，当报头的第n阶段解析结果包括的待解析的下一层报头类型不是第n+1阶段解析的报头类型时，跳过对报头的第n+1阶段解析，并进入到第n+2阶段解析。

本公开实施例中的一个阶段解析可以对应于数据包的网络传输的一层协议的解析。

若报文是按照TCP/IP协议传输的，则该报文最多可能包含4层协议，分别是应用层协议、传输层协议、网络层协议和数据链路层协议。此时，所述N可等于4，即一个阶段对应于一个层的报头解析。

一个层可能包括多种不同的协议，则携带在报头中的报头类型就不同。例如，以传输层为例，该层对应的报头类型可包括但不限于：TCP报头和UDP(User Datagram Protocol，用户数据报协议)报头。以网络层为例，该层对应的包头类型可包括但不限于：ICMP报头、ARP报头、RARP(Reverse Address Resolution Protocol，反向地址转换协议)报头。

当待解析的下一层报头类型是第n+1阶段解析的报头类型时，根据第n阶段解析结果包括的下一阶段的偏移地址对报头进行第n+1阶段解析，以及当完成第N阶段解析或前N-1层协议解析确定跳过第N阶段解析时，停止对报头的本次分段解析，如此，不管当前报文携带哪些阶段能够解析的报头，都能够被解析到，故针对携带不同类型报头的报文，每个阶段能够以统一的解析方式对报文进行解析，这样，在分段解析多类型的数据包时，无需添加多个解析模块，只需编写一个解析模块，每个阶段的解析代码都是相同的，由此减少了代码开发量，增加了通用性，实现了通用化的数据解析，大大节省了系统的逻辑资源。另外，由于无需在每个阶段处理报文包含的全部数据，因此能够极大地提高数据报文的解析速度。

在一个实施例中，解析配置信息包括：字段解析信息及阶段流转信息。

第n阶段的解析配置信息包括：第n阶段的字段解析信息及阶段流转信息。

第n阶段的字段解析信息包括：第n阶段能够解析的报头类型及各个报头类型对应的报头域字段。

阶段流转信息包括：报文内待解析的下一层报头类型及下一阶段的偏移地址。阶段流转信息与报头域字段具有对应关系。

可以理解的是，解析配置信息还可以包括其他配置信息，例如报头结构体。

本实施例中，可以将每个阶段的解析配置信息包括的报头类型、每种报头类型对应的报头域字段以及阶段流转信息表都封装成函数，这样使得用户可以结合应用场景，调用上层软件对解析的报头类型和解析的阶段数进行修改，实现可配置化，方便升级迭代满足不同的应用的报文解析需求。

如图2所示，上述步骤101中，根据解析配置信息，对报头进行第n阶段解析得到第n阶段解析结果，可以包括：

201，根据第n阶段的字段解析信息以及第n阶段待解析的报头类型，对报头进行报头域字段解析；其中，报头域字段包括：帧类型、报头长度、报头编号和/或掩码。

其中，网络传输数据是按帧进行传输的，不同的帧类型用于指示不同的协议类型在网络传输数据所使用的具体格式，不同的帧类型的偏移量不同。

报头长度是指协议长度，例如，以太网报头长度为14字节，IPv4(Internet Protocol version 4，互联网协议第4版)报头长度为20字节。报头编号用于唯一标识报头类型。

掩码(Mask)用于指示报头的域(Field)需要保留的位和/或需要清除的位。

可以理解的是，在实际应用时，报头域字段中可以仅包括帧类型和掩码。

在一个示例中，不同报头类型对应的预设报头域字段保存在预设的报头域字段表中，预设的报头域字段表可以参见如下表1所示。

表1：预设的报头域字段表

在表1所示的报头域字段表中包含每个协议类型可能包含的帧类型，这样针对QinQ技术，报文带有两层VLAN Tag的二层隧道协议的应用场景，可以在报头域字段的每个协议类型下设置多个帧类型，不同帧类型的偏移量不同。

本实施例中，由于预设的报头域字段中包含不同协议类型可能包含的帧类型，如此，针对QinQ的多个VLAN TAG的特性，可以通过在预设的报头域字段中设置多个帧类型字段，能够获取每个VLAN报头，这样利用帧类型能够更细化数据类型的解析，从而更加准确地进行后续解析，能够满足使用QinQ等技术的复杂应用场景的数据报头解析。

在一些示例中，在步骤201中，根据第n阶段的字段解析信息中的各个报头类型对应的报头域字段，对报头进行解析获得待解析的报头类型对应的报头域字段。

202，根据报头域字段查询第n阶段的阶段流转信息，确定待解析的下一层报头类型和下一阶段解析的偏移地址。

在一个示例中，各个阶段的阶段流转信息保存在预设的阶段流转信息表中。预设的阶段流转信息表可如下表2所示但不限于表2所示。

表2：预设的阶段流转信息表

如表2所示的阶段流转信息表中包括不同报头类型的下一层报头类型、下一个阶段的偏移地址，此外还可以包括当前数据段是否解析完成的动作标志位，动作标志位置为1表示当前数据段解析完成，动作标志位置为0表示当前数据段解析未完成。这样在获得报头域字段后，可以通过在预设的阶段流转信息表中查找该报头域字段对应的阶段流转信息，获取待解析的下一层报头类型、下一个阶段的偏移地址和当前数据段是否解析完成的动作标志位。

在一个实施例中，如图3所示，上述步骤103中，根据偏移地址对报头进行第n+1阶段解析，可以包括：

301，在进行第n+1阶段解析时，将报头包含的待解析的报头域字段与第n+1阶段的报头域字段表匹配。

302，若报头包含的待解析的报头域字段为包含在第n+1阶段的报头域字段表的有效字段，则解析报头包含的待解析的报头域字段的内容。

本实施例中，在进行第n+1阶段解析时，可以将报头包含的待解析的报头域字段与预设的报头域字段表作对比，确定待解析的报头域字段是否与该报头域字段表中的某一行字段相符，若相符，则确定待解析的报头域字段为有效字段，否则确定待解析的报头域字段为无效字段。当报头包含的待解析的报头域字段为有效字段，则继续对报头进行解析出待解析的报头域字段的内容。

在一个实施例中，继续参见图3所示，方法还可以包括：

303，若报头包含的待解析的报头域字段为不包含在第n+1阶段的报头域字段表的无效字段，则停止第n+1阶段的解析。

本实施例中，当确定报头包含的待解析的报头域字段为无效字段时，则停止第n+1阶段的解析，并直接跳转到第n+2阶段进行判断。

在一个实施例中，如图4所示，方法还可以包括：

401，当接收的数据包大于分段解析的可处理报长时，将数据包按照预设长度划分为多个数据段。

可处理报长可以是不同报头类型对应的报头长度中的最大长度。这里，可处理报长取值为64字节，但本公开实施例中并不限于此。

这里，预设长度可以根据实际应用进行设定，例如将预设长度设定为与可处理报长相同的长度。

402，从第1个数据段开始进行报头的分段解析。

在一些示例中，从第1个数据段开始，执行步骤101至步骤104进行报头的分段解析，当第1个数据段解析完成，继续对第2个数据段进行报头的分段解析，依此类推，直至完成所有数据段的报头解析。

403，拼接多个数据段的分段解析的解析结果，得到报头的解析结果。

在一些示例中，当该数据包所有数据段都依次完成分阶段解析后，可对各个数据段的分段解析的解析结果拼接，最终获得该数据包的报头解析结果。

本公开实施例中，按照分段解析的可处理报长，将数据包分成多个固定长度的数据段，每个数据段依次进行分阶段解析，如此能够应对复杂的协议长度不定的数据包，并进一步地加快了数据解析的速度。

在一个实施例中，上述步骤103中，当下一层报头类型是第n+1阶段解析的报头类型，根据偏移地址对报头进行第n+1阶段解析，可以包括：

在本数据段进行第n+1阶段解析时，若根据下一阶段解析的偏移地址、下一层报头类型的报头长度和第n+1阶段的字段解析信息指示的解析长度，确定出待解析的字段部分位于下一个数据段时，结合本数据段及下一数据段进行第n+1阶段解析。

在一些示例中，在本数据段进行第n+1阶段解析时，根据下一层报头类型的报头长度与报头偏移量的和值是否大于第n+1阶段的字段解析信息指示的解析长度，确定待解析的字段是否部分位于下一个数据段，当待解析的字段部分位于下一个数据段，可以确定待解析的报头跨越本数据段和下一个数据段。

当下一层报头类型的报头长度与报头偏移量的和值大于第n+1阶段的字段解析信息指示的解析长度时，确定待解析的字段部分位于下一个数据段，也即是，确定待解析的报头信息被分割到本数据段及下一个数据段。

当下一层报头类型的报头长度与报头偏移量的和值小于或等于第n+1阶段的字段解析信息指示的解析长度，确定出待解析的字段全部位于下一个数据段。

由于数据分段，可能一个阶段待解析的报头会分别位于不同的数据段，此时就存在该阶段报头解析的跨段解析。

在一个实施例中，如图5所示，上述步骤中，结合本数据段及下一数据段进行第n+1阶段解析，可以包括：

501，根据偏移地址对本数据段进行第n+1阶段解析，得到指示第n+1阶段解析结果的第一部分字段，并确定第n+1阶段未完成解析。

502，在下一个数据段进入未完成解析的第n+1阶段后，根据第一部分字段的长度以及下一层报头类型的报头长度，继续对下一个数据段进行第n+1阶段解析，得到指示第n+1阶段解析结果的第二部分字段。

在一些示例中，根据下一层报头类型的报头长度与第一部分字段的长度之间的差值，继续对下一个数据段进行第n+1阶段解析，得到第二部分字段。

503，将第二部分字段拼接到第一部分字段的后面，得到第n+1阶段解析结果。

在一些示例中，将第一部分字段向左偏移，第二部分字段向右偏移，并将右偏移后的第二部分字段拼接到向左偏移后的第一部分字段的后面，得到完整的报头解析结果。

本实施例中，由于待解析的报头信息被分割到本数据段及下一个数据段，通过先对本数据段进行第n+1阶段解析，得到第一部分字段，然后在下一个数据段进入未完成解析的第n+1阶段后，对下一个数据段进行第n+1阶段解析，得到第二部分字段，再将第二部分字段拼接到第一部分字段之后，如此能够获取到完整的第n+1阶段解析结果。

在本数据段进行第n+1阶段解析时，若根据下一阶段解析的偏移地址、下一层报头类型的报头长度和第n+1阶段的字段解析信息指示的解析长度，确定出待解析的字段全部位于本数据段时，对本数据段进行第n+1阶段解析，得到第n+1阶段解析结果。

本实施例中，当确定出待解析的字段全部位于本数据段，只需对本数据段进行第n+1阶段解析，即可获取到完整的第n+1阶段解析结果。

综上，本公开实施例中，将数据包分段处理后，会存在报头被切割的情况，通过根据待解析的下一层报长类型对应的报头长度加上报头偏移量获得偏移后的长度，报头偏移后的长度如果大于数据段的长度，则该阶段的报头跨越了两个数据段，需要结合下一个数据段提取报头，没有跨越则直接根据报头偏移量从当前数据段提取报头。

下面，将结合相关具体示例说明本公开实施例提供的报文的分段解析方法。

参见图6所示，图6为本公开实施例提供的报文的分段解析方法的一个具体示例流程图。该方法可以包括如下步骤：

1、在本数据段进行第n+1阶段解析时，获取第n阶段解析结果中的待解析的下一层报头类型、报头偏移量及上个阶段是否解析完成的标志位。

第n阶段的标志位指示第n阶段完成了解析，即第n阶段操作是Prev_Stg_Done，那么第n+1阶段需要开始解析。若第n阶段操作是等待(Wait)，在这种情况下，第n+1阶段需要等待，或者如果第n阶段操作是空操作指令(NO Operation，NOP)，那么第n+1阶段不需要做任何事情，只需要发送数据包而不进行任何解析。

2、校验该报头类型是否属于第n+1阶段解析的报头类型，若是，则执行步骤3，否则，进入第n+2阶段的报头解析。

每个阶段都会预设多种可解析的报头类型，并给报头类型都设置了编号，可以通过校验报头类型的编号是否为第n+1阶段解析的报头类型，来判断是否在第n+1阶段进行解析操作，如果该编号不是第n+1阶段解析的报头类型，则不做处理直接流转到下一个阶段。

3、计算该报头类型的报头长度。

每种报头类型预设有对应的报头长度，根据输入的报头类型获得该报头类型的报头长度。

4、结合报头类型的报头长度及报头偏移量，判断报头类型是否跨越数据段。若为是，则执行步骤5，否则执行步骤6。

5、根据报头偏移量并结合当前数据段和下个数据段提取报头。

6、根据报头偏移量从当前数据段中提取报头。

7、根据报头类型和提取的报头获取报头域字段。

8、校验该报头域字段是否与预设的报头域字段表相符合，相符合，则执行步骤9，否则丢弃无效报头。

9、根据报头域字段找到对应的第n+2阶段的阶段信息表。

在获得有效的报头域字段后，查找对应的阶段流转信息表，获取下个阶段的报头类型、报头偏移量和当前数据段是否解析完成的标志位。

下面，将继续结合具体示例说明本公开实施例提供的报文的分段解析方法。

假设每个阶段解析的数据长度为64字节，以一个数据包穿越以太网、IPv4层协议和TCP层协议为例，由外到内的层层解析数据包。以太网层可能只经过以太网、也可能穿越一个VLAN或者两个VLAN，网络层可能包括ARP、IPv4和IPv6(Internet Protocol version 6，互联网协议第6版)协议，传输层可能包括ICMP、UDP、TCP和GRE(Generic Routing Encapsulation，通用路由封装)协议。阶段预设信息表中对这些协议都有不同的解析配置信息，以太网层解析的目的是获得源MAC地址和目的MAC地址，网络层的报头解析是为了获得源IP地址和目的IP地址，传输层的报头解析是为了获得源端口号和目的端口号。

一、第1阶段的报头解析

将数据包进入第1阶段，并初始化输入第1阶段的报头类型是以太网，报头偏移量为0和上一个阶段是否解析完成的标志位为1。具体的对应于该数据包所包含的以太网协议，阶段预设信息表中的内容设置如下表3所示。

表3：第1阶段的阶段预设信息

阶段	报头类型	报头长度	编号	报头域字段表	阶段流转信息表
第1阶段	以太网	14	0	如下表4所示	如下表5所示

表4：以太网报头的报头域字段

报头类型	帧类型[0]	掩码[0]	帧类型[0]	掩码[0]	帧类型[0]	掩码[0]
以太网	以太网0	16'hffff	0	0	0	0

表5：以太网报头的阶段流转信息

报头类型	动作标志位	下一个阶段报头类型	下一个阶段报头偏移量
以太网	1	IPv4	14

其中，以太网报头的报头结构体如下表6所示。

表6：预设的以太网报头的结构体

经过第1阶段的报头解析后获得该数据包的以太网报头，然后根据以太网报头的结构体获得对应的以太网帧类型、源mac地址和目的mac地址。其中根据报头偏移量0字节和以太网报头的长度之和为14字节，小于64字节的数据包长度，判断该报头未跨越数据段，所以当以太网报头解析完成后，将第1阶段的动作标志位置1。在并向下一个阶段输入报头类型是IPv4，报头偏移量为14和上一个阶段是否解析完成的标志位为1。

二、第2阶段的报头解析

本阶段将解析IP报头，具体对应于该数据包所包含的IP协议，阶段预设信息表中的内容设置如下表7所示。

表7：第2阶段的阶段预设信息

阶段	报头类型	报头长度	编号	报头域字段表	阶段流转信息表
第2阶段	IPv4	20	1	如下表8所示	如下表9所示

表8：IPv4报头的报头域字段

报头类型	帧类型[0]	掩码[0]	帧类型[0]	掩码[0]	帧类型[0]	掩码[0]
IPv4	IPv40	16'h00ff	0	0	0	0

表9：IPv4报头的阶段流转信息

报头类型	动作标志位	下一层报头类型	下一个阶段报头偏移量
IPv4	1	TCP	34

其中，IPv4报头的报头结构体如下表10所示。

表10：预设的IPv4报头的结构体

经过第2阶段的报头解析后获得该数据包的IPv4报头，然后根据IPv4报头的结构体获得对应的关键信息包括源IP地址和目的IP地址。其中根据报头偏移量14字节和以太网报头的长度之和为34字节，小于64字节的数据包长度，判断该报头未跨越数据段，所以当IPv4报头解析完成后，将第2阶段的动作标志位置1。并向下一个阶段输入报头类型是TCP，报头偏移量为34和上一个阶段是否解析完成的标志位为1。

三、第3阶段的报头解析

第3阶段将解析IP报头，具体对应于该数据包所包含的IP协议，阶段预设信息表中的内容设置如下表11所示。

表11：第3阶段的阶段预设信息

报头类型

报头长度

编号

报头域字段

阶段流转信息表

TCP

20

5

如下表12所示

如下表13所示

表12：TCP报头的报头域字段

报头类型	帧类型[0]	掩码[0]	帧类型[0]	掩码[0]	帧类型[0]	掩码[0]
TCP	0	0	0	0	0	0

注：TCP报头类型的报头没有帧类型。

表13：TCP报头的阶段流转信息

报头类型	动作标志位	下一层报头类型	下一个阶段报头偏移量
TCP	1	负载	54

其中，TCP报头的预设的结构体如表14所示。

表14：预设的TCP报头的结构体

经过第3阶段的报头解析后获得该数据包的TCP报头，然后根据TCP报头的结构体，获得对应的关键信息包括源端口号和目的端口号。其中根据报头偏移量34字节和以太网报头的长度之和为54字节，小于64字节的数据包长度，判断该报头未跨越数据段，所以当以太网报头解析完成后，将当前阶段的动作标志位置1。并向下一个阶段输入报头类型是负载，报头偏移量为54和上一个阶段是否解析完成的标志位为1。

当解析到负载部分时，将不再进行报文的报头解析，直接将数据流转到下一个阶段，直至最后一个阶段。该数据包经过该分段解析后，获得了相应的以太网报头、IPv4报头和TCP报头，并获得关键信息源MAC地址和目的MAC地址、源IP地址和目的IP地址和源端口号和目的端口号，便于后续的数据的转发和处理。

在一个实施例中，提供了一种报文的分段解析装置；待解析的报文包括：报头；如图7所示，装置包括阶段解析模块701；阶段解析模块701被配置为：

根据解析配置信息，对报头进行第n阶段解析得到第n阶段解析结果，其中，当n小于N时，第n阶段解析结果包括：第n阶段解析出的报头信息、报文内待解析的下一层报头类型及下一阶段解析的偏移地址；其中，N为报头的最大解析阶段数；

当下一层报头类型不是第n+1阶段解析的报头类型，跳过对报头的第n+1阶段解，并进入到第n+2阶段解析；

当下一层报头类型是第n+1阶段解析的报头类型，根据偏移地址对报头进行第n+1阶段解析；

当完成第N阶段解析或前N-1层协议解析确定跳过第N阶段解析时，停止对报头的本次分段解析。

在一个实施例中，解析配置信息包括：字段解析信息及阶段流转信息；

阶段解析模块701被配置为：

根据第n阶段的字段解析信息以及第n阶段待解析的报头类型，对报头进行报头域字段解析；其中，报头域字段包括：帧类型、报头长度、报头编号和/或掩码；

根据报头域字段查询第n阶段的阶段流转信息，确定待解析的下一层报头类型和下一阶段解析的偏移地址。

在一个实施例中，阶段解析模块701被配置为：

在进行第n+1阶段解析时，将报头包含的待解析的报头域字段与第n+1阶段的报头域字段表匹配；

若报头包含的待解析的报头域字段为包含在第n+1阶段的报头域字段表的有效字段，则解析报头包含的待解析的报头域字段的内容。

在一个实施例中，阶段解析模块701还被配置为：

若报头包含的待解析的报头域字段为不包含在第n+1阶段的报头域字段表的无效字段，则停止第n+1阶段的解析。

在一个实施例中，装置还包括数据划分模块700和结果拼接模块702；

数据划分模块700，被配置为当接收的数据包大于分段解析的可处理报长时，将数据包按照预设长度划分为多个数据段；

阶段解析模块701，被配置为从第1个数据段开始进行报头的分段解析；

结果拼接模块702，被配置为拼接多个数据段的分段解析的解析结果，得到报头的解析结果。

在一个实施例中，阶段解析模块701被配置为：

根据偏移地址对本数据段进行第n+1阶段解析，得到指示第n+1阶段解析结果的第一部分字段，并确定第n+1阶段未完成解析；

在下一个数据段进入未完成解析的第n+1阶段后，根据第一部分字段的长度以及下一层报头类型的报头长度，继续对下一个数据段进行第n+1阶段解析，得到指示第n+1阶段解析结果的第二部分字段；

将第二部分字段拼接到第一部分字段的后面，得到第n+1阶段解析结果。

在一个实施例中，阶段解析模块701被配置为：

接下来，将结合图8，进一步对本公开实施例提供的报文的分段解析装置中的阶段解析模块进行说明。

如图8所示，阶段解析模块包括预判单元、报头提取单元和下阶段信息项提取单元。其中：

预判单元，被配置为根据输入的当前阶段的解析信息包括的报头类型、报头偏移量以及上阶段解析完成标志位，结合阶段预设信息表中的当前阶段对应的阶段预设信息，判断该报头类型是否需要解析，并确定需要解析的报头类型对应的报头长度，以及获取用于指示是否需要跨越数据段进行报头解析的跨字段标志位。

其中，阶段预设信息表是通过接收用户的报文解析配置信息生成的，报文解析配置信息包括每个阶段可解析的报头类型、每个报头类型对应的报头长度、每个报头类型对应的报头域字段、每个报头域对应的阶段流转信息表。

报头提取单元，被配置为当预判模块的预判结果指示该报头类型可解析时，根据预判结果中的报头类型对应的报头长度及跨字段标志位进行报头提取，获取报头类型的报头、报头域字段和该报头对应的关键信息。

下阶段信息项提取单元，被配置为根据报头提取单元针对当前阶段所获得的报头域字段，并结合阶段预设信息表中的报头域字段，提取阶段流转信息表包括的下一个阶段的报头类型、报头偏移量，并给出是当前否解析完成的标志位。

需要说明的是：上述实施例提供的报文的分段解析装置在实现报文的分段解析方法时，仅以上述各程序模块的划分进行举例说明，实际应用中，可以根据需要而将上述处理分配由不同的程序模块完成，即将报文的分段解析装置的内部结构划分成不同的程序模块，以完成以上描述的全部或者部分处理。另外，上述实施例提供的装置与相应方法的实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图9为本公开实施例提供的一种计算机设备的结构示意图；如图9所示，计算机设备900包括：处理器901和用于存储能够在处理器上运行的计算机程序的存储器902；其中，处理器901用于运行计算机程序时，执行如下操作：

根据解析配置信息，对报文包括的报头进行第n阶段解析得到第n阶段解析结果，其中，当n小于N时，第n阶段解析结果包括：第n阶段解析出的报头信息、报文内待解析的下一层报头类型及下一阶段解析的偏移地址；其中，N为报头的最大解析阶段数；

当下一层报头类型不是第n+1阶段解析的报头类型，跳过对报头的第n+1阶段解析，并进入到第n+2阶段解析；

实际应用时，计算机设备900还可以包括：至少一个网络接口903。计算机设备900中的各个组件通过总线系统904耦合在一起。可理解，总线系统904用于实现这些组件之间的连接通信。总线系统904除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图9中将各种总线都标为总线系统904。其中，处理器901的个数可以为至少一个。网络接口903用于计算机设备900与其他设备之间有线或无线方式的通信。

本公开实施例中的存储器902用于存储各种类型的数据以支持计算机设备900的操作。

上述本公开实施例揭示的方法可以应用于处理器901中，或者由处理器901实现。处理器901可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器901中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器901可以是通用处理器、数字信号处理器(DSP，DiGital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器901可以实现或者执行本公开实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本公开实施例所公开的方法的步骤，可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中，该存储介质位于存储器902，处理器901读取存储器902中的信息，结合其硬件完成前述方法的步骤。

在示例性实施例中，计算机设备900可以被一个或多个应用专用集成电路(ASIC，Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，Complex Programmable Logic Device)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)、通用处理器、控制器、微控制器(MCU，Micro Controller Unit)、微处理器(Microprocessor)、或其他电子元件实现，用于执行前述方法。

本公开实施例还提供了一种计算机可读存储介质，其上存储有计算机程序；计算机可读存储介质应用于报文的分段解析方法时，计算机程序被处理器运行时，执行如下操作：

在本公开所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本公开各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本公开上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本公开各个实施例方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是：“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

另外，本公开实施例所记载的技术方案之间，在不冲突的情况下，可以任意组合。

以上，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

一种报文的分段解析方法，其中，待解析的报文包括：报头；所述方法包括：

根据解析配置信息，对所述报头进行第n阶段解析得到第n阶段解析结果，其中，当所述n小于N时，所述第n阶段解析结果包括：所述第n阶段解析出的报头信息、所述报文内待解析的下一层报头类型及下一阶段解析的偏移地址；其中，所述N为所述报头的最大解析阶段数；

当所述下一层报头类型不是第n+1阶段解析的报头类型，跳过对所述报头的第n+1阶段解析，并进入到第n+2阶段解析；

当所述下一层报头类型是第n+1阶段解析的报头类型，根据所述偏移地址对所述报头进行第n+1阶段解析；

当完成所述第N阶段解析或前N-1层协议解析确定跳过第N阶段解析时，停止对所述报头的本次分段解析。
根据权利要求1所述的方法，其中，所述解析配置信息包括：字段解析信息及阶段流转信息；

所述根据解析配置信息，对所述报头进行第n阶段解析得到第n阶段解析结果，包括：

根据第n阶段的字段解析信息以及第n阶段待解析的报头类型，对所述报头进行报头域字段解析；其中，所述报头域字段包括：帧类型、报头长度、报头编号和/或掩码；

根据所述报头域字段查询所述第n阶段的阶段流转信息，确定待解析的所述下一层报头类型和所述下一阶段解析的偏移地址。
根据权利要求2所述的方法，其中，所述根据所述偏移地址对所述报头进行第n+1阶段解析，包括：

在进行第n+1阶段解析时，将所述报头包含的待解析的报头域字段与所述第n+1阶段的报头域字段表匹配；

若所述报头包含的待解析的报头域字段为包含在所述第n+1阶段的报头域字段表的有效字段，则解析所述报头包含的待解析的报头域字段的内容。
根据权利要求3所述的方法，其中，所述方法还包括：

若所述报头包含的待解析的报头域字段为不包含在所述第n+1阶段的报头域字段表的无效字段，则停止所述第n+1阶段的解析。
根据权利要求1至4任一所述的方法，其中，所述方法还包括：

当接收的数据包大于分段解析的可处理报长时，将所述数据包按照预设长度划分为多个数据段；

从第1个所述数据段开始进行所述报头的分段解析；

拼接多个所述数据段的分段解析的解析结果，得到所述报头的解析结果。
根据权利要求5所述的方法，其中，所述当所述下一层报头类型是第n+1阶段解析的报头类型，根据所述偏移地址对所述报头进行第n+1阶段解析，包括：

在本数据段进行第n+1阶段解析时，若根据所述下一阶段解析的偏移地址、所述下一层报头类型的报头长度和第n+1阶段的字段解析信息指示的解析长度，确定出待解析的字段部分位于下一个数据段时，结合所述本数据段及所述下一数据段进行第n+1阶段解析。
根据权利要求6所述的方法，其中，所述结合所述本数据段及所述下一数据段进行第n+1阶段解析，包括：

根据所述偏移地址对所述本数据段进行第n+1阶段解析，得到指示所述第n+1阶段解析结果的第一部分字段，并确定所述第n+1阶段未完成解析；

在所述下一个数据段进入未完成解析的所述第n+1阶段后，根据所述第一部分字段的长度以及所述下一层报头类型的报头长度，继续对所述下一个数据段进行第n+1阶段解析，得到指示所述第n+1阶段解析结果的第二部分字段；

将所述第二部分字段拼接到所述第一部分字段的后面，得到所述第n+1阶段解析结果。
根据权利要求5所述的方法，其中，所述当所述下一层报头类型是第n+1阶段解析的报头类型，根据所述偏移地址对所述报头进行第n+1阶段解析，包括：

在本数据段进行第n+1阶段解析时，若根据所述下一阶段解析的偏移地址、所述下一层报头类型的报头长度和第n+1阶段的字段解析信息指示的解析长度，确定出待解析的字段全部位于所述本数据段时，对所述本数据段进行第n+1阶段解析，得到所述第n+1阶段解析结果。
一种报文的分段解析装置，其中，待解析的报文包括：报头；所述装置包括阶段解析模块；所述阶段解析模块被配置为：

根据解析配置信息，对所述报头进行第n阶段解析得到第n阶段解析结果，其中，当所述n小于N时，所述第n阶段解析结果包括：所述第n阶段解析出的报头信息、所述报文内待解析的下一层报头类型及下一阶段解析的偏移地址；其中，所述N为所述报头的最大解析阶段数；

当所述下一层报头类型不是第n+1阶段解析的报头类型，跳过所述阶段解析模块对所述报头的第n+1阶段解，并进入到第n+2阶段解析；

当所述下一层报头类型是第n+1阶段解析的报头类型，执行所述阶段解析模块根据所述偏移地址对所述报头进行第n+1阶段解析；

当完成所述第N阶段解析或前N-1层协议解析确定跳过第N阶段解析时，停止所述阶段解析模块对所述报头的本次分段解析。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现权利要求1至8任一项所述报文的分段解析方法的步骤。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现权利要求1至8任一项所述报文的分段解析方法的步骤。