CN114760256A - 数据处理方法、装置、设备及存储介质 - Google Patents
数据处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114760256A CN114760256A CN202210393158.4A CN202210393158A CN114760256A CN 114760256 A CN114760256 A CN 114760256A CN 202210393158 A CN202210393158 A CN 202210393158A CN 114760256 A CN114760256 A CN 114760256A
- Authority
- CN
- China
- Prior art keywords
- data
- decoding
- parameter
- decompression
- length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 20
- 238000013075 data extraction Methods 0.000 claims abstract description 103
- 238000007781 pre-processing Methods 0.000 claims abstract description 96
- 230000009471 action Effects 0.000 claims abstract description 67
- 238000012545 processing Methods 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 28
- 230000006837 decompression Effects 0.000 claims description 121
- 230000006798 recombination Effects 0.000 claims description 82
- 238000005215 recombination Methods 0.000 claims description 82
- 238000000605 extraction Methods 0.000 claims description 79
- 230000008521 reorganization Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 16
- 230000014509 gene expression Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 210000001072 colon Anatomy 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/90—Buffering arrangements
- H04L49/9057—Arrangements for supporting packet reassembly or resequencing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/22—Parsing or analysis of headers
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种数据处理方法、装置、设备及存储介质。该方法包括:接收数据包,识别所述数据包对应的目标协议;调用与所述目标协议匹配的动作识别引擎,根据所述数据包命中的目标识别规则,对当前数据流进行预处理;所述预处理包括重组、解压或解码中的至少一种;调用数据提取引擎,按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据。本发明实施例的技术方案,可以将精细化动作识别与数据提取相关联,对数据流进行分类处理,提高规则复用性和数据提取效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置、设备及存储介质。
背景技术
随着互联网的快速发展,网络流量中包含有大量信息。如果能从网络流量中筛选出有价值的用户信息,将对网络内容识别和用户行为分析都有着十分重要的意义。
现有技术中,数据提取规则大多采用正则表达式来描述信息点,获取待提取信息。但是有些信息点特征比较复杂,例如流量被分段传输或者编码压缩等,因此仅使用正则表达式无法准确地描述信息点,数据提取效率较低。
发明内容
本发明提供了一种数据处理方法、装置、设备及存储介质,以解决仅使用正则表达式无法准确描述信息点,导致数据提取效率较低的问题。
根据本发明的一方面,提供了一种数据处理方法,包括:
接收数据包,识别所述数据包对应的目标协议;
调用与所述目标协议匹配的动作识别引擎,根据所述数据包命中的目标识别规则,对当前数据流进行预处理;所述预处理包括重组、解压或解码中的至少一种;
调用数据提取引擎,按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据。
可选的,所述根据所述数据包命中的目标识别规则,对当前数据流进行预处理,包括:
将所述数据包中的负载内容与预设的识别规则进行特征匹配,确定所述数据包命中的目标识别规则;
根据所述目标识别规则中的动作类型参数,确定是否对当前数据流进行预处理;
如果是,则根据所述目标识别规则中的预处理参数、重组参数组以及解压或解码参数组,确定预处理类型以及预处理关联信息,对当前数据流进行预处理。
采用上述技术方案,通过在识别规则中设置动作类型参数,对不同的数据流分类处理,通过在识别规则中设置预处理参数、重组参数组以及解压或解码参数组,自动识别并执行对数据流的精细化处理,提高数据提取效率。
可选的,所述根据所述目标识别规则中的预处理参数、重组参数组以及解压或解码参数组,确定预处理类型以及预处理关联信息,包括:
根据所述目标识别规则中的预处理参数,确定预处理类型;
如果所述预处理类型包括重组,则根据重组参数组中的获取方式参数,选择重组信息参数或者重组提取规则,确定重组的开始位置、长度和结束位置;
如果所述预处理类型包括解压或解码,则根据解压或解码参数组中的获取方式参数,选择解压或解码信息参数或者解压或解码提取规则,确定解压或解码的开始位置、长度和结束位置。
采用上述技术方案,通过在重组参数组和解压或解码参数组中设置获取方式参数,结合用户自定义的重组信息参数、解压或解码信息参数以及预先设置的预处理提取规则,为用户提供多种获取预处理关联信息的途径,增加预处理关联信息获取的灵活性。
可选的,所述选择重组信息参数或者重组提取规则,确定重组的开始位置、长度和结束位置,包括:
根据基于偏移的重组开始位置参数,或者重组开始位置提取规则,确定重组的开始位置;或者,
根据基于结束标志的重组结束位置参数,确定重组的结束位置;或者,
根据重组长度参数或者重组长度提取规则,确定重组的长度。
采用上述技术方案,通过用户自定义的用于重组的开始位置参数、结束位置参数以及长度参数等重组信息参数,以及预先设置的重组的开始位置提取规则以及长度提取规则,灵活获取各种重组关联信息。
可选的,所述选择解压或解码信息参数或者解压或解码提取规则,确定解压或解码的开始位置、长度和结束位置,包括:
根据基于偏移的解压或解码开始位置参数,或者基于偏移的解压或解码开始标志参数,或者解压或解码开始位置提取规则,确定解压或解码的开始位置;或者,
根据基于结束标志的解压或解码结束位置参数,确定解压或解码的结束位置;或者,
根据解压或解码长度参数或者解压或解码长度提取规则,确定解压或解码的长度。
采用上述技术方案,通过用户自定义的用于解压或解码的开始位置参数、开始标志参数、结束位置参数以及长度参数等解压或解码信息参数,以及预先设置的解压或解码的开始位置提取规则以及长度提取规则,灵活获取各种解压或解码关联信息。
可选的,所述按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据,包括:
将所述数据包中的负载内容与预设的数据提取规则进行特征匹配,确定所述数据包命中的目标数据提取规则;
根据所述目标数据提取规则中的提取参数组对当前数据流进行偏移处理,确定待提取数据的开始位置、长度以及结束位置,并从预处理后的当前数据流中提取指定数据;
根据所述目标数据提取规则中的处理参数组,确定结果数据类型以及结果使用方式,对提取到的数据进行处理。
采用上述技术方案,将动作识别与数据提取相关联,只对预处理后的数据流进行数据提取,可以避免不必要的数据提取操作,提高数据提取效率。并且,通过在数据提取规则中设置提取参数组,为用户提供多种途径获取待提取数据相关信息,增加信息获取的灵活性。通过设置处理参数组,对提取到的数据进行数据类型转换、解码等指定处理,使得数据可以直接投入后续使用。
可选的,所述根据所述目标数据提取规则中的提取参数组对当前数据流进行偏移处理,确定待提取数据的开始位置、长度以及结束位置,包括:
根据开始位置参数,从当前数据流的指定位置偏移指定长度,提取待提取数据的开始位置;或者,
根据开始标志参数,从当前数据流中的开始标志字符串偏移指定长度,提取待提取数据的开始位置;或者,
根据结束标志参数,从当前数据流中的结束标志字符串偏移指定长度,提取待提取数据的结束位置;或者,
根据信息长度参数,确定待提取数据的长度;或者,
根据长度获取参数,从当前数据流的指定位置偏移指定长度,提取待提取数据的长度。
采用上述技术方案,通过在数据提取规则中设置基于偏移值的提取参数组,使得用户可以灵活选择待提取数据的各种相关信息的获取方式,进而通过对当前数据流进行相应的偏移处理,获取待提取数据的开始位置、长度以及结束位置。
根据本发明的另一方面,提供了一种数据处理装置,包括:
协议识别模块,用于执行接收数据包,识别所述数据包对应的目标协议;
动作识别模块,用于执行调用与所述目标协议匹配的动作识别引擎,根据所述数据包命中的目标识别规则,对当前数据流进行预处理;所述预处理包括重组、解压或解码中的至少一种;
数据提取模块,用于执行调用数据提取引擎,按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的数据处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的数据处理方法。
本发明实施例的技术方案,通过接收数据包,识别所述数据包对应的目标协议;调用与所述目标协议匹配的动作识别引擎,根据所述数据包命中的目标识别规则,对当前数据流进行预处理;所述预处理包括重组、解压或解码中的至少一种;调用数据提取引擎,按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据,解决了仅使用正则表达式无法准确描述信息点,导致数据提取效率较低问题,取到了将精细化动作识别与数据提取相关联,对数据流进行分类处理,提高规则复用性和数据提取效率的有益效果。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种数据处理方法的流程图;
图2是根据本发明实施例二提供的一种数据处理方法的流程图;
图3是根据本发明实施例三提供的一种数据处理装置的结构示意图;
图4是实现本发明实施例的数据处理方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是根据本发明实施例一提供的一种数据处理方法的流程图,本实施例可适用于对数据流进行动作识别,根据识别结果进行重组、解压等预处理和数据提取的情况,该方法可以由数据处理装置来执行,该装置可以采用硬件和或或软件的形式实现,并可配置于电子设备中。如图1所示,该方法包括:
S110、接收数据包,识别所述数据包对应的目标协议。
本实施例中,包含完整数据信息的报文在传输过程中会被分为多个数据包,每个数据包中包括控制信息组成的报文头和数据信息组成的报文负载两部分。由于每种协议报文对应的动作识别引擎不同,或者说,每种协议报文的动作识别操作以及预处理操作都有所区别,因此,在接收数据包后,可以根据报文头的控制信息中的指定字段,识别出该数据包的报文协议,或者采用其他的协议识别技术确定该数据包的报文协议,例如安全传输层协议、开放式最短路优先协议等。
S120、调用与所述目标协议匹配的动作识别引擎,根据所述数据包命中的目标识别规则,对当前数据流进行预处理。
其中,所述预处理包括重组、解压或解码中的至少一种。
本实施例中,可以通过加载各种协议的动作识别规则,创建与各种协议对应的动作识别引擎,并建立协议标识与动作识别引擎之间的映射关系。在确定数据包对应的目标协议后,调用与目标协议标识匹配的动作识别引擎,从预先设置的大量识别规则中,查询所述数据包命中的目标识别规则,进而根据目标识别规则中的执行动作,对当前数据包对应的数据流进行重组、解压或者解码等预处理。其中,数据流可以包括同一个报文被分割封装成的多个数据包。
可选的,所述根据所述数据包命中的目标识别规则,对当前数据流进行预处理,包括:将所述数据包中的负载内容与预设的识别规则进行特征匹配,确定所述数据包命中的目标识别规则;根据所述目标识别规则中的动作类型参数,确定是否对当前数据流进行预处理;如果是,则根据所述目标识别规则中的预处理参数、重组参数组以及解压或解码参数组,确定预处理类型以及预处理关联信息,对当前数据流进行预处理。
其中,识别规则的格式可以为:[规则编号][匹配表达式]with action.do{[执行动作]}。规则编号为十进制的7位数,例如0000061,用于唯一标识一条识别规则;匹配表达式可表示为:pkt.payload~"正则表达式",在当前数据包的报文负载与匹配表达式匹配时,则按照执行动作对报文负载进行处理。执行动作中可以包括:分类标识、动作类型参数、待提取的信息类型、预处理参数、重组参数组、解压或解码参数组、客户端类型、优先级等。
本实施例中,针对每个识别规则,判断数据包的负载内容是否符合匹配表达式的条件,如果符合,则认为数据包命中该识别规则。如果数据包只命中一条识别规则,则该识别规则为目标识别规则,如果数据包命中多条识别规则,则根据执行动作中的优先级参数,对命中的多条识别规则进行排序,并按顺序依次将各识别规则作为目标识别规则对报文负载进行处理。其中,在根据优先级参数对识别规则排序时,优先级数值越小,优先级别越高。
本实施例中,动作类型参数可以包括:精细化动作标识opr_id以及字符串表示的精细化动作类型opr。可以根据目标识别规则中的精细化动作类型opr,确定该数据包对应的用户动作类型,例如登录(login)、退出(logout)、发文本消息(transtext)、发朋友圈(friendscircle)等。根据动作类型确定当前数据包是否有需要提取的数据,例如,登录数据包中可以提取账号和密码等信息,网页浏览数据包中可以提取网页地址和网页内容等信息。如果有,则按照执行动作中的预处理参数、重组参数组以及解压或解码参数组,对当前数据流进行相应的重组、解压或解码处理。如果没有,则无需对当前数据流进行预处理,后续也无需进行数据提取操作。
采用上述技术方案,通过在识别规则中设置动作类型参数,对不同的数据流分类处理,通过在识别规则中设置预处理参数、重组参数组以及解压或解码参数组,自动识别并执行对数据流的精细化处理,提高数据提取效率。
可选的,所述根据所述目标识别规则中的预处理参数、重组参数组以及解压或解码参数组,确定预处理类型以及预处理关联信息,包括:根据所述目标识别规则中的预处理参数,确定预处理类型;如果所述预处理类型包括重组,则根据重组参数组中的获取方式参数,选择重组信息参数或者重组提取规则,确定重组的开始位置、长度和结束位置;如果所述预处理类型包括解压或解码,则根据解压或解码参数组中的获取方式参数,选择解压或解码信息参数或者解压或解码提取规则,确定解压或解码的开始位置、长度和结束位置。
本实施例中,预处理参数pre_act用于表示提取数据之前需要执行的预处理动作,如重组、解压、解码等,多种预处理动作用冒号顺序隔开。重组参数组是指目标识别规则的执行动作中与报文重组相关的一组参数,包括:重组的获取方式参数recm_get,用户自定义的重组开始位置recm_offset、用户自定义的重组结束位置recm_end、用户自定义的重组长度recm_len、重组上下行关联指示recm_supplement。其中,为了方便描述,将用户自定义的recm_offset、recm_end、recm_len统称为重组信息参数。
其中,重组的获取方式参数recm_get,用于表示重组的开始位置、长度和结束位置信息的获取方式,格式为(start:len:end),start表示开始位置,len表示长度,end表示结束位置,用不同字节表示这三种信息。当取值为0时默认不处理,取值为1表示用户自定义,结合用户自定义的重组信息参数使用,取值为2表示通过预处理提取规则获取,需要结合预先设置的重组提取规则使用,取值为3表示通过预处理规则提取开始位置和重组长度,但是真实的重组从当前包起始的位置开始,需要结合预先设置的重组提取规则使用。
示例性的,对于recm_get=(1:0:1),第一个1表示用户定义重组的开始位置,即根据recm_offset参数获取开始位置,0表示不处理,第二个1表示用户定义重组结束位置,即根据recm_end参数获取结束位置。
相应的,解压或解码参数组是指目标识别规则的执行动作中与解压或解码相关的一组参数,包括:解压或解码的获取方式参数dcuz_get、用户自定义的解压或解码的开始位置dcuz_offset、用户定义的解压或解码的开始标志dcuz_start_flag、用户自定义的解压或解码的结束位置dcuz_end、用户自定义的解压或解码的长度dcuz_len。其中,为了方便描述,将用户自定义的dcuz_offset、dcuz_start_flag、dcuz_end、dcuz_len统称为解压或解码信息参数。
其中,获取方式参数dcuz_get,用于表示解压或解码的开始位置、长度和结束位置信息的获取方式,格式为(start:len:end),start表示开始位置,len表示长度,end表示结束位置,用不同字节表示这三种信息。当取值为0时默认不处理,取值为1表示用户自定义,结合用户自定义的解压或解码信息参数使用,取值为2表示通过预处理提取规则获取,需要结合预先设置的解压或解码提取规则使用。
采用上述技术方案,通过在重组参数组和解压或解码参数组中设置获取方式参数,结合用户自定义的重组信息参数、解压或解码信息参数以及预先设置的预处理提取规则,为用户提供多种获取预处理关联信息的途径,增加预处理关联信息获取的灵活性。
本实施例中,预处理提取规则的格式可以为:[规则编号][匹配表达式]withaction.get{[执行动作]}。规则编号为十进制的7位数,用于唯一标识一条预处理提取规则;匹配表达式可表示为:pkt.payload@"正则表达式",执行动作包含以下四种:action.get{refine.dcuz.start}:表示获取解码或解压的起始位置;action.get{refine.dcuz.len}:表示获取解码或解压的长度;action.get{refine.recm.start}:表示获取重组的起始位置;action.get{refine.recm.len}:表示获取重组的长度。
需要说明的是,在获取预处理关联信息时,只需获取开始位置与长度信息,或者开始位置与结束位置,即可实现对报文负载的预处理。
S130、调用数据提取引擎,按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据。
本实施例中,对报文负载进行预处理后,调用数据提取引擎,从大量预先设置的数据提取规则中,找到数据包命中的目标数据提取规则,根据目标数据提取规则中的执行动作,从预处理后的报文负载中提取出指定数据,并对提取出来的数据进行处理。
可选的,所述按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据,包括:将所述数据包中的负载内容与预设的数据提取规则进行特征匹配,确定所述数据包命中的目标数据提取规则;根据所述目标数据提取规则中的提取参数组对当前数据流进行偏移处理,确定待提取数据的开始位置、长度以及结束位置,并从预处理后的当前数据流中提取指定数据;根据所述目标数据提取规则中的处理参数组,确定结果数据类型以及结果使用方式,对提取到的数据进行处理。
其中,数据提取规则的格式可以为:[规则编号][匹配表达式]with action.get{[执行动作]}。规则编号为十进制的7位数,用于唯一标识一条数据提取规则;匹配表达式可表示为:pkt.payload~"正则表达式",执行动作包括:分类标识、提取的信息类型、提取参数组、处理参数组、优先级等。
本实施例中,选择数据包的负载内容与匹配表达式一致的数据提取规则作为数据包命中的规则。在数据包命中多条数据提取规则时,根据执行动作中的优先级数值由小到大的顺序,对命中的多条数据提取规则进行排序,并按顺序依次将各数据提取规则作为目标数据提取规则对报文负载进行处理。其中,优先级数值越小,优先级别越高。
其中,提取参数组是指目标数据提取规则的执行动作中与数据提取相关的一组参数,包括:开始位置参数start_off、用户自定义的开始标志start_def_flag、用户自定义的结束标志end_def_flag、用户定义的信息长度end_def_len、长度获取参数end_off_len、长度处理参数len_hdle。处理参数组是执行动作中用于对提取的数据进行处理的一组参数,包括:结果数据类型value_type和结果使用方式usage。
采用上述技术方案,将动作识别与数据提取相关联,只对预处理后的数据流进行数据提取,可以避免不必要的数据提取操作,提高数据提取效率。并且,通过在数据提取规则中设置提取参数组,为用户提供多种途径获取待提取数据相关信息,增加信息获取的灵活性。通过设置处理参数组,对提取到的数据进行数据类型转换、解码等指定处理,使得数据可以直接投入后续使用。
本发明实施例的技术方案,通过接收数据包,识别所述数据包对应的目标协议;调用与所述目标协议匹配的动作识别引擎,根据所述数据包命中的目标识别规则,对当前数据流进行预处理;所述预处理包括重组、解压或解码中的至少一种;调用数据提取引擎,按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据,解决了仅使用正则表达式无法准确描述信息点,导致数据提取效率较低问题,取到了将精细化动作识别与数据提取相关联,对数据流进行分类处理,提高规则复用性和数据提取效率的有益效果。
实施例二
图2是根据本发明实施例二提供的一种数据处理方法的流程图,本实施例在上述实施例的基础上,具体提供了:所述选择重组信息参数或者重组提取规则,确定重组的开始位置、长度和结束位置的具体步骤;所述选择解压或解码信息参数或者解压或解码提取规则,确定解压或解码的开始位置、长度和结束位置的具体步骤;所述根据所述目标数据提取规则中的提取参数组对当前数据流进行偏移处理,确定待提取数据的开始位置、长度以及结束位置的具体步骤。如图2所示,该方法包括:
S210、接收数据包,识别所述数据包对应的目标协议。
S220、调用与所述目标协议匹配的动作识别引擎,将所述数据包中的负载内容与预设的识别规则进行特征匹配,确定所述数据包命中的目标识别规则。
S230、根据所述目标识别规则中的预处理参数,确定预处理类型。
本实施例中,在确定预处理类型之前,可以将当前数据包与目标识别规则的执行动作中的分类标识进行匹配,进一步判断该规则是否适应于对数据包进行预处理。示例性的,判断当前数据包是否与执行动作中的业务大类编号top_id或者基础应用标识app_id一致。如果一致,则可以继续根据该识别规则对数据包的负载内容进行处理,如果不一致,则不能使用该识别规则处理数据包负载。其中,app_id表明该规则只对特定的应用生效,可以有多个,多种应用用冒号隔开。规则可根据top_id针对某一大类应用通用,也可根据app_id针对某一应用专用。
采用上述技术方案,当数据包负载中的信息点特征比较简单时,提高数据提取的正确率,避免大量数据包命中识别规则,导致数据误提取。
S240、如果所述预处理类型包括重组,则根据重组参数组中的获取方式参数,选择重组信息参数或者重组提取规则,确定重组的开始位置、长度和结束位置。
可选的,所述选择重组信息参数或者重组提取规则,确定重组的开始位置、长度和结束位置,包括:根据基于偏移的重组开始位置参数,或者重组开始位置提取规则,确定重组的开始位置;或者,根据基于结束标志的重组结束位置参数,确定重组的结束位置;或者,根据重组长度参数或者重组长度提取规则,确定重组的长度。
其中,重组开始位置recm_offset的格式为(drct:pkt:offset),drct表示针对当前方向重组还是反方向重组,取值为1表示重组当前方向,取值为2表示重组反方向;pkt是相对于当前包的包数,offset是相对有效负载的偏移字节数。示例性的,recm_offset=(1:0:0),1表示重组当前命中规则方向的报文,第一个0表示从命中规则的当前包开始重组,第二个0表示从当前包负载的开始位置进行重组,不用偏移。重组开始位置提取规则可以是S120中解释的执行动作为action.get{refine.recm.start}的预处理提取规则。
其中,重组结束位置recm_end的格式为(end_width:flag),end_width为结束标志的字节宽度,flag为字符串表示的结束标志。其中,flag包括两种形式,一种是通过指定字符串结束,如recm_end=(2:'\r\n');一种是通过非指定字符串方式结束,如recm_end=(-1:'f')。示例性的,recm_offset=(1:0:0),recm_end=(-1:'f')表示从命中规则的当前包的负载开始位置进行重组,重组当前方向的报文,直到流结束为止。
其中,重组长度recm_len以字节为单位,例如recm_len=1504。重组长度提取规则可以是S120中解释的执行动作为action.get{refine.recm.len}的预处理提取规则。
采用上述技术方案,通过用户自定义的用于重组的开始位置参数、结束位置参数以及长度参数等重组信息参数,以及预先设置的重组的开始位置提取规则以及长度提取规则,灵活获取各种重组关联信息。
S250、如果所述预处理类型包括解压或解码,则根据解压或解码参数组中的获取方式参数,选择解压或解码信息参数或者解压或解码提取规则,确定解压或解码的开始位置、长度和结束位置。
可选的,所述选择解压或解码信息参数或者解压或解码提取规则,确定解压或解码的开始位置、长度和结束位置,包括:根据基于偏移的解压或解码开始位置参数,或者基于偏移的解压或解码开始标志参数,或者解压或解码开始位置提取规则,确定解压或解码的开始位置;或者,根据基于结束标志的解压或解码结束位置参数,确定解压或解码的结束位置;或者,根据解压或解码长度参数或者解压或解码长度提取规则,确定解压或解码的长度。
其中,解压或解码的开始位置dcuz_offset的格式为(drct:offset),其中drct表示针对上行解码或解压,还是针对下行解码或解压,取值为1表示上行,取值为2表示下行;offset是相对包头的偏移字节数,如果需要重组,针对的是重组后的数据包,如果不需要重组,针对的就是单包。
其中,解压或解码开始标志dcuz_start_flag在同时重组和解压或解码时使用。格式为(width:flag:offset),其中width为开始标志的字节宽度,flag为字符串表示的开始标志;offset为相对开始标志的偏移字节,支持负偏移。解压或解码开始位置提取规则可以是S120中解释的执行动作为action.get{refine.dcuz.start}的预处理提取规则。
其中,解压或解码结束位置dcuz_end的格式为(end_width:flag),其中,end_width为结束标志的字节宽度,flag为字符串表示的结束标志。解压或解码长度提取规则可以是S120中解释的执行动作为action.get{refine.dcuz.len}的预处理提取规则。
采用上述技术方案,通过用户自定义的用于解压或解码的开始位置参数、开始标志参数、结束位置参数以及长度参数等解压或解码信息参数,以及预先设置的解压或解码的开始位置提取规则以及长度提取规则,灵活获取各种解压或解码关联信息。
S260、调用数据提取引擎,将所述数据包中的负载内容与预设的数据提取规则进行特征匹配,确定所述数据包命中的目标数据提取规则。
本实施例中,在确定所述数据包命中的目标数据提取规则之后,可以将当前数据包与目标数据提取规则的执行动作中的分类标识进行匹配,进一步判断该规则是否用于对该数据包进行数据提取。示例性的,判断当前数据包是否与分类标识中的业务大类编号top_id或者基础应用标识app_id一致。如果一致,则可以继续根据该数据提取规则对数据包的负载内容进行处理,如果不一致,则不能使用该数据提取规则处理数据包负载。
采用上述技术方案,通过在数据头区规则中设置分类标识,对数据包命中的数据提取规则进一步验证,保证使用合适的数据提取规则对数据包负载进行数据提取,提高数据提取的正确率,避免数据误提取。
S270、根据所述目标数据提取规则中的提取参数组对当前数据流进行偏移处理,确定待提取数据的开始位置、长度以及结束位置,并从预处理后的当前数据流中提取指定数据。
可选的,所述根据所述目标数据提取规则中的提取参数组对当前数据流进行偏移处理,确定待提取数据的开始位置、长度以及结束位置,包括:根据开始位置参数,从当前数据流的指定位置偏移指定长度,提取待提取数据的开始位置;或者,根据开始标志参数,从当前数据流中的开始标志字符串偏移指定长度,提取待提取数据的开始位置;或者,根据结束标志参数,从当前数据流中的结束标志字符串偏移指定长度,提取待提取数据的结束位置;或者,根据信息长度参数,确定待提取数据的长度;或者,根据长度获取参数,从当前数据流的指定位置偏移指定长度,提取待提取数据的长度。
采用上述技术方案,通过在数据提取规则中设置基于偏移值的提取参数组,使得用户可以灵活选择待提取数据的各种相关信息的获取方式,进而通过对当前数据流进行相应的偏移处理,获取待提取数据的开始位置、长度以及结束位置。
其中,开始位置start_off的格式为(type:offset)。其中type表示偏移类型,取值为1表示从当前数据包的当前位置开始偏移,支持负偏移,取值为2表示从当前数据包的包头开始偏移,取值为3表示从当前数据包的包尾开始偏移,从包尾开始偏移时,offset值为正值;取值为4表示从下一个数据包的包头开始偏移;offset表示偏移多少个字节开始提取。
其中,开始标志start_def_flag的格式为(width:flag:offset),其中width为开始标志的字节宽度,flag为开始标志,用字符串表示;offset表示相对开始标志的偏移字节,支持负偏移。开始标志可分为两种,一种是通过指定字符开始,例如以’A’开头,一种是以非指定字符方式开始,例如,以第一个不是字母的字符开始。
其中,结束标志end_def_flag的格式为(width:flag:offset),其中width为结束标志的字节宽度,flag为用字符串表示的结束标志;offset为相对结束标志的偏移字节;结束标志与开始标志的种类相同。
其中,长度获取参数end_off_len的格式为(type:offset:width),其中type表示偏移类型,取值为1表示从当前位置开始偏移,取值为2表示从包头开始偏移,取值为3表示从包尾开始偏移;offset表示偏移多少个字节来获取长度;width表示字节宽度。
针对end_off_len,还需要搭配参数len_hdle来获取信息长度的数据类型及处理方式,其格式为(type:operate:value),type表示获取到的数据类型,取值为1表示获取字符串(数据包中为数值的字符串表示),取值为2表示获取整数(数据包中为数值的二进制表示);取值为3表示字节序转换(数据包中为网络序);operate表示获取到数值后需要进行的运算操作,取值为0表示不处理,取值为1表示加法运算,取值为2表示减法运算;value表示运算值。
S280、根据所述目标数据提取规则中的处理参数组,确定结果数据类型以及结果使用方式,对提取到的数据进行处理。
其中,结果数据类型value_type用于表示提取信息最终的数据类型,取值为1表示原始二进制值,取值为2表示字符串,取值为3表示数值,取值为4表示列表形式的二进制数据,取值为5表示列表形式的字符串,取值为6表示列表形式的数值。结果使用方式usage取值为1表示直接使用,取值为2表示需要utf8字符集url解码,取值为3表示需要utf8字符集base64解码等。
需要说明的是,上述所有实施例中涉及的参数都只是一种可实施方式,可以根据不同的业务场景和业务需要进行扩展或调整。
本发明实施例的技术方案,采用key-value的形式定义应用协议精细化识别及提取规则语法,使得流量的精细化识别及提取逻辑通用化,同时针对不同的流量做分类处理,还能将用户动作和信息提取关联起来,提高规则的复用性和数据提取的有效性。
实施例三
图3是根据本发明实施例三提供的一种数据处理装置的结构示意图。
如图3所示,该装置包括:
协议识别模块310,用于执行接收数据包,识别所述数据包对应的目标协议;
动作识别模块320,用于执行调用与所述目标协议匹配的动作识别引擎,根据所述数据包命中的目标识别规则,对当前数据流进行预处理;所述预处理包括重组、解压或解码中的至少一种;
数据提取模块330,用于执行调用数据提取引擎,按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据。
可选的,动作识别模块320包括:
识别规则命中单元,用于执行将所述数据包中的负载内容与预设的识别规则进行特征匹配,确定所述数据包命中的目标识别规则;
判断单元,用于执行根据所述目标识别规则中的动作类型参数,确定是否对当前数据流进行预处理;
预处理单元,用于执行如果是,则根据所述目标识别规则中的预处理参数、重组参数组以及解压或解码参数组,确定预处理类型以及预处理关联信息,对当前数据流进行预处理。
可选的,所述预处理单元,包括:
类型确定子单元,用于执行根据所述目标识别规则中的预处理参数,确定预处理类型;
重组信息获取子单元,用于执行如果所述预处理类型包括重组,则根据重组参数组中的获取方式参数,选择重组信息参数或者重组提取规则,确定重组的开始位置、长度和结束位置;
解压解码信息获取子单元,用于执行如果所述预处理类型包括解压或解码,则根据解压或解码参数组中的获取方式参数,选择解压或解码信息参数或者解压或解码提取规则,确定解压或解码的开始位置、长度和结束位置。
可选的,所述重组信息获取子单元,用于执行:
根据基于偏移的重组开始位置参数,或者重组开始位置提取规则,确定重组的开始位置;或者,
根据基于结束标志的重组结束位置参数,确定重组的结束位置;或者,
根据重组长度参数或者重组长度提取规则,确定重组的长度。
可选的,所述解压解码信息获取子单元,用于执行:
根据基于偏移的解压或解码开始位置参数,或者基于偏移的解压或解码开始标志参数,或者解压或解码开始位置提取规则,确定解压或解码的开始位置;或者,
根据基于结束标志的解压或解码结束位置参数,确定解压或解码的结束位置;或者,
根据解压或解码长度参数或者解压或解码长度提取规则,确定解压或解码的长度。
可选的,数据提取模块330,包括:
提取规则命中单元,用于执行将所述数据包中的负载内容与预设的数据提取规则进行特征匹配,确定所述数据包命中的目标数据提取规则;
数据提取单元,用于执行根据所述目标数据提取规则中的提取参数组对当前数据流进行偏移处理,确定待提取数据的开始位置、长度以及结束位置,并从预处理后的当前数据流中提取指定数据;
数据处理单元,用于执行根据所述目标数据提取规则中的处理参数组,确定结果数据类型以及结果使用方式,对提取到的数据进行处理。
可选的,所述数据提取单元,用于执行:
根据开始位置参数,从当前数据流的指定位置偏移指定长度,提取待提取数据的开始位置;或者,
根据开始标志参数,从当前数据流中的开始标志字符串偏移指定长度,提取待提取数据的开始位置;或者,
根据结束标志参数,从当前数据流中的结束标志字符串偏移指定长度,提取待提取数据的结束位置;或者,
根据信息长度参数,确定待提取数据的长度;或者,
根据长度获取参数,从当前数据流的指定位置偏移指定长度,提取待提取数据的长度。
本发明实施例所提供的数据处理装置可执行本发明任意实施例所提供的数据处理方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如数据处理方法。
在一些实施例中,数据处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的数据处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
接收数据包,识别所述数据包对应的目标协议;
调用与所述目标协议匹配的动作识别引擎,根据所述数据包命中的目标识别规则,对当前数据流进行预处理;所述预处理包括重组、解压或解码中的至少一种;
调用数据提取引擎,按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述数据包命中的目标识别规则,对当前数据流进行预处理,包括:
将所述数据包中的负载内容与预设的识别规则进行特征匹配,确定所述数据包命中的目标识别规则;
根据所述目标识别规则中的动作类型参数,确定是否对当前数据流进行预处理;
如果是,则根据所述目标识别规则中的预处理参数、重组参数组以及解压或解码参数组,确定预处理类型以及预处理关联信息,对当前数据流进行预处理。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标识别规则中的预处理参数、重组参数组以及解压或解码参数组,确定预处理类型以及预处理关联信息,包括:
根据所述目标识别规则中的预处理参数,确定预处理类型;
如果所述预处理类型包括重组,则根据重组参数组中的获取方式参数,选择重组信息参数或者重组提取规则,确定重组的开始位置、长度和结束位置;
如果所述预处理类型包括解压或解码,则根据解压或解码参数组中的获取方式参数,选择解压或解码信息参数或者解压或解码提取规则,确定解压或解码的开始位置、长度和结束位置。
4.根据权利要求3所述的方法,其特征在于,所述选择重组信息参数或者重组提取规则,确定重组的开始位置、长度和结束位置,包括:
根据基于偏移的重组开始位置参数,或者重组开始位置提取规则,确定重组的开始位置;或者,
根据基于结束标志的重组结束位置参数,确定重组的结束位置;或者,
根据重组长度参数或者重组长度提取规则,确定重组的长度。
5.根据权利要求3所述的方法,其特征在于,所述选择解压或解码信息参数或者解压或解码提取规则,确定解压或解码的开始位置、长度和结束位置,包括:
根据基于偏移的解压或解码开始位置参数,或者基于偏移的解压或解码开始标志参数,或者解压或解码开始位置提取规则,确定解压或解码的开始位置;或者,
根据基于结束标志的解压或解码结束位置参数,确定解压或解码的结束位置;或者,
根据解压或解码长度参数或者解压或解码长度提取规则,确定解压或解码的长度。
6.根据权利要求1所述的方法,其特征在于,所述按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据,包括:
将所述数据包中的负载内容与预设的数据提取规则进行特征匹配,确定所述数据包命中的目标数据提取规则;
根据所述目标数据提取规则中的提取参数组对当前数据流进行偏移处理,确定待提取数据的开始位置、长度以及结束位置,并从预处理后的当前数据流中提取指定数据;
根据所述目标数据提取规则中的处理参数组,确定结果数据类型以及结果使用方式,对提取到的数据进行处理。
7.根据权利要求6所述的方法,其特征在于,所述根据所述目标数据提取规则中的提取参数组对当前数据流进行偏移处理,确定待提取数据的开始位置、长度以及结束位置,包括:
根据开始位置参数,从当前数据流的指定位置偏移指定长度,提取待提取数据的开始位置;或者,
根据开始标志参数,从当前数据流中的开始标志字符串偏移指定长度,提取待提取数据的开始位置;或者,
根据结束标志参数,从当前数据流中的结束标志字符串偏移指定长度,提取待提取数据的结束位置;或者,
根据信息长度参数,确定待提取数据的长度;或者,
根据长度获取参数,从当前数据流的指定位置偏移指定长度,提取待提取数据的长度。
8.一种数据处理装置,其特征在于,包括:
协议识别模块,用于执行接收数据包,识别所述数据包对应的目标协议;
动作识别模块,用于执行调用与所述目标协议匹配的动作识别引擎,根据所述数据包命中的目标识别规则,对当前数据流进行预处理;所述预处理包括重组、解压或解码中的至少一种;
数据提取模块,用于执行调用数据提取引擎,按照所述数据包命中的目标数据提取规则,从预处理后的当前数据流中提取指定数据。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-4中任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210393158.4A CN114760256B (zh) | 2022-04-14 | 2022-04-14 | 数据处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210393158.4A CN114760256B (zh) | 2022-04-14 | 2022-04-14 | 数据处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114760256A true CN114760256A (zh) | 2022-07-15 |
CN114760256B CN114760256B (zh) | 2024-01-30 |
Family
ID=82330959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210393158.4A Active CN114760256B (zh) | 2022-04-14 | 2022-04-14 | 数据处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114760256B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101557329A (zh) * | 2009-05-27 | 2009-10-14 | 杭州迪普科技有限公司 | 一种基于应用层的数据分割方法及装置 |
CN101605018A (zh) * | 2009-06-17 | 2009-12-16 | 中兴通讯股份有限公司 | 一种基于流的深度报文检测协议解码方法、设备及系统 |
EP2175603A1 (en) * | 2008-10-09 | 2010-04-14 | Juniper Networks, Inc. | Dynamic access control policy with port restrictions for a network security appliance |
CN102437937A (zh) * | 2011-12-29 | 2012-05-02 | 北京锐安科技有限公司 | 一种深度包检测方法 |
WO2013079003A1 (zh) * | 2011-11-30 | 2013-06-06 | 华为技术有限公司 | 网络消息解析方法及通信设备 |
CN103281213A (zh) * | 2013-04-18 | 2013-09-04 | 西安交通大学 | 一种网络流量内容提取和分析检索方法 |
CN103685224A (zh) * | 2013-09-05 | 2014-03-26 | 北京安博达通科技有限责任公司 | 网络入侵检测方法 |
CN104022920A (zh) * | 2014-06-26 | 2014-09-03 | 重庆重邮汇测通信技术有限公司 | 一种lte网络流量识别系统及方法 |
WO2016054992A1 (zh) * | 2014-10-10 | 2016-04-14 | 中兴通讯股份有限公司 | 网络数据采集系统及方法 |
CN108964979A (zh) * | 2018-06-07 | 2018-12-07 | 成都深思科技有限公司 | 一种网络数据流显示系统及其工作方法 |
CN111478966A (zh) * | 2020-04-07 | 2020-07-31 | 全球能源互联网研究院有限公司 | 物联网协议的解析方法、装置、计算机设备及存储介质 |
CN112468365A (zh) * | 2020-11-26 | 2021-03-09 | 上海阅维科技股份有限公司 | 用于网络镜像流量的数据质量检测方法、系统及介质 |
CN113132416A (zh) * | 2021-06-03 | 2021-07-16 | 新华三信息安全技术有限公司 | 一种数据包检测方法及装置 |
CN113902574A (zh) * | 2021-10-19 | 2022-01-07 | 中国平安人寿保险股份有限公司 | 协议数据处理方法、装置、计算机设备及存储介质 |
CN114050926A (zh) * | 2021-11-09 | 2022-02-15 | 南方电网科学研究院有限责任公司 | 一种数据报文深度检测方法和装置 |
-
2022
- 2022-04-14 CN CN202210393158.4A patent/CN114760256B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2175603A1 (en) * | 2008-10-09 | 2010-04-14 | Juniper Networks, Inc. | Dynamic access control policy with port restrictions for a network security appliance |
CN101557329A (zh) * | 2009-05-27 | 2009-10-14 | 杭州迪普科技有限公司 | 一种基于应用层的数据分割方法及装置 |
CN101605018A (zh) * | 2009-06-17 | 2009-12-16 | 中兴通讯股份有限公司 | 一种基于流的深度报文检测协议解码方法、设备及系统 |
WO2013079003A1 (zh) * | 2011-11-30 | 2013-06-06 | 华为技术有限公司 | 网络消息解析方法及通信设备 |
CN102437937A (zh) * | 2011-12-29 | 2012-05-02 | 北京锐安科技有限公司 | 一种深度包检测方法 |
CN103281213A (zh) * | 2013-04-18 | 2013-09-04 | 西安交通大学 | 一种网络流量内容提取和分析检索方法 |
CN103685224A (zh) * | 2013-09-05 | 2014-03-26 | 北京安博达通科技有限责任公司 | 网络入侵检测方法 |
CN104022920A (zh) * | 2014-06-26 | 2014-09-03 | 重庆重邮汇测通信技术有限公司 | 一种lte网络流量识别系统及方法 |
WO2016054992A1 (zh) * | 2014-10-10 | 2016-04-14 | 中兴通讯股份有限公司 | 网络数据采集系统及方法 |
CN108964979A (zh) * | 2018-06-07 | 2018-12-07 | 成都深思科技有限公司 | 一种网络数据流显示系统及其工作方法 |
CN111478966A (zh) * | 2020-04-07 | 2020-07-31 | 全球能源互联网研究院有限公司 | 物联网协议的解析方法、装置、计算机设备及存储介质 |
CN112468365A (zh) * | 2020-11-26 | 2021-03-09 | 上海阅维科技股份有限公司 | 用于网络镜像流量的数据质量检测方法、系统及介质 |
CN113132416A (zh) * | 2021-06-03 | 2021-07-16 | 新华三信息安全技术有限公司 | 一种数据包检测方法及装置 |
CN113902574A (zh) * | 2021-10-19 | 2022-01-07 | 中国平安人寿保险股份有限公司 | 协议数据处理方法、装置、计算机设备及存储介质 |
CN114050926A (zh) * | 2021-11-09 | 2022-02-15 | 南方电网科学研究院有限责任公司 | 一种数据报文深度检测方法和装置 |
Non-Patent Citations (1)
Title |
---|
张黎: "基于网络流量的工控系统异常检测方法研究", 《中国优秀硕士学位论文全文数据库》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114760256B (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2608464C2 (ru) | Устройство, способ и сетевой сервер для обнаружения структур данных в потоке данных | |
CN114760369B (zh) | 一种协议元数据提取方法、装置、设备及存储介质 | |
CN110727697A (zh) | 数据的处理方法和装置、存储介质、电子装置 | |
CN107506284B (zh) | 日志处理方法及装置 | |
CN115567589B (zh) | Json数据的压缩传输方法、装置、设备及存储介质 | |
CN112861346A (zh) | 数据处理系统、方法及电子设备 | |
CN113377998A (zh) | 数据加载的方法、装置、电子设备及存储介质 | |
CN117201340A (zh) | 一种报文特征识别方法、装置、设备及存储介质 | |
CN117271467A (zh) | 一种日志的查询以及转发方法、装置、设备及存储介质 | |
CN114760256A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN112241621A (zh) | 一种通过用户代理识别客户端环境的方法和装置 | |
CN115632866A (zh) | 基于fpga实现的报文脱敏方法、装置、设备及介质 | |
CN113518088B (zh) | 数据处理方法、装置、服务器、客户端和介质 | |
CN114500398A (zh) | 一种处理器协同加速的方法、装置、设备及介质 | |
CN115599571A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN113656731A (zh) | 广告页面的处理方法、装置、电子设备和存储介质 | |
CN117112162B (zh) | 一种数据处理方法、装置、设备和存储介质 | |
CN116016724B (zh) | 一种报文的解析方法、装置、设备及介质 | |
CN113472654B (zh) | 一种网络流量数据转发方法、装置、设备及介质 | |
CN114338543B (zh) | 一种网络访问限速方法、装置、设备及存储介质 | |
CN110880999B (zh) | 一种电子红包识别方法、装置及终端设备 | |
CN116455851A (zh) | 一种消息推送方法、电子设备和存储介质 | |
CN115883676A (zh) | 一种数据包的传输方法、装置、电子设备以及存储介质 | |
CN118093009A (zh) | 一种数据读取方法、装置、存储介质、电子设备及产品 | |
CN116862388A (zh) | 生产方法、装置、软件物料清单端、持续集成端及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |