CN113422699A - 数据流处理方法、装置、计算机可读存储介质及电子设备 - Google Patents

数据流处理方法、装置、计算机可读存储介质及电子设备 Download PDF

Info

Publication number
CN113422699A
CN113422699A CN202110692893.0A CN202110692893A CN113422699A CN 113422699 A CN113422699 A CN 113422699A CN 202110692893 A CN202110692893 A CN 202110692893A CN 113422699 A CN113422699 A CN 113422699A
Authority
CN
China
Prior art keywords
data streams
target
reference data
data stream
groups
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110692893.0A
Other languages
English (en)
Other versions
CN113422699B (zh
Inventor
周娟
郭勇
彭继革
蒋亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202110692893.0A priority Critical patent/CN113422699B/zh
Publication of CN113422699A publication Critical patent/CN113422699A/zh
Application granted granted Critical
Publication of CN113422699B publication Critical patent/CN113422699B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0894Packet rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2425Traffic characterised by specific attributes, e.g. priority or QoS for supporting services specification, e.g. SLA
    • H04L47/2433Allocation of priorities to traffic types
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/90Buffering arrangements
    • H04L49/9057Arrangements for supporting packet reassembly or resequencing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0227Filtering policies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请提供一种数据流处理方法、装置、介质及电子设备,涉及数据安全技术领域,包括:对接收到的数据流进行应用协议分组得到多组参考数据流,并基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流;对多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令;根据各目标数据流分别对应的会话请求指令确定待处理业务。可见,实施上述方法可以依据应用协议、目标协议地址筛选出需要被还原的数据流,进而再根据报文切片还原出会话请求指令,根据会话请求指令可以确定出待处理的任务,避免全局解析重组,可以提升数据流处理效率。

Description

数据流处理方法、装置、计算机可读存储介质及电子设备
技术领域
本申请涉及数据安全技术领域,具体而言,涉及一种数据流处理方法、数据流处理装置、计算机可读存储介质及电子设备。
背景技术
在网络管理中,数据流量统计和分析是较为重要的任务,网络的数据流量通常可以反映网络物理链路的运行状况,是判断网络运行是否正常的关键依据。一般来说,需要将获取到的所有数据流进行解码和重组,进而还原出数据流中的具体内容,依据该具体内容可以实现对于数据流的分析。但是,数据流中通常存在噪声数据流,噪声数据流的具体内容一般对数据流分析没有实质性帮助,如果对于全局数据流都进行解码和重组,则会造成数据流处理效率较低。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本申请的目的在于提供一种数据流处理方法、数据流处理装置、计算机可读存储介质及电子设备,可以依据应用协议、目标协议地址筛选出需要被还原的数据流,进而再根据报文切片还原出会话请求指令,根据会话请求指令可以确定出待处理的任务,避免全局解析重组,可以提升数据流处理效率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请的一方面,提供一种数据流处理方法,包括:
对接收到的数据流进行应用协议分组得到多组参考数据流,并基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流;
对多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令;
根据各目标数据流分别对应的会话请求指令确定待处理业务。
在本申请的一种示例性实施例中,根据各目标数据流分别对应的会话请求指令确定待处理业务,包括:
根据各目标数据流分别对应的会话请求指令对组内目标数据流进行数据重组,以还原指令信息;
确定各指令信息标识的待处理业务。
在本申请的一种示例性实施例中,根据各目标数据流分别对应的会话请求指令确定待处理业务之后,上述方法还包括:
若待处理业务未命中预设业务标签库,则判定待处理业务为未知业务;
当未知业务数量达到预设阈值时,对所有未知业务进行敏感数据检测,得到检测结果;
根据检测结果对所有未知业务进行类型绑定;
根据类型绑定后的所有未知业务更新预设业务标签库。
在本申请的一种示例性实施例中,基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流,包括:
基于目标协议地址对多组参考数据流分别进行分组,得到多组待过滤数据流;
根据预设筛选规则对多组待过滤数据流进行过滤,得到多组目标数据流;
其中,组内待过滤数据流对应于相同的应用协议和相同的目标协议地址,组间待过滤数据流对应于不同的应用协议和不同的目标协议地址;待过滤数据流的组别数量大于等于参考数据流的组别数量,多组目标数据流的组别数量小于等于待过滤数据流的组别数量。
在本申请的一种示例性实施例中,基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流,包括:
根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配线程;
根据各组参考数据流分别对应的线程对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流。
在本申请的一种示例性实施例中,根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配线程,包括:
为各组参考数据流分配等量的基础线程;
根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配增补线程。
在本申请的一种示例性实施例中,各应用协议对应的传输参数至少包括应用协议瞬时传输速率,各组参考数据流对应的传输参数至少包括数据流瞬时传输速率,则根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配增补线程,包括:
根据各应用协议瞬时传输速率和各数据流瞬时传输速率确定各组参考数据流的分配优先级;
根据分配优先级为各组参考数据流分配增补线程。
根据本申请的一方面,提供一种数据流处理装置,包括:
应用协议分组单元,用于对接收到的数据流进行应用协议分组得到多组参考数据流;
目标协议地址分组单元,用于基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流;
会话请求指令确定单元,用于对多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令;
待处理业务确定单元,用于根据各目标数据流分别对应的会话请求指令确定待处理业务。
在本申请的一种示例性实施例中,待处理业务确定单元根据各目标数据流分别对应的会话请求指令确定待处理业务,包括:
根据各目标数据流分别对应的会话请求指令对组内目标数据流进行数据重组,以还原指令信息;
确定各指令信息标识的待处理业务。
在本申请的一种示例性实施例中,上述装置还包括:
业务判定单元,用于在待处理业务确定单元根据各目标数据流分别对应的会话请求指令确定待处理业务之后,若待处理业务未命中预设业务标签库,则判定待处理业务为未知业务;
敏感数据检测单元,用于当未知业务数量达到预设阈值时,对所有未知业务进行敏感数据检测,得到检测结果;
标签绑定单元,用于根据检测结果对所有未知业务进行类型绑定;
预设业务标签库更新单元,用于根据类型绑定后的所有未知业务更新预设业务标签库。
在本申请的一种示例性实施例中,目标协议地址分组单元基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流,包括:
基于目标协议地址对多组参考数据流分别进行分组,得到多组待过滤数据流;
根据预设筛选规则对多组待过滤数据流进行过滤,得到多组目标数据流;
其中,组内待过滤数据流对应于相同的应用协议和相同的目标协议地址,组间待过滤数据流对应于不同的应用协议和不同的目标协议地址;待过滤数据流的组别数量大于等于参考数据流的组别数量,多组目标数据流的组别数量小于等于待过滤数据流的组别数量。
在本申请的一种示例性实施例中,目标协议地址分组单元基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流,包括:
根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配线程;
根据各组参考数据流分别对应的线程对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流。
在本申请的一种示例性实施例中,目标协议地址分组单元根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配线程,包括:
为各组参考数据流分配等量的基础线程;
根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配增补线程。
在本申请的一种示例性实施例中,各应用协议对应的传输参数至少包括应用协议瞬时传输速率,各组参考数据流对应的传输参数至少包括数据流瞬时传输速率,则目标协议地址分组单元根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配增补线程,包括:
根据各应用协议瞬时传输速率和各数据流瞬时传输速率确定各组参考数据流的分配优先级;
根据分配优先级为各组参考数据流分配增补线程。
根据本申请的一方面,提供一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的方法。
根据本申请的一方面,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一项的方法。
根据本申请的一方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的各种可选实现方式中提供的方法。
本申请示例性实施例可以具有以下部分或全部有益效果:
在本申请的一示例实施方式所提供的数据流处理方法中,可以对接收到的数据流进行应用协议分组得到多组参考数据流,并基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流;对多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令;根据各目标数据流分别对应的会话请求指令确定待处理业务。依据上述方案描述,本申请一方面,可以依据应用协议、目标协议地址筛选出需要被还原的数据流,进而再根据报文切片还原出会话请求指令,根据会话请求指令可以确定出待处理的任务,避免全局解析重组,可以提升数据流处理效率。本申请另一方面,可以通过依据应用协议分组、目标协议地址分组、报文切片的三层架构,实现对于数据流的有效处理,提升对于计算资源的利用率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本申请实施例的一种数据流处理方法及数据流处理装置的示例性系统架构的示意图;
图2示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图;
图3示意性示出了根据本申请的一个实施例的数据流处理方法的流程图;
图4示意性示出了根据本申请的一个实施例的用于实现数据流处理方法的三层架构示意图;
图5示意性示出了根据本申请的一个实施例的数据分析结构示意图;
图6示意性示出了根据本申请的一个实施例的数据流处理方法的流程图;
图7示意性示出了根据本申请的一个实施例中的数据流处理装置的结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本申请的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本申请的各方面变得模糊。
此外,附图仅为本申请的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本申请实施例的一种数据流处理方法及数据流处理装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本申请实施例所提供的数据流处理方法一般由服务器105执行,相应地,数据流处理装置一般设置于服务器105中。但本领域技术人员容易理解的是,本申请实施例所提供的数据流处理方法也可以由终端设备101、102或103执行,相应的,数据流处理装置也可以设置于终端设备101、102或103中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例中,服务器105可以对接收到的数据流进行应用协议分组得到多组参考数据流,并基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流;对多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令;根据各目标数据流分别对应的会话请求指令确定待处理业务。
图2示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图2示出的电子设备的计算机系统200仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从储存部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统操作所需的各种程序和数据。CPU201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的储存部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入储存部分208。
特别地,根据本申请的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时,执行本申请的方法和装置中限定的各种功能。
本示例实施方式提供了一种数据流处理方法。该数据流处理方法可以应用于上述服务器105,也可以应用于上述终端设备101、102、103中的一个或多个,本示例性实施例中对此不做特殊限定。参考图3所示,该数据流处理方法可以包括以下步骤S310至步骤S330。
步骤S310:对接收到的数据流进行应用协议分组得到多组参考数据流,并基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流。
步骤S320:对多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令。
步骤S330:根据各目标数据流分别对应的会话请求指令确定待处理业务。
实施图3所示的方法,可以依据应用协议、目标协议地址筛选出需要被还原的数据流,进而再根据报文切片还原出会话请求指令,根据会话请求指令可以确定出待处理的任务,避免全局解析重组,可以提升数据流处理效率。此外,可以通过依据应用协议分组、目标协议地址分组、报文切片的三层架构,实现对于数据流的有效处理,提升对于计算资源的利用率。
下面,对于本示例实施方式的上述步骤进行更加详细的说明。
在步骤S310中,对接收到的数据流进行应用协议分组得到多组参考数据流,并基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流。
其中,应用协议可以为http、tns、ftp、smtp等未加密协议,也可以为https等加密协议。多组参考数据流中每组参考数据流对应于不同的应用协议,每组参考数据流中可以包含一个或多个数据流,例如,A组参考数据流对应的应用协议为http,B组参考数据流对应的应用协议为tns、C组参考数据流对应的应用协议为tns。多组目标数据流中每组目标数据流对应于不同的目标协议地址,每组目标数据流中可以包含一个或多个数据流。
其中,数据流可以为TCP通信数据流(TCP Stream)或NetFlow流。TCP通信数据流是满足于TCP传输控制协议的数据流。NetFlow流定义为在一个源IP地址和目的IP地址之间传输的单向数据包流。其中,NetFlow流可以通过如下字段进行标识:源协议地址、目标协议地址、源端口号、目标端口号、第三层协议、服务类型(Tos)、输入的逻辑端口(ifIndex)。进一步地,NetFlow缓存是存储数据流的内存区域,可以定期更新。当路由器处理一个数据流的第一个数据包时,会在缓存中创建一个新的流的条目,该条目包含了关于数据流的所有统计信息(如,数据流中包含的数据包数目、流中的所有字节数等)也包含了数据流的各字段对应的属性信息。当后继的数据包到达时,可以检查新到达的数据包的属性是否满足缓存中己有数据流的定义,如果满足,则对缓存中的已有的数据流条目进行计数。
另外,在对接收到的数据流进行应用协议分组得到多组参考数据流之前,上述方法还可以包括:通过端口镜像(Port Monitoring)或分光器(Optical Splitter)获取链路上原始的数据流并解析数据流以获取应用协议。其中,分光器用于分发下行数据并集中上行数据,包括一个上行光接口和若干下行光接口,从上行光接口进入的光信号被分配到所有的下行光接口传输出去,从下行光接口进入的光信号被分配到唯一的上行光接口传输出去。端口镜像(port Mirroring)功能可以通过在交换机或路由器将一个或多个源端口的数据流量转发到某一个指定端口来实现对网络的监听,指定端口可以称为镜像端口或目的端口。
具体地,解析数据流的方式可以为:通过网卡流量采集模块对网络OSI模型中的七层应用协议进行采集分析。其中,七层应用协议包括:应用层,表示层,会话层,传输层,网络层,数据链路层,物理层。具体地,OSI模型中的每一层对应不同的通信协议,在计算机通信双方交互过程中完成各自特定的工作。当收到网络数据包时,首先由下层协议对收到的网络数据进行处理,然后提交使上层协议能够识别的数据,上层协议接收到下层协议的数据,根据本层的规定对数据进行相应处理,处理完毕可以继续提交更上层协议。
作为一种可选的实施例,基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流,包括:基于目标协议地址对多组参考数据流分别进行分组,得到多组待过滤数据流;根据预设筛选规则对多组待过滤数据流进行过滤,得到多组目标数据流;其中,组内待过滤数据流对应于相同的应用协议和相同的目标协议地址,组间待过滤数据流对应于不同的应用协议和不同的目标协议地址;待过滤数据流的组别数量大于等于参考数据流的组别数量,多组目标数据流的组别数量小于等于待过滤数据流的组别数量。
其中,预设筛选规则用于限定允许进入计算单元的目标协议地址。组别数量即组数量。
可见,实施该可选的实施例,能够实现对于无效流量的过滤,提升对于数据流的处理效率,避免对计算资源的浪费。
作为一种可选的实施例,基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流,包括:根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配线程;根据各组参考数据流分别对应的线程对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流。
其中,根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配线程,包括:基于PF(Proportional Fair,比例公平)调度算法计算各应用协议对应的传输参数和各组参考数据流对应的传输参数,并根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配线程,这样有利于实现流量中各种协议的计算拓扑的并发资源最优分配。
可见,实施该可选的实施例,能够基于各应用协议对应的传输参数和各组参考数据流对应的传输参数进行线程分配,使得需要更多计算资源的数据流获得更多的计算资源,需要较少计算资源的数据流获得较少的计算资源,从而实现对于计算资源的动态分配,提升对于计算资源的利用率。
作为一种可选的实施例,根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配线程,包括:为各组参考数据流分配等量的基础线程;根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配增补线程。
其中,为各组参考数据流分配等量的基础线程,包括:为各组参考数据流分配M个的基础线程,M为正整数。
可见,实施该可选的实施例,能够通过为不同的数据流提供不同数量的线程,实现对于计算资源的动态调整,以提升对于计算资源的利用率。
作为一种可选的实施例,各应用协议对应的传输参数至少包括应用协议瞬时传输速率,各组参考数据流对应的传输参数至少包括数据流瞬时传输速率,则根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配增补线程,包括:根据各应用协议瞬时传输速率和各数据流瞬时传输速率确定各组参考数据流的分配优先级;根据分配优先级为各组参考数据流分配增补线程。
其中,根据各应用协议瞬时传输速率和各数据流瞬时传输速率确定各组参考数据流的分配优先级之前,上述方法还包括:计算t时刻k协议的瞬时传输速率Pk瞬时(t)以及t时刻之前两个时刻的k协议的平均流量
Figure BDA0003127389040000121
k协议可以为任一应用协议(如,http),t为正整数;基于
Figure BDA0003127389040000122
计算分配参数Pk(t);进而,计算t时刻第i个数据流的瞬时传输速率Pi瞬时(t)以及t时刻之前两个时刻的数据流的平均流量
Figure BDA0003127389040000123
进而,基于
Figure BDA0003127389040000124
计算分配参数Pi(t)。
基于此,根据各应用协议瞬时传输速率和各数据流瞬时传输速率确定各组参考数据流的分配优先级,包括:根据Pk(t)/Pi(t)由高到低的顺序确定各组参考数据流的分配优先级;其中,Pk(t)/Pi(t)越大,对应的参考数据流的优先级越高,优先级越高,分配得到的增补线程越多。
可见,实施该可选的实施例,能够根据应用协议瞬时传输速率和数据流瞬时传输速率分配增补线程,提升分配的合理性。
在步骤S320中,对多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令。
其中,对多组目标数据流分别进行报文切片,包括:对各组目标数据流中的目标数据流进行IP报文数据截取;或者,对各组目标数据流中的目标数据流进行前100位报文截取。其中,IP报文数据和前100位报文均包括会话请求指令(如,http的统一资源定位系统(URL))。
IP可以根据数据包头部中的目的地址将数据包送到不同网络中,网关根据IP地址选择传输的路径。目标数据流的IP数据包的报文格式可以为如下表所示:
Figure BDA0003127389040000131
在步骤S330中,根据各目标数据流分别对应的会话请求指令确定待处理业务。
其中,待处理业务是具体的用户请求,如,注册业务、登录业务等。另外,根据各目标数据流分别对应的会话请求指令确定待处理业务之后,上述方法还可以包括:基于分布式应用程序协调服务(ZooKeeper Server)根据拓扑配置信息向待处理业务分配至少一个计算节点(Node),以使得至少一个计算节点执行待处理业务;其中,拓扑配置信息可以包括应用协议、目标协议地址、目标端口、源协议地址、源端口、URL中至少一个。进而,当接收到新的拓扑配置信息时,上述方法还可以包括:基于ZooKeeper Server创建新计算节点并根据新计算节点执行新的拓扑配置对应的任务;新的拓扑配置与原拓扑配置存在至少一项不同信息。进而,新计算节点可以为临时节点,基于此,上述方法还可以包括:当新的拓扑配置对应的任务执行完毕,则自动删除上述的新计算节点,从而减少对于存储资源的占用。
作为一种可选的实施例,根据各目标数据流分别对应的会话请求指令确定待处理业务,包括:根据各目标数据流分别对应的会话请求指令对组内目标数据流进行数据重组,以还原指令信息;确定各指令信息标识的待处理业务。
其中,根据各目标数据流分别对应的会话请求指令对组内目标数据流进行数据重组,以还原指令信息,包括:将对应于会话请求指令的目标数据流进行重组,以获得完整的IP报文;进而,根据完整的IP报文进行TCP会话重组,得到TCP的原始报文流;进而,根据TCP的原始报文流获取完整的会话数据;进而,确定会话数据中的指令信息;其中,指令信息为会话请求指令请求的具体内容。上述过程可以理解为,对二进制比特数据流中各个位置的字段进行提取和解析重组,具体可以利用端口匹配、流量特征检测、自动连接关联和行为特征分析等手段。
举例来说,若还原出的会话请求指令为/page/pc/service?isconvert=true&action=QRY_CUST_QUERY_CUST_INFOS&billID=13608082308,则其中的/page/pc/service为URL,isconvert=true&action=QRY_CUST_QUERY_CUST_INFOS&billID=13608082308为用户输入的数据部分。
可见,实施该可选的实施例,能够对分组、过滤得到的目标数据流进行数据重组,从而得到有效的指令信息,避免对噪声数据流进行数据重组,提升了对于计算机资源的利用率。
作为一种可选的实施例,根据各目标数据流分别对应的会话请求指令确定待处理业务之后,上述方法还包括:若待处理业务未命中预设业务标签库,则判定待处理业务为未知业务;当未知业务数量达到预设阈值时,对所有未知业务进行敏感数据检测,得到检测结果;根据检测结果对所有未知业务进行类型绑定;根据类型绑定后的所有未知业务更新预设业务标签库。
其中,预设业务标签库可以包括目标协议地址、目标端口、源协议地址、源端口、URL中至少一个。
具体地,上述方法还包括:提取URL中的参数(如,getname、getcard等);将参数与预设业务标签库中的URL进行比对,若参数命中了预设业务标签库中的某一个URL,则基于ZooKeeper Server根据拓扑配置信息向待处理业务分配至少一个计算节点(Node),以使得至少一个计算节点执行待处理业务;若未参数命中预设业务标签库,则判定待处理业务为未知业务。
进而,对所有未知业务进行敏感数据检测,得到检测结果,包括:对所有未知业务进行聚类,并对聚类结果进行敏感数据检测,得到检测结果。其中,敏感数据可以为违规数据,违规数据可以为预先设定的数据,例如,在用户请求的注册任务中,若检测到用户输入的用户名包含符号,则可以判定该注册任务中包含敏感数据。
具体地,对所有未知业务进行聚类,包括:根据URL对所有未知业务进行聚类,得到多个业务集,各业务集对应于不同的URL;进而,确定各业务集分别对应的输出语句(如,M=“/page/pc/service”),例如,业务集1中的业务均对应于1=“/page/pc/service”,M=1,不同的业务集对应的M不同;进而,可以通过预设字符(如,“&”、“:”)分割得到至少一项用户输入数据(如,N1=“isconvert=true”、N2=“action=QRY_CUST_QUERY_CUST_INFOS”、N3=“billID=13608082308”,其中,isconvert、action、billID为参数名,true、QRY_CUST_QUERY_CUST_INFOS、13608082308为变量参数值);进而,可以相同的参数名聚类,进而基于参数名聚类结果对相同的变量参数值进行再次聚类;其中,聚类依据的可以是合成聚类算法或序列算法等。
进而,根据检测结果对所有未知业务进行类型绑定,包括:若检测结果用于表示未知业务中包含敏感数据,则将该未知业务与普通业务类型绑定;若检测结果用于表示未知业务中不包含敏感数据,则将该未知业务与关注业务类型绑定。其中,针对普通业务类型的业务的处理方式为:针对下行访问内容流重组还原。针对关注业务类型的业务的处理方式为:针对上行请求内容解析还原。
可见,实施该可选的实施例,能够实现敏感数据的精准定位,提升对于敏感数据的检测效率。
请参阅图4,图4示意性示出了根据本申请的一个实施例的用于实现数据流处理方法的三层架构示意图。如图4所示,三层架构包括物理分组层410、逻辑分组层420以及数据分析层430;其中,物理分组层410包括计算单元411,逻辑分组层420包括一个分组计算单元组(即,计算单元421和计算单元422)和另一个分组计算单元组(即,计算单元4211、计算单元4212、计算单元4221、计算单元4222),数据分析层430包括计算单元431、计算单元432、计算单元433、计算单元434、计算单元435、计算单元436、计算单元437、计算单元438。其中,上述计算单元421和计算单元422用于执行至少一个计算任务(如,任务1、任务2、任务3)。
具体地,物理分组层410可以基于TCP流分组策略通过计算单元411对TCP通信数据流进行应用协议分组,得到两组参考数据流并发送至逻辑分组层420;其中,一组参考数据流是封装http数据流的数据结构,另一组参考数据流是封装FTP数据流的数据结构。其中,FTP(File Transfer Protocol,文件传输协议)是TCP/IP协议组中的协议之一,http(Hypertext Transfer Protocol)是超文本传输协议。
进而,逻辑分组层420可以依据计算单元421基于目标协议地址对封装http数据流的数据结构进行分组并根据预设筛选规则对多组待过滤数据流进行过滤,得到多组目标数据流(即,分组目标IP对象1-封装http数据流的数据结构,分组目标IP对象2-封装http数据流的数据结构),以及依据计算单元422对封装FTP数据流的数据结构进行分组并根据预设筛选规则对多组待过滤数据流进行过滤,得到多组目标数据流(即,分组目标IP对象1-封装FTP数据流的数据结构,分组目标IP对象2-封装FTP数据流的数据结构)。
进而,计算单元4211用于对分组目标IP对象1-封装http数据流的数据结构进行报文切片,并根据切片结果确定http数据流中各目标数据流分别对应的会话请求指令(如,源IP对象1和源IP对象2),从而将“源IP对象1;目标IP对象1;http数据流”输入计算单元431,以及将“源IP对象2;目标IP对象1;http数据流”输入计算单元432。计算单元4212用于对分组目标IP对象2-封装http数据流的数据结构进行报文切片,并根据切片结果确定http数据流中各目标数据流分别对应的会话请求指令(如,源IP对象1和源IP对象2),从而将“源IP对象1;目标IP对象2;http数据流”输入计算单元433,以及将“源IP对象2;目标IP对象2;http数据流”输入计算单元434。计算单元4221用于对分组目标IP对象1-封装FTP数据流的数据结构进行报文切片,并根据切片结果确定FTP数据流中各目标数据流分别对应的会话请求指令(如,源IP对象1和源IP对象2),从而将“源IP对象1;目标IP对象1;FTP数据流”输入计算单元435,以及将“源IP对象2;目标IP对象1;FTP数据流”输入计算单元436。计算单元4222用于对分组目标IP对象2-封装FTP数据流的数据结构进行报文切片,并根据切片结果确定FTP数据流中各目标数据流分别对应的会话请求指令(如,源IP对象1和源IP对象2),从而将“源IP对象1;目标IP对象2;FTP数据流”输入计算单元437,以及将“源IP对象2;目标IP对象2;FTP数据流”输入计算单元438。
其中,计算单元431、计算单元432、计算单元433、计算单元434、计算单元435、计算单元436、计算单元437用于进行数据重组,以还原指令信息,进而确定各指令信息标识的待处理业务,检测待处理业务是否未命中预设业务标签库,如果否,判定待处理业务为未知业务。当未知业务数量达到预设阈值时,对所有未知业务进行敏感数据检测,得到检测结果,根据检测结果对所有未知业务进行类型绑定,并根据类型绑定后的所有未知业务更新预设业务标签库。
请参阅图5,图5示意性示出了根据本申请的一个实施例的数据分析结构示意图。如图5所示,数据分析结构可以包括分组实时计算结构510、初始化实时计算结构节点521、初始化实时计算结构节点522、应用了基于分布式应用程序协调服务的实时计算结构节点531和实时计算结构节点532。
具体地,分组实时计算结构510用于对接收到的数据流进行应用协议分组得到多组参考数据流,并基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到对应于分组目标IP对象1和封装http数据流的数据结构的数据流1和对应于分组目标IP对象2和封装http数据流的数据结构的数据流2。
进而,初始化实时计算结构节点521可以根据为数据流1分配基础线程,并根据http对应的传输参数和数据流1对应的传输参数为数据流1分配增补线程,进而根据基础线程和增补线程确定拓扑信息1,将拓扑信息1发送至基于分布式应用程序协调服务并将数据流1发送至实时计算结构节点531。
其中,初始化实时计算结构节点5221可以根据为数据流2分配基础线程,并根据FTP对应的传输参数和数据流2对应的传输参数为数据流2分配增补线程,进而根据基础线程和增补线程确定拓扑信息2,将拓扑信息2发送至基于分布式应用程序协调服务并将数据流2发送至实时计算结构节点532。进而,实时计算结构节点531和实时计算结构节点532可以基于分配得到的线程进行数据重组,以还原指令信息,进而确定各指令信息标识的待处理业务,检测待处理业务是否未命中预设业务标签库,如果否,判定待处理业务为未知业务。当未知业务数量达到预设阈值时,对所有未知业务进行敏感数据检测,得到检测结果,根据检测结果对所有未知业务进行类型绑定,并根据类型绑定后的所有未知业务更新预设业务标签库。
请参阅图6,图6示意性示出了根据本申请的一个实施例的数据流处理方法的流程图。如图6所示,数据流处理方法可以包括如下步骤。
步骤S600:接收数据流并解析数据流以获取应用协议。
步骤S610:对接收到的数据流进行应用协议分组得到多组参考数据流。
步骤S620:为各组参考数据流分配等量的基础线程,根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配增补线程,以使得基础线程和/或增补线程执行对多组参考数据流中各组参考数据流进行分组和噪声过滤的步骤。
步骤S630:基于目标协议地址对多组参考数据流分别进行分组,得到多组待过滤数据流。
步骤S640:根据预设筛选规则对多组待过滤数据流进行过滤,得到多组目标数据流;其中,组内待过滤数据流对应于相同的应用协议和相同的目标协议地址,组间待过滤数据流对应于不同的应用协议和不同的目标协议地址,待过滤数据流的组别数量大于等于参考数据流的组别数量,多组目标数据流的组别数量小于等于待过滤数据流的组别数量。
步骤S650:对多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令。
步骤S660:根据各目标数据流分别对应的会话请求指令对组内目标数据流进行数据重组,以还原指令信息,进而确定各指令信息标识的待处理业务。
步骤S670:检测待处理业务是否未命中预设业务标签库。如果是,则结束本次流程。如果否,则执行步骤S680。
步骤S680:判定待处理业务为未知业务。
步骤S690:当未知业务数量达到预设阈值时,对所有未知业务进行敏感数据检测,得到检测结果,根据检测结果对所有未知业务进行类型绑定,并根据类型绑定后的所有未知业务更新预设业务标签库。
需要说明的是,步骤S600~步骤S690与图3所示的各步骤及其实施例相对应,针对步骤S600~步骤S690的具体实施方式,请参阅图3所示的各步骤及其实施例,此处不再赘述。
可见,实施图6所示的方法,可以依据应用协议、目标协议地址筛选出需要被还原的数据流,进而再根据报文切片还原出会话请求指令,根据会话请求指令可以确定出待处理的任务,避免全局解析重组,可以提升数据流处理效率。此外,可以通过依据应用协议分组、目标协议地址分组、报文切片的三层架构,实现对于数据流的有效处理,提升对于计算资源的利用率。
进一步的,本示例实施方式中,还提供了一种数据流处理装置。参考图7所示,该数据流处理装置700可以包括:
应用协议分组单元701,用于对接收到的数据流进行应用协议分组得到多组参考数据流;
目标协议地址分组单元702,用于基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流;
会话请求指令确定单元703,用于对多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令;
待处理业务确定单元704,用于根据各目标数据流分别对应的会话请求指令确定待处理业务。
可见,实施图7所示的装置,可以依据应用协议、目标协议地址筛选出需要被还原的数据流,进而再根据报文切片还原出会话请求指令,根据会话请求指令可以确定出待处理的任务,避免全局解析重组,可以提升数据流处理效率。此外,可以通过依据应用协议分组、目标协议地址分组、报文切片的三层架构,实现对于数据流的有效处理,提升对于计算资源的利用率。
在本申请的一种示例性实施例中,待处理业务确定单元704根据各目标数据流分别对应的会话请求指令确定待处理业务,包括:
根据各目标数据流分别对应的会话请求指令对组内目标数据流进行数据重组,以还原指令信息;
确定各指令信息标识的待处理业务。
可见,实施该可选的实施例,能够对分组、过滤得到的目标数据流进行数据重组,从而得到有效的指令信息,避免对噪声数据流进行数据重组,提升了对于计算机资源的利用率。
在本申请的一种示例性实施例中,上述装置还包括:
业务判定单元(未图示),用于在待处理业务确定单元704根据各目标数据流分别对应的会话请求指令确定待处理业务之后,若待处理业务未命中预设业务标签库,则判定待处理业务为未知业务;
敏感数据检测单元(未图示),用于当未知业务数量达到预设阈值时,对所有未知业务进行敏感数据检测,得到检测结果;
标签绑定单元(未图示),用于根据检测结果对所有未知业务进行类型绑定;
预设业务标签库更新单元(未图示),用于根据类型绑定后的所有未知业务更新预设业务标签库。
可见,实施该可选的实施例,能够实现敏感数据的精准定位,提升对于敏感数据的检测效率。
在本申请的一种示例性实施例中,目标协议地址分组单元702基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流,包括:
基于目标协议地址对多组参考数据流分别进行分组,得到多组待过滤数据流;
根据预设筛选规则对多组待过滤数据流进行过滤,得到多组目标数据流;
其中,组内待过滤数据流对应于相同的应用协议和相同的目标协议地址,组间待过滤数据流对应于不同的应用协议和不同的目标协议地址;待过滤数据流的组别数量大于等于参考数据流的组别数量,多组目标数据流的组别数量小于等于待过滤数据流的组别数量。
可见,实施该可选的实施例,能够实现对于无效流量的过滤,提升对于数据流的处理效率,避免对计算资源的浪费。
在本申请的一种示例性实施例中,目标协议地址分组单元702基于目标协议地址对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流,包括:
根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配线程;
根据各组参考数据流分别对应的线程对多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流。
可见,实施该可选的实施例,能够基于各应用协议对应的传输参数和各组参考数据流对应的传输参数进行线程分配,使得需要更多计算资源的数据流获得更多的计算资源,需要较少计算资源的数据流获得较少的计算资源,从而实现对于计算资源的动态分配,提升对于计算资源的利用率。
在本申请的一种示例性实施例中,目标协议地址分组单元702根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配线程,包括:
为各组参考数据流分配等量的基础线程;
根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配增补线程。
可见,实施该可选的实施例,能够通过为不同的数据流提供不同数量的线程,实现对于计算资源的动态调整,以提升对于计算资源的利用率。
在本申请的一种示例性实施例中,各应用协议对应的传输参数至少包括应用协议瞬时传输速率,各组参考数据流对应的传输参数至少包括数据流瞬时传输速率,则目标协议地址分组单元702根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为各组参考数据流分配增补线程,包括:
根据各应用协议瞬时传输速率和各数据流瞬时传输速率确定各组参考数据流的分配优先级;
根据分配优先级为各组参考数据流分配增补线程。
可见,实施该可选的实施例,能够根据应用协议瞬时传输速率和数据流瞬时传输速率分配增补线程,提升分配的合理性。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
由于本申请的示例实施例的数据流处理装置的各个功能模块与上述数据流处理方法的示例实施例的步骤对应,因此对于本申请装置实施例中未披露的细节,请参照本申请上述的数据流处理方法的实施例。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种数据流处理方法,其特征在于,包括:
对接收到的数据流进行应用协议分组得到多组参考数据流,并基于目标协议地址对所述多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流;
对所述多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令;
根据所述各目标数据流分别对应的会话请求指令确定待处理业务。
2.根据权利要求1所述的方法,其特征在于,根据所述各目标数据流分别对应的会话请求指令确定待处理业务,包括:
根据所述各目标数据流分别对应的会话请求指令对组内目标数据流进行数据重组,以还原指令信息;
确定各指令信息标识的待处理业务。
3.根据权利要求1所述的方法,其特征在于,根据所述各目标数据流分别对应的会话请求指令确定待处理业务之后,所述方法还包括:
若所述待处理业务未命中预设业务标签库,则判定所述待处理业务为未知业务;
当未知业务数量达到预设阈值时,对所有未知业务进行敏感数据检测,得到检测结果;
根据所述检测结果为所述所有未知业务绑定标签;
根据所述检测结果对所述所有未知业务进行类型绑定;
根据类型绑定后的所有未知业务更新所述预设业务标签库。
4.根据权利要求1所述的方法,其特征在于,基于目标协议地址对所述多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流,包括:
基于所述目标协议地址对所述多组参考数据流分别进行分组,得到多组待过滤数据流;
根据预设筛选规则对所述多组待过滤数据流进行过滤,得到多组目标数据流;
其中,组内待过滤数据流对应于相同的应用协议和相同的目标协议地址,组间待过滤数据流对应于不同的应用协议和不同的目标协议地址;所述待过滤数据流的组别数量大于等于所述参考数据流的组别数量,所述多组目标数据流的组别数量小于等于所述待过滤数据流的组别数量。
5.根据权利要求1所述的方法,其特征在于,基于目标协议地址对所述多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流,包括:
根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为所述各组参考数据流分配线程;
根据所述各组参考数据流分别对应的线程对所述多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流。
6.根据权利要求5所述的方法,其特征在于,根据各应用协议对应的传输参数和各组参考数据流对应的传输参数为所述各组参考数据流分配线程,包括:
为所述各组参考数据流分配等量的基础线程;
根据所述各应用协议对应的传输参数和所述各组参考数据流对应的传输参数为所述各组参考数据流分配增补线程。
7.根据权利要求6所述的方法,其特征在于,所述各应用协议对应的传输参数至少包括应用协议瞬时传输速率,所述各组参考数据流对应的传输参数至少包括数据流瞬时传输速率,则根据所述各应用协议对应的传输参数和所述各组参考数据流对应的传输参数为所述各组参考数据流分配增补线程,包括:
根据各应用协议瞬时传输速率和各数据流瞬时传输速率确定所述各组参考数据流的分配优先级;
根据所述分配优先级为所述各组参考数据流分配增补线程。
8.一种数据流处理装置,其特征在于,包括:
应用协议分组单元,用于对接收到的数据流进行应用协议分组得到多组参考数据流;
目标协议地址分组单元,用于基于目标协议地址对所述多组参考数据流中各组参考数据流进行分组和噪声过滤,得到多组目标数据流;
会话请求指令确定单元,用于对所述多组目标数据流分别进行报文切片,并根据切片结果确定每组目标数据流中各目标数据流分别对应的会话请求指令;
待处理业务确定单元,用于根据所述各目标数据流分别对应的会话请求指令确定待处理业务。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
CN202110692893.0A 2021-06-22 2021-06-22 数据流处理方法、装置、计算机可读存储介质及电子设备 Active CN113422699B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110692893.0A CN113422699B (zh) 2021-06-22 2021-06-22 数据流处理方法、装置、计算机可读存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110692893.0A CN113422699B (zh) 2021-06-22 2021-06-22 数据流处理方法、装置、计算机可读存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN113422699A true CN113422699A (zh) 2021-09-21
CN113422699B CN113422699B (zh) 2023-04-07

Family

ID=77716033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110692893.0A Active CN113422699B (zh) 2021-06-22 2021-06-22 数据流处理方法、装置、计算机可读存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN113422699B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230087758A1 (en) * 2021-09-14 2023-03-23 The Nielsen Company (Us), Llc Methods and apparatus to accurately credit streaming sessions

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101610271A (zh) * 2009-07-21 2009-12-23 国网电力科学研究院 一种基于数据流还原技术的数据库安全防护方法
CN103618792A (zh) * 2013-11-29 2014-03-05 华为技术有限公司 数据流的识别方法及设备
CN103780610A (zh) * 2014-01-16 2014-05-07 绵阳师范学院 基于协议特征的网络数据恢复方法
WO2015149302A1 (zh) * 2014-04-02 2015-10-08 中国科学院自动化研究所 基于点云与数据驱动的树木模型重建方法
CN107666486A (zh) * 2017-09-27 2018-02-06 清华大学 一种基于报文协议特征的网络数据流恢复方法及系统
CN109376254A (zh) * 2018-09-11 2019-02-22 青岛海信移动通信技术股份有限公司 数据流的处理方法、装置、电子设备及可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101610271A (zh) * 2009-07-21 2009-12-23 国网电力科学研究院 一种基于数据流还原技术的数据库安全防护方法
CN103618792A (zh) * 2013-11-29 2014-03-05 华为技术有限公司 数据流的识别方法及设备
CN103780610A (zh) * 2014-01-16 2014-05-07 绵阳师范学院 基于协议特征的网络数据恢复方法
WO2015149302A1 (zh) * 2014-04-02 2015-10-08 中国科学院自动化研究所 基于点云与数据驱动的树木模型重建方法
CN107666486A (zh) * 2017-09-27 2018-02-06 清华大学 一种基于报文协议特征的网络数据流恢复方法及系统
CN109376254A (zh) * 2018-09-11 2019-02-22 青岛海信移动通信技术股份有限公司 数据流的处理方法、装置、电子设备及可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230087758A1 (en) * 2021-09-14 2023-03-23 The Nielsen Company (Us), Llc Methods and apparatus to accurately credit streaming sessions

Also Published As

Publication number Publication date
CN113422699B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
US10599456B2 (en) Centralized networking configuration in distributed systems
US10855545B2 (en) Centralized resource usage visualization service for large-scale network topologies
US10230627B2 (en) Service path allocation method, router and service execution entity
US10355949B2 (en) Behavioral network intelligence system and method thereof
CN106953737B (zh) 在计算机网络内使用输出协议提供应用元数据
US6625650B2 (en) System for multi-layer broadband provisioning in computer networks
US9712390B2 (en) Encoding traffic classification information for networking configuration
US11283856B2 (en) Dynamic socket QoS settings for web service connections
US20150149631A1 (en) Customer-directed networking limits in distributed systems
US20150016252A1 (en) Source-driven switch probing with feedback request
US10284460B1 (en) Network packet tracing
CN112039796B (zh) 数据包传输方法和装置、存储介质和电子设备
CN114285781B (zh) Srv6业务流量统计方法、装置、电子设备及介质
CN113422699B (zh) 数据流处理方法、装置、计算机可读存储介质及电子设备
CN113992544B (zh) 端口流量分配的优化方法、装置
CN110545230A (zh) 用于转发vxlan报文的方法和装置
CN110611937B (zh) 数据分流方法、装置、边缘数据中心和可读存储介质
US11528187B1 (en) Dynamically configurable networking device interfaces for directional capacity modifications
WO2023065848A1 (zh) 业务调度方法、装置、设备及计算机可读存储介质
US11218394B1 (en) Dynamic modifications to directional capacity of networking device interfaces
CN112822107A (zh) 一种基于人工智能的广域网优化方法
CN112436951A (zh) 一种预知流量路径的方法和装置
CN115250254B (zh) Netflow报文分发处理方法及装置
CN117579534A (zh) 智能路由方法、装置、电子设备及存储介质
CN115988574A (zh) 基于流表的数据处理方法、系统、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant