CN111404832B - 一种基于连续tcp链接的业务分类方法和装置 - Google Patents

一种基于连续tcp链接的业务分类方法和装置 Download PDF

Info

Publication number
CN111404832B
CN111404832B CN201910001994.1A CN201910001994A CN111404832B CN 111404832 B CN111404832 B CN 111404832B CN 201910001994 A CN201910001994 A CN 201910001994A CN 111404832 B CN111404832 B CN 111404832B
Authority
CN
China
Prior art keywords
tcp
service
tcp link
target
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910001994.1A
Other languages
English (en)
Other versions
CN111404832A (zh
Inventor
郭韧
倪伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910001994.1A priority Critical patent/CN111404832B/zh
Publication of CN111404832A publication Critical patent/CN111404832A/zh
Application granted granted Critical
Publication of CN111404832B publication Critical patent/CN111404832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/19Flow control; Congestion control at layers above the network layer
    • H04L47/193Flow control; Congestion control at layers above the network layer at the transport layer, e.g. TCP related
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Abstract

本发明涉及图像处理技术,尤其涉及一种基于连续TCP链接的业务分类方法和装置,用于对业务类型进行识别,该方法为:业务处理装置确定TCP链接集合,并分别将每一个TCP链接上承载的目标数据流切割成若干流量块,然后对各个TCP链接进行排序,并根据N个连续的任意一个流量块,生成相应的目标流量图像,最后,通过业务类型识别模型确定所述目标业务的业务类型。这样,业务处理装置可以通过业务类型识别模型对目标业务进行分类,提高业务类型识别模型训练的自主性,降低网络设备的开销,并且,利用了同一目标业务下不同TCP链接的关联关系,保证业务分类结果的准确度,提高业务类型识别的精确度和有效性。

Description

一种基于连续TCP链接的业务分类方法和装置
技术领域
本发明涉及图像处理技术,尤其涉及一种基于连续TCP链接的业务分类方法和装置。
背景技术
目前,网络流量的识别方法主要分为深度包检测(Deep Packet Inspection,DPI)和深度流检测(Deep Flow Inspection,DFI)两种方式,其中,DPI方式按照不同的网络传输协议深度解析报文内容,获取应用层各个字段内容,将解析到的内容与预先人工分析的“业务应用层特征规则库”进行匹配,从而判定当前流量所对应的业务大类(即时通信、邮箱、门户等)、业务小类(新浪、百度、腾讯等)以及精细化动作(发图片、发消息等)。
DFI方式仅解析网络(Internet Protocol,IP)层、传输层的相关特征(如报文数量、包长、时间窗口等),以一条流量为粒度,分析流量的传输规律,从而训练/总结出一个分类模型,可以在一定程度上做到流量的分类。
然而,DPI方式有三个弊端:一是当流量采用应用层加密方式后,原有的应用层明文内容变为加密内容,DPI作为网络中间采集设备,根本无法破解,无法进行业务识别和分类;二是需要大量人员对“业务应用层特征规则库”中的每个子业务进行解析和分析,耗费大量资源和精力;三是互联网业务变化多端,任何一次应用程序(Application,APP)的版本更新都有可能使得之前分析的规则库无效,因此,仍需要长期且手工跟踪每一个业务的更新情况。另外,DFI方式提取特征数量和可选种类有限,只能相对准确分析到业务大类,而对业务小类和业务精细化动作的识别能力有限。
因此,需要设计一种基于连续TCP链接的业务分类方法以解决上述问题。
发明内容
本发明的目的是提供一种基于连续TCP链接的业务分类方法及装置,以有效识别业务类型。
本发明实施例提供的具体技术方案如下:
一种基于连续TCP链接的业务分类方法,包括:
确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:
按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,其中,N表示连续的TCP链接的数目,N为自然数;
将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是基于样本业务对应的样本流量图像以及样本业务的业务类型,经训练后获得的。
可选的,确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块之前,进一步包括:
确定用户触发的样本业务和所述样本业务的业务类型,以及确定用户基于样本业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的样本数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的样本流量图像;
基于获得的各个样本流量图像和相应的业务类型之间的对应关系,采用卷积神经网络算法进行模型训练,获得相应的业务类型识别模型。
可选的,确定用户基于目标业务与服务器建立的传输控制协议TCP链接集合,包括:
对目标业务触发的多个目标数据流进行监测,并将传输所述多个目标数据流所需的多个TCP链接确定为TCP链接集合。
可选的,按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块,包括:
以TCP链接为粒度,按照预设的数据量单位,或者,按照预设的时长单位,将所述TCP链接上承载的样本数据流切割成若干个流量块。
可选的,根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,包括:
针对所述N个连续的TCP链接,分别获取每一个TCP链接对应的一个流量块;
针对获得的N个流量块分别执行以下操作:将流量块包含的每一个字节分别映射为一个像素点,获得相应的流量图像;
从所述N个流量块各自对应的所述流量图像中,选取出红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的目标流量图像。
一种基于连续传输控制协议TCP链接的业务分类装置,可选的,包括:
切割单元,用于确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;
生成单元,用于按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,其中,N表示连续的TCP链接的数目,N为自然数;
识别单元,用于将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是基于样本业务对应的样本流量图像以及样本业务的业务类型,经训练后获得的。
可选的,确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块之前,所述切割单元进一步用于:
确定用户触发的样本业务和所述样本业务的业务类型,以及确定用户基于样本业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的样本数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的样本流量图像;
基于获得的各个样本流量图像和相应的业务类型之间的对应关系,采用卷积神经网络算法进行模型训练,获得相应的业务类型识别模型。
可选的,确定用户基于目标业务与服务器建立的传输控制协议TCP链接集合,所述切割单元用于:
对目标业务触发的多个目标数据流进行监测,并将传输所述多个目标数据流所需的多个TCP链接确定为TCP链接集合。
可选的,按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块,所述切割单元用于:
以TCP链接为粒度,按照预设的数据量单位,或者,按照预设的时长单位,将所述TCP链接上承载的样本数据流切割成若干个流量块。
可选的,根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,所述生成单元用于:
针对所述N个连续的TCP链接,分别获取每一个TCP链接对应的一个流量块;
针对获得的N个流量块分别执行以下操作:将流量块包含的每一个字节分别映射为一个像素点,获得相应的流量图像;
从所述N个流量块各自对应的所述流量图像中,选取出红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的目标流量图像。
一种存储介质,可选的,存储有用于实现基于连续传输控制协议TCP链接的业务分类的方法的程序,所述程序被处理器运行时,执行以下步骤:
确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:
按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,其中,N表示连续的TCP链接的数目,N为自然数;
将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是基于样本业务对应的样本流量图像以及样本业务的业务类型,经训练后获得的。
一种通信装置,可选的,包括一个或多个处理器;以及一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述装置执行如上述任一项所述的方法。
综上所述,本发明实施例中,业务处理装置确定TCP链接集合,并分别将每一个TCP链接上承载的目标数据流切割成若干流量块,然后对各个TCP链接进行排序,并根据N个连续的任意一个流量块,生成相应的目标流量图像,最后,将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型。这样,业务处理装置可以通过业务类型识别模型对目标业务进行分类,保证了业务类型识别模型的自动训练,提高业务类型识别模型训练的自主性,降低网络设备的开销,并且,利用了同一目标业务下不同TCP链接的关联关系,保证业务分类结果的准确度,提高业务类型识别的精确度和有效性。
附图说明
图1为本发明实施例中业务处理示意图;
图2为本发明实施例中业务类型识别模型的训练流程示意图;
图3为本发明实施例中业务分类流程示意图;
图4为本发明实施例中业务处理装置功能结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中,参阅图1所示,用户通过业务处理装置与服务器建立连接,在用户发起一种业务后,用户和服务器之间需要通过业务处理装置建立传输控制协议(Transmission Control Protocol,TCP)链接,来传输所述一种业务产生的数据流,并且,业务处理装置会对用户和服务器之间的数据流进行监测,将数据流进行处理后,获得流量图像和对应的业务类型,经过训练形成业务类型识别模型,用于对新的业务进行分类,其中,TCP链接是用户和服务器之间建立的一种逻辑联系,使得通信双方都确认对方为自己的传输连接端点。
参阅图2所示,本发明实施例中,在对业务进行分类之前,需要对业务类型识别模型进行训练,详细流程如下:
步骤200:业务处理装置确定用户触发的样本业务和所述样本业务的业务类型,以及确定用户基于样本业务与服务器建立的TCP链接集合。
具体的,本发明实施例中,用户触发样本业务后,业务处理装置可以确定所述样本业务的业务类型,并且,所述样本业务可触发网络产生相应的样本数据流,为实现样本数据流的可靠传输,在传输所述样本数据流之前,用户和服务器之间需要通过业务处理装置建立TCP链接。由于一个样本业务可以触发多个TCP链接,因此,业务处理装置可以确定用户和服务器之间建立的TCP链接集合。
例如,样本业务为“网页访问”时,业务处理装置将“网页访问”的业务类型记为业务类型1,在用户A通过服务器访问某个网页的过程中,可以触发网络产生相应的样本数据流,在传输所述样本数据流之前,用户和服务器之间通过业务处理装置建立TCP链接。
例如,若用户A需要通过服务器浏览某个网页的图片,则触发网络产生相应的样本数据流,进而产生传输所述样本数据流对应的TCP链接1,若用户A需要通过服务器观看某个网页的视频,则触发网络产生相应的样本数据流,进而产生传输所述样本数据流对应的TCP链接2,若用户A需要通过服务器下载某个网页的文档,则触发网络产生相应的样本数据流,进而产生传输所述样本数据流对应的TCP链接3,若用户A需要通过服务器下载某个网页的游戏,则触发网络产生相应的样本数据流,进而产生传输所述样本数据流对应的TCP链接4,因此,业务处理装置确定用户和服务器之间建立的TCP链接集合为:TCP链接1、TCP链接2、TCP链接3和TCP链接4。
步骤201:业务处理装置分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的样本数据流进行切割,获得若干流量块。
具体的,本发明实施例中,在业务处理装置确定样本业务的业务类型和TCP链接集合后,针对所述TCP链接集合中的每一个TCP链接,业务处理装置以TCP链接为粒度,按照预设的数据量单位,或者,按照预设的时长单位,将TCP链接上承载的样本数据流切割成若干个流量块。
例如,样本业务为“网页访问”时,根据用户的不同业务需求,业务处理装置确定用户和服务器之间建立的TCP链接集合为:TCP链接1、TCP链接2、TCP链接3和TCP链接4,针对TCP链接1,业务处理装置从TCP链接1建立开始,以100个字节为单位,将所述TCP链接1上承载的样本数据流切割成若干流量块,或者,以1秒为单位,对所述TCP链接1上承载的样本数据流进行切割,获得若干流量块。
步骤202:业务处理装置按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序。
具体的,本发明实施例中,业务处理装置按照TCP链接建立时间的先后顺序,对TCP链接集合中的各个TCP链接进行排序。
例如,TCP链接集合为:TCP链接1、TCP链接2、TCP链接3和TCP链接4时,若用户A首先需要通过服务器观看某个网页的视频,触发产生TCP链接2,然后,用户A需要通过服务器下载某个网页的文档,触发产生TCP链接3,接下来,用户A通过服务器浏览某个网页的图片,触发产生TCP链接1,最后,若用户A需要通过服务器下载某个网页的游戏,触发产生TCP链接4,则业务处理装置根据TCP链接建立时间的先后顺序,将TCP链接1、TCP链接2、TCP链接3和TCP链接4排序为TCP链接2、TCP链接3、TCP链接1和TCP链接4。
步骤203:业务处理装置针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的样本流量图像。
具体的,本发明实施例中,N表示连续的TCP链接的数目,N为自然数,当N=3时,即业务处理装置按照TCP链接建立时间的先后顺序,针对3个连续的TCP链接,分别获取每一个TCP链接对应的一个流量块,并针对获得的3个流量块分别执行以下操作:将流量块包含的每一个字节分别映射为一个像素点,获得相应的流量图像,进而,将所述3个流量块各自对应的所述流量图像,作为出红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的样本流量图像。
进一步的,N还可以取值为N=4、5、6或者7,在这种情况下,业务处理装置会针对N个TCP链接中的每一个TCP链接分别选取一个流量块,如,4个流量块,5个流量块,6个流量块或者7个流量块,然后,将获得的N个流量块分别映射为相应的流量图像,再从N个流量块对应的流量图像中选取3个流量图像,作为红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的样本流量图像。
例如,N=4,业务处理装置根据TCP链接建立时间的先后顺序,将TCP链接1、TCP链接2、TCP链接3和TCP链接4排序为TCP链接2、TCP链接3、TCP链接1和TCP链接4。
接着,可选的,业务处理装置在上述各个TCP链接获取对数据流进行切割后获得的包含100个字节的第一个流量块,将每一个字节映射为一个像素点,一个流量图像可对应100个像素点,则,包括100个字节的第一个流量块可以生成一个流量图像,所述流量图像只有黑白两种颜色,若要得到具有彩色的样本流量图像,则需要三个流量块,因此,将获得的4个流量块分别映射为相应的流量图像后,从4个流量块对应的流量图像中选取3个流量图像,作为红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的样本流量图像。
因此,业务处理装置可以根据建立时间连续的TCP链接2、TCP链接3和TCP链接1各自对应的第一个流量块生成样本流量图像1,以及,根据建立时间连续的TCP链接3、TCP链接1和TCP链接4各自对应的第一个流量块,生成样本流量图像2。
步骤204:业务处理装置基于获得的各个样本流量图像和相应的业务类型之间的对应关系,采用卷积神经网络算法进行模型训练,获得相应的业务类型识别模型。
具体的,本发明实施例中,在用户触发样本业务后,业务处理装置可以预先确定所述样本业务的业务类型,通过执行上述步骤200-203可以获得样本业务对应的各个样本流量图像和相应的业务类型之间的对应关系,进而,采用深度神经网络中的卷积神经网络算法,经过模型训练后获得相应的业务类型识别模型。
其中,卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现,一般地,CNN的基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。
例如,用户发起“网页访问”后,业务处理装置确定所述“网页访问”的业务类型,并将“网页访问”的业务类型记为业务类型1,同时,通过上述步骤200-203可以得到所述“网页访问”的样本流量图像1和样本流量图像2,由于样本流量图像1和样本流量图像2均是“网页访问”触发的数据流产生的流量图像,因此,样本流量图像1和样本流量图像2的业务类型均为业务类型1,即,样本流量图像1对应的业务类型为业务类型1,样本流量图像2对应的业务类型也为业务类型1。
进而,业务处理装置采用同样的方式,可以获得海量的样本数据,即,确定各类样本流量图像和相应的业务类型之间的关系,然后,基于海量的样本数据进行训练,可选的,可以采用业务类型识别算法进行模型训练。
参阅图3所示,本发明实施例中,在完成对业务类型识别模型的训练后,可以采用业务类型识别模型,针对基于连续TCP链接的目标业务进行识别,详细流程如下:
步骤300:业务处理装置确定用户触发的目标业务,以及确定用户基于样本业务与服务器建立的TCP链接集合。
具体的,本发明实施例中,用户触发目标业务后,所述目标业务可触发网络产生相应的目标数据流,为实现目标数据流的可靠传输,在传输所述目标数据流之前,用户和服务器之间需要通过业务处理装置建立TCP链接。由于一个目标业务可以触发多个TCP链接,因此,业务处理装置可以确定用户和服务器之间建立的TCP链接集合。
例如,样本业务为“微信聊天”时,在用户B通过服务器进行在线聊天的过程中,可以触发网络产生相应的目标数据流,在传输所述目标数据流之前,用户和服务器之间通过业务处理装置建立TCP链接。
例如,若用户B需要通过服务器发送短信息,则触发网络产生相应的目标数据流,进而产生传输所述目标数据流对应的TCP链接5,若用户B需要通过服务器进行视频聊天,则触发网络产生相应的目标数据流,进而产生传输所述目标数据流对应的TCP链接6,若用户B需要通过服务器进行语音通话,则触发网络产生相应的目标数据流,进而产生传输所述目标数据流对应的TCP链接7,若用户B需要通过服务器发送图片,则触发网络产生相应的目标数据流,进而产生传输所述目标数据流对应的TCP链接8,因此,业务处理装置确定用户和服务器之间建立的TCP链接集合为:TCP链接5、TCP链接6、TCP链接7和TCP链接8。
步骤301:业务处理装置分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块。
具体的,本发明实施例中,在业务处理装置确定目标业务TCP链接集合后,针对所述TCP链接集合中的每一个TCP链接,业务处理装置以TCP链接为粒度,按照预设的数据量单位,或者,按照预设的时长单位,将TCP链接上承载的目标数据流切割成若干个流量块。
例如,样本业务为“微信聊天”时,根据用户的不同业务需求,业务处理装置确定用户和服务器之间建立的TCP链接集合为:TCP链接5、TCP链接6、TCP链接7和TCP链接8,针对TCP链接5,业务处理装置从TCP链接5建立开始,以100个字节为单位,将所述TCP链接5上承载的目标数据流切割成若干流量块,或者,以1秒为单位,对所述TCP链接5上承载的目标数据流进行切割,获得若干流量块。
步骤302:业务处理装置按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序。
具体的,本发明实施例中,业务处理装置按照TCP链接建立时间的先后顺序,对TCP链接集合中的各个TCP链接进行排序。
例如,TCP链接集合为:TCP链接5、TCP链接6、TCP链接7和TCP链接8时,若用户B首先需要通过服务器进行视频聊天,触发产生TCP链接6,然后,用户B需要通过服务器发送短信息,触发产生TCP链接5,接下来,用户B通过服务器进行语音通话,触发产生TCP链接7,最后,用户B需要通过服务器发送图片,触发产生TCP链接8,则业务处理装置根据TCP链接建立时间的先后顺序,将TCP链接5、TCP链接6、TCP链接7和TCP链接8排序为TCP链接6、TCP链接5、TCP链接7和TCP链接8。
步骤303:业务处理装置针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像。
具体的,本发明实施例中,N=3,即业务处理装置按照TCP链接建立时间的先后顺序,针对3个连续的TCP链接,分别获取每一个TCP链接对应的一个流量块,并针对获得的3个流量块分别执行以下操作:将流量块包含的每一个字节分别映射为一个像素点,获得相应的流量图像,进而,将所述3个流量块各自对应的所述流量图像,作为红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的目标流量图像。
进一步的,N还可以取值为N=4、5、6或者7,在这种情况下,业务处理装置会针对N个TCP链接中的每一个TCP链接分别选取一个流量块,如,4个流量块,5个流量块,6个流量块或者7个流量块,然后,将获得的N个流量块分别映射为相应的流量图像,再从N个流量块对应的流量图像中选取3个流量图像,作为红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的目标流量图像。
例如,N=4,业务处理装置根据TCP链接建立时间的先后顺序,将TCP链接5、TCP链接6、TCP链接7和TCP链接8排序为TCP链接6、TCP链接5、TCP链接7和TCP链接8。
接着,可选的,业务处理装置在上述各个TCP链接获取对数据流进行切割后获得的包含100个字节的第一个流量块,将获得的4个流量块分别映射为相应的流量图像后,从4个流量块对应的流量图像中选取3个流量图像,作为红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的目标流量图像。
因此,业务处理装置可以根据建立时间连续的TCP链接6、TCP链接5、TCP链接7各自对应的第一个流量块生成目标流量图像1,根据建立时间连续的TCP链接5、TCP链接7、TCP链接8各自对应的第一个流量块生成目标流量图像2。
步骤304:业务处理装置将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是基于样本业务对应的样本流量图像以及样本业务的业务类型,经训练后获得的。
即,业务处理装置获得各个目标流量图像后,可以基于训练的业务类型识别模型对目标业务进行分类。
例如,业务处理装置首先会对目标业务的业务类型进行评估,即,业务处理装置基于业务类型识别模型可以对目标流量图像1对应的业务类型进行识别,若目标流量图像1与样本流量图像1或者样本流量图像2的相似度低于50%,则目标流量图像1对应的目标业务不属于业务类型1,其中,业务类型1是样本流量图像1或者样本流量图像2对应的“网页访问”的业务类型。
基于上述实施例中,参阅图4所示,本发明实施例中,业务处理装置至少包括:切割单元101、生成单元102和识别单元103,其中,
切割单元101,用于确定用户基于目标业务与服务器建立的传输控制协议TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;
生成单元102,用于按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,其中,N表示连续的TCP链接的数目,N为自然;
识别单元103,用于将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是基于样本业务对应的样本流量图像以及样本业务的业务类型,经训练后获得的。
可选的,确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块之前,所述切割单元101进一步用于:
确定用户触发的样本业务和所述样本业务的业务类型,以及确定用户基于样本业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的样本数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的样本流量图像;
基于获得的各个样本流量图像和相应的业务类型之间的对应关系,采用卷积神经网络算法进行模型训练,获得相应的业务类型识别模型。
可选的,确定用户基于目标业务与服务器建立的传输控制协议TCP链接集合,所述切割单元101用于:
对目标业务触发的多个目标数据流进行监测,并将传输所述多个目标数据流所需的多个TCP链接确定为TCP链接集合。
可选的,按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块,所述切割单元101用于:
以TCP链接为粒度,按照预设的数据量单位,或者,按照预设的时长单位,将所述TCP链接上承载的样本数据流切割成若干个流量块。
可选的,根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,所述生成单元102用于:
针对所述N个连续的TCP链接,分别获取每一个TCP链接对应的一个流量块;
针对获得的N个流量块分别执行以下操作:将流量块包含的每一个字节分别映射为一个像素点,获得相应的流量图像;
从所述N个流量块各自对应的所述流量图像中,选取出红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的目标流量图像。
基于同一发明构思,本发明实施例提供一种存储介质,存储有用于实现基于连续TCP链接的业务分类的方法的程序,所述程序被处理器运行时,执行以下步骤:
确定用户基于目标业务与服务器建立的传输控制协议TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的样本流量图像,其中,N表示连续的TCP链接的数目,N为自然;
将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是基于样本业务对应的样本流量图像以及样本业务的业务类型,经训练后获得的。
基于同一发明构思,本发明实施例提供一种计算机装置,包括一个或多个处理器;以及一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述装置执行如上述任一项所述的方法。
综上所述,本发明实施例中,首先,业务处理装置确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对每一个TCP链接上承载的目标数据流进行切割,获得若干流量块,然后,按照建立时间的先后对各个TCP链接进行排序,并根据N个连续的任意一个流量块,生成相应的目标流量图像,最后,将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是经训练后获得的。这样,业务处理装置可以根据训练后的业务类型识别模型,对目标流量图像对应的目标业务进行分类,保证了业务类型识别模型的自动训练,提高业务类型识别模型训练的自主性,降低网络设备的开销,节省人力资源,并且,通过N个连续的TCP链接各自对应的任意一个流量块,生成相应的样本流量图像,利用了同一目标业务下不同TCP链接的关联关系,保证业务分类结果的准确度,提高业务类型识别的精确度和有效性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于连续传输控制协议TCP链接的业务分类方法,其特征在于,包括:
确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:
按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:
针对所述N个连续的TCP链接,分别获取每一个TCP链接对应的一个流量块;
针对获得的N个流量块分别执行以下操作:将流量块包含的每一个字节分别映射为一个像素点,获得相应的流量图像;
从所述N个流量块各自对应的所述流量图像中,选取出红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的目标流量图像;
其中,N表示连续的TCP链接的数目,N为自然数;
将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是基于样本业务对应的样本流量图像以及样本业务的业务类型,经训练后获得的。
2.如权利要求1所述的方法,其特征在于,确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块之前,进一步包括:
确定用户触发的样本业务和所述样本业务的业务类型,以及确定用户基于样本业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的样本数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的样本流量图像;
基于获得的各个样本流量图像和相应的业务类型之间的对应关系,采用卷积神经网络算法进行模型训练,获得相应的业务类型识别模型。
3.如权利要求1或2所述的方法,其特征在于,确定用户基于目标业务与服务器建立的传输控制协议TCP链接集合,包括:
对目标业务触发的多个目标数据流进行监测,并将传输所述多个目标数据流所需的多个TCP链接确定为TCP链接集合。
4.如权利要求1或2所述的方法,其特征在于,按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块,包括:
以TCP链接为粒度,按照预设的数据量单位,或者,按照预设的时长单位,将所述TCP链接上承载的样本数据流切割成若干个流量块。
5.一种基于连续传输控制协议TCP链接的业务分类装置,其特征在于,包括:
切割单元,用于确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;
生成单元,用于按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:
针对所述N个连续的TCP链接,分别获取每一个TCP链接对应的一个流量块;
针对获得的N个流量块分别执行以下操作:将流量块包含的每一个字节分别映射为一个像素点,获得相应的流量图像;
从所述N个流量块各自对应的所述流量图像中,选取出红、绿、蓝三种颜色通道对应的流量图像,合并生成相应的目标流量图像;
其中,N表示连续的TCP链接的数目,N为自然数;
识别单元,用于将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是基于样本业务对应的样本流量图像以及样本业务的业务类型,经训练后获得的。
6.如权利要求5所述的装置,其特征在于,确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块之前,所述切割单元进一步用于:
确定用户触发的样本业务和所述样本业务的业务类型,以及确定用户基于样本业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:按照预设方式对TCP链接上承载的样本数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的样本流量图像;
基于获得的各个样本流量图像和相应的业务类型之间的对应关系,采用卷积神经网络算法进行模型训练,获得相应的业务类型识别模型。
7.如权利要求6所述的装置,其特征在于,确定用户基于目标业务与服务器建立的传输控制协议TCP链接集合,所述切割单元用于:
对目标业务触发的多个目标数据流进行监测,并将传输所述多个目标数据流所需的多个TCP链接确定为TCP链接集合。
8.如权利要求5或6所述的装置,其特征在于,按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块,所述切割单元用于:
以TCP链接为粒度,按照预设的数据量单位,或者,按照预设的时长单位,将所述TCP链接上承载的样本数据流切割成若干个流量块。
9.一种存储介质,其特征在于,存储有用于实现基于连续传输控制协议TCP链接的业务分类的方法的程序,所述程序被处理器运行时,执行以下步骤:
确定用户基于目标业务与服务器建立的TCP链接集合,并分别针对所述TCP链接集合中的每一个TCP链接执行以下操作:
按照预设方式对TCP链接上承载的目标数据流进行切割,获得若干流量块;
按照建立时间的先后对所述TCP链接集合中的各个TCP链接进行排序,并针对每N个连续的TCP链接分别执行以下操作:根据N个连续的TCP链接各自对应的任意一个流量块,生成相应的目标流量图像,其中,N表示连续的TCP链接的数目,N为自然数;
将获得的各个目标流量图像,采用预设的业务类型识别模型进行业务类型识别,确定所述目标业务的业务类型,所述业务类型识别模型是基于样本业务对应的样本流量图像以及样本业务的业务类型,经训练后获得的。
10.一种通信装置,其特征在于,包括一个或多个处理器;以及一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述装置执行如权利要求1至4中任一项所述的方法。
CN201910001994.1A 2019-01-02 2019-01-02 一种基于连续tcp链接的业务分类方法和装置 Active CN111404832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910001994.1A CN111404832B (zh) 2019-01-02 2019-01-02 一种基于连续tcp链接的业务分类方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910001994.1A CN111404832B (zh) 2019-01-02 2019-01-02 一种基于连续tcp链接的业务分类方法和装置

Publications (2)

Publication Number Publication Date
CN111404832A CN111404832A (zh) 2020-07-10
CN111404832B true CN111404832B (zh) 2023-05-09

Family

ID=71430215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910001994.1A Active CN111404832B (zh) 2019-01-02 2019-01-02 一种基于连续tcp链接的业务分类方法和装置

Country Status (1)

Country Link
CN (1) CN111404832B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326879A (zh) * 2021-05-31 2021-08-31 深圳前海微众银行股份有限公司 一种业务数据的监测方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106790019B (zh) * 2016-12-14 2019-10-11 北京天融信网络安全技术有限公司 基于特征自学习的加密流量识别方法及装置
CN107819646A (zh) * 2017-10-23 2018-03-20 国网冀北电力有限公司信息通信分公司 一种分布式传输的网络流量分类系统和方法
CN108200006B (zh) * 2017-11-21 2020-12-18 中国科学院声学研究所 一种基于层次化时空特征学习的网络流量分类方法及装置

Also Published As

Publication number Publication date
CN111404832A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN110519177B (zh) 一种网络流量识别方法及相关设备
CN107566786A (zh) 一种获取监控视频的方法、装置及终端设备
CN103986715B (zh) 一种网络流量控制的方法及装置
CN108156146B (zh) 一种用于识别异常用户操作的方法与装置
CN109889469B (zh) 短信验证方法、装置、存储介质、短信验证系统及终端
CN106487747A (zh) 用户识别方法、系统、装置及处理方法、装置
CN105337841B (zh) 一种信息处理方法和系统、客户端和服务器
CN110247819B (zh) 一种基于加密流识别的Wi-Fi视频采集设备检测方法及系统
CN106888152B (zh) 一种消息处理方法、装置和系统
CN105681389B (zh) 一种基于Skype不同功能通信流的识别方法及装置
CN113825129B (zh) 一种5g网络环境下工业互联网资产测绘方法
CN110796098A (zh) 内容审核模型的训练及审核方法、装置、设备和存储介质
CN104348638B (zh) 识别会话流量的业务类型的方法、系统及设备
CN108092976A (zh) 设备指纹构造方法及装置
CN108521576A (zh) 媒体资源的显示方法、装置、存储介质和电子装置
CN104994016A (zh) 用于分组分类的方法和装置
CN103955846B (zh) 信息处理系统中控制多个终端智能反馈的控制方法及装置
CN107707594A (zh) 一种实现按需加速的文件传输方法及装置
CN111404832B (zh) 一种基于连续tcp链接的业务分类方法和装置
CN107592554A (zh) 直播视频转发方法及装置
CN104184723A (zh) 一种应用程序识别方法、装置和网络设备
CN111565303A (zh) 基于雾计算及深度学习的视频监控方法、系统和可读存储介质
CN107483508B (zh) 报文过滤方法、装置、设备及存储介质
CN107529190B (zh) 用户数据获取系统和方法
CN115209179A (zh) 视频数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant