CN110493144A - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN110493144A
CN110493144A CN201910701272.7A CN201910701272A CN110493144A CN 110493144 A CN110493144 A CN 110493144A CN 201910701272 A CN201910701272 A CN 201910701272A CN 110493144 A CN110493144 A CN 110493144A
Authority
CN
China
Prior art keywords
data
bit
server
data bit
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910701272.7A
Other languages
English (en)
Other versions
CN110493144B (zh
Inventor
钟锦红
秦晓卫
杨渡佳
刘玮康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Huawei Technologies Co Ltd
Original Assignee
University of Science and Technology of China USTC
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC, Huawei Technologies Co Ltd filed Critical University of Science and Technology of China USTC
Priority to CN201910701272.7A priority Critical patent/CN110493144B/zh
Publication of CN110493144A publication Critical patent/CN110493144A/zh
Priority to PCT/CN2020/105870 priority patent/WO2021018252A1/zh
Application granted granted Critical
Publication of CN110493144B publication Critical patent/CN110493144B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2408Traffic characterised by specific attributes, e.g. priority or QoS for supporting different services, e.g. a differentiated services [DiffServ] type of service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2475Traffic characterised by specific attributes, e.g. priority or QoS for supporting traffic characterised by the type of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请实施例公开了一种数据处理方法及装置,本申请实施例具体涉及人工智能的深度学习领域,该方法包括:终端设备获取多个数据包;终端设备在多个数据包中确定数据包的数据部分与第一数据特征相匹配的第一数据包;终端设备在多个数据包中确定与第一数据包的五元组相同的至少一个数据包;终端设备确定与第一数据特征对应的第一业务标签;终端设备确定第一业务标签为第一数据包和至少一个数据包的业务标签。本申请实施例可以对数据包进行精准的识别,并且可以实现对多个数据包的精细化分类。

Description

一种数据处理方法及装置
技术领域
本申请实施例涉及通信技术领域,更具体的说,涉及数据处理方法及装置。
背景技术
目前,随着互联网技术的迅速发展,各种各样的应用软件相继产生,在网络上传输的网络数据也越来越多样化。
为了实现对网络数据进行精细化分类的目的,主要采用端口识别技术来识别网络数据所归属的应用软件。在终端设备发送或接收数据包时,终端设备会提取数据包的端口号,并根据端口号与应用软件之间的映射关系确定该数据包所归属的应用软件。
利用传统的端口识别技术可以识别数据包所归属的应用软件,但是,这种端口识别技术无法识别出数据包归属于应用软件的哪项具体业务。例如,假设传统的端口识别技术识别出数据包A归属于通信软件,但是却无法识别出数据包A属于通信软件中的哪项具体业务。
目前,一个应用软件均具有多项业务,对于用户而言,每项业务的重要性可能并不相同。例如,对于用户而言,通信软件中的抢红包业务比接收图片业务更加重要,所以抢红包业务所产生的数据包的优先级高于接收图片业务所产生的数据包,由于传统的端口识别技术无法识别数据包归属于应用软件的哪项具体业务,所以终端设备便无法对抢红包业务所产生的数据包进行加速处理,从而使得传统的端口识别技术无法满足对网络数据进行精细化分类的要求。
发明内容
本申请实施例提供一种数据处理方法及装置,以准确的识别数据包归属于应用软件的具体业务。
本申请实施例是这样实现的:
第一方面,本申请实施例提供了一种数据处理方法,该方法包括:终端设备获取多个数据包,终端设备在多个数据包中确定数据包的数据部分与第一数据特征相匹配的第一数据包,第一数据特征为特征数据位与特征数据的映射关系,终端设备在多个数据包中确定与第一数据包的多元组相同的至少一个数据包,多元组至少包括源IP地址和目的IP地址,终端设备确定与第一数据特征对应的第一业务标签,第一业务标签为第一应用软件的第一业务的标识,第一业务标签为第一数据包和至少一个数据包的业务标签。
在第一方面中,终端设备可以在多个数据包中找到与第一数据特征相匹配的第一数据包,并将第一数据特征对应的第一业务标签分配给第一数据包,从而实现了对数据包进行精准的识别。当然,在多个数据包中找到与第一数据特征相匹配的第一数据包以后,还可以在多个数据包中确定与第一数据包的多元组相同的至少一个数据包,并将第一业务标签分配给第一数据包和至少一个数据包,从而实现了对多个数据包的精细化分类。
在一种可能的实现方式中,特征数据位包括至少一个数据位,特征数据位中的每个数据位对应一个特征数据,或者,特征数据位包括至少一个数据位,特征数据位中的每个数据位对应至少两个特征数据,或者,特征数据位包括至少一个第一数据位和至少一个第二数据位,至少一个第一数据位中的每个数据位对应一个特征数据,至少一个第二数据位中的每个数据位对应至少两个特征数据。
在一种可能的实现方式中,第一数据包和至少一个数据包的网络通信类型为短连接。
在一种可能的实现方式中,第一数据特征为预先存储在终端设备内的数据特征。
在一种可能的实现方式中,多元组为四元组、五元组或七元组,四元组包括源IP地址、源端口、目的IP地址和目的端口,五元组包括源IP地址、源端口、目的IP地址、目的端口和传输层协议,七元组包括源IP地址、源端口、目的IP地址、目的端口、传输层协议、服务类型和接口索引。
在一种可能的实现方式中,第一业务标签为第一应用软件的发送图片业务的标识、第一应用软件的接收图片业务的标识、第一应用软件的发送视频业务的标识或第一应用软件的接收视频业务的标识。
在一种可能的实现方式中,在终端设备确定与第一数据特征对应的第一业务标签以后,方法还包括:终端设备确定第一业务标签的业务类型是否为待加速类型,在终端设备确定第一业务标签的业务类型为待加速类型时,终端设备对第一数据包和至少一个数据包进行网络加速,网络加速包括智能带宽分配、报文多发和降低协商速率中的至少一个。
第二方面,本申请实施例提供了一种数据处理方法,该方法包括:终端设备获取多个数据包,终端设备在多个数据包中确定数据包的数据部分与第一数据特征相匹配的数据包的第一数量,第一数据特征为特征数据位与特征数据的映射关系,终端设备确定与第一数据特征对应的第一业务标签,第一业务标签为第一应用软件的第一业务的标识,终端设备确定第一数量为第一业务标签对应的第一业务发生的次数。
在第二方面中,终端设备可以在多个数据包中确定与第一数据特征相匹配的数据包的第一数量,然后,便可以确定第一数量为第一业务标签对应的业务发生的次数,所以终端设备可以根据多个数据包确定业务发生的次数。
在一种可能的实现方式中,特征数据位包括至少一个数据位,特征数据位中的每个数据位对应一个特征数据,或者,特征数据位包括至少一个数据位,特征数据位中的每个数据位对应至少两个特征数据,或者,特征数据位包括至少一个第一数据位和至少一个第二数据位,至少一个第一数据位中的每个数据位对应一个特征数据,至少一个第二数据位中的每个数据位对应至少两个特征数据。
在一种可能的实现方式中,与第一数据特征相匹配的数据包的网络通信类型为长连接。
在一种可能的实现方式中,第一数据特征为预先存储在终端设备内的数据特征。
在一种可能的实现方式中,第一业务标签为第一应用软件的发送文字信息业务的标识、第一应用软件的接收文字信息业务的标识、第一应用软件的发送语音信息业务的标识、第一应用软件的接收语音信息业务的标识、第一应用软件的发送语音通话业务的标识、第一应用软件的接收语音通话业务的标识、第一应用软件的发送视频通话业务的标识或第一应用软件的接收视频通话业务的标识。
在一种可能的实现方式中,在终端设备确定第一数量为第一业务标签对应的第一业务发生的次数以后,方法还包括:终端设备输出第一业务标签对应的第一业务发生的次数。
第三方面,本申请实施例提供了一种数据处理方法,该方法包括:服务器在第一时间段内获取多个数据包,服务器根据第一参数将多个数据包分成至少两个数据子流,服务器在至少两个数据子流的每个数据子流中提取具有数据特征的信令数据包得到至少两个信令数据包,服务器获取至少两个信令数据包的数据部分得到至少两组数据,至少两组数据中的每组数据包括多个数据位,多个数据位中的每个数据位上具有数据,服务器根据至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据,特征数据位包括至少一个数据位,特征数据为特征数据位上的数据,服务器将特征数据位与特征数据之间的映射关系确定为第一数据特征,服务器获取第一时间段对应的第一业务标签,第一业务标签为第一应用软件的第一业务的标识,服务器建立第一数据特征与第一业务标签的映射关系。
在第三方面中,通过服务器对多个数据包的学习,服务器可以建立起数据特征与业务标签之间的映射关系。在对数据包进行识别的阶段,可以在多个数据包中找到与第一数据特征相匹配的第一数据包,然后,便可以将第一数据特征对应的第一业务标签分配给第一数据包,从而实现了对数据包进行精准的识别。当然,在多个数据包中找到与第一数据特征相匹配的第一数据包以后,还可以在多个数据包中确定与第一数据包的五元组相同的至少一个数据包,并将第一业务标签分配给第一数据包和至少一个数据包,从而实现了对多个数据包的精细化分类。
在一种可能的实现方式中,服务器根据至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据包括:服务器根据至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为特征数据位,服务器确定特征数据位上出现的概率大于第一阈值的数据为特征数据。
在一种可能的实现方式中,服务器根据至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据包括:服务器根据至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为特征数据位,服务器确定特征数据位上的数据为特征数据。
在一种可能的实现方式中,服务器根据至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为特征数据位包括:服务器根据至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,第一可选位包括至少两个数据位,服务器获取第一可选位上的数据得到多个可选数据组合,服务器计算在多个可选数据组合中的每个可选数据组合出现的概率,服务器在多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合,服务器判断至少两个可选数据组合出现的概率之和是否小于第五阈值,在服务器确定至少两个可选数据组合出现的概率之和小于第五阈值时,服务器计算第一可选位中的每个数据位的信息熵,服务器删除第一可选位中信息熵最大的数据位,并执行服务器获取第一可选位上的数据得到多个可选数据组合的步骤,在服务器确定至少两个可选数据组合出现的概率之和大于或等于第五阈值时,服务器确定第一可选位为特征数据位。
在一种可能的实现方式中,服务器根据至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据包括:服务器根据至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为第一特征数据位,服务器确定第一特征数据位上出现的概率大于第一阈值的数据为第一特征数据,服务器根据至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为第二特征数据位,服务器确定第二特征数据位上的数据为第二特征数据,服务器确定第一特征数据位和第二特征数据位为特征数据位,服务器确定第一特征数据和第二特征数据为特征数据。
在一种可能的实现方式中,服务器根据至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为第二特征数据位包括:服务器根据至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,第一可选位包括至少两个数据位,服务器获取第一可选位上的数据得到多个可选数据组合,服务器计算在多个可选数据组合中的每个可选数据组合出现的概率,服务器在多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合,服务器判断至少两个可选数据组合出现的概率之和是否小于第五阈值,在服务器确定至少两个可选数据组合出现的概率之和小于第五阈值时,服务器计算第一可选位中的每个数据位的信息熵,服务器删除第一可选位中信息熵最大的数据位,并执行服务器获取第一可选位上的数据得到多个可选数据组合的步骤,在服务器确定至少两个可选数据组合出现的概率之和大于或等于第五阈值时,服务器确定第一可选位为第二特征数据位。
在一种可能的实现方式中,第一参数包括多元组,或者,第一参数包括多元组和时间戳,多元组至少包括源IP地址和目的IP地址。
在一种可能的实现方式中,多元组为四元组、五元组或七元组,四元组包括源IP地址、源端口、目的IP地址和目的端口;五元组包括源IP地址、源端口、目的IP地址、目的端口和传输层协议,七元组包括源IP地址、源端口、目的IP地址、目的端口、传输层协议、服务类型和接口索引。
在一种可能的实现方式中,在第一参数包括多元组时,第一业务标签为第一应用软件的发送图片业务的标识、第一应用软件的接收图片业务的标识、第一应用软件的发送视频业务的标识或第一应用软件的接收视频业务的标识。在第一参数包括多元组和时间戳时,第一业务标签为第一应用软件的发送文字信息业务的标识、第一应用软件的接收文字信息业务的标识、第一应用软件的发送语音信息业务的标识、第一应用软件的接收语音信息业务的标识、第一应用软件的发送语音通话业务的标识、第一应用软件的接收语音通话业务的标识、第一应用软件的发送视频通话业务的标识或第一应用软件的接收视频通话业务的标识。
第四方面,本申请实施例提供了一种终端设备,该终端设备包括:获取模块,用于获取多个数据包。处理模块,用于在多个数据包中确定数据包的数据部分与第一数据特征相匹配的第一数据包,第一数据特征为特征数据位与特征数据的映射关系,在多个数据包中确定与第一数据包的多元组相同的至少一个数据包,多元组至少包括源IP地址和目的IP地址,确定与第一数据特征对应的第一业务标签,第一业务标签为第一应用软件的第一业务的标识,第一业务标签为第一数据包和至少一个数据包的业务标签。
在一种可能的实现方式中,处理模块,具体用于确定第一业务标签的业务类型是否为待加速类型,在终端设备确定第一业务标签的业务类型为待加速类型时,对第一数据包和至少一个数据包进行网络加速,网络加速包括智能带宽分配、报文多发和降低协商速率中的至少一个。
第五方面,本申请实施例提供了一种终端设备,该终端设备包括:获取模块,用于获取多个数据包。处理模块,用于在多个数据包中确定数据包的数据部分与第一数据特征相匹配的数据包的第一数量,第一数据特征为特征数据位与特征数据的映射关系,确定与第一数据特征对应的第一业务标签,第一业务标签为第一应用软件的第一业务的标识,确定第一数量为第一业务标签对应的第一业务发生的次数。
在一种可能的实现方式中,处理模块,具体用于输出第一业务标签对应的第一业务发生的次数。
第六方面,本申请实施例提供了一种服务器,该服务器包括:获取模块,用于在第一时间段内获取多个数据包。处理模块,用于根据第一参数将多个数据包分成至少两个数据子流,在至少两个数据子流的每个数据子流中提取具有数据特征的信令数据包得到至少两个信令数据包,获取至少两个信令数据包的数据部分得到至少两组数据,至少两组数据中的每组数据包括多个数据位,多个数据位中的每个数据位上具有数据,根据至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据,特征数据位包括至少一个数据位,特征数据为特征数据位上的数据,将特征数据位与特征数据之间的映射关系确定为第一数据特征,获取第一时间段对应的第一业务标签,第一业务标签为第一应用软件的第一业务的标识,建立第一数据特征与第一业务标签的映射关系。
在一种可能的实现方式中,处理模块,具体用于根据至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为特征数据位,确定特征数据位上出现的概率大于第一阈值的数据为特征数据。
在一种可能的实现方式中,处理模块,具体用于根据至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为特征数据位,确定特征数据位上的数据为特征数据。
在一种可能的实现方式中,处理模块,具体用于根据至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,第一可选位包括至少两个数据位,获取第一可选位上的数据得到多个可选数据组合,计算在多个可选数据组合中的每个可选数据组合出现的概率,在多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合,判断至少两个可选数据组合出现的概率之和是否小于第五阈值,确定至少两个可选数据组合出现的概率之和小于第五阈值时,计算第一可选位中的每个数据位的信息熵,删除第一可选位中信息熵最大的数据位,并执行获取第一可选位上的数据得到多个可选数据组合的步骤,确定至少两个可选数据组合出现的概率之和大于或等于第五阈值时,确定第一可选位为特征数据位。
在一种可能的实现方式中,处理模块,具体用于根据至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为第一特征数据位,确定第一特征数据位上出现的概率大于第一阈值的数据为第一特征数据,根据至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为第二特征数据位,确定第二特征数据位上的数据为第二特征数据,确定第一特征数据位和第二特征数据位为特征数据位,确定第一特征数据和第二特征数据为特征数据。
在一种可能的实现方式中,处理模块,具体用于根据至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,第一可选位包括至少两个数据位,获取第一可选位上的数据得到多个可选数据组合,计算在多个可选数据组合中的每个可选数据组合出现的概率,在多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合,判断至少两个可选数据组合出现的概率之和是否小于第五阈值,确定至少两个可选数据组合出现的概率之和小于第五阈值时,计算第一可选位中的每个数据位的信息熵,删除第一可选位中信息熵最大的数据位,并执行获取第一可选位上的数据得到多个可选数据组合的步骤,确定至少两个可选数据组合出现的概率之和大于或等于第五阈值时,确定第一可选位为第二特征数据位。
第七方面,本申请实施例提供了一种终端设备,该终端设备包括处理器和存储器,其中,处理器用于读取存储在存储器中的软件代码并执行如上述第一方面或第一方面的任一种可能实现方式中的方法。
第八方面,本申请实施例提供了一种终端设备,该终端设备包括处理器和存储器,其中,处理器用于读取存储在存储器中的软件代码并执行如上述第二方面或第二方面的任一种可能实现方式中的方法。
第九方面,本申请实施例提供了一种服务器,该服务器包括处理器和存储器,其中,处理器用于读取存储在存储器中的软件代码并执行如上述第三方面或第三方面的任一种可能实现方式中的方法。
附图说明
图1所示的为本申请实施例提供的一种网络示意图;
图2所示的为本申请实施例提供的一种数据处理方法的流程图;
图3所示的为本申请实施例提供的另一种数据处理方法的流程图;
图4所示的为本申请实施例提供的又一种数据处理方法的流程图;
图5所示的为本申请实施例提供的又一种数据处理方法的流程图;
图6所示的为本申请实施例提供的又一种数据处理方法的流程图;
图7所示的为本申请实施例提供的又一种数据处理方法的流程图;
图8所示的为本申请实施例提供的又一种数据处理方法的流程图;
图9所示的为本申请实施例提供的一种终端设备的示意图;
图10所示的为本申请实施例提供的另一种终端设备的示意图;
图11所示的为本申请实施例提供的一种服务器的示意图;
图12所示的为本申请实施例提供的又一种终端设备的示意图;
图13所示的为本申请实施例提供的又一种终端设备的示意图;
图14所示的为本申请实施例提供的又一种服务器的示意图。
具体实施方式
本申请实施例提供一种数据处理方法及装置,可以解决背景技术中存在的问题,本申请实施例可以准确的识别数据包归属于应用软件的具体业务。
请参见图1所示,图1所示的为本申请实施例提供的一种网络示意图。在图1所示的网络示意图中展示了移动通信网100、终端设备200、代理服务器300和业务服务器400,其中,移动通信网100为终端设备200与代理服务器300和业务服务器400之间传输数据的网络通道,终端设备200可以为智能手机或平板电脑等设备,代理服务器300为根据终端设备200产生的数据进行智能学习的服务器,业务服务器400为终端设备200内的某个应用软件对应的服务器,业务服务器400可以为该应用软件提供版本更新、数据存储和业务维护等服务。
请参见图1和图2所示,图2所示的为本申请实施例提供的一种数据处理方法的流程图。假设终端设备200内安装有通信软件,通信软件包括发送图片、发送文字信息和发送语音信息等业务。本申请实施例以通信软件发送图片的业务为例,说明代理服务器300通过学习终端设备200发送图片对应的数据的规律来生成数据特征,以使数据特征可以识别发送图片的业务产生的数据。本申请实施例提供的数据处理方法包括以下步骤:
步骤S101、代理服务器300在第一时间段内接收终端设备200发送的600个数据包。
其中,请参见表1所示,表1所示的为测试时间段与业务标签的映射关系表。表1所示的映射关系表会分别存储在终端设备200和代理服务器300内,终端设备200的通信软件会按照表1的测试时间段发送预设数量的图片,终端设备200在测试时间段发送的图片会以多个数据包的形式通过移动通信网100发送至代理服务器300中。
测试时间段 业务标签
11:10:10-11:10:15 发送图片
表1
例如,通过表1可知,在11点10分10秒至11点10分15秒之间,终端设备200的通信软件向代理服务器300发送6张图片,6张图片分别为图片A1、图片A2、图片A3、图片A4、图片A5和图片A6,这6张图片中的每张图片均有100个数据包,所以代理服务器300在第一时间段内接收终端设备200发送的600个数据包。当然,为了方便说明,本申请实施例以发送6张图片为例,本领域技术人员可以根据实际情况来调整测试时间段和发送图片的数量。
需要说明的是,在正常情况下,终端设备200的通信软件发送的图片会以多个数据包的形式通过移动通信网100发送至业务服务器400中,终端设备200的通信软件不会向代理服务器300发送数据包。为了使终端设备200的通信软件向业务服务器400发送的数据包可以被代理服务器300获取到,需要预先在终端设备200和代理服务器300上设置抓取数据包的功能,从而使得终端设备200的通信软件可以同时将6张图片对应的数据包发送至代理服务器300和业务服务器400。由于本申请实施例只关注终端设备200的通信软件向代理服务器300发送数据的过程,所以在图2中未展示出终端设备200的通信软件向业务服务器400发送数据包的过程。
步骤S102、代理服务器300根据五元组将600个数据包分成6个数据子流。
其中,本申请实施例的代理服务器300根据五元组将600个数据包分成6个数据子流,当然,并不局限于五元组,代理服务器300还可以根据四元组或七元组将600个数据包分成6个数据子流。四元组包括源IP地址、源端口、目的IP地址和目的端口,五元组包括源IP地址、源端口、目的IP地址、目的端口和传输层协议;七元组包括源IP地址、源端口、目的IP地址、目的端口、传输层协议、服务类型和接口索引。
其中,代理服务器300在第一时间段内接收终端设备200发送的多个数据包以后,通过表1可知,代理服务器300在第一时间段内接收的多个数据包均为图片对应的数据包。代理服务器300为了学习每张图片对应的数据包所具有的规律,代理服务器300需要根据五元组将多个数据包分成多个数据子流,每个数据子流为一张图片对应的多个数据包。
其中,数据子流为具有相同五元组的数据包的集合,五元组包括源IP地址、源端口、目的IP地址、目的端口和传输层协议。
需要说明的是,图2所示的实施例针对的场景为短连接,其中,短连接是相对于长连接而言的概念,指的是在数据传送过程中,只在需要发送数据时,才去建立一个连接,数据发送完成后,则断开此连接,即每次连接只完成一项业务的发送。
在终端设备200的通信软件通过短连接完成一项业务时,一个数据子流为应用软件完成一次业务所产生的数据包的集合。例如,终端设备200的通信软件通过短连接发送一张图片所产生的数据包的集合为一个数据子流。
在终端设备200的通信软件需要发送一张图片时,终端设备200的通信软件需要与一个新的业务服务器建立短连接,在图片发送完成时,该短连接便会被断开,所以终端设备200的通信软件发送的每张图片会通过多个短连接发送至不同的业务服务器上。由于接收图片的业务服务器均不相同,所以不同的图片的数据包的五元组也就不同,但是同一张图片对应的数据包的五元组相同,所以通过五元组可以将多个数据包分成多个数据子流,每个数据子流为一张图片对应的多个数据包。
请参见表2所示,表2所示的为图片A1的数据包的五元组B1、图片A2的数据包的五元组B2、图片A3的数据包的五元组B3、图片A4的数据包的五元组B4、图片A5的数据包的五元组B5和图片A6的数据包的五元组B6。
表2
通过表2可以得知,假设在11点10分10秒至11点10分15秒之间,终端设备200的通信软件向代理服务器300发送6张图片,每张图片有100个数据包,表2中的源IP地址均为终端设备200的IP地址,表2中的目的IP地址为6个不同的业务服务器的IP地址,所以五元组B1、五元组B2、五元组B3、五元组B4、五元组B5和五元组B6的源IP地址均相同,且五元组B1、五元组B2、五元组B3、五元组B4、五元组B5和五元组B6的目的IP地址均不同。
请参见表3所示,表3所示的为图片、五元组、数据子流和数据包的数量之间的映射关系。
表3
通过上文和表3可以得知,代理服务器300根据五元组可以将600个数据包分成6个数据子流。
另外,如果代理服务器300在第一时间段内接收终端设备200发送的数据包大于600个,而且根据五元组将多个数据包分成至少7个数据子流,那么说明终端设备200向代理服务器300发送的数据包不仅包括6张图片的数据包,还混入了其他类型业务的数据包,例如,假设还混入了发送文字信息的业务的数据包。
为了过滤掉与6张图片的数据包无关的其他数据包,可以采用一些手段来实现数据包的过滤。例如,在代理服务器300根据五元组将多个数据包分成多个数据子流以后,对于多个数据子流而言,需要满足以下几个筛选条件:条件A、数据子流的数据包中的源IP地址为终端设备200的IP地址;条件B、数据子流的数据包中的协议类型为TCP协议;条件C、数据子流中的每个数据包均大于20字节;条件D、数据子流的数据包的数量大于20个。
代理服务器300可以通过上述筛选条件对多个数据子流进行筛选,代理服务器300会保留符合筛选条件的数据子流,删除不符合筛选条件的数据子流。当然,筛选条件可以针对不同的业务类型进行设定,上述几个筛选条件是针对发送图片的业务,如果针对其他类型的业务还需要设定其他类型的筛选条件。
步骤S103、代理服务器300在6个数据子流的每个数据子流中提取具有数据特征的信令数据包得到6个信令数据包。
其中,在代理服务器300根据五元组将600个数据包分成6个数据子流以后,便可以在6个数据子流中分别找到具有数据特征的6个信令数据包。具体的,代理服务器300可以在每个数据子流的100个数据包中找到数据包的包头的TCP flag字段为“PSH ACK”的信令数据包。
请参见表4所示,表4所示的为数据子流与信令数据包之间的映射关系。
数据子流 信令数据包
数据子流C1 信令数据包D1
数据子流C2 信令数据包D2
数据子流C3 信令数据包D3
数据子流C4 信令数据包D4
数据子流C5 信令数据包D5
数据子流C6 信令数据包D6
表4
通过上文和表4可以得知,代理服务器300在6个数据子流的每个数据子流中提取具有数据特征的信令数据包得到6个信令数据包。
当然,在多个数据子流提取具有数据特征的信令数据包的过程中,每种业务对应的获取方式可能不同,对于发送图片的业务而言,可以采用寻找数据包的包头的TCP flag字段为“PSH ACK”的信令数据包。
另外,如果采用寻找数据包的包头的TCP flag字段为“PSH ACK”的信令数据包的方式,找到了两个或两个以上的信令数据包,那么代理服务器300需要将每个信令数据包都提取出来,以进行后续的智能学习。
步骤S104、代理服务器300获取6个信令数据包的数据部分得到6组数据,6组数据中的每组数据包括11个数据位,11个数据位中的每个数据位上具有数据。
请参见表5所示,表5所示的为从6个信令数据包的数据部分中得到的6组数据。在实际的场景中,每个信令数据包的数据部分均会具有较多的位数,为了展示方便,本申请实施例仅展示每个信令数据包的数据部分的11位数据。
数据位 1 2 3 4 5 6 7 8 9 10 11
第1组数据 a b 0 0 2 d 3 2 7 8 4
第2组数据 a b 0 0 2 d 3 5 7 8 4
第3组数据 a b 0 0 2 d 3 2 5 8 4
第4组数据 a b 0 0 2 d 4 7 1 7 2
第5组数据 a b 0 0 2 d 4 5 5 7 2
第6组数据 a b 0 0 2 d 9 8 1 1 7
表5
步骤S105、代理服务器300根据6组数据的11个数据位上的数据确定符合预设条件的特征数据位和特征数据,特征数据位包括至少一个数据位,特征数据为特征数据位上的数据。
其中,在代理服务器300获取6个信令数据包的数据部分得到6组数据以后,代理服务器300会根据6组数据的11个数据位上的数据确定符合预设条件的特征数据位和特征数据。
在步骤S105中,关于“代理服务器300根据6组数据的11个数据位上的数据确定符合预设条件的特征数据位和特征数据”的过程,会在后文中会进行详细的说明,在此仅展示出最终得到的特征数据位和特征数据。
请参见表6所示,表6所示的为特征数据位与特征数据之间的映射关系。
特征数据位 特征数据
第1位至第6位、第7位、第10位和第11位 “ab002d384”
第1位至第6位、第7位、第10位和第11位 “ab002d472”
第1位至第6位、第7位、第10位和第11位 “ab002d917”
表6
通过上文和表6可以得知,代理服务器300根据6组数据的11个数据位上的数据确定符合预设条件的特征数据位为“第1位至第6位、第7位、第10位和第11位”,特征数据为“ab002d384”、“ab002d472”或“ab002d917”。
步骤S106、代理服务器300将特征数据位与特征数据之间的映射关系确定为第一数据特征。
步骤S107、代理服务器300获取第一时间段对应的第一业务标签。
其中,第一业务标签为第一应用软件的第一业务的标识。例如,通过表1可以得知,第一时间段为“11:10:10-11:10:15”,所以与第一时间段对应的第一业务标签为“发送图片”。
在本实施例中,第一应用软件为终端设备200内的通信软件,第一业务为通信软件内的“发送图片”的业务。
另外,本申请实施例是以第一业务标签为“发送图片”进行举例说明的。当然,第一业务标签还可以为第一应用软件的接收图片业务的标识、第一应用软件的发送视频业务的标识或第一应用软件的接收视频业务的标识。可以理解的是,第一业务标签与第一数据特征关联,不同应用的相同类型的业务,例如“发送图片”业务,的业务标签可以相同,也可以不同。如第一业务标签可以是第一应用的发送图片业务的业务标签,也可以是终端设备多个应用的发送图片业务的业务标签,还可以是终端设备所有应用发送图片的业务的业务标签。
步骤S108、代理服务器300建立第一数据特征与第一业务标签的映射关系。
请参见表7所示,表7所示的为数据特征与业务标签之间的映射关系。
表7
在图1和图2所示的实施例中,通过代理服务器300对终端设备200发送的数据包的学习,代理服务器300可以建立起数据特征与业务标签之间的映射关系。在对数据包进行识别的阶段,可以在多个数据包中找到与第一数据特征相匹配的第一数据包,然后,便可以将第一数据特征对应的第一业务标签分配给第一数据包,从而实现了对数据包进行精准的识别。当然,在多个数据包中找到与第一数据特征相匹配的第一数据包以后,还可以在多个数据包中确定与第一数据包的五元组相同的至少一个数据包,并将第一业务标签分配给第一数据包和至少一个数据包,从而实现了对多个数据包的精细化分类。
在图1和图2所示的实施例中,在步骤S105中,即“代理服务器300根据6组数据的11个数据位上的数据确定符合预设条件的特征数据位和特征数据”步骤,存在多种实现方式,下面介绍几种具体的实现方式。
第一种方式:
在步骤S105中,即“代理服务器300根据6组数据的11个数据位上的数据确定符合预设条件的特征数据位和特征数据”步骤可以包括以下步骤:
步骤S1051、代理服务器300根据至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为特征数据位。
步骤S1052、代理服务器300确定特征数据位上出现的概率大于第一阈值的数据为特征数据。
请结合表5所示,如果将第一阈值设定为90%,那么前6位符合条件,所以代理服务器300可以将前6位确定为特征数据位,特征数据为“ab002d”。当然,还可以根据实际情况将第一阈值设定为其他的数值,并不局限于已经给出的数值。
第二种方式:
在步骤S105中,即“代理服务器300根据6组数据的11个数据位上的数据确定符合预设条件的特征数据位和特征数据”步骤可以包括以下步骤:
步骤S1051、代理服务器300根据至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,第一可选位包括至少两个数据位。
请结合表5所示,分别计算每一位上的数据出现的概率。
第7位包括数据“3”、数据“4”和数据“9”,数据“3”出现的概率为50%,数据“4”出现的概率为33.3%,数据“9”出现的概率为16.7%。
第8位包括数据“2”、数据“5”、数据“7”和数据“8”,数据“2”出现的概率为33.3%,数据“5”出现的概率为33.3%,数据“7”出现的概率为16.7%,数据“8”出现的概率为16.7%。
第9位包括数据“1”、数据“5”和数据“7”,数据“1”出现的概率为33.3%,数据“5”出现的概率为33.3%,数据“7”出现的概率为33.3%。
第10位包括数据“8”、数据“7”和数据“1”,数据“8”出现的概率为50%,数据“7”出现的概率为33.3%,数据“1”出现的概率为16.7%。
第11位包括数据“4”、数据“2”和数据“7”,数据“4”出现的概率为50%,数据“2”出现的概率为33.3%,数据“7”出现的概率为16.7%。
其中,请结合表5所示,如果将第二阈值设定为80%且将第三阈值设定为33%,那么表5中的第7位上的概率之和为83.3%,第8位上的概率之和为66.6%,第9位上的概率之和为100%,第10位上的概率之和为83.3%,第11位上的概率之和为83.3%,所以第7位、第9位、第10位和第11位符合要求,那么代理服务器300会将第7位、第9位、第10位和第11位确定为第一可选位。
步骤S1052、代理服务器300获取第一可选位上的数据得到多个可选数据组合。
其中,第7位、第9位、第10位和第11位上的数据构成的可选数据组合分别为“3784”、“3584”、“4172”、“4572”和“9117”。
步骤S1053、代理服务器300计算在多个可选数据组合中的每个可选数据组合出现的概率。
其中,可选数据组合“3784”出现的概率为33.3%,可选数据组合“3584”出现的概率为16.7%,可选数据组合“4172”出现的概率为16.7%,可选数据组合“4572”出现的概率为16.7%,可选数据组合“9117”出现的概率为16.7%。
步骤S1054、代理服务器300在多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合。
其中,请结合表5所示,如果将第四阈值设定为20%,那么可选数据组合“3784”符合要求。
步骤S1055、代理服务器300判断至少两个可选数据组合出现的概率之和是否小于第五阈值。如果是,则执行步骤S1056;否则,执行步骤S1057。
其中,请结合表5所示,如果将第五阈值设定为80%,可选数据组合“3784”出现的概率为33.3%,所以可选数据组合“3784”出现的概率小于第五阈值,那么代理服务器300会执行步骤S1056。
步骤S1056、在代理服务器300确定至少两个可选数据组合出现的概率之和小于第五阈值(80%)时,代理服务器300计算第一可选位中的每个数据位的信息熵,代理服务器300删除第一可选位中信息熵最大的数据位,并执行步骤S1052。
其中,请结合表5所示,代理服务器300计算第一可选位中的每个数据位的信息熵,且信息熵的计算公式为其中,Pi为一个数据位中的每个数据出现的概率,对于第7位而言,P1为数据“3”出现的概率,P2为数据“4”出现的概率,P3为数据“9”出现的概率,将数据带入公式得到:
第7位的信息熵=-[(p1×log2p1)+(p2×log2p2)+(p3×log2p3)]
=-[(0.5×log20.5)+(0.333×log20.333)+(0.167×log20.167)]
=-[(0.5×-1)+(0.333×-1.5864)+(0.167×-2.5821)]
=-[(-0.5)+(-0.5282)+(-0.4312)]
=1.4594
代理服务器300分别计算第7位、第9位、第10位和第11位的信息熵,第7位的信息熵为1.4594,第9位的信息熵为1.5846,第10位的信息熵为1.4594,第11位的信息熵为1.4594。
然后,代理服务器300删除第7位、第9位、第10位和第11位中信息熵最大的数据位,即删除第9位。此时,第7位、第10位和第11位为新的第一可选位,代理服务器300会执行步骤S1052以重新确定新的第一可选位是否符合要求。
步骤S1057、在代理服务器300确定至少两个可选数据组合出现的概率之和大于或等于第五阈值(80%)时,代理服务器300确定第一可选位为特征数据位,代理服务器300确定特征数据位上的数据为特征数据。
其中,经过上述步骤的计算,代理服务器300最终可以确定第7位、第10位和第11位为特征数据位,特征数据为“384”、“472”或“917”。
第三种方式:
在步骤S105中,即“代理服务器300根据6组数据的11个数据位上的数据确定符合预设条件的特征数据位和特征数据”步骤可以包括以下步骤:
步骤S1051、代理服务器300根据至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为第一特征数据位。
步骤S1052、代理服务器300确定第一特征数据位上出现的概率大于第一阈值的数据为第一特征数据。
请结合表5所示,如果将第一阈值设定为90%,那么前6位符合条件,所以代理服务器300可以将前6位确定为第一特征数据位,第一特征数据为“ab002d”。当然,还可以根据实际情况将第一阈值设定为其他的数值,并不局限于已经给出的数值。
步骤S1053、代理服务器300根据至少两组数据的多个数据位上的数据确定符合第一条件的数据位为第二特征数据位,代理服务器300确定第二特征数据位上的数据为第二特征数据
其中,第三种方式的步骤S1053包括第二种方式的步骤S1051至步骤S1057,结合第二种方式中提到的内容,代理服务器300最终可以确定第7位、第10位和第11位为第二特征数据位,第二特征数据为“384”、“472”或“917”。
步骤S1055、代理服务器300确定第一特征数据位和第二特征数据位为特征数据位。
请结合表5所示,第一特征数据为前6位,第二特征数据位为第7位、第10位和第11位,所以特征数据位包括第1位至第6位、第7位、第10位和第11位。
步骤S1056、代理服务器300确定第一特征数据和第二特征数据为特征数据。
请结合表5所示,第一特征数据为“ab002d”,第二特征数据为“384”、“472”或“917”,所以特征数据为“ab002d384”、“ab002d472”或“ab002d917”。
请参见图1和图3所示,图3所示的为本申请实施例提供的另一种数据处理方法的流程图。假设终端设备200内安装有通信软件,通信软件包括发送图片、发送文字信息和发送语音信息等业务。本申请实施例以通信软件发送文字信息的业务为例,说明代理服务器300通过学习终端设备200发送文字信息对应的数据的规律来生成数据特征,以使数据特征可以识别发送文字信息的业务产生的数据。本申请实施例提供的数据处理方法包括以下步骤:
步骤S201、代理服务器300在第一时间段内接收终端设备200发送的30个数据包。
其中,请参见表8所示,表8所示的为测试时间段与业务标签的映射关系表。表8所示的映射关系表会分别存储在终端设备200和代理服务器300内,终端设备200的通信软件会按照表1的测试时间段发送多条的文字信息,终端设备200在测试时间段发送的多条文字信息会以多个数据包的形式通过移动通信网100发送至代理服务器300中。
测试时间段 业务标签
12:20:10-12:21:00 发送文字信息
表8
例如,通过表8可知,在12点20分10秒至12点21分00秒之间,终端设备200的通信软件向代理服务器300发送6条文字信息,6条文字信息分别为文字信息A1、文字信息A2、文字信息A3、文字信息A4、文字信息A5和文字信息A6,这6条文字信息中的每条文字信息均有5个数据包,所以代理服务器300在第一时间段内接收终端设备200发送的30个数据包。当然,为了方便说明,本申请实施例以发送6条文字信息为例,本领域技术人员可以根据实际情况来调整测试时间段和发送文字信息的数量。
其中,每条文字信息指的是通信软件接收到发送指令后发送的一条完整的文字信息。例如,假设终端设备200的通信软件第一次发送的文字信息A1为“早上好”,第二次发送的文字信息A2为“你吃饭了吗?”。
其中,图3所示的实施例针对的场景为长连接,其中,长连接指在一个连接上可以连续发送多个不同业务的数据包。例如,终端设备200的通信软件与业务服务器400建立长连接以后,终端设备200的通信软件不仅可以通过该长连接向业务服务器400发送多条文字信息,还可以通过该长连接向业务服务器400发送多条语音信息。代理服务器300在第一时间段内接收终端设备200发送的30个数据包以后,由于这30个数据包是通过一个长连接发送的,所以这30个数据包的五元组完全相同,代理服务器300通过五元组无法将30个数据包分割成多个数据子流。为此,终端设备200的通信软件需要在第一时间段内按照一定的时间间隔分批发送6条文字信息。
请参见表9所示,表9所示的为文字信息的发送时间与发送的文字信息之间的映射关系。表9会预先存储在终端设备200内,终端设备200会按照表9约定的时间发送6条文字信息,代理服务器300便可以按照数据包的五元组和数据包的时间戳来对多个数据包进行分割,从而得到每一条文字信息对应的数据包。
文字信息的发送时间 发送的文字信息
12:20:10 文字信息A1
12:20:20 文字信息A2
12:20:30 文字信息A3
12:20:40 文字信息A4
12:20:50 文字信息A5
12:21:00 文字信息A6
表9
通过表9可以得知,终端设备200的通信软件在12点20分10秒向代理服务器300发送文字信息A1,在12点20分20秒向代理服务器300发送文字信息A2,在12点20分30秒向代理服务器300发送文字信息A3,在12点20分40秒向代理服务器300发送文字信息A4,在12点20分50秒向代理服务器300发送文字信息A5,在12点20分60秒向代理服务器300发送文字信息A6。
需要说明的是,在正常情况下,终端设备200的通信软件发送的6条文字信息会以多个数据包的形式通过移动通信网100发送至业务服务器400中,终端设备200的通信软件不会向代理服务器300发送数据包。为了使终端设备200的通信软件向业务服务器400发送的数据包可以被代理服务器300获取到,需要预先在终端设备200和代理服务器300上设置抓取数据包的功能,从而使得终端设备200的通信软件可以同时将6条文字信息对应的数据包发送至代理服务器300和业务服务器400。由于本申请实施例只关注终端设备200的通信软件向代理服务器300发送数据的过程,所以在图3中未展示出终端设备200的通信软件向业务服务器400发送数据包的过程。
步骤S202、代理服务器300根据五元组和时间戳将30个数据包分成6个数据子流。
其中,本申请实施例的代理服务器300根据五元组和时间戳将30个数据包分成6个数据子流,当然,并不局限于五元组,代理服务器300还可以根据四元组或七元组和时间戳将30个数据包分成6个数据子流。四元组包括源IP地址、源端口、目的IP地址和目的端口,五元组包括源IP地址、源端口、目的IP地址、目的端口和传输层协议;七元组包括源IP地址、源端口、目的IP地址、目的端口、传输层协议、服务类型和接口索引。
其中,代理服务器300在第一时间段内接收终端设备200发送的多个数据包以后,通过表8可知,代理服务器300在第一时间段内接收的多个数据包均为6条文字信息对应的数据包。代理服务器300为了学习6条文字信息对应的数据包所具有的规律,代理服务器300需要根据五元组和时间戳将多个数据包分成多个数据子流,每个数据子流为一条文字信息对应的多个数据包。
请参见表10所示,表10所示的为数据包的五元组与数据包的时间戳之间的映射关系。
表10
通过表10可以得知,由于每个数据包都具有时间戳,该时间戳为该数据包的发送时间,所以代理服务器300可以根据五元组和时间戳将30个数据包分成6个数据子流。
通过表10可以得知,假设在12点20分10秒至12点21分00秒之间,终端设备200的通信软件向代理服务器300发送6条文字信息,每条文字信息有5个数据包,表10中的源IP地址均为终端设备200的IP地址,表10中的目的IP地址为一个业务服务器的IP地址,所以五元组B1、五元组B2、五元组B3、五元组B4、五元组B5和五元组B6的源IP地址均相同,且五元组B1、五元组B2、五元组B3、五元组B4、五元组B5和五元组B6的目的IP地址均相同。
请参见表11所示,表11所示的为文字信息、五元组、数据子流、数据包的数量和时间戳之间的映射关系。
文字信息 五元组 数据子流 数据包的数量 数据包的时间戳
文字信息A1 五元组B1 数据子流C1 5个 12:20:10
文字信息A2 五元组B2 数据子流C2 5个 12:20:20
文字信息A3 五元组B3 数据子流C3 5个 12:20:30
文字信息A4 五元组B4 数据子流C4 5个 12:20:40
文字信息A5 五元组B5 数据子流C5 5个 12:20:50
文字信息A6 五元组B6 数据子流C6 5个 12:21:00
表11
通过上文和表11可以得知,代理服务器300根据五元组和时间戳可以将30个数据包分成6个数据子流。
另外,如果代理服务器300在第一时间段内接收终端设备200发送的数据包大于30个,而且根据五元组和时间戳将多个数据包分成至少7个数据子流,那么说明终端设备200向代理服务器300发送的数据包不仅包括6条文字信息的数据包,还混入了其他类型业务的数据包,例如,假设还混入了发送图片的业务的数据包。
为了过滤掉与6条文字信息的数据包无关的其他数据包,可以采用一些手段来实现数据包的过滤。例如,在代理服务器300根据五元组将多个数据包分成多个数据子流以后,对于多个数据子流而言,需要满足以下几个筛选条件:条件A、数据子流的数据包中的源IP地址为终端设备200的IP地址;条件B、数据子流的数据包中的协议类型为TCP协议;条件C、数据子流的数据包的数量大于4个。
代理服务器300可以通过上述筛选条件对多个数据子流进行筛选,代理服务器300会保留符合筛选条件的数据子流,删除不符合筛选条件的数据子流。当然,筛选条件可以针对不同的业务类型进行设定,上述几个筛选条件是针对发送文字信息业务,如果针对其他类型的业务还需要设定其他类型的筛选条件。
步骤S203、代理服务器300在6个数据子流的每个数据子流中提取具有数据特征的信令数据包得到6个信令数据包。
步骤S204、代理服务器300获取6个信令数据包的数据部分得到6组数据,6组数据中的每组数据包括11个数据位,11个数据位中的每个数据位上具有数据。
步骤S205、代理服务器300根据6组数据的11个数据位上的数据确定符合预设条件的特征数据位和特征数据,特征数据位包括至少一个数据位,特征数据为特征数据位上的数据。
步骤S206、代理服务器300将特征数据位与特征数据之间的映射关系确定为第一数据特征。
步骤S207、代理服务器300获取第一时间段对应的第一业务标签。
步骤S208、代理服务器300建立第一数据特征与第一业务标签的映射关系。
其中,图3所示的步骤S203至步骤S208与图2所示的步骤S103至步骤S108相同,关于图3所示的步骤S203至步骤S208请参见图2所示的步骤S103至步骤S108的详细说明,在此不再赘述。
在图1和图3所示的实施例中,通过代理服务器300对终端设备200发送的数据包的学习,代理服务器300可以建立起数据特征与业务标签之间的映射关系。在对数据包进行识别的阶段,可以在多个数据包中找到与第一数据特征相匹配的第一数据包,然后,便可以将第一数据特征对应的第一业务标签分配给第一数据包,从而实现了对数据包进行精准的识别。当然,在多个数据包中找到与第一数据特征相匹配的第一数据包以后,还可以在多个数据包中确定与第一数据包的五元组相同的至少一个数据包,并将第一业务标签分配给第一数据包和至少一个数据包,从而实现了对多个数据包的精细化分类。
请参见图1和图4所示,图4所示的为本申请实施例提供的又一种数据处理方法的流程图。假设终端设备200内安装有通信软件,通信软件包括发送图片、发送文字信息和发送语音信息等业务。本申请实施例以通信软件发送图片的业务为例,说明终端设备200如何准确的识别数据包归属于应用软件的具体业务,以及如何对多个数据包进行精细化分类。本申请实施例提供的数据处理方法包括以下步骤:
步骤S301、终端设备200获取多个数据包。
其中,假设代理服务器300建立了第一数据特征与第一业务标签的映射关系,第一数据特征为第1位至第6位的数据为“ab002d”,第7位、第10位和第11位的数据为“384”、“472”或“917”,第一业务标签为发送图片。为了使终端设备200具有识别数据包的能力,需要预先将第一数据特征与第一业务标签的映射关系存储至终端设备200内。
当然,为了使不同的设备具有识别数据包的能力,还可以将第一数据特征与第一业务标签的映射关系存储至需要的设备,例如,可以将第一数据特征与第一业务标签的映射关系存储至终端、路由器、服务器或基站等设备内。
在终端设备200存储了第一数据特征与第一业务标签的映射关系以后,终端设备200便可以在多个数据包中识别出与数据特征相匹配的数据包。
在图1和图4所示的实施例中,假设终端设备200的通信软件在12点01分01秒时向业务服务器400发送了1张图片,该图片为图片A1,图片A1对应100个数据包。同时,终端设备200的其他应用软件在12点01分01秒时向其他的业务服务器发送了100个数据包,终端设备200在12点01分01秒时一共可以获取到200个数据包。
步骤S302、终端设备200在多个数据包中确定数据包的数据部分与第一数据特征相匹配的第一数据包,第一数据特征为特征数据位与特征数据的映射关系。
其中,前文提到终端设备200预先存储了第一数据特征与第一业务标签的映射关系,该映射关系可以参见表7所示,该映射关系为发送图片的业务与第一数据特征之间的映射关系。
终端设备200为了识别出在12点01分01秒时获取的200个数据包中哪些是通信软件发送的图片的数据包,终端设备200需要在200个数据包中确定数据包的数据部分与第一数据特征相匹配的第一数据包。
请参见表12所示,表12所示的为多个数据包的数据部分。其中,由于篇幅有限,在终端设备200获取到的200个数据包中仅展示出6个数据包的数据部分,每个数据包的数据部分仅展示11位数据。
数据位 1 2 3 4 5 6 7 8 9 10 11
第一数据包的数据部分 a b 0 0 2 d 3 2 7 8 4
第二数据包的数据部分 2 2 2 2 2 2 2 2 2 2 2
第三数据包的数据部分 3 3 3 3 3 3 3 3 3 3 3
第四数据包的数据部分 4 4 4 4 4 4 4 4 4 4 4
第五数据包的数据部分 5 5 5 5 5 5 5 5 5 5 5
第六数据包的数据部分 6 6 6 6 6 6 6 6 6 6 6
表12
通过表12可知,第一数据包的数据部分为“ab002d32784”,表7中的第一数据特征为第1位至第6位的数据为“ab002d”,第7位、第10位和第11位的数据为“384”、“472”或“917”,所以终端设备200通过将200个数据包与第一数据特征进行对比以后发现,第一数据包的数据部分与第一数据特征相匹配。此时,终端设备200便可以确定,第一数据包为终端设备200的通信软件在12点01分01秒时向业务服务器400发送的图片A1的一个数据包。为了得知200个数据包中哪些数据包也属于图片A1,终端设备还需要在200个数据包中找到与第一数据包的五元组相同的多个数据包。
步骤S303、终端设备200在多个数据包中确定与第一数据包的五元组相同的至少一个数据包。
其中,由于图片A1是终端设备200的通信软件通过短连接发送给业务服务器400的,所以在200个数据包中与第一数据包的五元组相同的多个数据包也属于图片A1。
请参见表13所示,表13所示的为图片、五元组和数据包的数量的映射关系。
图片 五元组 数据包的数量
图片A1 五元组B1 100个
表13
通过表13可知,终端设备200在200个数据包中可以确定出与第一数据包的五元组相同的99个数据包,第一数据包与99个数据包为图片A1对应的100个数据包,这100个数据包的五元组均为五元组B1。
另外,本申请实施例的终端设备200在多个数据包中确定与第一数据包的五元组相同的至少一个数据包。当然,并不局限于五元组,还可以为其他类型的元组,例如四元组或七元组等,所以终端设备200还可以在多个数据包中确定与第一数据包的四元组或七元组相同的至少一个数据包。四元组包括源IP地址、源端口、目的IP地址和目的端口,五元组包括源IP地址、源端口、目的IP地址、目的端口和传输层协议;七元组包括源IP地址、源端口、目的IP地址、目的端口、传输层协议、服务类型和接口索引。
步骤S304、终端设备200确定与第一数据特征对应的第一业务标签。
其中,在终端设备200在200个数据包中确定与第一数据包的五元组相同的99个数据包以后,终端设备200还需要通过表7中数据特征与业务标签的映射关系来确定,与第一数据特征对应的第一业务标签为“发送图片”。
步骤S305、终端设备200确定第一业务标签为第一数据包和至少一个数据包的业务标签。
其中,终端设备200将第一业务标签“发送图片”确定为第一数据包和与第一数据包的五元组相同的99个数据包的业务标签。
此时,终端设备200便在12点01分01秒时获取的200个数据包中找到了图片A1对应的100个数据包。
在图1和图4所示的实施例中,终端设备200可以在多个数据包中找到与第一数据特征相匹配的第一数据包,然后,便可以将第一数据特征对应的第一业务标签分配给第一数据包,从而实现了对数据包进行精准的识别。当然,在多个数据包中找到与第一数据特征相匹配的第一数据包以后,还可以在多个数据包中确定与第一数据包的五元组相同的至少一个数据包,并将第一业务标签分配给第一数据包和至少一个数据包,从而实现了对多个数据包的精细化分类。
请参见图1和图5所示,图5所示的为本申请实施例提供的又一种数据处理方法的流程图。假设终端设备200内安装有通信软件,通信软件包括发送图片、发送文字信息和发送语音信息等业务。本申请实施例以通信软件发送文字信息的业务为例,说明终端设备200如何准确的识别数据包归属于应用软件的具体业务,以及如何根据多个数据包确定业务发生的次数。本申请实施例提供的数据处理方法包括以下步骤:
步骤S401、终端设备200获取多个数据包。
请参见表14所示,表14所示的为数据特征与业务标签之间的映射关系。
表14
请结合表14所示,假设代理服务器300建立了第一数据特征与第一业务标签的映射关系,第一数据特征为第1位至第6位的数据为“ab002d”,第7位、第10位和第11位的数据为“384”、“472”或“917”,第一业务标签为发送文字信息。为了使终端设备200具有识别数据包的能力,需要预先将第一数据特征与第一业务标签的映射关系存储至终端设备200内。
当然,为了使不同的设备具有识别数据包的能力,还可以将第一数据特征与第一业务标签的映射关系存储至需要的设备,例如,可以将第一数据特征与第一业务标签的映射关系存储至终端、路由器、服务器或基站等设备内。
在终端设备200存储了第一数据特征与第一业务标签的映射关系以后,终端设备200便可以在多个数据包中识别出与数据特征相匹配的数据包。
在图1和图5所示的实施例中,假设终端设备200的通信软件在12点01分01秒时向业务服务器400发送了6条文字信息,每条文字信息具有5个数据包,6条文字信息一共有30个数据包。同时,终端设备200的其他应用软件在12点01分01秒时向其他的业务服务器发送了5个数据包,终端设备200在12点01分01秒时一共可以获取到35个数据包。
步骤S402、终端设备200在多个数据包中确定数据包的数据部分与第一数据特征相匹配的数据包的第一数量,第一数据特征为特征数据位与特征数据的映射关系。
其中,前文提到终端设备200预先存储了第一数据特征与第一业务标签的映射关系,该映射关系可以参见表14所示,该映射关系为发送文字信息的业务与第一数据特征之间的映射关系。
终端设备200需要根据在12点01分01秒时获取的35个数据包确定发送文字信息的次数,终端设备200可以在35个数据包中确定数据包的数据部分与第一数据特征相匹配的数据包的第一数量。
请参见表15所示,表15所示的为多个数据包的数据部分。其中,由于篇幅有限,在终端设备200获取到的35个数据包中仅展示出6个数据包的数据部分,每个数据包的数据部分仅展示11位数据。
数据位 1 2 3 4 5 6 7 8 9 10 11
第一数据包的数据部分 a b 0 0 2 d 3 2 7 8 4
第二数据包的数据部分 a b 0 0 2 d 3 5 7 8 4
第三数据包的数据部分 a b 0 0 2 d 3 2 5 8 4
第四数据包的数据部分 a b 0 0 2 d 4 7 1 7 2
第五数据包的数据部分 a b 0 0 2 d 4 5 5 7 2
第六数据包的数据部分 a b 0 0 2 d 9 8 1 1 7
表15
通过表15可知,第一数据包的数据部分、第二数据包的数据部分、第三数据包的数据部分、第四数据包的数据部分、第五数据包的数据部分和第六数据包的数据部分均与表14的第一数据特征相匹配。此时,终端设备200便可以确定,在35个数据包中数据包的数据部分与第一数据特征相匹配的数据包的第一数量为6,说明第一数据特征对应的第一业务标签的业务发生了6次。
步骤S403、终端设备200确定与第一数据特征对应的第一业务标签。
其中,通过表14可知,与第一数据特征对应的第一业务标签为“发送文字信息”。
步骤S404、终端设备200确定第一数量为第一业务标签对应的业务发生的次数。
最后,终端设备200可以确定第一业务标签对应的业务发生了6次。
在图1和图5所示的实施例中,终端设备200可以在多个数据包中确定与第一数据特征相匹配的数据包的第一数量,然后,便可以确定第一数量为第一业务标签对应的业务发生的次数,所以终端设备200可以根据多个数据包确定业务发生的次数。
请参见图6所示,图6所示的为本申请实施例提供的又一种数据处理方法的流程图,图6所示的方法包括以下步骤。
步骤S501、服务器在第一时间段内获取多个数据包。
步骤S502、服务器根据第一参数将多个数据包分成至少两个数据子流。
其中,第一参数包括多元组,或者,第一参数包括多元组和时间戳,多元组至少包括源IP地址和目的IP地址。
另外,多元组为四元组、五元组或七元组。四元组包括源IP地址、源端口、目的IP地址和目的端口,五元组包括源IP地址、源端口、目的IP地址、目的端口和传输层协议,七元组包括源IP地址、源端口、目的IP地址、目的端口、传输层协议、服务类型和接口索引。
步骤S503、服务器在至少两个数据子流的每个数据子流中提取具有数据特征的信令数据包得到至少两个信令数据包。
步骤S504、服务器获取至少两个信令数据包的数据部分得到至少两组数据,至少两组数据中的每组数据包括多个数据位,多个数据位中的每个数据位上具有数据。
步骤S505、服务器根据至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据,特征数据位包括至少一个数据位,特征数据为特征数据位上的数据。
步骤S506、服务器将特征数据位与特征数据之间的映射关系确定为第一数据特征。
步骤S507、服务器获取第一时间段对应的第一业务标签。
其中,在第一参数包括多元组时,第一业务标签为第一应用软件的发送图片业务的标识、第一应用软件的接收图片业务的标识、第一应用软件的发送视频业务的标识或第一应用软件的接收视频业务的标识。
其中,在第一参数包括多元组和时间戳时,第一业务标签为第一应用软件的发送文字信息业务的标识、第一应用软件的接收文字信息业务的标识、第一应用软件的发送语音信息业务的标识、第一应用软件的接收语音信息业务的标识、第一应用软件的发送语音通话业务的标识、第一应用软件的接收语音通话业务的标识、第一应用软件的发送视频通话业务的标识或第一应用软件的接收视频通话业务的标识。
步骤S508、服务器建立第一数据特征与第一业务标签的映射关系。
其中,关于步骤S501至步骤S508,请参见图2所示的步骤S101至步骤S108的详细说明,以及请参见图3所示的步骤S201至步骤S208的详细说明。
在图6所示的实施例中,通过服务器对多个数据包的学习,服务器可以建立起数据特征与业务标签之间的映射关系。在对数据包进行识别的阶段,可以在多个数据包中找到与第一数据特征相匹配的第一数据包,然后,便可以将第一数据特征对应的第一业务标签分配给第一数据包,从而实现了对数据包进行精准的识别。当然,在多个数据包中找到与第一数据特征相匹配的第一数据包以后,还可以在多个数据包中确定与第一数据包的五元组相同的至少一个数据包,并将第一业务标签分配给第一数据包和至少一个数据包,从而实现了对多个数据包的精细化分类。
请参见图7所示,图7所示的为本申请实施例提供的又一种数据处理方法的流程图,图7所示的方法包括以下步骤。
步骤S601、终端设备获取多个数据包。
步骤S602、终端设备在多个数据包中确定数据包的数据部分与第一数据特征相匹配的第一数据包,第一数据特征为特征数据位与特征数据的映射关系。
其中,第一数据特征为预先存储在终端设备内的数据特征。
其中,特征数据位包括至少一个数据位,特征数据位中的每个数据位对应一个特征数据;或者,特征数据位包括至少一个数据位,特征数据位中的每个数据位对应至少两个特征数据;或者,特征数据位包括至少一个第一数据位和至少一个第二数据位,至少一个第一数据位中的每个数据位对应一个特征数据,至少一个第二数据位中的每个数据位对应至少两个特征数据。
其中,与第一数据特征相匹配的数据包的网络通信类型为短连接。
步骤S603、终端设备在多个数据包中确定与第一数据包的多元组相同的至少一个数据包。
其中,多元组至少包括源IP地址和目的IP地址。
其中,多元组可以为四元组、五元组或七元组。四元组包括源IP地址、源端口、目的IP地址和目的端口。五元组包括源IP地址、源端口、目的IP地址、目的端口和传输层协议。七元组包括源IP地址、源端口、目的IP地址、目的端口、传输层协议、服务类型和接口索引。
步骤S604、终端设备确定与第一数据特征对应的第一业务标签。
其中,第一业务标签为第一应用软件的第一业务的标识,第一业务标签为第一数据包和至少一个数据包的业务标签。
另外,第一业务标签可以为第一应用软件的发送图片业务的标识、第一应用软件的接收图片业务的标识、第一应用软件的发送视频业务的标识或第一应用软件的接收视频业务的标识。
在步骤S604以后,终端设备还可以确定第一业务标签的业务类型是否为待加速类型。在终端设备确定第一业务标签的业务类型为待加速类型时,终端设备对第一数据包和至少一个数据包进行网络加速,网络加速包括智能带宽分配、报文多发和降低协商速率中的至少一个。这样做的目的在于,终端设备可以对较为重要的业务标签对应的数据包进行网络加速。
其中,关于步骤S601至步骤S604,请参见图4所示的步骤S301至步骤S304的详细说明。
在图7所示的实施例中,终端设备可以在多个数据包中找到与第一数据特征相匹配的第一数据包,然后,便可以将第一数据特征对应的第一业务标签分配给第一数据包,从而实现了对数据包进行精准的识别。当然,在多个数据包中找到与第一数据特征相匹配的第一数据包以后,还可以在多个数据包中确定与第一数据包的多元组相同的至少一个数据包,并将第一业务标签分配给第一数据包和至少一个数据包,从而实现了对多个数据包的精细化分类。
请参见图8所示,图8所示的为本申请实施例提供的又一种数据处理方法的流程图,图8所示的方法包括以下步骤。
步骤S701、终端设备获取多个数据包。
步骤S702、终端设备在多个数据包中确定数据包的数据部分与第一数据特征相匹配的数据包的第一数量,第一数据特征为特征数据位与特征数据的映射关系。
其中,第一数据特征为预先存储在终端设备内的数据特征。
其中,特征数据位包括至少一个数据位,特征数据位中的每个数据位对应一个特征数据;或者,特征数据位包括至少一个数据位,特征数据位中的每个数据位对应至少两个特征数据;或者,特征数据位包括至少一个第一数据位和至少一个第二数据位,至少一个第一数据位中的每个数据位对应一个特征数据,至少一个第二数据位中的每个数据位对应至少两个特征数据。
其中,与第一数据特征相匹配的数据包的网络通信类型为长连接。
步骤S703、终端设备确定与第一数据特征对应的第一业务标签。
其中,第一业务标签为第一应用软件的第一业务的标识。
其中,第一业务标签可以为第一应用软件的发送文字信息业务的标识、第一应用软件的接收文字信息业务的标识、第一应用软件的发送语音信息业务的标识、第一应用软件的接收语音信息业务的标识、第一应用软件的发送语音通话业务的标识、第一应用软件的接收语音通话业务的标识、第一应用软件的发送视频通话业务的标识或第一应用软件的接收视频通话业务的标识。
步骤S704、终端设备确定第一数量为第一业务标签对应的第一业务发生的次数。
在步骤S704以后,终端设备还可以输出第一业务标签对应的第一业务发生的次数。这样做的目的在于,终端设备可以统计出一段时间内第一业务标签对应的第一业务发生的次数,第一业务发生的次数可以作为大数据统计。
其中,关于步骤S701至步骤S704,请参见图5所示的步骤S401至步骤S404的详细说明。
在图8所示的实施例中,终端设备可以在多个数据包中确定与第一数据特征相匹配的数据包的第一数量,然后,便可以确定第一数量为第一业务标签对应的业务发生的次数,所以终端设备可以根据多个数据包确定业务发生的次数。
请参见图9所示,图9所示的为本申请实施例提供的一种终端设备的示意图。图9所示的终端设备包括以下模块:
获取模块11,用于获取多个数据包。具体详细的实现方式,请参考上述图4所示的方法实施例中步骤S301的详细描述。
处理模块12,用于在多个数据包中确定数据包的数据部分与第一数据特征相匹配的第一数据包,第一数据特征为特征数据位与特征数据的映射关系,在多个数据包中确定与第一数据包的多元组相同的至少一个数据包,多元组至少包括源IP地址和目的IP地址,确定与第一数据特征对应的第一业务标签,第一业务标签为第一应用软件的第一业务的标识,第一业务标签为第一数据包和至少一个数据包的业务标签。具体详细的实现方式,请参考上述图4所示的方法实施例中步骤S302至S304的详细描述。
在图9所示的实施例中,处理模块12,具体用于确定第一业务标签的业务类型是否为待加速类型,在终端设备确定第一业务标签的业务类型为待加速类型时,对第一数据包和至少一个数据包进行网络加速,网络加速包括智能带宽分配、报文多发和降低协商速率中的至少一个。
请参见图10所示,图10所示的为本申请实施例提供的另一种终端设备的示意图。图10所示的终端设备包括以下模块:
获取模块21,用于获取多个数据包。具体详细的实现方式,请参考上述图5所示的方法实施例中步骤S401的详细描述。
处理模块22,用于在多个数据包中确定数据包的数据部分与第一数据特征相匹配的数据包的第一数量,第一数据特征为特征数据位与特征数据的映射关系,确定与第一数据特征对应的第一业务标签,第一业务标签为第一应用软件的第一业务的标识,确定第一数量为第一业务标签对应的第一业务发生的次数。
在图10所示的实施例中,处理模块22,具体用于输出第一业务标签对应的第一业务发生的次数。具体详细的实现方式,请参考上述图5所示的方法实施例中步骤S402至S404的详细描述。
请参见图11所示,图11所示的为本申请实施例提供的一种服务器的示意图。图11所示的服务器包括以下模块:
获取模块31,用于在第一时间段内获取多个数据包。具体详细的实现方式,请参考上述图2所示的方法实施例中步骤S101的详细描述。
处理模块32,用于根据第一参数将多个数据包分成至少两个数据子流,在至少两个数据子流的每个数据子流中提取具有数据特征的信令数据包得到至少两个信令数据包,获取至少两个信令数据包的数据部分得到至少两组数据,至少两组数据中的每组数据包括多个数据位,多个数据位中的每个数据位上具有数据,根据至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据,特征数据位包括至少一个数据位,特征数据为特征数据位上的数据,将特征数据位与特征数据之间的映射关系确定为第一数据特征,获取第一时间段对应的第一业务标签,第一业务标签为第一应用软件的第一业务的标识,建立第一数据特征与第一业务标签的映射关系。具体详细的实现方式,请参考上述图5所示的方法实施例中步骤S102至S108的详细描述。
在图11所示的实施例中,处理模块32,具体用于根据至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为特征数据位,确定特征数据位上出现的概率大于第一阈值的数据为特征数据。
在图11所示的实施例中,处理模块32,具体用于根据至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为特征数据位,确定特征数据位上的数据为特征数据。
在图11所示的实施例中,处理模块32,具体用于根据至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,第一可选位包括至少两个数据位,获取第一可选位上的数据得到多个可选数据组合,计算在多个可选数据组合中的每个可选数据组合出现的概率,在多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合,判断至少两个可选数据组合出现的概率之和是否小于第五阈值,确定至少两个可选数据组合出现的概率之和小于第五阈值时,计算第一可选位中的每个数据位的信息熵,删除第一可选位中信息熵最大的数据位,并执行获取第一可选位上的数据得到多个可选数据组合的步骤,确定至少两个可选数据组合出现的概率之和大于或等于第五阈值时,确定第一可选位为特征数据位。
在图11所示的实施例中,处理模块32,具体用于根据至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为第一特征数据位,确定第一特征数据位上出现的概率大于第一阈值的数据为第一特征数据,根据至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为第二特征数据位,确定第二特征数据位上的数据为第二特征数据,确定第一特征数据位和第二特征数据位为特征数据位,确定第一特征数据和第二特征数据为特征数据。
在图11所示的实施例中,处理模块32,具体用于根据至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,第一可选位包括至少两个数据位,获取第一可选位上的数据得到多个可选数据组合,计算在多个可选数据组合中的每个可选数据组合出现的概率,在多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合,判断至少两个可选数据组合出现的概率之和是否小于第五阈值,确定至少两个可选数据组合出现的概率之和小于第五阈值时,计算第一可选位中的每个数据位的信息熵,删除第一可选位中信息熵最大的数据位,并执行获取第一可选位上的数据得到多个可选数据组合的步骤,确定至少两个可选数据组合出现的概率之和大于或等于第五阈值时,确定第一可选位为第二特征数据位。
请参见图12所示,图12所示的为本申请实施例提供的又一种终端设备的示意图。图12所示的终端设备包括处理器41、存储器42、总线43和输入/输出设备接口44。
在图12所示的实施例中,终端设备的输入/输出设备接口44可以获取多个数据包,总线43可以将输入/输出设备接口44获取的多个数据包传输至存储器42中。处理器41可以在存储器42中获取多个数据包,并且在多个数据包中确定数据包的数据部分与第一数据特征相匹配的第一数据包。然后,处理器41可以在多个数据包中确定与第一数据包的多元组相同的至少一个数据包,并确定与第一数据特征对应的第一业务标签,第一业务标签为第一数据包和至少一个数据包的业务标签。
在图12所示的实施例中,图12所示的终端设备等同于图1的终端设备200、图2的终端设备200、图4的终端设备200或图7的终端设备。关于图12中的终端设备可以参见图1、图2和图4对应的实施例中的对于终端设备200的详细说明,以及可以参见图7对应的实施例中对于终端设备的详细说明。
另外,图12中的输入/输出设备接口44等同于图9中的获取模块11,图12中的处理器41等同于图9中的处理模块12。
请参见图13所示,图13所示的为本申请实施例提供的又一种终端设备的示意图。图13所示的终端设备包括处理器51、存储器52、总线53和输入/输出设备接口54。
在图13所示的实施例中,终端设备的输入/输出设备接口54可以获取多个数据包,总线53可以将输入/输出设备接口54获取的多个数据包传输至存储器52中。处理器51可以在存储器52中获取多个数据包,并且在多个数据包中确定数据包的数据部分与第一数据特征相匹配的数据包的第一数量。然后,处理器51可以确定与第一数据特征对应的第一业务标签,并确定第一数量为第一业务标签对应的第一业务发生的次数。
在图13所示的实施例中,图13所示的终端设备等同于图1的终端设备200、图3的终端设备200、图5的终端设备200或图8的终端设备。关于图13中的终端设备可以参见图1、图3和图5对应的实施例中的对于终端设备200的详细说明,以及可以参见图8对应的实施例中对于终端设备的详细说明。
另外,图13中的输入/输出设备接口54等同于图10中的获取模块21,图13中的处理器51等同于图10中的处理模块22。
请参见图14所示,图14所示的为本申请实施例提供的又一种服务器的示意图。图14所示的服务器包括处理器61、存储器62、总线63和输入/输出设备接口64。
在图14所示的实施例中,服务器的输入/输出设备接口64可以在第一时间段内获取多个数据包,总线63可以将输入/输出设备接口64获取的多个数据包传输至存储器62中。
处理器61可以在存储器62中获取多个数据包,并且根据第一参数将多个数据包分成至少两个数据子流。然后,在至少两个数据子流的每个数据子流中提取具有数据特征的信令数据包得到至少两个信令数据包。其次,获取至少两个信令数据包的数据部分得到至少两组数据。再次,根据至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据,将特征数据位与特征数据之间的映射关系确定为第一数据特征,获取第一时间段对应的第一业务标签。最后,建立第一数据特征与第一业务标签的映射关系。
在图14所示的实施例中,图14所示的服务器等同于图1的代理服务器300、图2的代理服务器300、图3的代理服务器300或图6的服务器。关于图14中的服务器可以参见图1、图2和图3对应的实施例中的对于代理服务器300的详细说明,以及可以参见图6对应的实施例中对于服务器的详细说明。
另外,图14中的输入/输出设备接口64等同于图11中的获取模块31,图14中的处理器61等同于图11中的处理模块32。
需要说明的是,当上述实施例中涉及软件实现的功能时,相关软件或软件中的模块可存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。
此外,以上实施例仅用以说明本申请的技术方案而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,然而本领域的普通技术人员应当理解:其依然可对前述各实施例所记载的技术方案进行修改,或对其中部分技术特征进行等同替换。

Claims (35)

1.一种数据处理方法,其特征在于,包括:
终端设备获取多个数据包;
所述终端设备在所述多个数据包中确定数据包的数据部分与第一数据特征相匹配的第一数据包,所述第一数据特征为特征数据位与特征数据的映射关系;
所述终端设备在所述多个数据包中确定与所述第一数据包的多元组相同的至少一个数据包,所述多元组至少包括源IP地址和目的IP地址;
所述终端设备确定与所述第一数据特征对应的第一业务标签,所述第一业务标签为第一应用软件的第一业务的标识,所述第一业务标签为所述第一数据包和所述至少一个数据包的业务标签。
2.根据权利要求1所述的数据处理方法,其特征在于:
所述特征数据位包括至少一个数据位,所述特征数据位中的每个数据位对应一个特征数据;或者,
所述特征数据位包括至少一个数据位,所述特征数据位中的每个数据位对应至少两个特征数据;或者,
所述特征数据位包括至少一个第一数据位和至少一个第二数据位,所述至少一个第一数据位中的每个数据位对应一个特征数据,所述至少一个第二数据位中的每个数据位对应至少两个特征数据。
3.根据权利要求1所述的数据处理方法,其特征在于:
所述第一数据包和所述至少一个数据包的网络通信类型为短连接。
4.根据权利要求1所述的数据处理方法,其特征在于:
所述第一数据特征为预先存储在所述终端设备内的数据特征。
5.根据权利要求1所述的数据处理方法,其特征在于:
所述多元组为四元组、五元组或七元组;
所述四元组包括源IP地址、源端口、目的IP地址和目的端口;
所述五元组包括源IP地址、源端口、目的IP地址、目的端口和传输层协议;
所述七元组包括源IP地址、源端口、目的IP地址、目的端口、传输层协议、服务类型和接口索引。
6.根据权利要求1所述的数据处理方法,其特征在于:
所述第一业务标签为所述第一应用软件的发送图片业务的标识、所述第一应用软件的接收图片业务的标识、所述第一应用软件的发送视频业务的标识或所述第一应用软件的接收视频业务的标识。
7.根据权利要求1所述的数据处理方法,其特征在于,在所述终端设备确定与所述第一数据特征对应的第一业务标签以后,所述方法还包括:
所述终端设备确定所述第一业务标签的业务类型是否为待加速类型;
在所述终端设备确定所述第一业务标签的业务类型为待加速类型时,所述终端设备对所述第一数据包和所述至少一个数据包进行网络加速,所述网络加速包括智能带宽分配、报文多发和降低协商速率中的至少一个。
8.一种数据处理方法,其特征在于,包括:
终端设备获取多个数据包;
所述终端设备在所述多个数据包中确定数据包的数据部分与第一数据特征相匹配的数据包的第一数量,所述第一数据特征为特征数据位与特征数据的映射关系;
所述终端设备确定与所述第一数据特征对应的第一业务标签,所述第一业务标签为第一应用软件的第一业务的标识;
所述终端设备确定所述第一数量为所述第一业务标签对应的所述第一业务发生的次数。
9.根据权利要求8所述的数据处理方法,其特征在于:
所述特征数据位包括至少一个数据位,所述特征数据位中的每个数据位对应一个特征数据;或者,
所述特征数据位包括至少一个数据位,所述特征数据位中的每个数据位对应至少两个特征数据;或者,
所述特征数据位包括至少一个第一数据位和至少一个第二数据位,所述至少一个第一数据位中的每个数据位对应一个特征数据,所述至少一个第二数据位中的每个数据位对应至少两个特征数据。
10.根据权利要求8所述的数据处理方法,其特征在于:
与所述第一数据特征相匹配的数据包的网络通信类型为长连接。
11.根据权利要求8所述的数据处理方法,其特征在于:
所述第一数据特征为预先存储在所述终端设备内的数据特征。
12.根据权利要求8所述的数据处理方法,其特征在于,其特征在于:
所述第一业务标签为所述第一应用软件的发送文字信息业务的标识、所述第一应用软件的接收文字信息业务的标识、所述第一应用软件的发送语音信息业务的标识、所述第一应用软件的接收语音信息业务的标识、所述第一应用软件的发送语音通话业务的标识、所述第一应用软件的接收语音通话业务的标识、所述第一应用软件的发送视频通话业务的标识或所述第一应用软件的接收视频通话业务的标识。
13.根据权利要求8所述的数据处理方法,其特征在于,在所述终端设备确定所述第一数量为所述第一业务标签对应的所述第一业务发生的次数以后,所述方法还包括:
所述终端设备输出所述第一业务标签对应的所述第一业务发生的次数。
14.一种数据处理方法,其特征在于,包括:
服务器在第一时间段内获取多个数据包;
所述服务器根据第一参数将所述多个数据包分成至少两个数据子流;
所述服务器在所述至少两个数据子流的每个数据子流中提取具有数据特征的信令数据包得到至少两个信令数据包;
所述服务器获取所述至少两个信令数据包的数据部分得到至少两组数据,所述至少两组数据中的每组数据包括多个数据位,所述多个数据位中的每个数据位上具有数据;
所述服务器根据所述至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据,所述特征数据位包括至少一个数据位,所述特征数据为所述特征数据位上的数据;
所述服务器将所述特征数据位与所述特征数据之间的映射关系确定为第一数据特征;
所述服务器获取所述第一时间段对应的第一业务标签,所述第一业务标签为第一应用软件的第一业务的标识;
所述服务器建立所述第一数据特征与所述第一业务标签的映射关系。
15.根据权利要求14所述的数据处理方法,其特征在于,所述服务器根据所述至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据包括:
所述服务器根据所述至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为特征数据位;
所述服务器确定所述特征数据位上出现的概率大于所述第一阈值的数据为特征数据。
16.根据权利要求14所述的数据处理方法,其特征在于,所述服务器根据所述至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据包括:
所述服务器根据所述至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为特征数据位;
所述服务器确定所述特征数据位上的数据为特征数据。
17.根据权利要求16所述的数据处理方法,其特征在于,所述服务器根据所述至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为特征数据位包括:
所述服务器根据所述至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,所述第一可选位包括至少两个数据位;
所述服务器获取所述第一可选位上的数据得到多个可选数据组合;
所述服务器计算在所述多个可选数据组合中的每个可选数据组合出现的概率;
所述服务器在所述多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合;
所述服务器判断所述至少两个可选数据组合出现的概率之和是否小于第五阈值;
在所述服务器确定所述至少两个可选数据组合出现的概率之和小于所述第五阈值时,所述服务器计算所述第一可选位中的每个数据位的信息熵,所述服务器删除第一可选位中信息熵最大的数据位,并执行所述服务器获取所述第一可选位上的数据得到多个可选数据组合的步骤;
在所述服务器确定所述至少两个可选数据组合出现的概率之和大于或等于所述第五阈值时,所述服务器确定所述第一可选位为特征数据位。
18.根据权利要求14所述的数据处理方法,其特征在于,所述服务器根据所述至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据包括:
所述服务器根据所述至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为第一特征数据位;
所述服务器确定所述第一特征数据位上出现的概率大于所述第一阈值的数据为第一特征数据;
所述服务器根据所述至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为第二特征数据位;
所述服务器确定所述第二特征数据位上的数据为第二特征数据;
所述服务器确定所述第一特征数据位和所述第二特征数据位为特征数据位;
所述服务器确定所述第一特征数据和所述第二特征数据为特征数据。
19.根据权利要求18所述的数据处理方法,其特征在于,所述服务器根据所述至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为第二特征数据位包括:
所述服务器根据所述至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,所述第一可选位包括至少两个数据位;
所述服务器获取所述第一可选位上的数据得到多个可选数据组合;
所述服务器计算在所述多个可选数据组合中的每个可选数据组合出现的概率;
所述服务器在所述多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合;
所述服务器判断所述至少两个可选数据组合出现的概率之和是否小于第五阈值;
在所述服务器确定所述至少两个可选数据组合出现的概率之和小于所述第五阈值时,所述服务器计算所述第一可选位中的每个数据位的信息熵,所述服务器删除第一可选位中信息熵最大的数据位,并执行所述服务器获取所述第一可选位上的数据得到多个可选数据组合的步骤;
在所述服务器确定所述至少两个可选数据组合出现的概率之和大于或等于所述第五阈值时,所述服务器确定所述第一可选位为第二特征数据位。
20.根据权利要求14所述的数据处理方法,其特征在于:
所述第一参数包括多元组,或者,所述第一参数包括多元组和时间戳;
所述多元组至少包括源IP地址和目的IP地址。
21.根据权利要求20所述的数据处理方法,其特征在于:
所述多元组为四元组、五元组或七元组;
所述四元组包括源IP地址、源端口、目的IP地址和目的端口;
所述五元组包括源IP地址、源端口、目的IP地址、目的端口和传输层协议;
所述七元组包括源IP地址、源端口、目的IP地址、目的端口、传输层协议、服务类型和接口索引。
22.根据权利要求20所述的数据处理方法,其特征在于:
在所述第一参数包括多元组时,所述第一业务标签为所述第一应用软件的发送图片业务的标识、所述第一应用软件的接收图片业务的标识、所述第一应用软件的发送视频业务的标识或所述第一应用软件的接收视频业务的标识;
在所述第一参数包括多元组和时间戳时,所述第一业务标签为所述第一应用软件的发送文字信息业务的标识、所述第一应用软件的接收文字信息业务的标识、所述第一应用软件的发送语音信息业务的标识、所述第一应用软件的接收语音信息业务的标识、所述第一应用软件的发送语音通话业务的标识、所述第一应用软件的接收语音通话业务的标识、所述第一应用软件的发送视频通话业务的标识或所述第一应用软件的接收视频通话业务的标识。
23.一种终端设备,其特征在于,包括:
获取模块,用于获取多个数据包;
处理模块,用于在所述多个数据包中确定数据包的数据部分与第一数据特征相匹配的第一数据包,所述第一数据特征为特征数据位与特征数据的映射关系;在所述多个数据包中确定与所述第一数据包的多元组相同的至少一个数据包,所述多元组至少包括源IP地址和目的IP地址;确定与所述第一数据特征对应的第一业务标签,所述第一业务标签为第一应用软件的第一业务的标识,所述第一业务标签为所述第一数据包和所述至少一个数据包的业务标签。
24.根据权利要求23所述的终端设备,其特征在于:
所述处理模块,具体用于确定所述第一业务标签的业务类型是否为待加速类型;在所述终端设备确定所述第一业务标签的业务类型为待加速类型时,对所述第一数据包和所述至少一个数据包进行网络加速,所述网络加速包括智能带宽分配、报文多发和降低协商速率中的至少一个。
25.一种终端设备,其特征在于,包括:
获取模块,用于获取多个数据包;
处理模块,用于在所述多个数据包中确定数据包的数据部分与第一数据特征相匹配的数据包的第一数量,所述第一数据特征为特征数据位与特征数据的映射关系;确定与所述第一数据特征对应的第一业务标签,所述第一业务标签为第一应用软件的第一业务的标识;确定所述第一数量为所述第一业务标签对应的所述第一业务发生的次数。
26.根据权利要求25所述的终端设备,其特征在于:
所述处理模块,具体用于输出所述第一业务标签对应的所述第一业务发生的次数。
27.一种服务器,其特征在于,包括:
获取模块,用于在第一时间段内获取多个数据包;
处理模块,用于根据第一参数将所述多个数据包分成至少两个数据子流;在所述至少两个数据子流的每个数据子流中提取具有数据特征的信令数据包得到至少两个信令数据包;获取所述至少两个信令数据包的数据部分得到至少两组数据,所述至少两组数据中的每组数据包括多个数据位,所述多个数据位中的每个数据位上具有数据;根据所述至少两组数据的多个数据位上的数据确定符合预设条件的特征数据位和特征数据,所述特征数据位包括至少一个数据位,所述特征数据为所述特征数据位上的数据;将所述特征数据位与所述特征数据之间的映射关系确定为第一数据特征;获取所述第一时间段对应的第一业务标签,所述第一业务标签为第一应用软件的第一业务的标识;建立所述第一数据特征与所述第一业务标签的映射关系。
28.根据权利要求27所述的服务器,其特征在于:
所述处理模块,具体用于根据所述至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为特征数据位;确定所述特征数据位上出现的概率大于所述第一阈值的数据为特征数据。
29.根据权利要求27所述的服务器,其特征在于:
所述处理模块,具体用于根据所述至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为特征数据位;确定所述特征数据位上的数据为特征数据。
30.根据权利要求29所述的服务器,其特征在于:
所述处理模块,具体用于根据所述至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,所述第一可选位包括至少两个数据位;获取所述第一可选位上的数据得到多个可选数据组合;计算在所述多个可选数据组合中的每个可选数据组合出现的概率;在所述多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合;判断所述至少两个可选数据组合出现的概率之和是否小于第五阈值;确定所述至少两个可选数据组合出现的概率之和小于所述第五阈值时,计算所述第一可选位中的每个数据位的信息熵,删除第一可选位中信息熵最大的数据位,并执行获取所述第一可选位上的数据得到多个可选数据组合的步骤;确定所述至少两个可选数据组合出现的概率之和大于或等于所述第五阈值时,确定所述第一可选位为特征数据位。
31.根据权利要求27所述的服务器,其特征在于:
所述处理模块,具体用于根据所述至少两组数据的多个数据位上的数据,确定同一个数据位上的一个数据出现的概率大于第一阈值的数据位为第一特征数据位;确定所述第一特征数据位上出现的概率大于所述第一阈值的数据为第一特征数据;根据所述至少两组数据的多个数据位上的数据,确定符合第一条件的数据位为第二特征数据位;确定所述第二特征数据位上的数据为第二特征数据;确定所述第一特征数据位和所述第二特征数据位为特征数据位;确定所述第一特征数据和所述第二特征数据为特征数据。
32.根据权利要求31所述的服务器,其特征在于:
所述处理模块,具体用于根据所述至少两组数据的多个数据位上的数据,确定同一个数据位上的至少两个数据出现的概率之和大于第二阈值的数据位为第一可选位,同一个数据位上的至少两个数据中每个数据出现的概率大于第三阈值,所述第一可选位包括至少两个数据位;获取所述第一可选位上的数据得到多个可选数据组合;计算在所述多个可选数据组合中的每个可选数据组合出现的概率;在所述多个可选数据组合中选择出现的概率大于第四阈值的至少两个可选数据组合;判断所述至少两个可选数据组合出现的概率之和是否小于第五阈值;确定所述至少两个可选数据组合出现的概率之和小于所述第五阈值时,计算所述第一可选位中的每个数据位的信息熵,删除第一可选位中信息熵最大的数据位,并执行获取所述第一可选位上的数据得到多个可选数据组合的步骤;确定所述至少两个可选数据组合出现的概率之和大于或等于所述第五阈值时,确定所述第一可选位为第二特征数据位。
33.一种终端设备,其特征在于,包括处理器和存储器;
其中,所述处理器用于读取存储在所述存储器中的软件代码并执行如所述权利要求1-7任意一项所述的方法。
34.一种终端设备,其特征在于,包括处理器和存储器;
其中,所述处理器用于读取存储在所述存储器中的软件代码并执行如所述权利要求8-13任意一项所述的方法。
35.一种服务器,其特征在于,包括处理器和存储器;
其中,所述处理器用于读取存储在所述存储器中的软件代码并执行如所述权利要求14-22任意一项所述的方法。
CN201910701272.7A 2019-07-31 2019-07-31 一种数据处理方法及装置 Active CN110493144B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910701272.7A CN110493144B (zh) 2019-07-31 2019-07-31 一种数据处理方法及装置
PCT/CN2020/105870 WO2021018252A1 (zh) 2019-07-31 2020-07-30 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910701272.7A CN110493144B (zh) 2019-07-31 2019-07-31 一种数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN110493144A true CN110493144A (zh) 2019-11-22
CN110493144B CN110493144B (zh) 2023-03-10

Family

ID=68549047

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910701272.7A Active CN110493144B (zh) 2019-07-31 2019-07-31 一种数据处理方法及装置

Country Status (2)

Country Link
CN (1) CN110493144B (zh)
WO (1) WO2021018252A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021018252A1 (zh) * 2019-07-31 2021-02-04 华为技术有限公司 一种数据处理方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1889475A (zh) * 2006-07-31 2007-01-03 南京信风软件有限公司 一种实时监控p2p应用所消耗带宽的方法
CN101645803A (zh) * 2008-08-05 2010-02-10 中兴通讯股份有限公司 点对点业务的识别方法和互联网业务识别系统
CN102594819A (zh) * 2012-02-16 2012-07-18 深信服网络科技(深圳)有限公司 基于单次解析扫描的方法和装置
US20130100955A1 (en) * 2011-10-24 2013-04-25 Qualcomm Incorporated Technique for prioritizing traffic at a router
CN104320304A (zh) * 2014-11-04 2015-01-28 武汉虹信技术服务有限责任公司 一种易扩展的多方式融合的核心网用户流量应用识别方法
CN105471670A (zh) * 2014-09-11 2016-04-06 中兴通讯股份有限公司 流量数据分类方法及装置
CN105591973A (zh) * 2015-12-31 2016-05-18 杭州数梦工场科技有限公司 应用识别方法及装置
CN105721350A (zh) * 2016-03-04 2016-06-29 深圳市共进电子股份有限公司 一种智能分配带宽的方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103916294B (zh) * 2014-04-29 2018-05-04 华为技术有限公司 协议类型的识别方法和装置
CN105024862B (zh) * 2015-08-05 2018-04-13 福建师范大学 一种基于自主学习的网络业务识别方法
CN109639593B (zh) * 2018-12-24 2022-08-12 南京中孚信息技术有限公司 一种深度报文分析系统的升级方法及装置
CN110493144B (zh) * 2019-07-31 2023-03-10 华为技术有限公司 一种数据处理方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1889475A (zh) * 2006-07-31 2007-01-03 南京信风软件有限公司 一种实时监控p2p应用所消耗带宽的方法
CN101645803A (zh) * 2008-08-05 2010-02-10 中兴通讯股份有限公司 点对点业务的识别方法和互联网业务识别系统
US20130100955A1 (en) * 2011-10-24 2013-04-25 Qualcomm Incorporated Technique for prioritizing traffic at a router
CN102594819A (zh) * 2012-02-16 2012-07-18 深信服网络科技(深圳)有限公司 基于单次解析扫描的方法和装置
CN105471670A (zh) * 2014-09-11 2016-04-06 中兴通讯股份有限公司 流量数据分类方法及装置
CN104320304A (zh) * 2014-11-04 2015-01-28 武汉虹信技术服务有限责任公司 一种易扩展的多方式融合的核心网用户流量应用识别方法
CN105591973A (zh) * 2015-12-31 2016-05-18 杭州数梦工场科技有限公司 应用识别方法及装置
CN105721350A (zh) * 2016-03-04 2016-06-29 深圳市共进电子股份有限公司 一种智能分配带宽的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021018252A1 (zh) * 2019-07-31 2021-02-04 华为技术有限公司 一种数据处理方法及装置

Also Published As

Publication number Publication date
WO2021018252A1 (zh) 2021-02-04
CN110493144B (zh) 2023-03-10

Similar Documents

Publication Publication Date Title
US10038567B2 (en) Scalable IP-services enabled multicast forwarding with efficient resource utilization
CN101044770B (zh) 用于管理群组通信中的群组成员资格的方法和装置
CN101171809B (zh) 用于在数据交换网上传输组播流的方法和设备
CN101997916B (zh) 一种基于网络进行文件传输的方法和装置
US20030147390A1 (en) Protocol for multicast communication
CN101834783B (zh) 一种报文转发方法、装置及网络设备
US8774155B2 (en) Transporting call data via a packet data network
US6909717B1 (en) Real time ethernet protocol
KR20220116479A (ko) 멀티캐스트/브로드캐스트 서비스 데이터를 위한 시스템 및 방법
CN109302642A (zh) 数据采集方法和装置
CN105207860A (zh) 一种业务加速系统及方法
CN109890087B (zh) 一种处理数据包的方法与装置
KR100501080B1 (ko) 인터넷상 트래픽의 상위 계층 프로토콜들을 구분하는 방법및 장치
CN110493144A (zh) 一种数据处理方法及装置
CN101120546B (zh) 处理接入域上的广播消息的方法和节点
CN112566180B (zh) 一种提升tetra系统分组数据传输速率的方法
CN101043653A (zh) 基于透明模式实现无线网络控制器间mbms业务同步的方法
CN100508505C (zh) 用于对查询节点分类的方法和装置
CN103945333B (zh) 一种组呼业务数据的传输方法
CN101051864B (zh) 用于mbms业务的实现rlc序列号在rnc间同步的方法
CN101047492B (zh) 实现rlc序列号在无线网络控制器间同步的方法及系统
CN108882021B (zh) 一种视频播放方法和装置
CN105871566A (zh) 网络认证方法和设备
CN116582496B (zh) 令牌桶丢包优化方法及系统
CN105530615A (zh) 基于sctp协议的组呼业务数据分组识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant