CN103618792A - 数据流的识别方法及设备 - Google Patents

数据流的识别方法及设备 Download PDF

Info

Publication number
CN103618792A
CN103618792A CN201310629389.1A CN201310629389A CN103618792A CN 103618792 A CN103618792 A CN 103618792A CN 201310629389 A CN201310629389 A CN 201310629389A CN 103618792 A CN103618792 A CN 103618792A
Authority
CN
China
Prior art keywords
application
data flow
data
resource address
packet group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310629389.1A
Other languages
English (en)
Other versions
CN103618792B (zh
Inventor
唐华新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310629389.1A priority Critical patent/CN103618792B/zh
Publication of CN103618792A publication Critical patent/CN103618792A/zh
Priority to PCT/CN2014/074609 priority patent/WO2015078122A1/zh
Priority to CA2931525A priority patent/CA2931525C/en
Priority to US15/166,619 priority patent/US10250521B2/en
Application granted granted Critical
Publication of CN103618792B publication Critical patent/CN103618792B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/566Grouping or aggregating service requests, e.g. for unified processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/80Actions related to the user profile or the type of traffic
    • H04L47/803Application aware

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种数据流的识别方法及设备,该方法包括:接收第一应用的数据流和第二应用的数据流;提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址;当所述共有的资源地址中包含所述第一应用的服务器地址时,确定所述第一应用的数据流归属于所述第二应用;当所述共有的资源地址中包含所述第二应用的服务器地址时,确定所述第二应用的数据流归属于所述第一应用。本发明实施例可以更加准确的识别出数据流所属的应用,进而为流量统计、计费等业务提供更精准的数据,提升用户体验。

Description

数据流的识别方法及设备
技术领域
本发明涉及网络技术领域,更具体的说,涉及数据流的识别方法及设备。
背景技术
随着网络的普及和发展,终端内的应用与服务器之间的信息交互越来越频繁。为实现对应用产生的数据流的分析、统计或计费等功能,需要确定数据流所属的应用。
目前,通常根据数据流的协议类型对数据流所属的应用进行识别。具体的,接收一条数据流,根据该数据流的协议中包含的特征码来识别该数据流归属于哪个应用。在应用之间相互独立的情况下,这种识别方法能够准确的判断出数据流与应用之间的归属关系。
然而,在不同的应用之间,通常会存在相互的嵌套关系,即在第一应用的页面中嵌套有第二应用,例如:在Facebook网页上可以看Youtube网站上的视频短片,可以玩第三方游戏厂商在Facebook主页上提供的在线游戏,等等。这样,在第一应用的页面中启动第二应用时,第二应用产生的数据流是在第一应用的页面上产生的,所以该第二应用产生的数据流应归属于第一应用。但是,如果采用现有的数据流识别方式,该第二应用产生的数据流的协议中包含的识别码却指示该数据流属于第二应用,从而出现识别错误。
由此可见,在应用之间存在嵌套关系的情况下,使用现有识别方式存在识别错误率高的问题,从而无法准确的得出应用与数据流之间对应关系,进而不能给后续的分析、统计或计费等功能提供准确的基础数据。
发明内容
本发明实施例提供一种数据流的识别方法及设备,以更加准确的识别出数据流所属的应用,进而为流量统计、计费等业务提供更精准的数据,提升用户体验。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
第一方面,提供一种数据流的识别方法,包括:
接收第一应用的数据流和第二应用的数据流;
提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址;
当所述共有的资源地址中包含所述第一应用的服务器地址时,确定所述第一应用的数据流归属于所述第二应用;
当所述共有的资源地址中包含所述第二应用的服务器地址时,确定所述第二应用的数据流归属于所述第一应用。
结合上述第一方面,在第一种可能的实现方式中,在接收第一应用的数据流和第二应用的数据流之后,在提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址之前,还包括:
判断所述第一应用的数据流和/或所述第二应用的数据流是否完整;
如果所述第一应用的数据流和/或所述第二应用的数据流不完整,则对所述第一应用的数据流和/或所述第二应用的数据流通过分片和重组的方式还原成完整的数据流。
结合上述第一方面,在第二种可能的实现方式中,所述提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址,具体包括:
分别获取所述第一应用的数据流和所述第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
分别解析所述第一数据包组和所述第二数据包组得到第一数据集和第二数据集;
在所述第一数据集和所述第二数据集中提取共有的资源地址。
结合上述第一方面,在第三种可能的实现方式中,所述提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址,具体包括:
分别获取所述第一应用的数据流和所述第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
分别解析所述第一数据包组和所述第二数据包组得到第一压缩数据集和第二压缩数据集;
分别对所述第一压缩数据集和所述第二压缩数据集解压得到第一数据集和第二数据集;
在所述第一数据集和所述第二数据集中提取共有的资源地址。
第二方面,提供一种数据流的识别设备,包括:
接收模块,用于接收第一应用的数据流和第二应用的数据流;
提取模块,用于提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址;
第一确定模块,用于在所述共有的资源地址中包含所述第一应用的服务器地址时,确定所述第一应用的数据流归属于所述第二应用;
第二确定模块,用于在所述共有的资源地址中包含所述第二应用的服务器地址时,确定所述第二应用的数据流归属于所述第一应用。
结合上述第二方面,在第一种可能的实现方式中,还包括:
判断模块,用于判断所述第一应用的数据流和/或所述第二应用的数据流是否完整;
分片和重组模块,用于在所述第一应用的数据流和/或所述第二应用的数据流不完整时,对所述第一应用的数据流和/或所述第二应用的数据流通过分片和重组的方式还原成完整的数据流。
结合上述第二方面,在第二种可能的实现方式中,所述提取模块包括:
第一获取单元,用于分别获取所述第一应用的数据流和所述第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
第一解析单元,用于分别解析所述第一数据包组和所述第二数据包组得到第一数据集和第二数据集;
第一提取单元,用于在所述第一数据集和所述第二数据集中提取共有的资源地址。
结合上述第二方面,在第三种可能的实现方式中,所述提取模块包括:
第二获取单元,用于分别获取所述第一应用的数据流和所述第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
第二解析单元,用于分别解析所述第一数据包组和所述第二数据包组得到第一压缩数据集和第二压缩数据集;
解压单元,用于分别对所述第一压缩数据集和所述第二压缩数据集解压得到第一数据集和第二数据集;
第二提取单元,用于在所述第一数据集和所述第二数据集中提取共有的资源地址。
第三方面,提供一种数据流的识别设备,包括:处理器和存储器,其中,存储器内存储有处理器能够执行的操作指令,处理器读取存储器内的操作指令用于实现以下方法:
接收第一应用的数据流和第二应用的数据流;
提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址;
当所述共有的资源地址中包含所述第一应用的服务器地址时,确定所述第一应用的数据流归属于所述第二应用;
当所述共有的资源地址中包含所述第二应用的服务器地址时,确定所述第二应用的数据流归属于所述第一应用。
上述技术方案中的一个技术方案具有如下优点或有益效果:
在上述技术方案中,在第一应用嵌套于第二应用中时,需要通过第二应用获取第二应用的服务器中存储的第一应用的资源地址,在此过程中会产生含有资源地址的第二应用的数据流;在第一应用利用资源地址在第一应用的服务器上获取资源时,会产生含有资源地址的第一应用的数据流,由于资源地址是在第一应用的服务器上获取资源的途径,所以资源地址中会包含第一应用的服务器地址。由上述内容可知,当共有的资源地址包含第一应用的服务器地址时,说明第一应用嵌套于第二应用中,第一应用的数据流归属于第二应用。同理,当共有的资源地址包含第二应用的服务器地址时,说明第二应用嵌套于第一应用中,第二应用的数据流归属于第一应用。因此,本发明实施例可以更加准确的识别出数据流所属的应用,进而为流量统计、计费等业务提供更精准的数据,提升用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据流的识别方法的流程图;
图2为本发明实施例提供的另一种数据流的识别方法的流程图;
图3为本发明实施例提供的一种数据流的识别设备的模块图;
图4为本发明实施例提供的一种提取模块的模块图;
图5为本发明实施例提供的另一种提取模块的模块图;
图6为本发明实施例提供的另一种数据流的识别设备的模块图;
图7为本发明实施例提供的又一种数据流的识别设备的模块图;
图8为本发明实施例提供的一种终端与服务器信息交互的模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参见图1所示,图1所示的为本发明实施例提供的一种数据流的识别方法,本发明实施例提供的方法能够准确的识别出应用与数据流之间的归属关系,该方法包括:
步骤S101、接收第一应用的数据流和第二应用的数据流;
其中,第一应用的数据流为终端访问第一应用的服务器所产生的数据流,第二应用的数据流为终端访问第二应用的服务器所产生的数据流。第一应用和第二应用分别为运行在终端中的应用程序。当第一应用和第二应用不存在嵌套关系时,那么第一应用和第二应用分别为独立运行的应用程序,例如,第一应用为显示facebook网站的网页,第二应用可以为显示youtube网站的网页。当第二应用嵌套在第一应用中时,那么第一应用为独立运行的应用程序,第二应用为嵌套在第一应用中的应用程序,例如,第一应用为显示facebook网站的网页,第二应用为嵌套在facebook网站的网页中显示youtube服务器资源的视频窗口。当第一应用嵌套在第二应用中时,那么第二应用为独立运行的应用程序,第一应用为嵌套在第二应用中的应用程序,例如,第二应用为显示facebook网站的网页,第一应用为嵌套在facebook网站的网页中显示youtube服务器资源的视频窗口。当然,第一应用和第二应用不仅可以为网站的网页,还有可能为软件等其他类型的应用程序。
步骤S102、提取第一应用的数据流和第二应用的数据流中共有的资源地址;
其中,在第一应用和第二应用存在嵌套关系的情况下,在启动第一应用和第二应用时,第一应用的数据流和第二应用的数据流中就会产生共有的资源地址。
假设第二应用嵌套在第一应用中,且用户启动了第二应用,由于第二应用为嵌套在第一应用中的应用程序,所以第二应用无法得知如何在第二应用的服务器的什么位置获取资源,在用户调用第二应用的资源时,需要第一应用获取第一应用的服务器上预存的第二应用的资源地址,在此过程中会产生含有资源地址的第一应用的数据流;此时,第二应用利用该资源地址在第二应用的服务器上获取资源,于是会产生含有资源地址的第二应用的数据流,所以第一应用的数据流和第二应用的数据流中会产生共有的资源地址。由于资源地址是在第二应用的服务器上获取资源的途径,所以资源地址中会包含第二应用的服务器地址。
当然,在第一应用嵌套于第二应用的情况下,在启动第一应用后,第一应用的数据流和第二应用的数据流中同样会产生共有的资源地址,只不过这个资源地址包含第一应用的服务器。
另外,资源地址可以为URL(Uniform Resource Locator,统一资源定位符,也被称为网页地址)、URI(Uniform Resource Identifier,通用资源标识符)、IP地址(InternetProtocol,网络之间互连的协议)或HOST地址(即服务器地址)等。
在步骤S102中,提取第一应用的数据流和第二应用的数据流中共有的资源地址,具体可以包括以下三个子步骤,这三个子步骤具体为:
11)、分别获取第一应用的数据流和第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
具体的,第一数据包组和第二数据包组均包括至少一个数据包。关联关键字和关联信息均存储于应用的数据流的数据包中。
12)、分别解析第一数据包组和第二数据包组得到第一数据集和第二数据集;
具体的,第一数据集和第二数据集分别为第一应用的数据流和第二应用的数据流中包含的数据的集合。
13)、在第一数据集和第二数据集中提取共有的资源地址。
在步骤S102中,如果应用的数据流的数据量过大,那么会对数据流中的数据进行压缩,从而起到节约空间的目的。针对数据流的数据量过大的情况,步骤S102包括以下四个子步骤,这四个子步骤具体为:
21)、分别获取第一应用的数据流和第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
22)、分别解析第一数据包组和第二数据包组得到第一压缩数据集和第二压缩数据集;
具体的,第一压缩数据集和第二压缩数据集均为压缩后的数据构成的集合。
23)、分别对第一压缩数据集和第二压缩数据集解压得到第一数据集和第二数据集;
具体的,第一数据集和第二数据集分别为第一应用的数据流和第二应用的数据流中包含的数据的集合。
24)、在第一数据集和第二数据集中提取共有的资源地址。
步骤S103、当共有的资源地址中包含第一应用的服务器地址时,确定第一应用的数据流归属于第二应用;
其中,当第一应用的数据流和第二应用的数据流中共有的资源地址中包含第一应用的服务器地址时,说明第一应用嵌套于第二应用中,第一应用的数据流归属于第二应用。
步骤S104、当共有的资源地址中包含第二应用的服务器地址时,确定第二应用的数据流归属于第一应用。
其中,当第一应用的数据流和第二应用的数据流中共有的资源地址中包含第二应用的服务器地址时,说明第二应用嵌套于第一应用中,第二应用的数据流归属于第一应用。
在图1所示的实施例中,在第一应用嵌套于第二应用中时,需要通过第二应用获取第二应用的服务器中存储的第一应用的资源地址,在此过程中会产生含有资源地址的第二应用的数据流;在第一应用利用资源地址在第一应用的服务器上获取资源时,会产生含有资源地址的第一应用的数据流,由于资源地址是在第一应用的服务器上获取资源的途径,所以资源地址中会包含第一应用的服务器地址。由上述内容可知,当共有的资源地址包含第一应用的服务器地址时,说明第一应用嵌套于第二应用中,第一应用的数据流归属于第二应用。同理,当共有的资源地址包含第二应用的服务器地址时,说明第二应用嵌套于第一应用中,第二应用的数据流归属于第一应用。因此,本发明实施例可以更加准确的识别出数据流所属的应用,进而为流量统计、计费等业务提供更精准的数据,提升用户体验。
实施例二
请参见图2所示,图2所示的为本发明实施例提供的一种数据流的识别方法,本发明实施例提供的方法能够在第一应用的数据流和/或第二应用的数据流丢包的情况下,通过分片和重组的方式使应用的数据流还原成完整的数据流,以保证应用的数据流中包含的关联信息是完整的,该方法包括:
步骤S201、接收第一应用的数据流和第二应用的数据流;
步骤S202、判断第一应用的数据流和/或第二应用的数据流是否完整,若是,则进入步骤S204;否则,进入步骤S203;
其中,第一应用的数据流和第二应用的数据流具体可以为基于某种协议的请求或响应数据包,例如,基于HTTP协议的请求或响应数据包。在接收到第一应用的数据流和第二应用的数据流之后,两个应用的数据流可能存在不完整或乱序的情况,所以需要判断这两个应用的数据流是否完整,由于判断数据流是否完整为本领域技术人员公知的技术,所以在此不再赘述。
步骤S203、对第一应用的数据流和/或第二应用的数据流通过分片和重组的方式还原成完整的数据流;
其中,如果第一应用的数据流和/或第二应用的数据流不完整时,那么要通过分片和重组的方式使其还原成完整的数据流。例如,当第一应用的数据流和第二应用的数据流均为基于HTTP协议的请求数据包时,那么第一应用的请求数据包或第二应用的请求数据包在传输过程中有可能会丢包,从而导致第一应用的请求数据包或第二应用的请求数据包不完整,而且包含在第一应用的请求数据包或第二应用的请求数据包中的资源地址也有丢失的可能,所以在判断出第一应用的请求数据包或第二应用的请求数据包不完整时,通过分片和重组的方式使其还原成完整的请求数据包。
步骤S204、提取第一应用的数据流和第二应用的数据流中共有的资源地址;
步骤S205、当共有的资源地址中包含第一应用的服务器地址时,确定第一应用的数据流归属于第二应用;
步骤S206、当共有的资源地址中包含第二应用的服务器地址时,确定第二应用的数据流归属于第一应用。
在图2所示的实施例中,图2所示的实施例是在图1所示的实施例的基础上增加判断应用产生的数据流是否完整的步骤,以及增加在数据流不完整的情况下,对数据流还原成完整数据流的步骤。通过图2所示的实施例,可以判断出应用的数据流是否完整,如果不完整,那么说明应用的数据流在传输过程中,存在丢包的情况,在这种情况下,通过分片和重组的方式使应用的数据流还原成完整的数据流,以保证应用的数据流中包含的关联信息是完整的。
实施例三
请参见图3所示,图3所示的为本发明实施例提供的一种数据流的识别设备,该数据流的识别设备具体可以为DPI(Deep Packet Inspection,深度报文识别)设备。该DPI设备可以获取应用与应用服务器之间交互的数据流,通过提取第一应用的数据流和第二应用的数据流中共有的资源地址,把不同应用产生的数据流关联起来,解决无法把某一应用产生的所有流量与该应用关联起来的问题,从而实现精确识别数据流与应用的所属关系。DPI设备在识别出数据流与应用的归属关系后,将该归属关系发送给计费系统,从而保证计费系统可以按照应用产生的数据流进行计费,从而满足不同用户上网的需求。本发明实施例提供的数据流的识别设备能够准确的识别出应用与数据流之间的归属关系,该设备包括:
接收模块11,用于接收第一应用的数据流和第二应用的数据流;
提取模块12,用于提取第一应用的数据流和第二应用的数据流中共有的资源地址;
第一确定模块13,用于在共有的资源地址中包含第一应用的服务器地址时,确定第一应用的数据流归属于第二应用;
第二确定模块14,用于在共有的资源地址中包含第二应用的服务器地址时,确定第二应用的数据流归属于第一应用。
请参见图4所示,图4所示的为提取模块12的一种组成方式,提取模块12包括:
第一获取单元121,用于分别获取第一应用的数据流和第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
第一解析单元122,用于分别解析第一数据包组和第二数据包组得到第一数据集和第二数据集;
第一提取单元123,用于在第一数据集和第二数据集中提取共有的资源地址。
请参见图5所示,图5所示的为提取模块12的另一种组成方式,提取模块12包括:
第二获取单元124,用于分别获取第一应用的数据流和第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
第二解析单元125,用于分别解析第一数据包组和第二数据包组得到第一压缩数据集和第二压缩数据集;
解压单元126,用于分别对第一压缩数据集和第二压缩数据集解压得到第一数据集和第二数据集;
第二提取单元127,用于在第一数据集和第二数据集中提取共有的资源地址。
在图3至5所示的实施例中,本实施例提供的数据流的识别设备的功能与实施例一实现的功能相对应,所以关于本实施例的具体说明及其他功能可参见实施例一中的内容,在此不再一一赘述。
实施例四
请参见图6所示,图6所示的为本发明实施例提供的另一种数据流的识别设备,本发明实施例提供的装置能够在第一应用的数据流和/或第二应用的数据流丢包的情况下,通过分片和重组的方式使应用的数据流还原成完整的数据流,以保证应用的数据流中包含的关联信息是完整的,该设备包括:
接收模块21,用于接收第一应用的数据流和第二应用的数据流;
判断模块22,用于判断第一应用的数据流和/或第二应用的数据流是否完整;
分片和重组模块23,用于在第一应用的数据流和/或第二应用的数据流不完整时,对第一应用的数据流和/或第二应用的数据流通过分片和重组的方式还原成完整的数据流。
提取模块24,用于提取第一应用的数据流和第二应用的数据流中共有的资源地址;
第一确定模块25,用于在共有的资源地址中包含第一应用的服务器地址时,确定第一应用的数据流归属于第二应用;
第二确定模块26,用于在共有的资源地址中包含第二应用的服务器地址时,确定第二应用的数据流归属于第一应用。
在图6所示的实施例中,本实施例提供的数据流的识别设备的功能与实施例二实现的功能相对应,所以关于本实施例的具体说明及其他功能可参见实施例二中的内容,在此不再一一赘述。
实施例五
请参见图7所示,图7所示的为本发明实施例提供的又一种数据流的识别设备,本发明实施例提供的装置能够准确的识别出应用与数据流之间的归属关系,该设备包括处理器31和存储器32,其中,存储器32内存储有处理器31能够执行的操作指令,处理器31读取存储器32内的操作指令用于实现以下功能:接收第一应用的数据流和第二应用的数据流;提取第一应用的数据流和第二应用的数据流中共有的资源地址;当共有的资源地址中包含第一应用的服务器地址时,确定第一应用的数据流归属于第二应用;当共有的资源地址中包含第二应用的服务器地址时,确定第二应用的数据流归属于第一应用。
应用例一
请参见图8所示,图8所示的为本发明实施例提供的一种终端与服务器信息交互的模块示意图。假设终端1内已经打开facebook网站页面11,在facebook网站页面11内嵌套有youtube视频窗口12,youtube视频窗口12播放的内容为youtube服务器3上的视频资源。
在图8所示的应用例中,facebook服务器2和youtube服务器3已经预先建立联系,youtube服务器3会将视频对应的视频名称、视频ID和播放地址URL等信息自动发送给facebook服务器2。在终端1接收到播放youtube视频窗口12内视频资源的指令后,终端1分别与facebook服务器2和youtube服务器3进行了信息交互,这些信息交互的过程请参见以下步骤:
步骤①、终端1向facebook服务器2发送获取youtube视频窗口12中的视频ID对应的URL的指令;
步骤②、facebook服务器2将与该视频ID对应的URL发送给终端1,其中,假设URL为http://www.youtube.com/A/B;
步骤③、终端1向youtube服务器3发送获取URL=http://www.youtube.com/A/B对应的视频资源的指令;
步骤④、youtube服务器3向终端1发送URL=http://www.youtube.com/A/B对应的视频资源,终端1将该视频资源在youtube视频窗口12中显示出来。
在通过传统的DPI技术识别以后可以了解到,在步骤①和步骤②中,终端1与facebook服务器2在交互过程中产生的数据流归属于facebook网站页面11;在步骤③和步骤④中,终端1与youtube服务器3在交互过程中产生的数据流归属于youtube视频窗口12。
由于youtube视频窗口12嵌套在facebook网站页面11中,所以youtube视频窗口12对应的数据流应当归属于facebook网站页面11。关于数据流与应用之间归属关系的判断请参见以下步骤:
步骤①、接收facebook网站页面11的数据流和youtube视频窗口12的数据流;
步骤②、提取facebook网站页面11产生的数据流和youtube视频窗口12产生的数据流中共有的资源地址URL=http://www.youtube.com/A/B;
其中,由于资源地址URL=http://www.youtube.com/A/B中包含youtube视频窗口12对应的服务器地址www.youtube.com,所以youtube视频窗口12产生的数据流归属于facebook网站页面11。
需要说明的是,图1至图8所示的实施例只是本发明所介绍的优选实施例,本领域技术人员在此基础上,完全可以设计出更多的实施例,因此不在此处赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种数据流的识别方法,其特征在于,包括:
接收第一应用的数据流和第二应用的数据流;
提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址;
当所述共有的资源地址中包含所述第一应用的服务器地址时,确定所述第一应用的数据流归属于所述第二应用;
当所述共有的资源地址中包含所述第二应用的服务器地址时,确定所述第二应用的数据流归属于所述第一应用。
2.根据权利要求1所述的方法,其特征在于,在接收第一应用的数据流和第二应用的数据流之后,在提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址之前,还包括:
判断所述第一应用的数据流和/或所述第二应用的数据流是否完整;
如果所述第一应用的数据流和/或所述第二应用的数据流不完整,则对所述第一应用的数据流和/或所述第二应用的数据流通过分片和重组的方式还原成完整的数据流。
3.根据权利要求1所述的方法,其特征在于,所述提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址,具体包括:
分别获取所述第一应用的数据流和所述第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
分别解析所述第一数据包组和所述第二数据包组得到第一数据集和第二数据集;
在所述第一数据集和所述第二数据集中提取共有的资源地址。
4.根据权利要求1所述的方法,其特征在于,所述提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址,具体包括:
分别获取所述第一应用的数据流和所述第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
分别解析所述第一数据包组和所述第二数据包组得到第一压缩数据集和第二压缩数据集;
分别对所述第一压缩数据集和所述第二压缩数据集解压得到第一数据集和第二数据集;
在所述第一数据集和所述第二数据集中提取共有的资源地址。
5.一种数据流的识别设备,其特征在于,包括:
接收模块,用于接收第一应用的数据流和第二应用的数据流;
提取模块,用于提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址;
第一确定模块,用于在所述共有的资源地址中包含所述第一应用的服务器地址时,确定所述第一应用的数据流归属于所述第二应用;
第二确定模块,用于在所述共有的资源地址中包含所述第二应用的服务器地址时,确定所述第二应用的数据流归属于所述第一应用。
6.根据权利要求5所述的数据流的识别设备,其特征在于,还包括:
判断模块,用于判断所述第一应用的数据流和/或所述第二应用的数据流是否完整;
分片和重组模块,用于在所述第一应用的数据流和/或所述第二应用的数据流不完整时,对所述第一应用的数据流和/或所述第二应用的数据流通过分片和重组的方式还原成完整的数据流。
7.根据权利要求5所述的数据流的识别设备,其特征在于,所述提取模块包括:
第一获取单元,用于分别获取所述第一应用的数据流和所述第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
第一解析单元,用于分别解析所述第一数据包组和所述第二数据包组得到第一数据集和第二数据集;
第一提取单元,用于在所述第一数据集和所述第二数据集中提取共有的资源地址。
8.根据权利要求5所述的数据流的识别设备,其特征在于,所述提取模块包括:
第二获取单元,用于分别获取所述第一应用的数据流和所述第二应用的数据流中所有的数据包得到第一数据包组和第二数据包组;
第二解析单元,用于分别解析所述第一数据包组和所述第二数据包组得到第一压缩数据集和第二压缩数据集;
解压单元,用于分别对所述第一压缩数据集和所述第二压缩数据集解压得到第一数据集和第二数据集;
第二提取单元,用于在所述第一数据集和所述第二数据集中提取共有的资源地址。
9.一种数据流的识别设备,其特征在于,包括:处理器和存储器,其中,存储器内存储有处理器能够执行的操作指令,处理器读取存储器内的操作指令用于实现以下方法:
接收第一应用的数据流和第二应用的数据流;
提取所述第一应用的数据流和所述第二应用的数据流中共有的资源地址;
当所述共有的资源地址中包含所述第一应用的服务器地址时,确定所述第一应用的数据流归属于所述第二应用;
当所述共有的资源地址中包含所述第二应用的服务器地址时,确定所述第二应用的数据流归属于所述第一应用。
CN201310629389.1A 2013-11-29 2013-11-29 数据流的识别方法及设备 Active CN103618792B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201310629389.1A CN103618792B (zh) 2013-11-29 2013-11-29 数据流的识别方法及设备
PCT/CN2014/074609 WO2015078122A1 (zh) 2013-11-29 2014-04-02 数据流的识别方法及设备
CA2931525A CA2931525C (en) 2013-11-29 2014-04-02 Data stream identifying method and device
US15/166,619 US10250521B2 (en) 2013-11-29 2016-05-27 Data stream identifying method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310629389.1A CN103618792B (zh) 2013-11-29 2013-11-29 数据流的识别方法及设备

Publications (2)

Publication Number Publication Date
CN103618792A true CN103618792A (zh) 2014-03-05
CN103618792B CN103618792B (zh) 2017-04-19

Family

ID=50169496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310629389.1A Active CN103618792B (zh) 2013-11-29 2013-11-29 数据流的识别方法及设备

Country Status (4)

Country Link
US (1) US10250521B2 (zh)
CN (1) CN103618792B (zh)
CA (1) CA2931525C (zh)
WO (1) WO2015078122A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015078122A1 (zh) * 2013-11-29 2015-06-04 华为技术有限公司 数据流的识别方法及设备
CN105790960A (zh) * 2014-12-24 2016-07-20 中国电信股份有限公司 流量识别方法和系统、流量网关
CN107787003A (zh) * 2016-08-24 2018-03-09 中兴通讯股份有限公司 一种流量检测的方法和装置
CN109150764A (zh) * 2017-06-16 2019-01-04 中兴通讯股份有限公司 流量管理方法、装置、设备及存储介质
CN109936512A (zh) * 2017-12-15 2019-06-25 华为技术有限公司 流量分析方法、公共服务流量归属方法及相应的计算机系统
CN113422699A (zh) * 2021-06-22 2021-09-21 中国电信股份有限公司 数据流处理方法、装置、计算机可读存储介质及电子设备

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115225718A (zh) * 2022-07-26 2022-10-21 深圳证券通信有限公司 安卓系统的网络请求数据获取方法及相关装置
CN117131236B (zh) * 2023-10-28 2024-02-02 深圳海云安网络安全技术有限公司 一种敏感数据的检测方法及系统

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130024778A1 (en) 2011-07-13 2013-01-24 Z124 Dynamic cross-environment application configuration/orientation
US8331234B1 (en) * 2004-09-08 2012-12-11 Q1 Labs Inc. Network data flow collection and processing
US20070130120A1 (en) * 2005-12-01 2007-06-07 Yen-Fu Chen System and method of selectively searching textual content
US8055993B2 (en) * 2006-11-09 2011-11-08 International Business Machines Corporation Selecting and displaying descendant pages
CN100553206C (zh) * 2007-12-14 2009-10-21 北京交通大学 基于报文采样和应用签名的互联网应用流量识别方法
EP2258084B1 (en) * 2008-03-10 2012-06-06 Telefonaktiebolaget L M Ericsson (PUBL) Technique for classifying network traffic and for validating a mechanism for calassifying network traffic
CN101252541B (zh) * 2008-04-09 2011-05-04 中国科学院计算技术研究所 一种网络流量分类模型的建立方法及相应系统
US20100153539A1 (en) * 2008-12-15 2010-06-17 Gregory Thomas Zarroli Algorithm for classification of browser links
CN101582897A (zh) * 2009-06-02 2009-11-18 中兴通讯股份有限公司 一种深度报文检测方法和装置
US8891939B2 (en) * 2009-12-22 2014-11-18 Citrix Systems, Inc. Systems and methods for video-aware screen capture and compression
US8493905B2 (en) * 2010-09-08 2013-07-23 Intel Corporation Wireless clone mode display
IL214360A (en) * 2011-07-31 2016-05-31 Verint Systems Ltd System and method for identifying main pages in decoding network traffic
US9445138B2 (en) * 2012-04-12 2016-09-13 Qualcomm Incorporated Broadcast content via over the top delivery
CN103200231B (zh) * 2013-03-04 2016-07-20 华为技术有限公司 策略控制方法及系统
WO2015000141A1 (zh) * 2013-07-02 2015-01-08 华为技术有限公司 一种支持流媒体进行组播的方法和相关装置及系统
US9609629B2 (en) * 2013-07-25 2017-03-28 Imvision Software Technologies Ltd. Method and apparatus for efficient transmission of unmanaged over-the-top streams over cellular communication networks
CN103618792B (zh) * 2013-11-29 2017-04-19 华为技术有限公司 数据流的识别方法及设备

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015078122A1 (zh) * 2013-11-29 2015-06-04 华为技术有限公司 数据流的识别方法及设备
US10250521B2 (en) 2013-11-29 2019-04-02 Huawei Technologies Co., Ltd. Data stream identifying method and device
CN105790960A (zh) * 2014-12-24 2016-07-20 中国电信股份有限公司 流量识别方法和系统、流量网关
CN105790960B (zh) * 2014-12-24 2019-07-19 中国电信股份有限公司 流量识别方法和系统、流量网关
CN107787003A (zh) * 2016-08-24 2018-03-09 中兴通讯股份有限公司 一种流量检测的方法和装置
CN109150764A (zh) * 2017-06-16 2019-01-04 中兴通讯股份有限公司 流量管理方法、装置、设备及存储介质
CN109150764B (zh) * 2017-06-16 2023-07-18 中兴通讯股份有限公司 流量管理方法、装置、设备及存储介质
CN109936512A (zh) * 2017-12-15 2019-06-25 华为技术有限公司 流量分析方法、公共服务流量归属方法及相应的计算机系统
CN109936512B (zh) * 2017-12-15 2021-10-01 华为技术有限公司 流量分析方法、公共服务流量归属方法及相应的计算机系统
US11425047B2 (en) 2017-12-15 2022-08-23 Huawei Technologies Co., Ltd. Traffic analysis method, common service traffic attribution method, and corresponding computer system
CN113422699A (zh) * 2021-06-22 2021-09-21 中国电信股份有限公司 数据流处理方法、装置、计算机可读存储介质及电子设备

Also Published As

Publication number Publication date
US20160277306A1 (en) 2016-09-22
US10250521B2 (en) 2019-04-02
CA2931525A1 (en) 2015-06-04
CA2931525C (en) 2020-07-21
WO2015078122A1 (zh) 2015-06-04
CN103618792B (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
CN103618792A (zh) 数据流的识别方法及设备
CN101873259B (zh) Sctp报文识别方法和装置
CN103365964B (zh) 一种信息推荐方法及相关设备、系统
CN104767775A (zh) 网页应用消息推送方法及系统
US20150106914A1 (en) Remote control system, and method thereof
CN103747112A (zh) 一种cdn回源的方法、第一服务器及系统
CN103297270A (zh) 应用类型识别方法及网络设备
CN103327021B (zh) 一种多设备互动方法及相关设备、系统
CN103547342A (zh) 消息发送方法、消息阅读通知方法、消息接收方法及装置
CN103729411A (zh) 一种多媒体文件的传输方法、服务器及电子设备
CN103401836A (zh) 一种用于判断网页是否被isp劫持的方法与设备
CN103944994A (zh) 分布式资源获取方法及装置
CN103139259A (zh) 一种实现低流量同步消息记录的方法和服务器
CN103139015A (zh) 网络共享检测方法、装置及设备
CN104702564A (zh) 一种网络共享用户识别方法及装置
CN103974232A (zh) WiFi用户终端识别方法及系统
CN104796491A (zh) 一种服务器和基于一次扫码的软件下载及注册方法
CN106203229A (zh) 不同权限的终端设备识读二维码以显示不同信息的方法
CN104639348A (zh) 网络设备及其配置方法
CN104618418A (zh) 播放多媒体文件的方法及装置
CN105099769A (zh) 业务平台的异常操作处理方法、设备和系统
CN104518968A (zh) 一种报文处理的方法和透明代理服务器
CN105049546B (zh) 一种dhcp服务器为客户端分配ip地址的方法及装置
CN103347031A (zh) 一种防范arp报文攻击的方法及设备
CN105141653A (zh) 业务平台的数据交互方法、设备和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant