CN112565106A - 流量业务识别方法、装置、设备及计算机存储介质 - Google Patents

流量业务识别方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN112565106A
CN112565106A CN201910918590.9A CN201910918590A CN112565106A CN 112565106 A CN112565106 A CN 112565106A CN 201910918590 A CN201910918590 A CN 201910918590A CN 112565106 A CN112565106 A CN 112565106A
Authority
CN
China
Prior art keywords
domain name
preset
uri
name
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910918590.9A
Other languages
English (en)
Other versions
CN112565106B (zh
Inventor
唐蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Hebei Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Hebei Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Hebei Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910918590.9A priority Critical patent/CN112565106B/zh
Publication of CN112565106A publication Critical patent/CN112565106A/zh
Application granted granted Critical
Publication of CN112565106B publication Critical patent/CN112565106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2483Traffic characterised by specific attributes, e.g. priority or QoS involving identification of individual flows
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/30Types of network names
    • H04L2101/38Telephone uniform resource identifier [URI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例涉及互联网技术领域,公开了一种流量业务识别方法、装置、设备及计算机存储介质,其中方法包括:获取XDR话单,所述XDR话单包括DPI大小类业务标识、域名和URI地址;根据所述DPI大小类业务标识、域名和URI地址中的至少一种,识别所述XDR话单的ICP名称。通过上述方式,本发明实施例更加准确地识别出流量业务的ICP名称。

Description

流量业务识别方法、装置、设备及计算机存储介质
技术领域
本发明实施例涉及互联网技术领域,具体涉及一种流量业务识别方法、装置、设备及计算机存储介质。
背景技术
随着互联网业务的蓬勃发展,不断改善用户的互联网体验是各运营商的工作目标,为了更好的了解用户的感知,各运营商对获取的用户流量开展了各种深度分析,并细化到对流量业务的大小类型进行专项分析。
在实现本发明实施例的过程中,发明人发现:目前的流量业务识别方法主要有基于DPI(Deep Packet Inspection,深度报文检测)的大小类业务识别和域名与ICP(Internet Content Provider,网络内容服务商)的对应资源库匹配两种技术。然而,基于DPI的大小类业务识别会受到非对称路由和重定向的影响,使得DPI往往只能识别出是网页视频、HTTP网页浏览、HTTP续传下载等大类业务,而不能具体识别出是某个ICP视频、某个ICP浏览或者某个ICP下载。对于域名与ICP的对应资源库匹配方法,目前现网数据越来越多的域名是以IP形式存在的,而建立该资源表要花费大量人力物力,维护成本也较大。
发明内容
鉴于上述问题,本发明实施例提供了一种流量业务识别方法、装置、设备及计算机存储介质,克服了上述问题或者至少部分地解决了上述问题。
根据本发明实施例的一个方面,提供了一种流量业务识别方法,所述方法包括:获取XDR话单,所述XDR话单包括DPI大小类业务标识、域名和URI(Uniform ResourceIdentifier,统一资源标识符)地址;根据所述DPI大小类业务标识、域名和URI地址中的至少一种,识别所述XDR话单的ICP名称。
在一种可选的方式中,根据所述DPI大小类业务标识、域名和URI地址中的至少一种,识别所述XDR话单的ICP名称,具体为:将所述DPI大小类业务标识与预设业务库进行匹配;当所述DPI大小类业务标识与预设业务库的匹配失败时,将所述域名与预设域名资源库进行匹配;当所述域名与预设域名资源库的匹配失败时,将所述URI地址与预设URI资源库进行匹配,识别所述XDR话单的ICP名称。
在一种可选的方式中,所述当所述DPI大小类业务标识与预设业务库的匹配失败时,将所述域名与预设域名资源库进行匹配之后,所述方法还包括:当所述域名与预设域名资源库的匹配成功时,输出所述域名在所述预设域名资源库内对应的ICP名称;将所述域名在所述预设域名资源库内对应的ICP名称与新建DPI大小类业务标识的对应关系加入所述预设业务库。
在一种可选的方式中,所述当所述域名与预设域名资源库的匹配失败时,将所述URI地址与预设URI资源库进行匹配,识别所述XDR话单的ICP名称之后,所述方法还包括:当所述URI地址与预设URI资源库的匹配成功时,输出所述URI地址在所述预设URI资源库内对应的ICP名称;将所述URI地址在所述预设URI资源库内对应的ICP名称与新建DPI大小类业务标识的对应关系加入所述预设业务库。
在一种可选的方式中,所述当所述URI地址与预设URI资源库的匹配成功时,输出所述URI地址在所述预设URI资源库内对应的ICP名称之后,所述方法还包括:当所述域名非IP形式时,将所述域名与所述URI地址在所述预设URI资源库内对应的ICP名称的对应关系加入所述预设域名资源库。
在一种可选的方式中,所述获取XDR话单,具体为:获取DPI探针采集到的报文;将所述报文转化为所述XDR话单。
在一种可选的方式中,所述获取XDR话单之前,所述方法还包括:访问网站资源;导出所述网站资源的URI信息;根据所述网站资源的URI信息,建立所述预设URI资源库。
根据本发明实施例的另一方面,提供了一种话务热点聚类装置,包括:获取模块,用于获取XDR话单,所述XDR话单包括DPI大小类业务标识、域名和URI地址;识别模块,用于根据所述DPI大小类业务标识、域名和URI地址中的至少一种,识别所述XDR话单的ICP名称。
根据本发明实施例的另一方面,提供了一种流量业务识别设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述一种流量业务识别方法对应的操作。
根据本发明实施例的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行上述一种流量业务识别方法对应的操作。
本发明实施例通过解析获取的XDR话单中的DPI大小类业务标识、域名和URI地址,并将其分别与预设业务库、预设域名资源库和预设URI资源库进行匹配,从而识别出该XDR话单的ICP名称。和现有技术中仅通过DPI的大小类业务识别或仅通过将域名与ICP的对应资源库匹配来识别相比,本发明实施例会先将XDR话单中的DPI大小类业务标识与预设业务库匹配,匹配失败时,再将XDR话单中的域名与预设域名资源库进行匹配,若匹配仍不成功,则最后将XDR话单中的URI地址与预设URI资源库进行匹配,从而能够确保识别XDR话单的ICP名称。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种流量业务识别方法的流程图;
图2示出了通过DPI探针采集到的百度网盘业务的报文;
图3示出了本发明实施例中识别ICP名称的子步骤流程图;
图4示出了本发明实施例提供的一种流量业务识别装置的结构示意图;
图5示出了本发明实施例提供的流量业务识别设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
随着互联网业务的蓬勃发展,为了更好的了解用户的感知,各运营商对获取的用户流量开展了各种深度分析。目前运营商流量业务模型测算技术主要有基于DPI的大小类业务识别和域名与ICP的对应资源库匹配两种技术。DPI技术是一种基于应用层的流量检测和控制技术,称为“深度包检测”。所谓“深度”是和普通的报文分析层次相比较而言的,普通报文检测仅分析IP包的4层以下的内容,包括源地址、目的地址、源端口、目的端口以及协议类型。而DPI除了对前面的层次分析外,还增加了对应用数据包的检测,其将数据包应用层的指纹信息作为匹配特征。通过DPI硬件对该指纹信息进行准实时读取并识别,可在短时间内对流量打上业务标签,可保证用户流量业务模型测算的时效性。现在现网DPI的覆盖率已达50%,已然成为各大运营商进行流量业务模型测算的一个重要手段。然而该方式受到非对称路由和重定向的影响,使得DPI往往只能识别出是网页视频、HTTP网页浏览、HTTP续传下载等大类业务,而不能具体识别出是某个ICP视频、某个ICP浏览或者某个ICP下载。其中,非对称路由是指用户请求报文与服务器响应报文不是由同一条链路传输。重定向是指服务器之间的跳转,如DNS解析用户请求到服务器A,但请求实际内容资源在服务器B,这时在服务器A接收用户请求时就会将请求重定向到服务器B,此时用户访问服务器B时的域名是IP形式的。这两种情况下,用户访问记录在话单记录中记录的信息则不全,对DPI的内容识别存在一定的影响,会造成识别率结果偏低。
域名与ICP的对应资源库匹配技术测算流量业务模型的方法是先通过爬虫获取域名备案信息、拨测抓包获取ICP域名、以及手动访问网站确认等方式,积累域名与ICP的匹配资源表。之后通过将XDR话单中的用户访问的域名信息与该资源表进行匹配,即可针对HTTP协议业务进行较精准识别。虽然该方法一定程度上弥补了大小类业务识别的弊端。但现网数据越来越多的域名是以IP形式存在的,而网站资源的IP域名并非固定的,而是不断变化的。所以如果要建立IP形式的域名与ICP对应的资源表也会随着网站资源的IP域名变化而需要不断更新同步,其维护过程要消耗大量人力。因此,本发明实施例提供了一种流量业务识别方法,其在上述两种方式的基础上增加了通过将XDR话单中的URI地址来与预设URI资源库进行匹配,由此增加用户流量的识别率,为网络流量优化提供更可靠的依据。
下面结合附图对本发明实施例进行说明。
请参阅图1,图1示出了本发明实施例提供的一种流量业务识别方法的流程图,该方法包括以下步骤:
步骤S110:获取XDR话单,所述XDR话单包括DPI大小类业务标识、域名和URI地址。
在本步骤中,所述XDR话单是指DR(Detailed Record,详细记录)话单中的一种,其本质为用户的上网记录。DR包括CDR(Call Detailed Record,语音呼叫业务的详细记录)、TDR(Transaction Detailed Record,事务详细记录叫)和IPDR(IP Detailed Record,TCP/IP通信的详细记录)等。
在一些实施例中,XDR话单的获取方式可以是:获取DPI探针采集到的报文;将所述报文转化为所述XDR话单。其中,DPI探针是上述基于DPI的大小类业务识别的方法采用的DPI硬件,通过将其接入相关流量业务的链路,从而获取和该流量业务相关的报文。例如,如图2所示,其示出了通过DPI探针采集到的百度网盘业务的报文,报文通常为一段码流。为了方便后续的匹配,还需要将其转换成符合运营商统一规范的XDR话单,包含DPI识别到的大小类业务标签,用户访问的域名信息和URI信息,以及上下行流量数据等。例如,通过该百度网盘业务的报文中的“Host:qd.baidupcs.com”可以确定用户访问的域名信息,该域名信息可以转换为XDR话单的格式。XDR话单的格式可以参阅表1中示出的格式,其为用户使用微信业务的XDR话单。
表1
Figure BDA0002216838230000061
其中,host即指XDR话单中的域名,大类业务id和小类业务id则是指XDR话单中的DPI大小类业务标识。
步骤S120:根据所述DPI大小类业务标识、域名和URI地址中的至少一种,识别所述XDR话单的ICP名称。
在现有的使用DPI大小类业务标识和域名识别XDR话单的ICP名称的基础上,本发明实施例增加通过URI地址来识别的方式,使当XDR话单中的域名为IP形式时,且DPI大小类业务标识无法识别出具体的ICP名称时,也能通过URI地址识别出ICP名称,进一步确保了ICP名称的识别准确性。此外,由于解析XDR话单中的URI地址的工作量较大,而通过DPI大小类业务标识识别最为快速,因此,本发明实施例为这三种识别方式设置了优先级。请参阅图3,其示出了本发明实施例中识别ICP名称的子步骤流程图,步骤S120具体为:
步骤S121:将所述DPI大小类业务标识与预设业务库进行匹配。
在本步骤中,所述预设业务库主要是基于DPI探针识别后的业务ID与业务名称的对应资源库。预设业务库中的部分业务名称可以表明ICP名称,若XDR话单中的DPI大小类业务在预设业务库中与该业务名称匹配,则说明匹配成功,可以输出ICP名称,并取消后续识别步骤。
例如,请参阅表2,其示出了预设业务库中的部分匹配规则。
表2
大类业务 小类业务 大类业务id 小类业务id
即时通信 微信 1 0009
视频 网页视频 5 7010
若需要要识别的XDR话单有A和B,其中A包含的DPI大小类业务标识为1和0009,而B包含的DPI大小类业务标识为5和7010。在将A和B与预设业务库进行匹配后,可以确定A的大类业务和小类业务分别为即时通信和微信,由于微信为具体的ICP名称,所以可以说明A与预设业务库的匹配成功,并可以将“微信”作为ICP名称输出。而B的大类业务和小类业务分别为视频和网页视频,其皆无法表示具体的ICP名称,所以说明B与预设业务库的匹配失败,因此还需要后续的预设域名资源库来对XDR话单B进行进一步的识别。
步骤S122:当所述DPI大小类业务标识与预设业务库的匹配失败时,将所述域名与预设域名资源库进行匹配。
如上所述,所述预设域名资源库是通过爬虫获取域名备案信息、拨测抓包获取ICP域名、以及手动访问网站确认等方式,积累域名与ICP的匹配资源表。但是预设域名资源库中保存的仅是非IP形式的域名与ICP的匹配规则,因此,若XDR话单中的域名为IP形式,则会与预设域名资源库的匹配失败,进而还需要进一步通过预设URI资源库来对其进行识别。
例如,请参阅表3,其示出了预设域名资源库中的部分匹配规则。
表3
ICP名称 域名
爱奇艺视频 data.video.iqiyi.com
梨视频 www.pearvideo.com
若需要要识别的XDR话单有A和B,其中A包含的域名为111.62.67.21,而B包含的域名为www.pearvideo.com。在将A和B与预设业务库进行匹配后,由于预设域名资源库中不包含IP形式的域名与ICP的匹配规则,所以A匹配失败。而B在预设域名资源库中匹配的ICP名称为梨视频,所以B匹配成功,并将“梨视频”作为其ICP名称输出。
步骤S123:当所述域名与预设域名资源库的匹配失败时,将所述URI地址与预设URI资源库进行匹配,识别所述XDR话单的ICP名称。
在本步骤中,所述预设URI资源库是指包含URI地址与ICP名称对应关系的资源表。具体地,预设URI资源库的建立方式可以是:访问网站资源;导出所述网站资源的URI信息;根据所述网站资源的URI信息,建立所述预设URI资源库。
其中,所述网站资源的URI信息可以通过抓包工具或爬虫软件获取,而网站资源的ICP名称可以根据该网站资源的实际名称来确定。例如,在抓取播放爱奇艺视频时的URI信息时,可以先打开爱奇艺app播放一段视频,然后通过抓包工具进行抓包,获取如表4所示的URI信息:
表4
Figure BDA0002216838230000081
通过抓包工具分析所获得的URI信息,将这种形式的URI规则归纳为:.*/videos/(?:v0|v1).*\\.f4v\\?(?:(?:(?:.*pri_idc=.*?)|(?:.*src=iqiyi\\.com&.*))){2}.*。因此,最终得到的预设URI资源库如下述表5所示:
表5
Figure BDA0002216838230000091
若一XDR话单的URI地址为http://111.62.67.21/videos/v0/20181217/08/b6/308d280795ceef2a78e5f7f42ff83f98.f4v?key=0bfabec630ed339165df020bbddb4ba22&dis_k=276037a33248066e8d2e027d725fa3905&dis_t=1546874947&dis_dz=CMNET-HeBei&dis_st=42&src=iqiyi.com&uuid=b7c5605b-5c337043-f0&qd_tm=1546874945921&qd_ip=b7c5605b&mss=1&qd_aid=225205201&qd_vipdyn=0&qd_k=94066f3fa8995d8d36570f4d1a8af19b&qd_uid=1376458346&pri_idc=baiducdn_cmnet&qd_stert=370856&qypid=&qd_p=b7c5605b&qd_src=01012001010000000000&qd_index=2&qd_vip=1&qyid=kb5z2kohn2wqkhxprvvd3qfqec6ea52v&qd_tvid=1664553300&qd_vipres=0,将将其与预设URI资源库进行匹配时,可以确定其对应的ICP名称为爱奇艺视频,所以其匹配成功,可以将“爱奇艺视频”作为ICP名称输出。
需要说明的是:若XDR话单在于预设URI资源库进行匹配后仍无法确定其ICP名称,则需要将其ICP名称输出为空,并后续再进行人工核查其ICP名称。
本发明实施例通过解析获取的XDR话单中的DPI大小类业务标识、域名和URI地址,并将其分别与预设业务库、预设域名资源库和预设URI资源库进行匹配,从而识别出该XDR话单的ICP名称。和现有技术中仅通过DPI的大小类业务识别或仅通过将域名与ICP的对应资源库匹配来识别相比,本发明实施例会先将XDR话单中的DPI大小类业务标识与预设业务库匹配,匹配失败时,再将XDR话单中的域名与预设域名资源库进行匹配,若匹配仍不成功,则最后将XDR话单中的URI地址与预设URI资源库进行匹配,从而能够确保识别XDR话单的ICP名称。此外,由于解析XDR话单中的URI地址的工作量较大,所以将预设URI资源库放在最后进行匹配,也能加快识别的效率。
继续参阅图3,,在步骤S122后,所述方法还包括:
步骤S124:当所述域名与预设域名资源库的匹配成功时,输出所述域名在所述预设域名资源库内对应的ICP名称。
步骤S125:将所述域名在所述预设域名资源库内对应的ICP名称与新建DPI大小类业务标识的对应关系加入所述预设业务库。
如上述步骤S122所述,当一XDR话单中的域名与预设域名资源库的匹配成功时,则可以将该域名在预设域名资源库中对应的ICP名称输出。同时,由于在上述步骤中该XDR话单与预设业务库匹配失败,所以预设业务库内未包含该ICP名称的匹配规则。因此,预设业务库内需要增加该ICP名称匹配规则,即会在预设业务库内加上该ICP名称与一新的DPI大小类业务标识的对应关系,该新的DPI大小类业务标识不能与预设业务库内的其它DPI大小类业务标识一致。例如,一XDR话单如下述表6所示:
表6
Figure BDA0002216838230000101
将该XDR话单与表3所示的预设域名资源库匹配后可以确定其ICP名称为梨视频。若预设业务库为表2,则在其基础上还要增加梨视频的匹配规则,增加后的预设业务库如下述表7所示:
表7
大类业务 小类业务 大类业务id 小类业务id
即时通信 微信 1 0009
视频 网页视频 5 7010
视频 梨视频 5 9001
由于该XDR话单的小类业务id在原有的预设业务库已存在,因此在增加梨视频的匹配规则时,需要为其重新设置一个小类业务id,即新建DPI大小类业务标识,该小类业务id不能与预设业务库内现有的小类业务id相同。此外,后续当DPI探针再次采集到该业务类型的报文时,会为其打上更新后的DPI大小类业务标识。
继续参阅图3,在步骤S123后,所述方法还包括:
步骤S126:当所述URI地址与预设URI资源库的匹配成功时,输出所述URI地址在所述预设URI资源库内对应的ICP名称。
步骤S128:将所述URI地址在所述预设URI资源库内对应的ICP名称与新建DPI大小类业务标识的对应关系加入所述预设业务库。
如上述步骤S123所述,当一XDR话单中的URI地址与预设URI资源库的匹配成功时,则可以将该URI地址在预设URI资源库中对应的ICP名称输出。同时,和上述步骤S125相同,该ICP名称与重新设置一个小类业务id的对应关系也会加入至预设业务库。
继续参阅参阅图3,在步骤S126后,所述方法还包括:
步骤S127:当所述域名非IP形式时,将所述域名与所述URI地址在所述预设URI资源库内对应的ICP名称的对应关系加入所述预设域名资源库。
同样地,若一XDR话单与预设URI资源库匹配成功,则说明该XDR话单与预设域名资源库的匹配失败,即预设域名资源库并未包含步骤S126中输出的ICP名称,因此该ICP名称的也需要加入至预设域名资源库内。但由于IP形式的域名会更新,为了降低预设域名资源库的维护难度,通常其不会存储IP形式的域名与ICP名称的对应关系,所以仅在该XDR话单的域名非IP形式时,才将该XDR话单的域名与步骤S126中输出的ICP名称的对应关系加入至预设域名资源库。
例如,若与预设URI资源库匹配的XDR话单有A和B,其中A包含的域名为111.62.67.21,而B包含的域名为data.video.qiyi.com。A和B的URI地址在与预设URI资源库匹配后输出的ICP名称皆为爱奇艺视频。由于A的域名为IP形式,所以仅有B的域名data.video.qiyi.com与“爱奇艺视频”的对应关系会加入至预设域名资源库。
本发明实施例通过解析获取的XDR话单中的DPI大小类业务标识、域名和URI地址,并将其分别与预设业务库、预设域名资源库和预设URI资源库进行匹配,从而识别出该XDR话单的ICP名称。和现有技术中仅通过DPI的大小类业务识别或仅通过将域名与ICP的对应资源库匹配来识别相比,本发明实施例会先将XDR话单中的DPI大小类业务标识与预设业务库匹配,匹配失败时,再将XDR话单中的域名与预设域名资源库进行匹配,若匹配仍不成功,则最后将XDR话单中的URI地址与预设URI资源库进行匹配,从而能够确保识别XDR话单的ICP名称。此外,本发明实施例中的预设业务库和预设域名资源库还会根据后续的匹配结果自适应学习,将后续匹配输出的ICP名称的匹配规则加入其中,从而完善预设业务库和预设域名资源库,加快后续识别其它XDR话单的效率。
图4示出了本发明实施例提供的一种流量业务识别装置的结构示意图。如图4所示,所述装置100包括获取模块10和识别模块20。
获取模块10,用于获取XDR话单,所述XDR话单包括DPI大小类业务标识、域名和URI地址;识别模块20,用于根据所述DPI大小类业务标识、域名和URI地址中的至少一种,识别所述XDR话单的ICP名称。
在一种可选的方式中,所述识别模块20具体为:将所述DPI大小类业务标识与预设业务库进行匹配;当所述DPI大小类业务标识与预设业务库的匹配失败时,将所述域名与预设域名资源库进行匹配;当所述域名与预设域名资源库的匹配失败时,将所述URI地址与预设URI资源库进行匹配,识别所述XDR话单的ICP名称。
在一种可选的方式中,所述识别模块20还包括:当所述域名与预设域名资源库的匹配成功时,输出所述域名在所述预设域名资源库内对应的ICP名称;将所述域名在所述预设域名资源库内对应的ICP名称与新建DPI大小类业务标识的对应关系加入所述预设业务库。
在一种可选的方式中,所述识别模块20还包括:当所述URI地址与预设URI资源库的匹配成功时,输出所述URI地址在所述预设URI资源库内对应的ICP名称;将所述URI地址在所述预设URI资源库内对应的ICP名称与新建DPI大小类业务标识的对应关系加入所述预设业务库。
在一种可选的方式中,所述识别模块20还包括:当所述域名非IP形式时,将所述域名与所述URI地址在所述预设URI资源库内对应的ICP名称的对应关系加入所述预设域名资源库。
在一种可选的方式中,所述获取模块10具体为:获取DPI探针采集到的报文;将所述报文转化为所述XDR话单。
在一种可选的方式中,所述装置100还包括访问模块30、导出模块40和建立模块50。
访问模块30,用于访问网站资源;导出模块40,用于导出所述网站资源的URI信息;建立模块50,用于根据所述网站资源的URI信息,建立所述预设URI资源库。
本发明实施例通过解析获取模块10获取的XDR话单中的DPI大小类业务标识、域名和URI地址,并将其通过识别模块20与预设业务库、预设域名资源库和预设URI资源库进行匹配,从而识别出该XDR话单的ICP名称。和现有技术中仅通过DPI的大小类业务识别或仅通过将域名与ICP的对应资源库匹配来识别相比,本发明实施例会先将XDR话单中的DPI大小类业务标识与预设业务库匹配,匹配失败时,再将XDR话单中的域名与预设域名资源库进行匹配,若匹配仍不成功,则最后将XDR话单中的URI地址与预设URI资源库进行匹配,从而能够确保识别XDR话单的ICP名称。此外,由于解析XDR话单中的URI地址的工作量较大,所以将预设URI资源库放在最后进行匹配,也能加快识别的效率。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的流量业务识别方法。
图5示出了本发明实施例提供的流量业务识别设备的结构示意图,本发明具体实施例并不对故障定位设备的具体实现做限定。
如图5所示,该流量业务识别设备可以包括:处理器(processor)202、通信接口(Communications Interface)204、存储器(memory)206、以及通信总线208。
其中:处理器202、通信接口204、以及存储器206通过通信总线208完成相互间的通信。通信接口204,用于与其它设备比如客户端或其它服务器等的网元通信。处理器202,用于执行程序210,具体可以执行上述流量业务识别方法实施例中的相关步骤。
具体地,程序210可以包括程序代码,该程序代码包括计算机操作指令。
处理器202可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。流量业务识别设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器206,用于存放程序210。存储器206可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序210具体可以用于使得处理器202执行以下操作:
获取XDR话单,所述XDR话单包括DPI大小类业务标识、域名和URI地址;
根据所述DPI大小类业务标识、域名和URI地址中的至少一种,识别所述XDR话单的ICP名称。
在一种可选的方式中,程序210具体可以进一步用于使得处理器202执行以下操作:
将所述DPI大小类业务标识与预设业务库进行匹配;
当所述DPI大小类业务标识与预设业务库的匹配失败时,将所述域名与预设域名资源库进行匹配;
当所述域名与预设域名资源库的匹配失败时,将所述URI地址与预设URI资源库进行匹配,识别所述XDR话单的ICP名称。
在一种可选的方式中,程序210具体可以进一步用于使得处理器202执行以下操作:
当所述域名与预设域名资源库的匹配成功时,输出所述域名在所述预设域名资源库内对应的ICP名称;
将所述域名在所述预设域名资源库内对应的ICP名称与新建DPI大小类业务标识的对应关系加入所述预设业务库。
在一种可选的方式中,程序210具体可以进一步用于使得处理器202执行以下操作:
当所述URI地址与预设URI资源库的匹配成功时,输出所述URI地址在所述预设URI资源库内对应的ICP名称;
将所述URI地址在所述预设URI资源库内对应的ICP名称与新建DPI大小类业务标识的对应关系加入所述预设业务库。
在一种可选的方式中,程序210具体可以进一步用于使得处理器202执行以下操作:
当所述域名非IP形式时,将所述域名与所述URI地址在所述预设URI资源库内对应的ICP名称的对应关系加入所述预设域名资源库。
在一种可选的方式中,程序210具体可以进一步用于使得处理器202执行以下操作:
获取DPI探针采集到的报文;
将所述报文转化为所述XDR话单。
在一种可选的方式中,程序210具体可以进一步用于使得处理器202执行以下操作:
访问网站资源;
导出所述网站资源的URI信息;
根据所述网站资源的URI信息,建立所述预设URI资源库。
本发明实施例通过解析获取的XDR话单中的DPI大小类业务标识、域名和URI地址,并将其分别与预设业务库、预设域名资源库和预设URI资源库进行匹配,从而识别出该XDR话单的ICP名称。和现有技术中仅通过DPI的大小类业务识别或仅通过将域名与ICP的对应资源库匹配来识别相比,本发明实施例会先将XDR话单中的DPI大小类业务标识与预设业务库匹配,匹配失败时,再将XDR话单中的域名与预设域名资源库进行匹配,若匹配仍不成功,则最后将XDR话单中的URI地址与预设URI资源库进行匹配,从而能够确保识别XDR话单的ICP名称。此外,由于解析XDR话单中的URI地址的工作量较大,所以将预设URI资源库放在最后进行匹配,也能加快识别的效率。
本发明实施例提供了一种可执行程序,所述可执行程序可执行上述任意方法实施例中的流量业务识别方法。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (10)

1.一种流量业务识别方法,其特征在于,包括:
获取XDR话单,所述XDR话单包括深度报文检测DPI大小类业务标识、域名和统一资源标识符URI地址;
根据所述DPI大小类业务标识、域名和URI地址中的至少一种,识别所述XDR话单的网络内容服务商ICP名称。
2.如权利要求1所述的方法,其特征在于,所述根据所述DPI大小类业务标识、域名和URI地址中的至少一种,识别所述XDR话单的ICP名称,具体为:
将所述DPI大小类业务标识与预设业务库进行匹配;
当所述DPI大小类业务标识与预设业务库的匹配失败时,将所述域名与预设域名资源库进行匹配;
当所述域名与预设域名资源库的匹配失败时,将所述URI地址与预设URI资源库进行匹配,识别所述XDR话单的ICP名称。
3.如权利要求2所述的方法,其特征在于,所述当所述DPI大小类业务标识与预设业务库的匹配失败时,将所述域名与预设域名资源库进行匹配之后,所述方法还包括:
当所述域名与预设域名资源库的匹配成功时,输出所述域名在所述预设域名资源库内对应的ICP名称;
将所述域名在所述预设域名资源库内对应的ICP名称与新建DPI大小类业务标识的对应关系加入所述预设业务库。
4.如权利要求2所述的方法,其特征在于,所述当所述域名与预设域名资源库的匹配失败时,将所述URI地址与预设URI资源库进行匹配,识别所述XDR话单的ICP名称之后,所述方法还包括:
当所述URI地址与预设URI资源库的匹配成功时,输出所述URI地址在所述预设URI资源库内对应的ICP名称;
将所述URI地址在所述预设URI资源库内对应的ICP名称与新建DPI大小类业务标识的对应关系加入所述预设业务库。
5.如权利要求4所述的方法,所述当所述URI地址与预设URI资源库的匹配成功时,输出所述URI地址在所述预设URI资源库内对应的ICP名称之后,所述方法还包括:
当所述域名非IP形式时,将所述域名与所述URI地址在所述预设URI资源库内对应的ICP名称的对应关系加入所述预设域名资源库。
6.如权利要求1所述的方法,其特征在于,所述获取XDR话单,具体为:
获取DPI探针采集到的报文;
将所述报文转化为所述XDR话单。
7.如权利要求1所述的方法,其特征在于,所述获取XDR话单之前,所述方法还包括:
访问网站资源;
导出所述网站资源的URI信息;
根据所述网站资源的URI信息,建立所述预设URI资源库。
8.一种流量业务识别装置,其特征在于,包括:
获取模块,用于获取XDR话单,所述XDR话单包括DPI大小类业务标识、域名和URI地址;
识别模块,用于根据所述DPI大小类业务标识、域名和URI地址中的至少一种,识别所述XDR话单的ICP名称。
9.一种流量业务识别设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7任意一项所述的流量业务识别方法。
10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7任意一项所述的流量业务识别方法。
CN201910918590.9A 2019-09-26 2019-09-26 流量业务识别方法、装置、设备及计算机存储介质 Active CN112565106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910918590.9A CN112565106B (zh) 2019-09-26 2019-09-26 流量业务识别方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910918590.9A CN112565106B (zh) 2019-09-26 2019-09-26 流量业务识别方法、装置、设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN112565106A true CN112565106A (zh) 2021-03-26
CN112565106B CN112565106B (zh) 2023-04-28

Family

ID=75029870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910918590.9A Active CN112565106B (zh) 2019-09-26 2019-09-26 流量业务识别方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN112565106B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104022920A (zh) * 2014-06-26 2014-09-03 重庆重邮汇测通信技术有限公司 一种lte网络流量识别系统及方法
CN104639391A (zh) * 2015-01-04 2015-05-20 中国联合网络通信集团有限公司 一种生成网络流量记录的方法及相应的流量检测设备
JP2015097330A (ja) * 2013-11-15 2015-05-21 Kddi株式会社 サービス推定装置及び方法
US20170048155A1 (en) * 2014-04-29 2017-02-16 Huawei Technologies Co., Ltd. Protocol type identification method and apparatus
CN106452940A (zh) * 2016-08-22 2017-02-22 中国联合网络通信有限公司重庆市分公司 一种互联网业务流量归属的识别方法和装置
CN108337652A (zh) * 2017-01-20 2018-07-27 中国移动通信集团河南有限公司 一种检测流量欺诈的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015097330A (ja) * 2013-11-15 2015-05-21 Kddi株式会社 サービス推定装置及び方法
US20170048155A1 (en) * 2014-04-29 2017-02-16 Huawei Technologies Co., Ltd. Protocol type identification method and apparatus
CN104022920A (zh) * 2014-06-26 2014-09-03 重庆重邮汇测通信技术有限公司 一种lte网络流量识别系统及方法
CN104639391A (zh) * 2015-01-04 2015-05-20 中国联合网络通信集团有限公司 一种生成网络流量记录的方法及相应的流量检测设备
CN106452940A (zh) * 2016-08-22 2017-02-22 中国联合网络通信有限公司重庆市分公司 一种互联网业务流量归属的识别方法和装置
CN108337652A (zh) * 2017-01-20 2018-07-27 中国移动通信集团河南有限公司 一种检测流量欺诈的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卫涛,韦薇,张扬,李心恬,陈晓帅: "移动用户上网日志全程关联方案探讨", 《电信快报》 *

Also Published As

Publication number Publication date
CN112565106B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN107493183B (zh) 一种故障定位方法及装置
US9178845B2 (en) Method, client device, server system for parsing a data usage value
US7657591B2 (en) Dispatching client requests to appropriate server-side methods
CN108259425A (zh) 攻击请求的确定方法、装置及服务器
CN108363662A (zh) 一种应用程序测试方法、存储介质及终端设备
WO2021164261A1 (zh) 云网络设备的测试方法、存储介质和计算机设备
CN102724317A (zh) 一种网络数据流量分类方法和装置
US20140160969A1 (en) Service Classification of Web Traffic
CN110943884B (zh) 一种数据处理方法及装置
CN106790593B (zh) 一种页面处理方法和装置
CN110798445B (zh) 公共网关接口测试方法、装置、计算机设备及存储介质
CN108664316A (zh) 一种获取api的接口信息的方法和装置
CN109241733A (zh) 基于Web访问日志的爬虫行为识别方法及装置
CN108809769B (zh) 一种检测IPv6活跃度的方法和电子设备
WO2023109524A1 (zh) 信息泄露监测方法及系统、电子设备
WO2015081988A1 (en) Performance metric of a system conveying web content
US9396259B1 (en) Capture of web application state
CN102055620B (zh) 监控用户体验的方法和系统
CN116346649A (zh) 负载均衡设备的虚服务抓包方法及装置
CN112565106B (zh) 流量业务识别方法、装置、设备及计算机存储介质
CN107517237A (zh) 一种视频识别方法和装置
CN110572394A (zh) 访问控制方法及装置
CN114285774B (zh) 流量录制方法、装置、电子设备及存储介质
CN110620682B (zh) 资源信息的获取方法及装置、存储介质、终端
CN111327716B (zh) 一种业务交互方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant