CN107342913B - 一种cdn节点的探测方法和装置 - Google Patents

一种cdn节点的探测方法和装置 Download PDF

Info

Publication number
CN107342913B
CN107342913B CN201710373619.0A CN201710373619A CN107342913B CN 107342913 B CN107342913 B CN 107342913B CN 201710373619 A CN201710373619 A CN 201710373619A CN 107342913 B CN107342913 B CN 107342913B
Authority
CN
China
Prior art keywords
domain name
determining
characteristic value
cdn node
accessed website
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710373619.0A
Other languages
English (en)
Other versions
CN107342913A (zh
Inventor
张峰晓
张健
石磊
吴胜军
杨震
金红
杨满智
刘长永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eversec Beijing Technology Co Ltd
Original Assignee
Eversec Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eversec Beijing Technology Co Ltd filed Critical Eversec Beijing Technology Co Ltd
Priority to CN201710373619.0A priority Critical patent/CN107342913B/zh
Publication of CN107342913A publication Critical patent/CN107342913A/zh
Application granted granted Critical
Publication of CN107342913B publication Critical patent/CN107342913B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters

Abstract

本发明公开了一种CDN节点的探测方法和装置,属于互联网技术领域。方法包括:根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,域名解析请求中携带有被访问网站的域名信息;根据被访问网站的特征信息,确定被访问网站的CDN节点疑似度;根据CDN节点疑似度,判断被访问网站是否存在CDN节点。本发明实施例能够节省CDN节点探测时使用的资源,同时也能够提高CDN节点的探测效率。

Description

一种CDN节点的探测方法和装置
技术领域
本发明涉及互联网技术领域,特别涉及一种CDN节点的探测方法和装置。
背景技术
CDN(Content Delivery Network,内容分发网络),是通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络,CDN能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。
因可以快速提升用户访问和下载速度、提高用户体验,CDN业务被市场大范围使用,但也逐渐暴露出一些问题,尤其是网络信息安全隐患显现,比如诈骗、钓鱼网站等不良网站通过CDN业务,利用互联网传播不良信息、诈骗等非法信息;另外,新行业分类目录发布将CDN作为独立的业务发展与管理,但仍存在无证经营企业,即企业未取得CDN业务的电信业务经营许可证,擅自开展CDN业务。因此,为净化网络环境、强化网络信息安全管理,有必要对CDN节点进行探测,以需要掌握到CDN业务的使用情况。
现有技术中,一般是通过投入大量的设备和资源对被访问网站的所有CDN带宽进行采样分析,来探测CDN节点。因此,现有技术中,由于在CDN节点的探测过程中,需要投入了大量的设备和资源,存在CDN节点探测时使用资源较高,以及探测效率较低的问题。
发明内容
为了节省对CDN节点探测时使用的资源,以及提高CDN节点的探测效率,本发明实施例提供了一种CDN节点的探测方法和装置。所述技术方案如下:
第一方面,提供了一种CDN节点的探测方法,所述方法包括:
根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,所述域名解析请求中携带有所述被访问网站的域名信息;
根据所述被访问网站的特征信息,确定所述被访问网站的CDN节点疑似度;
根据所述CDN节点疑似度,判断所述被访问网站是否存在CDN节点。
结合第一方面,在第一种可能的实现方式中,所述特征信息至少包括与所述域名信息对应的CName、IP地址和所述IP地址的分布区域,所述根据所述特征信息,确定所述被访问网站的CDN节点疑似度包括:
根据所述域名信息对应的CName,确定第一特征值;
根据所述域名信息对应的IP地址,确定第二特征值;
根据所述IP地址的分布区域,确定第三特征值;
根据所述第一特征值、所述第二特征值和所述第三特征值,确定所述被访问网站的CDN节点疑似度;
其中,所述第一特征值、所述第二特征值和所述第三特征值均用于量化所述被访问网站的CDN节点疑似度。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,
所述根据所述域名信息对应的CName,确定第一特征值包括:
判断所述域名信息对应的CName是否包含预设关键词;
若所述域名信息对应的CName包含所述预设关键词,则根据预设评分标准,确定所述第一特征值;
所述根据所述域名信息对应的IP地址,确定第二特征值包括:
获取所述域名信息对应的所有IP地址,并去重统计所述IP地址的数目;
根据所述预设评分标准和所述IP地址的数目,确定所述第二特征值;
所述根据所述IP地址的分布区域,确定第三特征值包括:
去重统计所述IP地址的分布区域的数目;
根据所述预设评分标准和所述IP地址的分布区域的数目,确定所述第三特征值。
结合第一方面的第一种可能的实现方式,在第三种可能的实现方式中,所述根据所述第一特征值、所述第二特征值和所述第三特征值,确定所述被访问网站的CDN节点疑似度包括:
获取所述第一特征值、所述第二特征值和所述第三特征值分别对应的权重系数;
根据所述第一特征值、所述第二特征值和所述第三特征值与分别对应的权重系数乘积的累加值,确定所述CDN节点疑似度。
结合第一方面或第一方面的第一种可能的实现方式,在第四种可能的实现方式中,所述根据所述CDN节点疑似度,判断所述被访问网站是否存在CDN节点包括:
判断所述CDN节点疑似度是否超过预设阈值,若是,则判定所述被访问网站存在CDN节点。
结合第一方面,在第五种可能的实现方式中,所述方法还包括:
模拟客户端的域名解析请求,并将所述域名解析请求发送至所述多个域名服务器;
接收所述多个域名服务器分别针对所述域名解析请求返回的域名解析结果。
第二方面,提供了一种CDN节点的探测装置,所述装置包括:
获取模块,用于根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,所述域名解析请求中携带有所述被访问网站的域名信息;
确定模块,用于根据所述被访问网站的特征信息,确定所述被访问网站的CDN节点疑似度;
判断模块,用于根据所述CDN节点疑似度,判断所述被访问网站是否存在CDN节点。
结合第二方面,在第一种可能的实现方式中,所述特征信息至少包括与所述域名信息对应的CName、IP地址和所述IP地址的分布区域,所述确定模块包括:
第一确定子模块,用于根据所述域名信息对应的CName,确定第一特征值;
第二确定子模块,用于根据所述域名信息对应的IP地址,确定第二特征值;
第三确定子模块,用于根据所述IP地址的分布区域,确定第三特征值;
第四确定子模块,用于根据所述第一特征值、所述第二特征值和所述第三特征值,确定所述被访问网站的CDN节点疑似度;
其中,所述第一特征值、所述第二特征值和所述第三特征值均用于量化所述被访问网站的CDN节点疑似度。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,
所述第一确定子模块具体用于:
判断所述域名信息对应的CName是否包含预设关键词;
若所述域名信息对应的CName包含所述预设关键词,则根据预设评分标准,确定所述第一特征值;
所述第二确定子模块具体用于:
获取所述域名信息对应的所有IP地址,并去重统计所述IP地址的数目;
根据所述预设评分标准和所述IP地址的数目,确定所述第二特征值;
所述第三确定子模块具体用于:
去重统计所述IP地址的分布区域的数目;
根据所述预设评分标准和所述IP地址的分布区域的数目,确定所述第三特征值。
结合第二方面的第一种可能的实现方式,在第三种可能的实现方式中,所述第四确定子模块具体用于:
获取所述第一特征值、所述第二特征值和所述第三特征值分别对应的权重系数;
根据所述第一特征值、所述第二特征值和所述第三特征值与分别对应的权重系数乘积的累加值,确定所述CDN节点疑似度。
结合第二方面或第二方面的第一种可能的实现方式,在第四种可能的实现方式中,所述判断模块具体用于:
判断所述CDN节点疑似度是否超过预设阈值,若是,则判定所述被访问网站存在CDN节点。
结合第二方面,在第五种可能的实现方式中,所述装置还包括:
模拟模块,用于模拟客户端的域名解析请求;
发送模块,用于将所述域名解析请求发送至所述多个域名服务器;
接收模块,用于接收所述多个域名服务器分别针对所述域名解析请求返回的域名解析结果。
本发明实施例提供了一种CDN节点的探测方法和装置,由于通过根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,因此能够根据多个域名服务器返回的域名解析结果获取到对被访问网站进行分析的大量分析数据,由此提高了探测被访问网站是否存在CDN节点的准确性;另外,由于通过根据所述被访问网站的特征信息,确定所述被访问网站的CDN节点疑似度,并根据所述CDN节点疑似度,判断所述被访问网站是否存在CDN节点,因此相比较现有技术,本发明的方案能够避免在CDN节点探测过程中投入大量的设备和资源对被访问网站的所有CDN带宽进行采样分析,因此不但节省了CDN节点探测时使用的资源,同时也提高了CDN节点的探测效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种CDN节点的探测方法流程图;
图2是本发明实施例提供的一种CDN节点的探测方法流程图;
图3是本发明实施例提供的一种CDN节点的探测装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种CDN节点的探测方法,参照图1所示,该方法包括:
101、模拟客户端的域名解析请求,并将域名解析请求发送至多个域名服务器。
102、接收多个域名服务器分别针对域名解析请求返回的域名解析结果。
103、根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,域名解析请求中携带有被访问网站的域名信息。
104、根据被访问网站的特征信息,确定被访问网站的CDN节点疑似度。
具体的,特征信息至少包括与域名信息对应的CName、IP地址和IP地址的分布区域;
根据特征信息,确定被访问网站的CDN节点疑似度,该过程可以包括:
根据域名信息对应的CName,确定第一特征值;
根据域名信息对应的IP地址,确定第二特征值;
根据IP地址的分布区域,确定第三特征值;
根据第一特征值、第二特征值和第三特征值,确定被访问网站的CDN节点疑似度;
其中,第一特征值、第二特征值和第三特征值均用于量化被访问网站的CDN节点疑似度。
其中,根据域名信息对应的CName,确定第一特征值,该过程可以包括:
判断域名信息对应的CName是否包含预设关键词;
若域名信息对应的CName包含预设关键词,则根据预设评分标准,确定第一特征值。
其中,根据域名信息对应的IP地址,确定第二特征值,该过程可以包括:
获取域名信息对应的所有IP地址,并去重统计IP地址的数目;
根据预设评分标准和IP地址的数目,确定第二特征值。
其中,根据IP地址的分布区域,确定第三特征值,该过程可以包括:
去重统计IP地址的分布区域的数目;
根据预设评分标准和IP地址的分布区域的数目,确定第三特征值。
其中,根据第一特征值、第二特征值和第三特征值,确定被访问网站的CDN节点疑似度,该过程可以包括:
获取第一特征值、第二特征值和第三特征值分别对应的权重系数;
根据第一特征值、第二特征值和第三特征值与分别对应的权重系数乘积的累加值,确定CDN节点疑似度。
105、根据CDN节点疑似度,判断被访问网站是否存在CDN节点。
具体的,判断CDN节点疑似度是否超过预设阈值,若是,则判定被访问网站存在CDN节点。
本发明实施例提供了一种CDN节点的探测方法,由于通过根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,因此能够根据多个域名服务器返回的域名解析结果获取到对被访问网站进行分析的大量分析数据,由此提高了探测被访问网站是否存在CDN节点的准确性;另外,由于通过根据被访问网站的特征信息,确定被访问网站的CDN节点疑似度,并根据CDN节点疑似度,判断被访问网站是否存在CDN节点,因此相比较现有技术,本发明的方案能够避免在CDN节点探测过程中投入大量的设备和资源对被访问网站的所有CDN带宽进行采样分析,由此不但节省了CDN节点探测时使用的资源,同时也提高了CDN节点的探测效率。
实施例二
本发明实施例提供了一种CDN节点的探测方法,参照图2所示,方法包括:
201、模拟客户端的域名解析请求,并将域名解析请求发送至多个域名服务器,域名解析请求中携带有被访问网站的域名信息。
客户端上安装有网页浏览器,客户端可以是台式计算机、笔记本计算机、膝上型计算机、手机、个人数字助理等。
域名服务器,又称DNS服务器(Domain Name Server),用于域名和与域名相对应的IP地址转换的服务器。
多个域名服务器包括基础运营商的域名服务器和企业的域名服务器,其中基础运营商的域名服务器,比如联通DNS服务器、电信DNS服务器等。
多个域名服务器分布在多个不同区域,多个不同区域包括境外的多个国家或地区以及中国境内的多个省份或地区。
具体的,该过程可以包括:
通过程序模拟客户端针对被访问网站的域名发起域名解析请求;
根据多个域名服务器的IP地址,将域名解析请求多线程并发发送至多个域名服务器;
该多个域名服务器的IP地址与多个域名服务器名称之间的对应关系预先存储在域名服务器列表中。
除此以外,模拟客户端的域名解析请求还可以作为一触发事件,并在满足一定触发条件时而触发。
202、接收多个域名服务器分别针对域名解析请求返回的域名解析结果。
具体的,判断是否接收到多个域名服务器中的每个域名服务器返回的域名解析结果,若是,则执行步骤203;否则,结束或者返回步骤201。
本发明对具体的接收过程不加以限定。
可选的,在实际应用中,若在预设时间内未接收到多个域名服务器中的某个域名服务器返回的域名解析结果,则可以重新模拟客户端的域名解析请求,并将域名解析请求发送至未返回域名解析结果的该域名服务器,直至接收到该域名服务器返回的域名解析结果。
本发明实施例中,通过模拟客户端的域名解析请求,实现了对被访问网站是否存在CDN节点的主动探测;另外,由于是将域名解析请求发送至多个域名服务器,并接收多个域名服务器分别针对域名解析请求返回的域名解析结果,因此根据多个域名服务器返回的域名解析结果能够获取到对被访问网站进行分析的大量分析数据,由此提高了探测被访问网站是否存在CDN节点的准确性。
203、根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息。
其中,特征信息至少包括与域名信息对应的CName、IP地址和IP地址的分布区域。
CName为别名记录,即允许将多个名字映射到同一个域名。如“www.example.com”的别名为“www.example.com.cloudglb.net”。
IP地址包括IPv4地址和IPv6地址中的至少一个。
具体的,该过程可以包括:
a、接收多个域名服务器分别针对域名解析请求返回的域名解析结果,该域名解析结果为标准网络协议报文。
其中,多个域名服务器分别针对域名解析请求返回域名解析结果,该过程可以包括:
多个域名服务器中的每个域名服务器通过查询其各自的解析日志记录,判断各自的解析日志记录中是否存在与域名解析请求中的域名信息相对应的域名解析结果,若存在,则返回与域名解析请求中域名信息相对应的域名解析结果。否则,对域名解析请求解析不成功的域名服务器将域名解析请求转发至上一级域名服务器,由上一级域名服务器进行解析,如果上一级域名服务器不能解析,或将该域名解析请求发至根域名服务器,或将该域名解析请求转至上上级域名服务器,以此循环,以获取到最终的域名解析结果并返回。
b、对多个域名服务器域名解析结果进行汇总分类形成域名信息、CName与IP地址的多对多的对应关系,以获取被访问网站的特征信息。
其中,特征信息至少包括与域名信息对应的CName、IP地址和IP地址的分布区域。
除此以外,被访问网站的特征信息还可以包括其他的能够用于探测被访问网站是否存在CDN节点的信息,本发明实施例对此不加以限定。
本发明实施例中,通过根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,因此根据多个域名服务器返回的域名解析结果能够获取到对被访问网站进行分析的大量分析数据,由此提高了探测被访问网站是否存在CDN节点的准确性;而同时,获取到的被访问网站的特征信息至少包括与域名信息对应的CName、IP地址和IP地址的分布区域,由此通过被访问网站的特征信息来确定被访问网站是否存在CDN节点,进一步提高了CDN节点探测的准确性。
204、根据域名信息对应的CName,确定第一特征值。
其中,第一特征值用于量化被访问网站的CDN节点疑似度。
具体的,该过程可以包括:
判断域名信息对应的CName是否包含预设关键词;
若域名信息对应的CName包含预设关键词,则根据预设评分标准,确定第一特征值。
其中,预设关键词可以是一个关键词或由多个关键词结合得到的预设关键词,比如,可以是关键词“CDN”、“Cloud”、“Cache”或“DNS”,也可以由关键词“CDN”、“Cloud”、“Cache”和“DNS”中的多个关键词结合得到,示例性的,将关键词“CDN”和“Cloud”相结合得到“cloudcdn”作为预设关键词,本发明实施例对具体的预设关键词不加以限定。
其中,预设评分标准中设定域名信息对应的CName包含预设关键词时的第一特征值。
根据预设评分标准,确定第一特征值,该第一特征值可以是介于0到99之间的任一值,比如,预设评分标准中设定域名信息对应的CName包含预设关键词时的第一特征值为t,若预设关键词为“cloudcdn”,域名信息对应的CName为www.example.com.cloudcdn.net”,判定CName中包含预设关键词,那么根据预设评分标准,确定第一特征值为t。
本发明实施例中,由于CName能够指向一个CDN服务器集群,因此通过CName确定第一特征值,能够保证CDN节点的探测准确性。
205、根据域名信息对应的IP地址,确定第二特征值。
其中,第二特征值用于量化被访问网站的CDN节点疑似度。
具体的,该过程可以包括:
获取域名信息对应的所有IP地址,并去重统计IP地址的数目;
根据预设评分标准和IP地址的数目,确定第二特征值。
其中,预设评分标准中设定IP地址不同的数目对应不同的第二特征值,IP地址的数目越大,其所对应的第二特征值越高,该第二特征值可以是介于0到99之间的任一值。预设评分标准可以设定如下:IP地址的数目低于A时,所对应的第二特征值为a;IP地址的数目在A与B之间时,所对应的第二特征值为b;IP地址的数目在B与C之间时,所对应的第二特征值为c;IP地址的数目超过C时,所对应的第二特征值为d,其中,A<B<C,a<b<c<d。
本发明实施例中,因为CDN是分布式的,分布式必然存在至少一个IP地址,因此通过域名信息对应的IP地址来确定第二特征值,能够保证CDN节点的探测准确性。
206、根据IP地址的分布区域,确定第三特征值。
其中,第三特征值用于量化被访问网站的CDN节点疑似度。
具体,该过程可以包括:
去重统计IP地址的分布区域的数目;
根据预设评分标准和IP地址的分布区域的数目,确定第三特征值。
其中,预设评分标准中设定IP地址的分布区域不同的数目对应不同的第三特征值,IP地址的分布区域的数目越大,其所对应的第三特征值越高,该第三特征值可以是介于0到99之间的任一值。预设评分标准可以设定如下:IP地址的分布区域的数目低于M时,所对应的第三特征值为m;IP地址的数目在M与N之间时,所对应的第三特征值为n;IP地址的数目超过P时,所对应的第三特征值为p,其中,M<N<P,m<n<p。
需要说明的是,本发明对步骤204、步骤205与步骤206的执行先后顺序不作具体限定,在实际应用中,同时执行步骤204、步骤205与步骤206,为优选方案,以进一步提高CDN节点的探测效率。
值得注意的是,步骤204至步骤206是实现根据特征信息,确定被访问网站的CDN节点疑似度的过程,除了上述步骤的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
本发明实施例中,因为对于同一个被访问网站而言,若获取到分布在多个不同区域的IP地址,表明该被访问网站使用了CDN,因此通过域名信息对应的IP地址来确定第三特征值,能够保证CDN节点的探测准确性。
207、根据第一特征值、第二特征值和第三特征值,确定被访问网站的CDN节点疑似度。
具体的,该过程可以包括:
a、获取第一特征值、第二特征值和第三特征值分别对应的权重系数。
其中,第一特征值、第二特征值和第三特征值分别对应的权重系数用于指示第一特征值、第二特征值和第三特征值相对重要程度,其分别对应的权重系数可以根据专家指导进行确定,或者根据机器学习结果进行确定,或者根据专家指导与机器学习结果的结合进行确定。
比如,第一特征值、第二特征值、第三特征值分别对应的权重系数均大于等于0且小于等于1,其分别对应的权重系数之间的关系可以是:第一特征值的权重系数小于第三特征值的权重系数,第三特征值的权重系数小于第二特征值的权重系数;也可以是,第一特征值的权重系数、第三特征值的权重系数与第三特征值的权重系数均相等。
b、根据第一特征值、第二特征值和第三特征值与分别对应的权重系数乘积的累加值,确定CDN节点疑似度。
具体的,CDN节点疑似度可以通过如下计算公式进行计算:
D=M1*a1+M2*a2+M3*a3;
其中,D表示CDN节点疑似度,M1表示第一特征值,a1表示第一特征值的权重系数,M2表示第二特征值,a2表示第二特征值的权重系数,M3表示第三特征值,a3表示第三特征值的权重系数。
比如,将第一特征值的权重系数、第二特征值的权重系数、第三特征值的权重系数中的其中两项值设置为不等于0,另外一项值设置为等于0,即通过两项特征值的结合确定CDN节点疑似度;由此通过两项特征值的结合确定CDN节点疑似度能够节约探测CDN节点使用的资源,且进一步提高CDN节点的探测效率。
又如,将第一特征值的权重系数、第二特征值的权重系数、第三特征值的权重系数中的其中一项值设置为不等于0,另外两项值设置为等于0,即通过一项特征值确定CDN节点疑似度,由此能够最大程度节约探测CDN节点使用的资源,且进一步提高CDN节点的探测效率,但相对使用两项或三项特征值的结合来探测CDN节点而言,通过一项特征值对CDN节点进行的探测准确率较低。
在实际应用中,将该第一特征值、第二特征值和第三特征值相结合来确定CDN节点疑似度,以进一步提高CDN节点探测的准确性,为优选方案,但是不排除采用其中的一项或两项的结合以探测CDN节点,其均在本发明保护范围之内,本发明实施例对此不加以限定。
208、判断CDN节点疑似度是否超过预设阈值,若是,则判定被访问网站存在CDN节点。
其中,预设阈值可以根据专家指导进行确定,或者根据机器学习结果进行确定,或者根据专家指导与机器学习结果的结合进行确定。
具体的,若CDN节点疑似度超过预设阈值,则判定被访问网站存在CDN节点,否则,判定被访问网站不存在CDN节点。
本发明实施例对具体的判断过程不加以限定。
本发明实施例中,通过第一特征值、第二特征值和第三特征值三个维度来确定被访问网站的CDN节点疑似度,以及通过判断CDN节点疑似度是否超过预设阈值,以确定被访问网站是否存在CDN节点,使得判断结果更加准确,适用于所有的被访问网站,从而进一步提高了CDN节点的探测效率。
本发明实施例提供了一种CDN节点的探测方法,由于通过根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,因此根据多个域名服务器返回的域名解析结果能够获取到对被访问网站进行分析的大量分析数据,由此提高了探测被访问网站是否存在CDN节点的准确性;另外,由于通过根据被访问网站的特征信息,确定被访问网站的CDN节点疑似度,并根据CDN节点疑似度,判断被访问网站是否存在CDN节点,因此相比较现有技术,本发明的方案能够避免在CDN节点探测过程中投入大量的设备和资源对被访问网站的所有CDN带宽进行采样分析,由此不但节省了CDN节点探测时使用的资源,同时也提高了CDN节点的探测效率。
实施例三
本发明实施例提供了一种CDN节点的探测装置,参照图3所示,CDN节点的探测装置3包括:
获取模块31,用于根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,域名解析请求中携带有被访问网站的域名信息;
确定模块32,用于根据被访问网站的特征信息,确定被访问网站的CDN节点疑似度;
判断模块33,用于根据CDN节点疑似度,判断被访问网站是否存在CDN节点。
可选的,特征信息至少包括与域名信息对应的CName、IP地址和IP地址的分布区域,确定模块32包括:
第一确定子模块321,用于根据域名信息对应的CName,确定第一特征值;
第二确定子模块322,用于根据域名信息对应的IP地址,确定第二特征值;
第三确定子模块323,用于根据IP地址的分布区域,确定第三特征值;
第四确定子模块324,用于根据第一特征值、第二特征值和第三特征值,确定被访问网站的CDN节点疑似度;
其中,第一特征值、第二特征值和第三特征值均用于量化被访问网站的CDN节点疑似度。
可选的,第一确定子模块321具体用于:
判断域名信息对应的CName是否包含预设关键词;
若域名信息对应的CName包含预设关键词,则根据预设评分标准,确定第一特征值;
第二确定子模块322具体用于:
获取域名信息对应的所有IP地址,并去重统计IP地址的数目;
根据预设评分标准和IP地址的数目,确定第二特征值;
第三确定子模块323具体用于:
去重统计IP地址的分布区域的数目;
根据预设评分标准和IP地址的分布区域的数目,确定第三特征值。
可选的,第四确定子模块324具体用于:
获取第一特征值、第二特征值和第三特征值分别对应的权重系数;
根据第一特征值、第二特征值和第三特征值与分别对应的权重系数乘积的累加值,确定CDN节点疑似度。
可选的,判断模块33具体用于:
判断CDN节点疑似度是否超过预设阈值,若是,则判定被访问网站存在CDN节点。
可选的,CDN节点的探测装置3还包括:
模拟模块34,用于模拟客户端的域名解析请求;
发送模块35,用于将域名解析请求发送至多个域名服务器;
接收模块36,用于接收多个域名服务器分别针对域名解析请求返回的域名解析结果。
本发明实施例提供了一种CDN节点的探测装置,该装置通过根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,因此根据多个域名服务器返回的域名解析结果能够获取到对被访问网站进行分析的大量分析数据,由此提高了探测被访问网站是否存在CDN节点的准确性;另外,由于通过根据被访问网站的特征信息,确定被访问网站的CDN节点疑似度,并根据CDN节点疑似度,判断被访问网站是否存在CDN节点,因此相比较现有技术,本发明的方案能够避免在CDN节点探测过程中投入大量的设备和资源对被访问网站的所有CDN带宽进行采样分析,由此不但节省了CDN节点探测时使用的资源,同时也提高了CDN节点的探测效率。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
需要说明的是,本发明实施例中所述的“第一”、“第二”、“第三”、“第四”均是相对而言,是为了帮助本领域技术人员进一步理解本发明实施例所提供的CDN节点的探测方法和装置,并非特指或限定。
需要说明的是:上述实施例提供的CDN节点的探测装置在执行CDN节点的探测方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的CDN节点的探测装置与CDN节点的探测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种CDN节点的探测方法,其特征在于,所述方法包括:
根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,所述域名解析请求中携带有所述被访问网站的域名信息;
根据所述被访问网站的特征信息,确定所述被访问网站的CDN节点疑似度;
根据所述CDN节点疑似度,判断所述被访问网站是否存在CDN节点;
其中,所述特征信息至少包括与所述域名信息对应的CName、IP地址和所述IP地址的分布区域,所述根据所述特征信息,确定所述被访问网站的CDN节点疑似度包括:
根据所述域名信息对应的CName,确定第一特征值;
根据所述域名信息对应的IP地址,确定第二特征值;
根据所述IP地址的分布区域,确定第三特征值;
获取所述第一特征值、所述第二特征值和所述第三特征值分别对应的权重系数;
根据所述第一特征值、所述第二特征值和所述第三特征值与分别对应的权重系数乘积的累加值,确定所述CDN节点疑似度;
其中,所述第一特征值、所述第二特征值和所述第三特征值均用于量化所述被访问网站的CDN节点疑似度。
2.根据权利要求1所述的方法,其特征在于,
所述根据所述域名信息对应的CName,确定第一特征值包括:
判断所述域名信息对应的CName是否包含预设关键词;
若所述域名信息对应的CName包含所述预设关键词,则根据预设评分标准,确定所述第一特征值;
所述根据所述域名信息对应的IP地址,确定第二特征值包括:
获取所述域名信息对应的所有IP地址,并去重统计所述IP地址的数目;
根据所述预设评分标准和所述IP地址的数目,确定所述第二特征值;
所述根据所述IP地址的分布区域,确定第三特征值包括:
去重统计所述IP地址的分布区域的数目;
根据所述预设评分标准和所述IP地址的分布区域的数目,确定所述第三特征值。
3.根据权利要求1所述的方法,其特征在于,所述根据所述CDN节点疑似度,判断所述被访问网站是否存在CDN节点包括:
判断所述CDN节点疑似度是否超过预设阈值,若是,则判定所述被访问网站存在CDN节点。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
模拟客户端的域名解析请求,并将所述域名解析请求发送至所述多个域名服务器;
接收所述多个域名服务器分别针对所述域名解析请求返回的域名解析结果。
5.一种CDN节点的探测装置,其特征在于,所述装置包括:
获取模块,用于根据多个域名服务器分别针对域名解析请求返回的域名解析结果,获取被访问网站的特征信息,所述域名解析请求中携带有所述被访问网站的域名信息;
确定模块,用于根据所述被访问网站的特征信息,确定所述被访问网站的CDN节点疑似度;
判断模块,用于根据所述CDN节点疑似度,判断所述被访问网站是否存在CDN节点;
其中,所述特征信息至少包括与所述域名信息对应的CName、IP地址和所述IP地址的分布区域,所述确定模块包括:
第一确定子模块,用于根据所述域名信息对应的CName,确定第一特征值;
第二确定子模块,用于根据所述域名信息对应的IP地址,确定第二特征值;
第三确定子模块,用于根据所述IP地址的分布区域,确定第三特征值;
第四确定子模块,用于获取所述第一特征值、所述第二特征值和所述第三特征值分别对应的权重系数,根据所述第一特征值、所述第二特征值和所述第三特征值与分别对应的权重系数乘积的累加值,确定所述CDN节点疑似度;
其中,所述第一特征值、所述第二特征值和所述第三特征值均用于量化所述被访问网站的CDN节点疑似度。
6.根据权利要求5所述的装置,其特征在于,
所述第一确定子模块具体用于:
判断所述域名信息对应的CName是否包含预设关键词;
若所述域名信息对应的CName包含所述预设关键词,则根据预设评分标准,确定所述第一特征值;
所述第二确定子模块具体用于:
获取所述域名信息对应的所有IP地址,并去重统计所述IP地址的数目;
根据所述预设评分标准和所述IP地址的数目,确定所述第二特征值;
所述第三确定子模块具体用于:
去重统计所述IP地址的分布区域的数目;
根据所述预设评分标准和所述IP地址的分布区域的数目,确定所述第三特征值。
CN201710373619.0A 2017-05-24 2017-05-24 一种cdn节点的探测方法和装置 Active CN107342913B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710373619.0A CN107342913B (zh) 2017-05-24 2017-05-24 一种cdn节点的探测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710373619.0A CN107342913B (zh) 2017-05-24 2017-05-24 一种cdn节点的探测方法和装置

Publications (2)

Publication Number Publication Date
CN107342913A CN107342913A (zh) 2017-11-10
CN107342913B true CN107342913B (zh) 2020-02-07

Family

ID=60220301

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710373619.0A Active CN107342913B (zh) 2017-05-24 2017-05-24 一种cdn节点的探测方法和装置

Country Status (1)

Country Link
CN (1) CN107342913B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109167674B (zh) * 2018-07-24 2021-05-18 网宿科技股份有限公司 服务节点的评分方法、域名系统dns调度方法及服务器
CN109635027B (zh) * 2018-12-03 2022-11-25 北京安华金和科技有限公司 一种数据库访问结果集探测的实现方法
CN109818821B (zh) * 2018-12-28 2021-02-05 大唐软件技术股份有限公司 一种网站cdn架构的检测方法及装置
CN111970262B (zh) * 2020-08-07 2023-02-28 杭州安恒信息技术股份有限公司 网站的第三方服务启用状态的检测方法、装置和电子装置
CN112968980B (zh) * 2021-02-01 2023-04-18 恒安嘉新(北京)科技股份公司 一种概率确定方法、装置、存储介质及服务器
CN113411377B (zh) * 2021-05-14 2023-08-18 郑州埃文计算机科技有限公司 一种基于大型内容网站dns解析的cdn场景判定方法
CN113381904B (zh) * 2021-05-19 2022-06-21 上海交通大学 轻量级的cdn节点快速检测系统及方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103248715A (zh) * 2012-02-07 2013-08-14 北京百度网讯科技有限公司 用于cdn的位置检测方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102111309B (zh) * 2010-12-30 2013-06-26 北京世纪互联宽带数据中心有限公司 一种cdn节点的探测方法及系统
CN102932451B (zh) * 2012-10-31 2015-11-18 北龙中网(北京)科技有限责任公司 一种针对内容分发网络的解决系统
CN106603734B (zh) * 2015-10-16 2019-08-02 任子行网络技术股份有限公司 Cdn服务ip检测方法和系统
US9967227B2 (en) * 2015-11-11 2018-05-08 Fastly, Inc. Enhanced content route selection in content delivery networks

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103248715A (zh) * 2012-02-07 2013-08-14 北京百度网讯科技有限公司 用于cdn的位置检测方法及装置

Also Published As

Publication number Publication date
CN107342913A (zh) 2017-11-10

Similar Documents

Publication Publication Date Title
CN107342913B (zh) 一种cdn节点的探测方法和装置
US7454523B2 (en) Geographic location determination including inspection of network address
CN109274632B (zh) 一种网站的识别方法及装置
Dong et al. Network measurement based modeling and optimization for IP geolocation
WO2014205060A1 (en) Confidence scoring of device reputation based on characteristic network behavior
CN105917632A (zh) 用于电信中的可扩缩分布式网络业务分析的方法
CN104092791A (zh) 一种综合质量与成本的互联网内容资源调度方法和系统
CN112333299B (zh) 一种域名解析方法、配置方法及设备
CN112954089B (zh) 一种解析数据的方法、装置、设备以及存储介质
CN104219230A (zh) 识别恶意网站的方法及装置
CA2990611A1 (en) Systems and methods for categorization of web assets
CN106713242B (zh) 数据请求的处理方法及处理装置
CN109818821B (zh) 一种网站cdn架构的检测方法及装置
CN104202418B (zh) 为内容提供商推荐商业的内容分发网络的方法和系统
Seifert et al. Identification of malicious web pages through analysis of underlying dns and web server relationships
Mansoori et al. How do they find us? A study of geolocation tracking techniques of malicious web sites
CN107612946B (zh) Ip地址的检测方法、检测装置和电子设备
RU2008121872A (ru) Ближайший узел для соединений распределенных служб
CN111970262A (zh) 网站的第三方服务启用状态的检测方法、装置和电子装置
CN115190107B (zh) 基于泛域名多子系统管理方法、管理终端及可读存储介质
Chavula et al. Performance barriers to cloud services in Africa’s public sector: A latency perspective
CN104468857B (zh) 一种对应关系的获取方法及系统
CN114448849B (zh) 网站IPv6网络支持模式检测方法及电子设备
CN106789979B (zh) 一种idc机房内活跃域名的有效性诊断方法和装置
JP6481721B2 (ja) ユーザアクセスログの関連付け方法、装置、システム、プログラム及び記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant