CN109165334B - 一种建立cdn厂家基础知识库的方法 - Google Patents

一种建立cdn厂家基础知识库的方法 Download PDF

Info

Publication number
CN109165334B
CN109165334B CN201811100278.0A CN201811100278A CN109165334B CN 109165334 B CN109165334 B CN 109165334B CN 201811100278 A CN201811100278 A CN 201811100278A CN 109165334 B CN109165334 B CN 109165334B
Authority
CN
China
Prior art keywords
cdn
domain name
information
subnet
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811100278.0A
Other languages
English (en)
Other versions
CN109165334A (zh
Inventor
张振涛
张健
石磊
张峰晓
杨满智
蔡琳
陈晓光
金红
刘长永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eversec Beijing Technology Co Ltd
Original Assignee
Eversec Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eversec Beijing Technology Co Ltd filed Critical Eversec Beijing Technology Co Ltd
Priority to CN201811100278.0A priority Critical patent/CN109165334B/zh
Publication of CN109165334A publication Critical patent/CN109165334A/zh
Application granted granted Critical
Publication of CN109165334B publication Critical patent/CN109165334B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种建立CDN厂商基础知识库的方法,该方法包括:通过爬虫,获得网站上所有CDN厂家信息;被动采集全国各个域名解析服务器的域名解析记录,获得所有的域名解析信息;针对所有的解析域名进行字典表比照、CNAME聚类、IP分散度判别等综合判定,获得CDN子网信息;针对CDN子网域名信息依据字典表关联、备案库查询、whois查询、人工判别等手段建立与CDN厂商的对应关系,并形成最终的CDN厂商的子网域名和加速节点IP地址基础知识库。本发明公开的方法能够较为全面地发现CDN厂商的加速节点,并建立CDN厂商子网域名、加速节点IP地址等基础知识库,从而为CDN业务的行业发展和有效管理提供一定的技术支撑。

Description

一种建立CDN厂家基础知识库的方法
技术领域
本发明涉及互联网技术领域,特别涉及一种建立CDN厂家基础知识库的方法。
背景技术
互联网迅猛发展,CDN作为一种为最终用户提供快速网页浏览、视频播放和文件下载的内容分发技术,在互联网中占据越来越重要的地位。本发明的技术方法,基于编写简单的爬虫工具、结合工信部已建的全国DNS信息安全管理系统中采集的域名和IP地址数据、采用字典表关联、CNAME聚类、IP分散度分析、备案库查询、whois查询等综合技术,构建了较为完整的CDN厂家的子网域名和节点IP地址知识库,对于从整体上掌握CDN行业的发展和行业管理起到了很好的技术支撑作用。
发明内容
为了更有效地对CDN厂家基础资源,包括CDN子网域名、节点IP地址、接入点数量、接入点所在国家/地区等进行准确的掌握,从而从整体上支持CDN行业发展和行业管理,本发明提出了一种建立CDN厂商基础知识库的方法。
本发明的技术方案如下:
通过爬虫主动爬取https://www.cdnplanet.com网站,获得CDN厂家信息;
通过DNS信安系统被动采集全国解析的域名和IP地址信息;
针对域名进行字典表关联、CNAME聚类、IP分散度判别,从而形成CDN子网域名列表,并标定相应的相似度;
针对CDN子网域名列表通过字典表关联、备案查询、whois查询、人工判别等手段,建立与CDN厂家的关联关系;
基于以上数据,建立CDN厂家基础资源库,具体包括:厂家名称、CDN子网域名、CDN节点IP、CDN节点所在国家、CDN节点所在地点,通过统计汇总可以分析出每个CDN厂家的节点数、分布情况、业务量(接入的加速域名数量)等行业管理急需的基础数据。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的建立CDN厂商基础知识库的方法的流程图。
图2为本发明实施例中的CDN厂商信息采集的流程示意图。
图3为本发明实施例中的域名解析信息采集的流程示意图。
图4为本发明实施例中的CDN子网域名判别的流程示意图。
图5为本发明实施例中的字典表管理的流程示意图。
图6为本发明实施例中的字典表样例的示意图。
图7为本发明实施例中的域名数量聚类的计算流程图。
图8为本发明实施例中的IP分散度的计算流程图。
图9为本发明实施例中的CDN厂商数据关联的流程图。
具体实施方式
1、定义
1.1域名(Domain Name)
本发明方法中所指的域名(Domain Name)是指,由一串用点分隔的名字组成的互联网上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。域名采用分级结构,最高级为根域名,其次为顶级域名,再次为一级域名,二级域名,三级域名等。如.为根域名,.com、.cn为顶级域名,google.com为一级域名,www.google.com为二级域名。
1.2 CDN(Content Delivery Network)
本发明方法中所指的CDN是指提供内容加速服务的一种互联网技术。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳定。通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络,CDN系统能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。其目的是使用户可就近取得所需内容,解决Internet网络拥挤的状况,提高用户访问网站的响应速度。一般来说,采用CNAME的方式来实现CDN加速技术是一种常见的技术,CNAME的原理是,被加速域名在现有域名解析体系中不保留A记录,而只是保留CNAME记录,而CNAME记录对应的真实IP地址由CDN网络依据实际情况动态解析出来,返回给最终的用户。如www.google.com是通过阿卡曼CDN加速的,它的CNAME为www.google.com.akamaized.net
1.3 CDN厂家
本发明方法中所指的CDN厂家,是指运营CDN业务的企业、个人或组织。如阿卡曼、阿里、腾讯等。CDN厂家运营CDN网络一般需要申请单独的CDN域名,该域名所属的命名空间均为该域名加速的范围,构成了一个逻辑上相对独立的网络空间,因此,一般也把CDN域名叫做子网域名。一般来说,为了达到大部分用户良好的客户感受度,一个CDN域名(子网域名)会对应多台地域分散的物理服务器,为最近的用户提供互联网服务。这些服务器都有独立的IP地址,每一个独立的IP地址叫做该子网的一个加速节点。
1.4 CDN域名(子网域名)
本发明方法中所指的CDN域名,也叫子网域名,是指CDN厂家运营的用于CDN加速的相对独立的有相同CNAME后缀域名的域名。例如,阿卡曼运营的akamaized.net、akamai.net均为其CDN域名,每个CDN域名下都可以接入很多被加速的网站域名。
1.5节点
本发明方法中所指的节点是指CDN网络中在同一个子网内的物理服务器对应的一个IP地址。一般而言一个物理服务器至少对应一个IP地址,有时会有多个IP地址,这时我们把它看作多个节点。
1.6 DNS信安系统
本发明方法中所指的DNS信安系统是指由工信部建设的部、省、企业三级采集监测和信安处置系统,支持基础资源上报、解析域名和IP采集、信息安全监测、信息安全处置、访问日志留存等功能。
1.7 CDN厂商基础知识库
本发明方法中所指的CDN厂商基础知识库是指本发明方法建立的知识库,包括:CDN厂商名称、CDN子网域名、CDN节点IP、CDN节点所在国家、CDN节点所在地点等基本知识库,以及由基本知识库通过统计汇总可以得到的每个CDN厂家的节点数、分布情况、业务量等知识数据。
2、CDN厂商基础知识库建立方法
如图1所示,本发明实施例所公开的建立CDN厂商基础知识库的方法,包括如下步骤:
步骤101、通过爬虫主动爬取https://www.cdnplanet.com网站,获得CDN厂家信息;
步骤102、通过DNS信安系统被动采集全国解析的域名和IP地址信息;
步骤103、针对域名进行字典表关联、CNAME聚类、IP分散度判别,从而形成CDN子网域名列表,并标定相应的相似度;
步骤104、针对CDN子网域名列表通过字典表关联、备案查询、whois查询、人工判别等手段,建立与CDN厂家的关联关系;
步骤105、基于以上数据,建立CDN厂家基础资源库,具体包括:厂家名称、CDN子网域名、CDN节点IP、CDN节点所在国家、CDN节点所在地点,通过统计汇总可以分析出每个CDN厂家的节点数、分布情况、业务量(接入的加速域名数量)等行业管理急需的基础数据。
下面来对上述各个步骤的具体过程进行详细描述。
2.1 CDN厂商信息采集算子
CDN厂商采集算子的计算流程见附图1。
参照图1所示,CDN厂商采集算子每天(可根据系统需要进行调整)连接一次网站https://www.cdnplanet.com,从“select from all countries”中依次选择每个国家,针对每个国家的连接页面爬取CDN厂商的列表信息,包括:CDN、POP count、POP locations,然后将所有信息汇总为一个关于CDN厂商的总表L1,包括:CDN厂商,对应CDN字段、所在国家,对应“select from all countries”中选择的国家、所在地点,对应POP locations字段、节点数量,对应POP count字段。
2.2域名解析信息采集算子
域名解析信息采集算子每天(可根据系统需要进行调整)从DNS信安系统中同步一次全国的域名解析数据,并加上当前时间标签,形成本地的域名解析数据库D1。
域名解析信息采集算子的具体流程见附图2。
通过定时器设定采集的时间,定时器时间到,通过接口访问DNS信安系统,并获取全国的域名解析数据,包括:域名、IP地址类型、IP地址、存货时间、最近上报时间,之后将数据保存在本地,形成本地域名解析库D1,包括:域名、IP地址类型、IP地址、存货时间、最近上报时间、入库时间。然后等待下一个计时器触发,再次爬取,如此循环。
2.3 CDN子网域名判定算子
CDN子网域名判定算子的总体计算流程见附图3。
CDN子网域名判定算子根据D1中的所有域名,首先调用字典表关联算子,将D1中所有域名划分为匹配成功的集合D2和匹配不成功的集合D3,把已知的CDN子网域名相关联的域名滤除,然后针对剩余的域名,也即依据D3中的所有域名,调用域名数量聚类算子进行计算,生成一个森林F1,之后按照系统配置的策略,对数量明显偏少的树和节点进行裁剪,对F1中每棵树的每个结点进行CDN域名相似度的判定,得到判定森林F2,在对F2中的每个节点对应的域名下挂的域名进行IP分散度检测算子的判别,剔除分散度太低的节点后生成森林F3,最后基于F3,将F3中每棵树的每个叶子节点信息捡摘出来,生成CDN子网域名列表库D4。
字典表关联算子的计算流程见附图4。
针对字典表中每一个CDN CNAME与D1中每个域名进行子串右匹配,如匹配成功,则将域名加入D2中,如匹配失败,则将域名加入D3中。字典表的样例见附图5。cname指别名记录也被称为规范名字,这种记录允许将多个名字映射到同一台计算机。所述子串右匹配是指:首先被查询的字符串要比待查询的字符串(也叫目标字符串)长,也就是说,目标字符串是被查询字符串的严格真子串;右匹配是指从字符串的右侧开始向左匹配;比如(1)目标字符串hichina.com、被查询字符串www.baidu.com.hichina.com,这样按照子串右匹配就匹配上了。(2)目标字符串hichina.com、被查询字符串hichina.com不认为匹配上,因为不是真子串。(3)目标字符串hichina.com、被查询字符串www.baidu.com.hichina.com.cdncache.com也不认为匹配上,因为不是右匹配。
域名数量聚类算子的计算流程见附图6。
首先,提取D3中所有的一级域名、二级域名、三级域名,形成待判定的CDN子网域名总表R1;针对R1中每个域名按照子串右匹配算法与D3中所有域名进行比较,并记录命中数量,以及与其关联的域名集合,该集合实质为D3的一个子集;然后,针对R1中所有的CDN子网域名按照域名的层级关系进行关联,形成一个森林F0,F0由很多树构成,每棵树最高为3层,根为最高的一级的域名,二级节点为根的下一级域名,三级节点为二级节点的下一级域名,每个节点具有两个属性:域名和聚类到该域名上的域名数量(也即该域名为空间的所有D3中域名总数);最后,针对F1中的每棵树从树根开始递归数量裁剪操作,即树根对应的域名数量减去其所有直接子节点对应的域名数量之和作为新的树根对应的域名数量,下一级节点以此类推。所有节点都进行完操作后的森林计为F1,F1由很多树构成,每棵树最高为3层,根为最高的一级的域名,二级节点为根的下一级域名,三级节点为二级节点的下一级域名,每个节点具有两个属性:域名和聚类到该域名上的域名数量(不含其下级域名聚类的数量)。
系统配置策略是依据经验值设定的数量区间,一般来说,CDN加速的域名数量不会太少,因此,在区间集合下限以下的CDN子网域名可以裁剪掉,在区间以上的可能性更大,在区间中的可能性较大。依据经验,本发明方法确认的数量区间为[500,2000],区间对应的CDN域名相似度为{20%,50%,70%},实际应用时,可以设置更为细致的区间集合和相似度集,用户可以依据情况进行调整。
IP分散度是对以上步骤中判断为相似度50%(含)以上的T2中每颗树的每个节点的域名在D3中相关联的IP地址数量、地域分布情况等进行判别,如果IP地址数量较多、地域分布较广,则相应CDN域名的相似度应该进行提高,即相应CDN域名更为可能是真正的CDN加速域名。
IP分散度检测算子的计算流程见附图7。其中的置信区间和系数集合均可以依据实际数据测试结果进行调整。
首先,针对F2中每个CDN域名检测其下挂域名(随机抽取M个)的IP地址关联数量,计为N1、N2、…、NM,计算平均数量NUM=(N1+N2+…NM)/M,设置信区间[5,10],对应的IP地址数量系数为lambda1∈{0.8,1.0,1.2};
其次,针对以上IP地址判断其所属地域,并记录不同的地域数为S1、S2、…、SM,计算平均数量SUM=(S1+S2+…+SM)/M,设置信区间[3,6],对应的IP地址数量系数为lambda2∈{0.8,1.0,1.2};
该CDN域名判断IP分散度指数为lambda=lambda1*lambda2;
该CDN域名的相似度最终判定为其原有相似度*lambda;
F2中所有节点都按照以上过程处理完成之后,剔除掉70%以下相似度的节点后形成的森林为F3。
2.4 CDN厂家关联算子
CDN厂商关联算子的计算流程见附图8。
CDN厂家关联算子首先基于字典表中的CDN域名对D4中的CDN域名进行关联,关联上CDN厂家,然后将L1表中CDN厂家的相关信息关联上;然后针对D4中剩余的CDN域名查询备案库,并关联相关厂家信息;再对D4中剩余的CDN域名通过whois查询关联上相关厂家信息;最后对D4中剩余的CDN域名进行人工标注厂家信息,也可以对上面两步中的个别数据进行人工核验修正;经过以上处理的D4中的CDN域名都可以关联上厂家信息(个别无法判断的,设置为空)、IP地址信息、国家信息、接入地信息(IP地址所在地),形成最终的CDN厂商基础信息知识库D5,D5中的数据包含:厂家名称、CDN子网域名、CDN节点IP、CDN节点所在国家、CDN节点所在地。
本发明公开的方法能够较为全面地发现CDN厂商的加速节点,并建立CDN厂商子网域名、加速节点IP地址等基础知识库,从而为CDN业务的行业发展和有效管理提供一定的技术支撑。

Claims (6)

1.一种建立CDN厂商基础知识库的方法,其特征在于,所述方法包括:
通过爬虫方式主动爬取CDN厂商信息;
通过接口方式被动接收全国所有域名解析服务器解析的域名和IP地址信息;
针对上步中的域名进行字典表比照、CNAME聚类、IP分散度判别,获得CDN子网信息;
针对CDN子网域名信息依据字典表关联、备案库查询、whois查询、人工判别手段建立与CDN厂商的对应关系;
基于上述步骤,建立最终的CDN厂商的子网域名和加速节点IP地址基础知识库;
其中,所述针对域名进行字典表比照、CNAME聚类、IP分散度判别,获得CDN子网信息,包括:
先基于已知的CDN域名字典表对获取的所有域名进行比照过滤,并把相关的域名关联到对应的CDN域名子网上,然后针对剩下的所有域名按照一级域名、二级域名、三级域名进行基于下级域名数量的树形聚类,并依据系统阈值策略的设置,判定相应的一级域名、二级域名、三级域名为CDN域名子网的相似度,最后对于相似度较高的CDN子网接入的域名,判定其IP地址的分散度,依据分散度判定盖CDN域名子网的最终相似度,其中,针对同一个域名,IP地址越分散,说明其通过CDN加速节点进行加速可能性越高。
2.根据权利要求1所述的方法,其特征在于,所述通过爬虫方式主动爬取CDN厂商信息,是指通过HTTP爬虫,爬取网站:https:// www.cdnplanet.com,对应的页面,获得CDN厂商信息,具体包括:CDN厂商名称、业务覆盖国家、节点数、节点所在地信息。
3.根据权利要求1所述的方法,其特征在于,通过接口方式被动接收全国所有域名解析服务器解析的域名和IP地址信息,包括:
通过程序接口每天接收全国DNS信息安全管理系统上报的全国当天解析的域名和对应IP地址记录,具体包括:域名、IP版本、IP地址、老化时间信息。
4.根据权利要求1所述的方法,其特征在于,所述针对CDN子网域名信息依据字典表关联、whois查询、备案库查询、人工判别手段建立与CDN厂商的对应关系,包括:
先基于CDN子网域名特征在字典表中进行关联查找对应的CDN厂家信息,如果有,就将CDN子网域名与该厂家关联,如果没有,通过备案查询接口进行查询,如果查询到厂家信息,将其与CDN子网域名关联,如果没有查到,通过whois查询对应的厂家信息,并将查询的结果与CDN子网域名关联,如果都没有查到,暂时不关联厂家信息,最后通过人工对whois关联的厂家信息以及暂时关联不上厂家信息的记录进行确认和补全。
5.根据权利要求4所述的方法,其特征在于,所述建立最终的CDN厂商的子网域名和加速节点IP地址基础知识库,是指通过以上各步骤,建立起CDN厂家的基础知识库,具体包括:CDN厂家名称、CDN子网域名、CDN节点数量、CDN节点所在国家、CDN节点所在地点、CDN节点IP地址。
6.根据权利要求4所述的方法,其特征在于,CNAME聚类的判定过程为:
根据形成的本地的域名解析数据库D1中的所有域名,分为匹配成功的集合D2和匹配不成功的集合D3;
提取D3中所有的一级域名、二级域名、三级域名,形成待判定的CDN子网域名总表R1;
针对R1中每个域名按照子串右匹配算法与D3中所有域名进行比较,并记录命中数量,以及与其关联的域名集合;
针对R1中所有的CDN子网域名按照域名的层级关系进行关联,形成一个森林F0,F0由多棵树构成,每棵树最高为3层,根为最高的一级的域名,二级节点为根的下一级域名,三级节点为二级节点的下一级域名,每个节点具有两个属性:域名和聚类到该域名上的域名数量;
CDN子网域名判定算子根据域名解析数据库D1中的所有域名,首先调用字典表关联算子,将D1中所有域名划分为匹配成功的集合D2和匹配不成功的集合D3,把已知的CDN子网域名相关联的域名滤除,然后针对剩余的域名,也即依据D3中的所有域名,调用域名数量聚类算子进行计算,生成一个森林F1,针对森林F1中的每棵树从树根开始递归数量裁剪操作,树根对应的域名数量减去其所有直接子节点对应的域名数量之和作为新的树根对应的域名数量。
CN201811100278.0A 2018-09-20 2018-09-20 一种建立cdn厂家基础知识库的方法 Active CN109165334B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811100278.0A CN109165334B (zh) 2018-09-20 2018-09-20 一种建立cdn厂家基础知识库的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811100278.0A CN109165334B (zh) 2018-09-20 2018-09-20 一种建立cdn厂家基础知识库的方法

Publications (2)

Publication Number Publication Date
CN109165334A CN109165334A (zh) 2019-01-08
CN109165334B true CN109165334B (zh) 2022-05-27

Family

ID=64879983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811100278.0A Active CN109165334B (zh) 2018-09-20 2018-09-20 一种建立cdn厂家基础知识库的方法

Country Status (1)

Country Link
CN (1) CN109165334B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113347139B (zh) * 2020-03-02 2022-11-22 深信服科技股份有限公司 一种识别安全信息的方法、装置、系统和介质
CN111970262B (zh) * 2020-08-07 2023-02-28 杭州安恒信息技术股份有限公司 网站的第三方服务启用状态的检测方法、装置和电子装置
CN112015910B (zh) * 2020-08-20 2024-05-17 恒安嘉新(北京)科技股份公司 域名知识库的生成方法、装置、计算机设备及存储介质
CN115277633A (zh) * 2022-01-24 2022-11-01 中国电子信息产业集团有限公司第六研究所 域名描述方法、电子设备及存储介质
CN115361358B (zh) * 2022-08-19 2024-02-06 山石网科通信技术股份有限公司 Ip的提取方法、装置、存储介质及电子装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1017204A2 (en) * 1998-12-28 2000-07-05 Fujitsu Limited Relaying apparatus for use in a network system
CN102546854A (zh) * 2012-01-10 2012-07-04 上海西默通信技术有限公司 一种域名和服务器建立http连接的域名解析方法
CN103595576A (zh) * 2013-10-31 2014-02-19 赛尔网络有限公司 一种基于内容提供商标识的互联口icp流量统计系统及方法
CN104038363A (zh) * 2013-10-24 2014-09-10 南京汇吉递特网络科技有限公司 一种对ccdn提供商信息进行采集及统计的方法
CN105704259A (zh) * 2016-01-21 2016-06-22 中国互联网络信息中心 一种域名权威服务来源ip识别方法和系统
CN106776768A (zh) * 2016-11-23 2017-05-31 福建六壬网安股份有限公司 一种分布式爬虫引擎的url抓取方法及系统
CN108040076A (zh) * 2018-02-06 2018-05-15 中国互联网络信息中心 基于Spark Streaming的DNS水刑攻击处理方法及系统
CN108270761A (zh) * 2017-01-03 2018-07-10 中国移动通信有限公司研究院 一种域名合法性检测方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7373416B2 (en) * 2003-04-24 2008-05-13 Akamai Technologies, Inc. Method and system for constraining server usage in a distributed network
US20120254333A1 (en) * 2010-01-07 2012-10-04 Rajarathnam Chandramouli Automated detection of deception in short and multilingual electronic messages

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1017204A2 (en) * 1998-12-28 2000-07-05 Fujitsu Limited Relaying apparatus for use in a network system
CN102546854A (zh) * 2012-01-10 2012-07-04 上海西默通信技术有限公司 一种域名和服务器建立http连接的域名解析方法
CN104038363A (zh) * 2013-10-24 2014-09-10 南京汇吉递特网络科技有限公司 一种对ccdn提供商信息进行采集及统计的方法
CN103595576A (zh) * 2013-10-31 2014-02-19 赛尔网络有限公司 一种基于内容提供商标识的互联口icp流量统计系统及方法
CN105704259A (zh) * 2016-01-21 2016-06-22 中国互联网络信息中心 一种域名权威服务来源ip识别方法和系统
CN106776768A (zh) * 2016-11-23 2017-05-31 福建六壬网安股份有限公司 一种分布式爬虫引擎的url抓取方法及系统
CN108270761A (zh) * 2017-01-03 2018-07-10 中国移动通信有限公司研究院 一种域名合法性检测方法及装置
CN108040076A (zh) * 2018-02-06 2018-05-15 中国互联网络信息中心 基于Spark Streaming的DNS水刑攻击处理方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CDN/云计算加速;AppEx;《https://blog.51cto.com/appexnetworks/965602》;20120817;第1页 *
Classifying DNS Heavy User Traffic by Using Hierarchical Aggregate Entropy;Keisuke Ishibashi等;《2012 World Telecommunications Congress》;20120315;1-6 *
Fast_flux服务网络检测方法研究;汪洋;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20111215(第S2期);I139-230 *
基于多元属性特征的恶意域名检测;张洋等;《计算机应用》;20160410(第04期);941-944 *
如何使用CDN将资源请求分配到多个域名;张成威;《https://blog.csdn.net/zhangchengwei4014/article/details/49925487》;20151119;第1页 *

Also Published As

Publication number Publication date
CN109165334A (zh) 2019-01-08

Similar Documents

Publication Publication Date Title
CN109165334B (zh) 一种建立cdn厂家基础知识库的方法
CN111935136B (zh) 基于dns数据分析的域名查询与解析异常检测系统及方法
US8713676B2 (en) Systems and methods for identifying malicious domains using internet-wide DNS lookup patterns
US10171318B2 (en) System and method of identifying internet-facing assets
US9191402B2 (en) Domain classification based on client request behavior
CN109241292B (zh) 一种基于主被动数据建立域名服务器体系知识图谱的方法
US6185614B1 (en) Method and system for collecting user profile information over the world-wide web in the presence of dynamic content using document comparators
US7188094B2 (en) Indexing virtual attributes in a directory server system
KR101010302B1 (ko) Irc 및 http 봇넷 보안 관제를 위한 관리 시스템 및 그 방법
AU2016262640B2 (en) Node de-duplication in a network monitoring system
US20100174686A1 (en) Generating Equivalence Classes and Rules for Associating Content with Document Identifiers
US20020143918A1 (en) Internet protocol (IP) address proximity detection and application to peer provider location
US20180139222A1 (en) Method and device for detecting website attack
CN110365810B (zh) 基于网络爬虫的域名缓存方法、装置、设备及存储介质
CN114846462A (zh) 使用图数据结构的资产搜索发现系统
KR20140035678A (ko) 학습 가능한 dns 분석기 및 분석 방법
CN112257032B (zh) 一种确定app责任主体的方法及系统
US10171415B2 (en) Characterization of domain names based on changes of authoritative name servers
Li et al. MIND: A distributed multi-dimensional indexing system for network diagnosis
CN109688236B (zh) Sinkhole域名处理方法及服务器
CN115037720A (zh) 域名解析请求的处理方法、装置、电子设备及存储介质
CN111885220B (zh) 一种目标单位ip资产主动获取与验证方法
CN112015910B (zh) 域名知识库的生成方法、装置、计算机设备及存储介质
CN113676379A (zh) 一种dns隧道检测方法、装置、系统及计算机存储介质
CN108933843B (zh) 一种dns调度方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant