CN113590909B - 一种基于多源信息定位域名根镜像节点地理位置的方法 - Google Patents

一种基于多源信息定位域名根镜像节点地理位置的方法 Download PDF

Info

Publication number
CN113590909B
CN113590909B CN202110856090.4A CN202110856090A CN113590909B CN 113590909 B CN113590909 B CN 113590909B CN 202110856090 A CN202110856090 A CN 202110856090A CN 113590909 B CN113590909 B CN 113590909B
Authority
CN
China
Prior art keywords
nsid
root
mirror image
domain name
geographic position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110856090.4A
Other languages
English (en)
Other versions
CN113590909A (zh
Inventor
张兆心
李超
程亚楠
陆柯羽
门浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology Weihai
Original Assignee
Harbin Institute of Technology Weihai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology Weihai filed Critical Harbin Institute of Technology Weihai
Priority to CN202110856090.4A priority Critical patent/CN113590909B/zh
Publication of CN113590909A publication Critical patent/CN113590909A/zh
Application granted granted Critical
Publication of CN113590909B publication Critical patent/CN113590909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Remote Sensing (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种基于多源信息定位域名根镜像节点地理位置的方法,其解决了现有根镜像识别方法无法确定域名解析响应的镜像节点以及无法确定具体地理位置的技术问题,其包含以下步骤:获取标识符nsid信息源,其包括通过网络爬虫获取VeriSign网站提供的根镜像地理经纬度坐标信息,构造镜像标识符nsid与地理经纬度之间的映射集合setroot_lg;或者通过主动探测数据获取;根据nsid信息确定nsid对应的地理位置。本发明可广泛应用于采用任播技术提供解析服务的环境下,发现镜像任播节点并进行地理定位的领域。

Description

一种基于多源信息定位域名根镜像节点地理位置的方法
技术领域
本发明涉及一种在域名根服务器采用任播技术提供解析服务的环境下,有效发现不同根镜像任播节点并进行地理定位的方法,特别是涉及一种基于多源信息定位域名根镜像节点地理位置的方法。
背景技术
域名系统是互联网架构中最重要的核心基础设施和战略资源,也是支撑互联网正常运行的关键基础服务。域名系统采用的是一种分布式的分层结构,其中根服务器位于最顶层,是互联网通信的入口和基础。为了提高解析效率,增强系统健壮性,以及实现解析流量的负载均衡,根服务器采用了任播技术提供域名解析服务,在全球不同地理位置部署了大量的根镜像节点。
如何定位这些根镜像节点,对于研究根的服务质量及根镜像部选址署等都至关重要。目前的方法大都是通过采用向根服务器请求id.server或bind.hostname对应的CHAOSTXT记录,从而获取根镜像标识。但这种方法主要存在以下不足:(1)在研究域名解析过程中,无法确定当次域名解析响应数据具体来自于哪个根镜像节点。因为该方法需要单独发起一次请求,才能获取根镜像标识,即使与域名解析请求一起,同时并行请求,由于根镜像选择存在抖动性,也不能保证两次请求同时命中同一个根镜像。(2)该方法获取的只是根镜像标识,不能确定根镜像节点所处的地理位置。当前,尚没有一种既能有效发现根镜像节点,又能同时确定根镜像节点地理位置的方法。
发明内容
本发明为了解决现有根镜像识别方法无法确定域名解析响应的镜像节点以及无法确定具体地理位置的技术问题,提供一种基于多源信息定位域名根镜像节点地理位置的方法。
本发明提供一种基于多源信息定位域名根镜像节点地理位置的方法,包含以下步骤:
步骤1:获取标识符nsid信息源,其包括通过网络爬虫获取VeriSign网站提供的根镜像地理经纬度坐标信息,构造镜像标识符nsid与地理经纬度之间的映射集合setroot_lg;或者通过主动探测数据获取;
步骤2:根据nsid信息确定nsid对应的地理位置。
优选地,步骤1中主动探测数据获取具体步骤包括:
步骤A:在不同地理位置分布式部署探测点,每个探测点主动向13个不同的根服务器请求顶级域名的NS记录,在请求报文中,启用扩展DNS机制中的NSID选项;同时并行获取探测点到请求根的traceroute路径信息;
步骤B:在响应报文中,获取NSID选项中本次请求响应根镜像对应的标识符nsid;在traceroute路径信息中获取倒数第N跳的IP地址,作为nsid标识的镜像节点服务器的IP;
步骤C:连续多次探测后,统计根镜像标识符nsid对应不同IP的命中概率集合,记为setid_ip
优选地,步骤B获取倒数第N跳的IP地址中N取值范围为2<=N<=4,当倒数第2跳为空时,N取3,依次取值,都为空时,视为无效数据,进入下次循环探测。
优选地,步骤2具体步骤包括:
步骤(1):遍历集合setroot_lg,查看集合中是否包含nsid对应经纬度坐标,如果包含,则根据地理经纬度确定nsid的地理位置;如果集合setroot_lg不包含,则进行步骤(2);
步骤(2):将nsid作为域名进行A记录解析,如果解析成功,则基于A记录的IP地址,通过IP定位技术,对nsid进行地理定位;如果解析失败,则进行步骤(3);
步骤(3):对nsid进行字符串规则匹配,查找nsid中是否包含国家名称及城市缩写,从而确定nsid对应的地理位置;如果匹配失败,则进行步骤(4);
步骤(4):选择nsid在集合setid_ip中对应命中概率最大的IP作为标识符的IP,最后通过IP定位技术,确定其地理位置。
本发明的有益效果是:提供了一种有发现根镜像节点并进行地理定位的方法,该方法可以确定DNS请求的响应数据具体来自哪个地理位置的根镜像节点,也可以识别出13个根全球大部分的根镜像节点,有助于研究全球范围内根镜像的服务质量以及新的根镜像部署选址等问题。同时本发明思路,也可以应用于研究任播技术的其他应用方向。本发明基于多种信息源,通过4种定位策略对域名根镜像节点进行了有效定位,解决了在使用任播技术的环境下,域名根镜像节点难以发现及定位的问题。
附图说明
图1是本发明实施根镜像节点地理定位过程的整体流程图;
附图符号说明:
1.VeriSign根镜像经纬度数据获取模块,通过网络爬虫获取VeriSign网站(https://root-servers.org/archives/)提供的部分根镜像经纬度数据;
2.根镜像地理经纬度集合setroot_lg,从模块1中提取每个nsid对应的地理经纬度;
3.探测点分布式部署模块,该模块需要在不同地理位置部署多个探测点,每个探测点并行运行nsid探测和traceroute路径追踪程序;
4.获取根镜像nsid模块,在DNS响应报文中,获取响应根镜像的标识符nsid;
5.获取traceroute路径中倒数第N跳IP模块,提取每次路径追踪中倒数第N跳中的IP地址(2<=N<=4);
6.集合setid_ip,每次探测任务结束,将nsid与倒数第N跳IP构成一个元组,循环多次探测后,统计对应nsid不同IP的命中概率;
7.输入定位数据模块,该模块是在集合setid_ip数据收敛后,分别输入需要识别定位的nsid,定位所需的两个集合setroot_lg和setid_ip
8.判断集合setroot_lg是否包含nsid模块,判定nsid在集合setroot_lg中是否有对应的地理经纬度坐标,如果有,则通过逆地理编码技术,根据经纬度确定其地理位置;否则,根据流程进入一下识别模块;
9.判定nsid是否为域名,能否解析其A记录模块,通过将nsid作为域名进行A记录解析,如果解析成功,提取A记录中的IP地址,通过IP地址定位技术,确定nsid对应的地理位置;如果解析失败,则根据流程进入下一模块判定其地理位置;
10.nsid字符串规则匹配模块,匹配查找nsid中是否包含国家名称缩写及城市缩写,通过遍历国家城市名称字典数据,从而确定nsid对应的地理位置;
11.集合setid_ip定位模块,在集合中取nsid对应命中概率最大的IP,通过IP地址定位技术,确定nsid对应的地理位置。
具体实施方式
下面结合附图和实施例对本发明做进一步说明,以使本发明所属技术领域的技术人员能够容易实施本发明。
实施例:如图1所示,本发明实施根镜像节点地理定位过程的整体流程图,通过多源信息定位根镜像节点地理位置的过程,主要包含以下步骤:
步骤1:定位所依赖数据源的获取过程,步骤如下:
步骤1):通过网络爬虫获取VeriSign网站提供的部分根镜像地理经纬度坐标信息(网站https://root-servers.org/archives/)。VeriSign是A根和J根的管理机构,会不定期发布全球根镜像的相关信息,其中包含了部分少量根镜像节点的地理经纬度坐标信息,提取该部分信息并构造镜像标识符nsid与地理经纬度之间的映射集合setroot_lg。
步骤2):主动探测数据获取。由于根镜像任播的特性,需要尽可能多的在不同地理位置部署探测点,具体部署地理范围由自身的研究目标决定,例如研究某个国家内部所在根镜像节点的情况,则需要在国家范围内部署探测点即可;如果是需要研究全球范围根镜像节点,则需要在全球尽可能多的部署探测点,考虑到开销会比较大,建议使用RIPE Atlas或PlanetLab等全球公开网络测量平台上的节点进行部署。在每个探测点上并行获取根镜像节点nsid和traceroute路径信息。
主动探测数据获取具体步骤:通过启用扩展DNS(EDNS)中的NSID选项,构造DNS请求报文,循环向13个根服务器主动发起顶级域名NS请求,在响应报文中提取NSID选项字段的内容,记为nsid,该nsid即为响应本次请求的根镜像节点标识符。同时,并行获取探测点到根服务器之间的traceroute路径信息,提取倒数第N跳IP地址作为本次nsid对应根镜像节点服务器的IP。N取值范围为2<=N<=4,当倒数第2跳为空时,取第3跳,依次取值。N的范围不易多大,否则影响定位的准确性,当所有取值探测数据都为空时,不统计,进入下次循环探测。
由于根镜像选择存在抖动的情况,即前后两次向同一个根请求,但获取的nsid不同,所以一个nsid可能会对应多个不同的IP。因此,当所有探测点获取到的nsid个数趋于收敛稳定后,统计每个nsid的IP命中概率率,即对应的不同IP出现次数与总请求次数的比值,构造nsid与IP命中概率之间的映射集合setid_ip。命中概率越大,表明该IP为nsid对应根镜像服务器IP的可能性就越大。
步骤2:nsid对应地理位置的定位过程,步骤如下:
步骤(1):首先查找集合setroot_lg中是否包含需要定位nsid的地理经纬度坐标,如果存在,则基于逆地理编码技术,根据经纬度坐标确定nsid对应的地理位置;否则通过步骤(2)进一步定位。
步骤(2):由于EDNS的NSID选项内容格式没有标准化,所以根镜像节点在配置NSID内容时,有些节点会设置为只起标识作用的某个字符串,也有的会将节点的域名作为标识符。因此首先判断nsid是否为域名,通过将nsid作为域名请求其A记录,如果响应成功,表明该nsid为其标识根镜像节点服务器的域名,A记录的IP地址为节点服务器的IP,进而通过IP定位技术,得到该镜像节点对应的地理位置。如果响应失败,表明nsid非域名,则需要通过步骤(3)进一步定位。
步骤(3):通过对nsid进行字符串规则匹配,查找nsid中是否包含国家及城市名称缩写,进而遍历国家城市名称字典数据,确定nsid对应的地理位置。否则需要通过步骤(4)进一步定位。
步骤(4):通过集合setid_ip查找需要识别nsid对应的映射IP,选择命中概率最大的IP作为该nsid对应镜像节点服务器的IP,再通过IP定位技术确定其地理位置。
以上所述仅对本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡是在本发明的权利要求限定范围内,所做的任何修改、等同替换、改进等,均应在本发明的保护范围之内。

Claims (3)

1.一种基于多源信息定位域名根镜像节点地理位置的方法,其特征是,包含以下步骤:
步骤1:获取标识符nsid信息源,其包括通过网络爬虫获取VeriSign网站提供的根镜像地理经纬度坐标信息,构造镜像标识符nsid与地理经纬度之间的映射集合setroot_lg;或者通过主动探测数据获取;所述步骤1中主动探测数据获取具体步骤包括:
步骤A:在不同地理位置分布式部署探测点,每个探测点主动向13个不同的根服务器请求顶级域名的NS记录,在请求报文中,启用扩展DNS机制中的NSID选项;同时并行获取探测点到请求根的traceroute路径信息;
步骤B:在响应报文中,获取NSID选项中本次请求响应根镜像对应的标识符nsid;在traceroute路径信息中获取倒数第N跳的IP地址,作为nsid标识的镜像节点服务器的IP;
步骤C:连续多次探测后,统计根镜像标识符nsid对应不同IP的命中概率集合,记为setid_ip;
步骤2:根据nsid信息确定nsid对应的地理位置。
2.根据权利要求1所述基于多源信息定位域名根镜像节点地理位置的方法,其特征在于,所述步骤B获取倒数第N跳的IP地址中N取值范围为2<=N<=4,当倒数第2跳为空时,N取3,依次取值;都为空时,视为无效数据,进入下次循环探测。
3.根据权利要求1所述基于多源信息定位域名根镜像节点地理位置的方法,其特征在于,所述步骤2具体步骤包括:
步骤(1):遍历集合setroot_lg,查看集合中是否包含nsid对应经纬度坐标,如果包含,则根据地理经纬度确定nsid的地理位置;如果集合setroot_lg不包含,则进行步骤(2);
步骤(2):将nsid作为域名进行A记录解析,如果解析成功,则基于A记录的IP地址,通过IP定位技术,对nsid进行地理定位;如果解析失败,则进行步骤(3);
步骤(3):对nsid进行字符串规则匹配,查找nsid中是否包含国家名称及城市缩写,从而确定nsid对应的地理位置;如果匹配失败,则进行步骤(4);
步骤(4):选择nsid在集合setid_ip中对应命中概率最大的IP作为标识符的IP,最后通过IP定位技术,确定其地理位置。
CN202110856090.4A 2021-07-28 2021-07-28 一种基于多源信息定位域名根镜像节点地理位置的方法 Active CN113590909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110856090.4A CN113590909B (zh) 2021-07-28 2021-07-28 一种基于多源信息定位域名根镜像节点地理位置的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110856090.4A CN113590909B (zh) 2021-07-28 2021-07-28 一种基于多源信息定位域名根镜像节点地理位置的方法

Publications (2)

Publication Number Publication Date
CN113590909A CN113590909A (zh) 2021-11-02
CN113590909B true CN113590909B (zh) 2023-09-19

Family

ID=78250908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110856090.4A Active CN113590909B (zh) 2021-07-28 2021-07-28 一种基于多源信息定位域名根镜像节点地理位置的方法

Country Status (1)

Country Link
CN (1) CN113590909B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117149931B (zh) * 2023-08-30 2024-05-24 北京锐星远畅科技有限公司 一种探测点位置与探测设备节点的坐标快速匹配方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015158193A1 (zh) * 2014-04-18 2015-10-22 北京奇虎科技有限公司 提供根域名解析服务的方法和系统
CN110113442A (zh) * 2019-04-19 2019-08-09 大唐软件技术股份有限公司 一种dns镜像服务器的位置确定方法和装置
CN111034236A (zh) * 2017-09-12 2020-04-17 索尼公司 多频带毫米波网络发现

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8831645B2 (en) * 2008-11-24 2014-09-09 Tekelec, Inc. Methods, systems, and computer readable media for providing geo-location proximity updates to a presence system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015158193A1 (zh) * 2014-04-18 2015-10-22 北京奇虎科技有限公司 提供根域名解析服务的方法和系统
CN111034236A (zh) * 2017-09-12 2020-04-17 索尼公司 多频带毫米波网络发现
CN110113442A (zh) * 2019-04-19 2019-08-09 大唐软件技术股份有限公司 一种dns镜像服务器的位置确定方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于主动测量的CN权威镜像选址效果评估;陈闻宇;肖中南;徐彦之;;科技导报(12);全文 *

Also Published As

Publication number Publication date
CN113590909A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
KR101620299B1 (ko) 이동 단말기의 네비게이션 기능에 기반한 사진 위치확인 방법 및 시스템
US10928218B2 (en) Map information management and correction of geodata
CN103004102B (zh) 地理定位系统及方法
US9729504B2 (en) Method of near real-time automated global geographical IP address discovery and lookup by executing computer-executable instructions stored on a non-transitory computer-readable medium
US9110982B1 (en) Method, system, and computer program product for obtaining crowd-sourced location information
US7929535B2 (en) Geolocation-based addressing method for IPv6 addresses
WO2014161228A1 (zh) 使用移动终端的位置数据来定位ip位置的方法和服务器
US20170046743A1 (en) Identifying the Physical Location of Internet Service Providers
CN108027800A (zh) 使用跟踪路由进行地理定位的方法、系统和装置
US8260313B1 (en) Apparatus and method for modifying service-access-point data within the apparatus
CN111447292B (zh) 一种IPv6地理位置定位方法、装置、设备及存储介质
CN113590909B (zh) 一种基于多源信息定位域名根镜像节点地理位置的方法
Ciavarrini et al. Smartphone-based geolocation of Internet hosts
Li et al. Geocam: An ip-based geolocation service through fine-grained and stable webcam landmarks
CN111194001A (zh) Lte指纹定位校正的方法、装置及系统
CN109729123B (zh) 一种广告投放地域的监测方法和装置
CN113779165B (zh) Ip地址地理位置歧义判定方法及相关设备
US10783169B1 (en) Inferring user interests from geo-location reports
Hong et al. A cheap and accurate delay-based IP Geolocation method using Machine Learning and Looking Glass
Liu et al. Street-level landmark mining algorithm based on radar search
Wang et al. One-geo: client-independent ip geolocation based on owner name extraction
JP5992544B2 (ja) ユーザ情報を提供する方法、装置及びコンピュータ記憶媒体
Chen et al. A rapid method for detecting geographically disconnected areas after disasters
CN115396397B (zh) 基于转发关系确定缓存域名系统服务范围的方法和装置
CN108055361B (zh) 一种利用公共服务的虚拟机定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant