CN108768862A - 一种多接口路由器地理定位方法 - Google Patents

一种多接口路由器地理定位方法 Download PDF

Info

Publication number
CN108768862A
CN108768862A CN201810454554.7A CN201810454554A CN108768862A CN 108768862 A CN108768862 A CN 108768862A CN 201810454554 A CN201810454554 A CN 201810454554A CN 108768862 A CN108768862 A CN 108768862A
Authority
CN
China
Prior art keywords
router
multiplex roles
interface
address
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810454554.7A
Other languages
English (en)
Other versions
CN108768862B (zh
Inventor
张宇
朱金玉
张宏莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201810454554.7A priority Critical patent/CN108768862B/zh
Publication of CN108768862A publication Critical patent/CN108768862A/zh
Application granted granted Critical
Publication of CN108768862B publication Critical patent/CN108768862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种多接口路由器地理定位方法,涉及地理定位技术领域。本发明为了解决现有的以路由器为单位的地理定位方法存在需要额外测量工作或需要人工辅助解析存在定位过程难以持续更新等问题。多接口路由器的接口IP地址由于路由器交换地址空间导致地理定位不同,采用接口选举使同一台多接口路由器的不同接口IP地址定位在相同位置;根据多接口路由器的邻居路由器的定位位置来对其进行定位,采用邻居选举使相连路由器间地理位置相近;将上述两个步骤结合在一起完成多接口路由器的地理位置定位。提出的方法经实验结果表明,与相关数据集相比,本发明在可定位路由器的覆盖率和定位准确率上都有明显提升。

Description

一种多接口路由器地理定位方法
技术领域
本发明涉及地理定位技术领域。
背景技术
网络空间测绘研究内容之一是实体资源定位,即确定网络设备实体在地理空间中的位置。路由器作为构建互联网的基石,对其地理定位技术就成了能否准确绘制网络空间的关键。然而,网络空间实体多以IP地址为标识,而IP地址本身具有地理位置无关性,同时,一台路由器拥有多个IP地址也增加了定位的不确定性。因此如何对路由器实施定位既是网络空间测绘核心问题之一,更是一个难点问题。近年来,网络拓扑发现大规模的路由器级拓扑技术不断发展,探测时间、规模、覆盖度均不断提升,IP地理定位技术的准确度精确度不断提高,让逻辑拓扑映射到地理位置成为可能。
过去的研究多以IP地址为单位进行地理定位,缺少以路由器为单位的地理定位研究。以往对路由器的研究通过提取和解码路由器主机名中包含的地理信息字符串定位路由器位置,或通过建立路径-时延模型来定位路由器地理位置。这些方法通常需要额外测量工作,或人工辅助解析,难以持续更新。不仅如此,测量通常不可重现,人工参与的解析结果会因人而异,导致定位过程难以重现,定位结果难以评估。
发明内容
为了解决现有的以路由器为单位的地理定位方法存在需要额外测量工作或需要人工辅助解析存在定位过程难以持续更新,致使测量难以重现、定位过程难以重现,人工解析因人而异定位结果难以估计的问题。本发明进而提供了一种多接口路由器地理定位方法。
本发明为解决上述技术问题采取的技术方案是:
一种多接口路由器地理定位方法,所述方法的实现过程为:
步骤1、多接口路由器的接口IP地址由于路由器交换地址空间导致地理定位不同,采用接口选举(Interface Election,IE)使同一台多接口路由器的不同接口IP地址定位在相同位置;
步骤2、根据多接口路由器的邻居路由器的定位位置来对其进行定位,采用邻居选举(Neighbor Election,NE)使相连路由器间地理位置相近;
步骤3、将步骤1和步骤2结合在一起完成多接口路由器的地理位置定位。
进一步地,步骤1具体实现过程为:
利用商业IP地理定位数据库对每台多接口路由器各接口IP地址进行位置定位;
为每台多接口路由器建立位置频数矩阵;
选取频数矩阵中置信度最大值对应的位置作为该多接口路由器的定位位置;
其中:多接口路由器位置频数矩阵如下:
I中Li表示路由器接口IP地址的第i个位置,Fi表示第i个位置出现的频数,CIi表示第i个位置是路由器位置的置信度;其中CIi表示为:
进一步地,步骤2的具体过程为:
利用商业IP地理定位数据库对每台单接口路由器进行位置定位;
根据路由器间的连接关系,为每台多接口路由器建立邻居路由器位置频数矩阵;
不断迭代邻居路由器位置频数矩阵,至没有新的位置数据更新;
选取邻居路由器位置频数矩阵中置信度最大值对应的位置作为路由器定位位置;
其中,邻居路由器位置频数矩阵如下:
N中ri表示邻居路由器的第i个位置,Ii表示第i个位置出现的频数,CNi表示第i个位置是路由器位置的的置信度;其中CNi表示为:
进一步地,步骤3的具体过程为:步骤3的具体实现过程为:
将步骤1获得的多接口路由器位置频数矩阵I和步骤2获得的邻居路由器位置频数矩阵N进行结合:
式中,表示:
当I中元素Li和N中元素ri相同时,两个元素对应的频数、置信度分别均为
当I中元素Li和N中元素ri不相同时,Li元素对应的频数、置信度分别为
ri元素对应的频数、置信度分别为
本发明的有益效果是:
本发明提出了一种基于公开路由器级拓扑测量数据与商业IP地理信息的路由器定位方法—RLoc,该方法充分利用现有网络拓扑测量与IP地理定位的成果来实施定位。与以往工作相比,RLoc无需实施新的大规模网络测量,或构建及校对时延-距离模型;无需在人工辅助下解析域名、Whois、网页等IP地址相关信息。
本发明方法的实现基于以下两点事实:同一台路由器的不同接口IP地址在相同位置;相连路由器间地理位置相近,而提出的基于公开路由器级拓扑测量数据与商业IP地理定位库的多接口路由器地理定位方法--RLoc。RLoc是一种多接口路由器地理定位方法,包括接口选举方法、邻居选举方法、综合法,定位路由器地理位置。RLoc为路由器定位能够定位更多的路由器即覆盖率更大,定位结果更准确即准确率更高,方法实验易于实施与重复,结果易于更新和评估。能够实现为虚拟拓扑中设备节点定位到现实世界中地理位置。
提出的方法经实验结果表明,与相关数据集相比,本发明在可定位路由器的覆盖率和定位准确率上都有明显提升。在覆盖率上,国家级达到99.84%,城市级达到96.00%,比相关数据集分别高出0.93%和36.48%;在IXP数据验证准确率上,国家级达到82.51%,城市级达到59.45%,比相关数据集分别高出9.91%和27.20%。
附图说明
图1是本发明的流程框图;图2是单接口路由器定位示意图,图中直线上的A表示接口IP地址,图中圆圈中A表示路由器地理位置;
图3、图4和图5是三种启发式方法定位多接口路由器示意图,图3表示接口选举法示意图(Interface Election,IE),图4表示邻居选举法示意图(Neighbor Election,NE),图5表示综合法示意图(IE+NE),图中:圆圈代表路由器,圆圈内的字母代表路由器的位置,黑色字母表示已知位置,灰色字母表示经过方法定位后的位置;圆圈的连接线表示路由器的接口IP地址,连线上的字母表示接口IP地址的位置;图3、图4表示对路由器N1、N2定位示意图;
图6为DDEC验证国家级各方法的准确率图,图7为DDEC验证城市级各方法的准确率图,图8为IXP验证国家级各方法的准确率图,图9为IXP验证城市级各方法的准确率图。
具体实施方式
具体实施方式一:如图1所示,本实施方式所述的对本发明所述的一种多接口路由器地理定位方法进行如下描述:
1、所述多接口路由器地理定位方法(RLoc)基于两点事实:1)同一台路由器的不同接口IP地址在相同位置;2)相连路由器间地理位置相近。提出了三种启发式方法,如图3至5所示,接口选举(Interface Election,IE)、邻居选举(Neighbor Election,NE)和综合法(IE+NE)。
2、所述多接口路由器地理定位方法的实现过程如下:
2.1、IE方法
RLoc充分利用同一台路由器上不同接口IP地址在相同位置这一事实,提出IE方法。
步骤:
路由器位置频数矩阵:
I中Li表示路由器接口IP地址的第i个位置,Fi表示第i个位置出现的频数,CIi表示第i个位置是路由器位置的置信度。其中CIi表示为:
例:在图3IE方法示意图中,首先,输入路由器的各接口IP地址,和商业IP地理定位数据库,为每个IP地址定位地理位置。其次为路由器建立位置频数矩阵为:
最终选择路由器的位置为A,置信度0.75。输出路由器位置A.
IE方法会出现位置歧义,即路由器有两个或几个位置拥有相同的置信度,导致定位失败的情况。
2.2、NE方法
RLoc充分利用相连路由器间地理位置相近这一事实,提出NE方法。
步骤:
其中,单接口路由器,如图1中1所示,只有一个接口IP地址,其位置为接口IP地址的位置。邻居路由器位置频数矩阵:
N中ri表示邻居路由器的第i个位置,Ii表示第i个位置出现的频数,CNi表示第i个位置是路由器位置的的置信度。其中CNi表示为:
例:在图4NE方法示意图中,首先输入路由器间连接关系、单接口路由器和商业IP地理定位数库,为每台单接口路由器地理定位。其次根据路由器间连接关系建立最初的邻居路由器位置频数矩阵:
N1、N2路由器第一次迭代的位置频数矩阵为:
根据路由器间连接关系不断迭代矩阵中信息,至不再有新的位置数据更新为止。第二次迭代的位置频数矩阵为:
最终选择N1位置为B,置信度为0.67;N2位置为A,置信度为0.8325。输出N1:B;N2:A。
NE方法会出现两种定位失败的情况:位置歧义;邻居缺失,即邻居路由器无法定位导致的频数矩阵缺失。
2.3、IE+NE方法
RLoc充分利用以上两种方法的事实依据,提出IE+NE方法。
步骤:
将两个方法的位置频数矩阵结合:
R中I与N表示各方法获得的位置频数矩阵,表示:当Li和ri相同时,频数、置信度分别均为当LI和ri不同,频数、置信度分别为
例:在图5IE+NE方法示意图中,N1、N2位置频数矩阵为:
最终选择N1位置为B,置信度为0.67,N2位置为A,置信度为0.79125。输出N1:B;N2:A。
IE+NE方法会出现位置歧义导致定位失败的情况。该方法消除了NE方法中邻居缺失而影响定位的情况。
3、对本发明的发明效果进行验证:
3.1实验数据
以CAIDA ITDK提供的2017年10月MIDAR和IFFINDER别名解析后获得的路由器级拓扑数据。对路由器级拓扑数据进行筛选及分析,删除为主机点的IP地址,获得76,520,865台路由器,其中132,175台多接口的路由器,41,666,625台单接口路由器。以2018年3月的IP2location商业地理定位数据库作为输入数据,定位了42,186,037个IP地址。
以2017年12月IXP数据、2018年3月DDEC工具获取的位置数据作为验证数据,评价各定位方法的准确率。IXP数据以IP前缀和位置映射关系定位路由器。当路由器至少一个接口IP地址在IXP数据的IP前缀中,则IP前缀的位置定位为路由器真实位置,IXP可定位1,929台路由器。DDEC数据以DDEC工具对路由器接口IP地址解析位置信息来定位。当路由器至少一个接口IP地址解析到位置,则该位置定位为路由器真实位置,DDEC数据可定位26,566个多接口路由器。
为对比评价方法,与2017年10月CAIDA发布的路由器位置数据集比较。RLoc以路由器级拓扑数据集和IP2location商业地理定位数据库为输入,而CAIDA以路由器级拓扑数据集、IXP、DDEC数据和MaxMind公开地理定位数据库为输入。其中输入的路由器级拓扑数据集相同,在相同路由器集上比较输出。
3.2实验结果
RLoc提出的EI、NI、EI+NI获得的数据与CAIDA数据的路由器定位覆盖率如表1所示表1各方法定位多接口路由器覆盖率
就覆盖率而言,EI+NI方法更好,IE在国家级优于NE,但NE在城市级优于IE。在国家级,RLoc方法定位了91.54%--99.84%,CAIDA定位了98.9%,两数据基本持平。在城市级,RLoc方法定位了83.97%--96.00%,CAIDA定位了59.52%,RLoc比CAIDA数据高出了24.45%--36.48%。
以DDEC与IXP数据分别评价RLoc方法获得的数据和CAIDA数据,在国家级、城市级路由器定位的准确率,如下图6-9所示:其中,堆积柱形图表示方法验证路由器的总数,灰色柱形表示验证正确的数量,白色柱形表示验证错误的数量。折线图表示方法的准确率。
就准确率而言,在国家级利用DDEC验证极值范围为18.50%--85.27%。RLoc为60.38%--63.20%,CAIDA为59.11%。利用IXP验证极值范围为0.62%--100.00%,RLoc为79.15%--84.78%,CAIDA为72.60%。在城市级利用DDEC验证极值范围为4.73%--52.15%,RLoc为25.23%--34.69%,CAIDA为19.15%。利用IXP验证极值范围为0.57%--96.63%,RLoc为46.01%--64.95%,CAIDA为32.25%。RLoc数据无论国家级、城市级的准确率均较CAIDA的数据有显著提升。
在DDEC数据验证准确率时,无论国家级或城市级,无论各方法或真值的极大均不高。这可能是因为DDEC方法对路由器接口IP地址定位准确率不高或该方法获得的数据并非路由器真实的位置导致。
城市级定位的准确率均较国家级准确率低。这可能是IP2location商业数据库对IP地址定位城市级准确率不高导致。RLoc提出的方法中,IE+NE较IE准确率低,这是由于NE准确率比IE的准确率低,导致IE+NE准确率低。均衡各方法的路由器定位覆盖率和准确率,IE+NE方法效果更好。
RLoc充分利用同一台路由器上不同接口IP地址在相同位置和相连路由器间地理位置相近这两个事实,具有比现有公开数据的更高的覆盖率和准确率。本文为平衡定位覆盖率和准确率选择IE+NE方法。覆盖率上,国家级达到99.8%,城市级达到96.00%,比CAIDA数据分别高出0.93%和36.48%;准确率上,IXP验证国家级达到82.51%,城市级达到59.45%,比CAIDA数据分别高出9.91%和27.20%;DDEC验证国家级到达62.70%,城市级达到32.96%,比CAIDA数据分别高出3.59%和13.81%。
RLoc无需实施新的大规模网络测量,或构建及校对时延-距离模型;无需在人工辅助下解析域名、Whois、网页等IP地址相关信息;易于实施与重复,结果易于更新和评估。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种多接口路由器地理定位方法,其特征在于,所述方法的实现过程为:
步骤1、多接口路由器的接口IP地址由于路由器交换地址空间导致地理定位不同,采用接口选举使同一台多接口路由器的不同接口IP地址定位在相同位置;
步骤2、根据多接口路由器的邻居路由器的定位位置来对其进行定位,采用邻居选举使相连路由器间地理位置相近;
步骤3、将步骤1和步骤2结合在一起完成多接口路由器的地理位置定位。
2.根据权利要求1所述的一种多接口路由器地理定位方法,其特征在于,步骤1具体实现过程为:
利用商业IP地理定位数据库对每台多接口路由器各接口IP地址进行位置定位;
为每台多接口路由器建立位置频数矩阵;
选取频数矩阵中置信度最大值对应的位置作为该多接口路由器的定位位置;
其中:多接口路由器位置频数矩阵如下:
I中Li表示路由器接口IP地址的第i个位置,Fi表示第i个位置出现的频数,CIi表示第i个位置是路由器位置的置信度;其中CIi表示为:
3.根据权利要求1或2所述的一种多接口路由器地理定位方法,其特征在于,步骤2的具体过程为:
利用商业IP地理定位数据库对每台单接口路由器进行位置定位;
根据路由器间的连接关系,为每台多接口路由器建立邻居路由器位置频数矩阵;
不断迭代邻居路由器位置频数矩阵,至没有新的位置数据更新;
选取邻居路由器位置频数矩阵中置信度最大值对应的位置作为路由器定位位置;其中,邻居路由器位置频数矩阵如下:
N中ri表示邻居路由器的第i个位置,Ii表示第i个位置出现的频数,CNi表示第i个位置是路由器位置的的置信度;其中CNi表示为:
4.根据权利要求3所述的一种多接口路由器地理定位方法,其特征在于,步骤3的具体过程为:步骤3的具体实现过程为:
将步骤1获得的多接口路由器位置频数矩阵I和步骤2获得的邻居路由器位置频数矩阵N进行结合:
式中,表示:
当I中元素Li和N中元素ri相同时,两个元素对应的频数、置信度分别均为
当I中元素Li和N中元素ri不相同时,Li元素对应的频数、置信度分别为
ri元素对应的频数、置信度分别为
CN201810454554.7A 2018-05-11 2018-05-11 一种多接口路由器地理定位方法 Active CN108768862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810454554.7A CN108768862B (zh) 2018-05-11 2018-05-11 一种多接口路由器地理定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810454554.7A CN108768862B (zh) 2018-05-11 2018-05-11 一种多接口路由器地理定位方法

Publications (2)

Publication Number Publication Date
CN108768862A true CN108768862A (zh) 2018-11-06
CN108768862B CN108768862B (zh) 2020-10-30

Family

ID=64010434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810454554.7A Active CN108768862B (zh) 2018-05-11 2018-05-11 一种多接口路由器地理定位方法

Country Status (1)

Country Link
CN (1) CN108768862B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112769702A (zh) * 2021-01-06 2021-05-07 郑州埃文计算机科技有限公司 一种基于路由器别名和基准点地理特征的路由器定位方法
CN113260045A (zh) * 2021-05-28 2021-08-13 上海钐昆网络科技有限公司 一种确定路由器地理位置的方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103973837A (zh) * 2014-05-27 2014-08-06 北京瑞汛世纪科技有限公司 一种确定物理位置信息的方法和装置
CN104168341A (zh) * 2014-08-15 2014-11-26 北京百度网讯科技有限公司 Ip地址的定位方法和cdn调度方法以及装置
CN105100292A (zh) * 2014-05-12 2015-11-25 阿里巴巴集团控股有限公司 确定终端的位置的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100292A (zh) * 2014-05-12 2015-11-25 阿里巴巴集团控股有限公司 确定终端的位置的方法及装置
CN103973837A (zh) * 2014-05-27 2014-08-06 北京瑞汛世纪科技有限公司 一种确定物理位置信息的方法和装置
CN104168341A (zh) * 2014-08-15 2014-11-26 北京百度网讯科技有限公司 Ip地址的定位方法和cdn调度方法以及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHUANXIONG GUO等: "Mining the Web and the Internet for Accurate IP Address Geolocations", 《IEEE INFOCOM 2009》 *
ZIHAN ZHUO等: "IP Address Geolocation Method Based on Network Flow Analysis", 《2016 3RD INTERNATIONAL CONFERENCE ON INFORMATION SCIENCE AND CONTROL ENGINEERING (ICISCE)》 *
宋建: "基于网络拓扑测量的IP地址定位系统的设计与实现", 《中国优秀硕士学位论文全文数据库》 *
王凯等: "一种大数据环境下的在线社交媒体位置推断方法", 《软件学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112769702A (zh) * 2021-01-06 2021-05-07 郑州埃文计算机科技有限公司 一种基于路由器别名和基准点地理特征的路由器定位方法
CN113260045A (zh) * 2021-05-28 2021-08-13 上海钐昆网络科技有限公司 一种确定路由器地理位置的方法、装置、设备及存储介质
CN113260045B (zh) * 2021-05-28 2021-09-24 上海钐昆网络科技有限公司 一种确定路由器地理位置的方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN108768862B (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
Laki et al. Spotter: A model based active geolocation service
CN105227688B (zh) 一种基于路径特征的区域级目标ip定位方法
CN109145169A (zh) 一种基于统计分词的地址匹配方法
CN105976604B (zh) 一种基于gis和公交gps数据的公交线路匹配方法
JP5185089B2 (ja) コンテンツ位置推定装置
Komosny et al. Location accuracy of commercial IP address geolocation databases
CN104537105B (zh) 一种基于Web地图的网络实体地标自动挖掘方法
CN104699835A (zh) 用于确定网页页面中包括兴趣点poi数据的方法及装置
CN108768862A (zh) 一种多接口路由器地理定位方法
CN107169063A (zh) 一种基于社交信息的用户属性预测方法与系统
CN111797182A (zh) 一种地址编码解析方法及系统
CN111159973A (zh) 一种中文地址的行政区划补齐及标准化方法
Hodson et al. Tracking the wheat rust pathogens.
CN108345662A (zh) 一种考虑用户分布区域差异的签到微博数据加权统计方法
CN105245628B (zh) 一种适用于弱连接网络的网络实体地理位置定位方法
CN110460606A (zh) 一种二阶sql注入漏洞检测方法、装置及设备
CN104008205A (zh) 一种内容路由的查询方法及系统
CN112835877B (zh) 一种面向公共突发事务的疫情大数据清理方法
CN110456399A (zh) 一种连续运行卫星定位服务系统及其运行方法
CN105812204A (zh) 一种基于连接度估计的递归域名服务器在线识别方法
CN113395211B (zh) 一种基于聚类思想的路由ip定位优化方法
CN109255433A (zh) 一种基于相似性的社区检测的方法
Jinxia et al. Ip geolocation technology research based on network measurement
CN110311991A (zh) 基于svm分类模型的街道级地标获取方法
CN105991780A (zh) 一种基于互联网ip地址定位数据的ip地址定位系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant