CN110995885B - 一种基于路由器误差训练的ip定位方法 - Google Patents
一种基于路由器误差训练的ip定位方法 Download PDFInfo
- Publication number
- CN110995885B CN110995885B CN201911280052.8A CN201911280052A CN110995885B CN 110995885 B CN110995885 B CN 110995885B CN 201911280052 A CN201911280052 A CN 201911280052A CN 110995885 B CN110995885 B CN 110995885B
- Authority
- CN
- China
- Prior art keywords
- training
- positioning
- router
- detection
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000001514 detection method Methods 0.000 claims abstract description 76
- 238000012795 verification Methods 0.000 claims abstract description 25
- 238000005070 sampling Methods 0.000 claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 9
- 230000004807 localization Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 238000005259 measurement Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000007418 data mining Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 235000008694 Humulus lupulus Nutrition 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/69—Types of network addresses using geographic information, e.g. room number
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/74—Address processing for routing
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于路由器误差训练的IP定位方法,包括如下步骤,对目标城市地标集进行采样,划分出训练集和验证集,对训练集进行扩展,得到探测集,对路由器进行提取,通过采集探测源到探测集节点的路径,从中提取出目标城市的城域网拓扑,对路由器进行训练,通过到训练集节点的路径来训练路由器定位结果,通过到验证集节点的路径来训练路由器定位误差,对IP进行面向街道级的定位,采集探测源到目标的路径,寻找其与目标城市城域网拓扑的重合部分,并得到最终定位结果。本发明能够解决现有方法无法给出单次定位结果的误差的问题,并能够实现对城市中定位目标的位置估计与误差范围估计,在得到误差范围的同时,也具有更好的定位效果。
Description
技术领域
本发明涉及IP定位技术领域,尤其涉及一种基于路由器误差训练的IP定位方法。
背景技术
随着网络的不断发展,基于位置的网络服务应用越来越广泛,而确定用户IP的地理位置是开展基于位置服务的基础。IP定位技术能够提供不依赖于用户协助的定位服务,在商业应用、网络管理、网络安全等方面应用广泛。在商业应用方面,服务商可以根据用户的地理位置来为用户提供基于位置信息的服务,如广告推送、天气预报、网站内容推荐等,移动应用还可以将IP定位技术与GPS定位技术相结合,提供更加精准的位置服务;在网络管理方面,管理者可以通过IP来确定目标位置,解决网络拥塞、节点故障等问题,提升网络管理性能,还能实现用户的访问控制;在网络安全领域,安全机构通过IP定位技术可以确定网络犯罪源头的地理位置,可以有效抑制网络谣言的传播,还可以实现网络犯罪行为的取证。因此,开展IP定位技术的研究具有十分重要的意义和十分迫切的需求。
现有IP定位方法可分为基于数据库的定位、基于数据挖掘的定位和基于网络测量的定位三类。
基于数据库的定位方法不需要大量的测量,可以很快得到目标的位置相关信息,因此得到了广泛的应用。目前互联网上存在大量提供对外查询服务的IP定位数据库,常见的数据库有Maxmind、IP2location、cz88、IP138、TaoBaoIP等。而结合大量定位数据库信息后构建的非公开数据库同样大量存在。这些数据库包含了IP地址到其所处地理位置的映射关系的同时,也记载了许多附属信息,如ISP、网关或时区等。基于数据库的定位方法尽管具有快速、便捷等优点,但也存在许多不足之处。首先,数据库的准确性难以保证。数据库只提供查询服务,而无法保证查询信息的真伪。其次,数据库的精度无法保障。数据库在构建过程中,完全依赖于提供的数据,无法在此基础上对位置数据的精度进行处理。最后,数据库更新不及时,维护难度大。数据库本身没有更新的功能,只能依靠维护者定期更新数据。当数据量较大时,维护的成本会相当高,与少量定位的实际需求不匹配。
基于数据挖掘的定位的思想是通过对机构网站、网络论坛、移动应用等渠道进行数据挖掘,依靠获得的文本信息,建立起从IP地址到实际地理位置的映射关系,从而完成对目标的定位。此类方法中较为典型的有Structon、Chenkin-Geo等。其中,Structon在互联网上爬取机构的主页,提取电话、区号和地址等位置信息,将URL转化为IP,并将IP与位置信息关联;Chenkin-Geo从手机端与PC端程序获取用户ID、地理位置、登录信息、IP地址等数据,并利用机器学习等方法建立起“IP地标-地理位置”关系以实现目标定位。基于数据挖掘的定位算法相比基于数据库的定位算法,在具有即时性高、主动性强等优点的同时,也存在一些不足之处,定位的准确性受到机构主页、网络服务提供商所提供的信息准确性,且在服务器托管、非协作环境下信息获得量以及获得效率受到制约,并不能取得很好的定位效果。
基于网络测量的定位通过对网络中时延、拓扑等信息的测量与分析,实现对IP的定位。此类方法中较为典型的有CBG(Constrained-Based Geolocation)、LBG(Learning-based Geolocation)、SLG(Street-Level Geolocation)和NNG(Neural Networks-basedGeolocation)等。其中,CBG计算每个探测源的“时延-距离”最小误差,将时延转化为地理距离,并通过多个探测源对目标IP进行位置估计;LBG通过对探测源到地标(地理位置已经且IP不会变化的网络节点)的时延和跳数等多种测量数据的综合应用,将IP定位问题转化为机器学习的分类问题;SLG根据CBG得到低精度的目标区域估计,并在目标区域内通过大量地标进行路径比对进一步提高定位精度;NNG基于延迟相似性的原理,训练了两层神经网络来估计IP地址的地理位置。基于网络测量的定位方法具有不依赖用户、即时性较高等特点,在非协作条件下具有前两种方法所不具备的优势。
对目标进行定位往往会出现误差,误差的大小反映了算法的定位能力。然而,现有基于网络测量的IP定位研究在定位准确率仍有待提高的同时,无法给出单次定位结果的误差评估。这种现象导致在得到定位结果后,只能依照算法的经验误差来估计定位结果的误差范围,降低了结果的可信度。
发明内容
本发明的目的是提供一种基于路由器误差训练的IP定位方法,能够解决现有方法无法给出单次定位结果的误差的问题,并能够实现对城市中定位目标的位置估计与误差范围估计,在得到误差范围的同时,也具有更好的定位效果。
本发明采用的技术方案为:一种基于路由器误差训练的IP定位方法,包括如下步骤:
a.对地标的划分,对目标城市地标集进行采样,划分出训练集和验证集,所述训练集用于提取目标城市的城域网并得到网络中各路由器的位置估计,所述验证集用于得到城域网中各路由器的误差估计;
b.对训练集按子网进行扩展,得到探测集,所述探测集用于对目标城市城域网的获取;
c.对路由器进行提取,通过采集探测源到探测集节点的路径,从中提取出目标城市的城域网拓扑;
d.对路由器进行训练,通过到训练集节点的路径来训练路由器定位结果,通过到验证集节点的路径来训练路由器定位误差;
e.对IP进行面向街道级的定位,采集探测源到目标的路径,寻找其与目标城市城域网拓扑的重合部分,并得到最终定位结果。
优选的,所述的步骤a中,通过自助法对目标城市地标集进行采样,有放回地从地标集中采样,在达到样本数量的次数后停止采样,将被选中过的地标放入训练集,未被选中过的地标放入验证集。
优选的,所述的步骤b中,对训练集按子网进行扩展具体为,对所有在训练集中的地标,探测其所在/24子网中的所有其他节点,如果节点对探测有响应,则将其放入探测集,最后将训练集中的所有节点放入探测集。
优选的,所述的步骤c中,采集探测源到探测集节点的路径具体为,使用多个探测源对探测集、训练集和验证集中所有节点分别进行路径探测,并按照时延分布规律去除骨干网节点与其他城市节点,保留属于目标城市的IP节点,分别得到探测路径集、训练路径集和验证路径集。
优选的,所述的步骤c中,提取目标城市的城域网拓扑具体为,对探测路径集进行别名解析,合并同一路由器对应的不同IP节点,整理城市内部路由节点间连接关系,得到城域网拓扑。
优选的,所述的步骤d中,训练路由器定位结果具体为,比对训练路径集与城域网拓扑的重合关系,按照先跳数后时延的优先级顺序确定城域网中各路由节点对应的最近地标,并将其定为该路由节点的位置,其探测路径未与训练路径集重合的路由节点所具有的定位能力与其更高一层的相邻路由节点相同。
所述的步骤d中,训练路由器定位误差具体为,比对验证路径集与城域网拓扑的重合关系,将距离路由节点最远的地标与该节点的距离定为其定位估计误差,对于只具有城市级定位能力的路由节点,其最大误差定为该城市的实际半径。
所述的步骤e具体为,对目标进行探测并记录其探测路径信息,按照时延分布规律去除路径中的骨干网节点与其他城市节点,保留属于目标城市的IP节点,将所得路径中的路由节点按从目标至探测源的顺序从城域网拓扑中进行匹配,若搜索到相同的路由器,则将对应路由器的定位地标和误差输出为定位结果。
本发明的有益效果是:本发明提出了一种新的面向街道级的基于城域网路由器误差训练的IP定位方法,该定位方法首先划分地标并对其进行探测,得到目标所在的城市拓扑网络,随后对网络中路由器进行误差训练,得到经验结果及估计误差,最后使用训练完成的城域网进行IP定位,得到定位结果,解决了现有的方法不能实现单次定位结果的误差的问题,并能够实现对城市中定位目标的位置估计与误差范围估计,在得到误差范围的同时,也具有更好的定位效果,由实验结果表明,本发明在具有较好的定位误差估计能力的同时,相比LBG、SLG、NNG等典型定位算法,还拥有更高的城市级定位成功率和更低的城市内定位中值误差。
附图说明
图1为本发明的流程图;
图2为本发明的原理框图;
图3为本发明所述的原始地标分布示意图;
图4为本发明所述的自助法采样训练集示意图;
图5为本发明所述的自助法采样验证集示意图;
图6为本发明所述的误差估计过程示意图;
图7为本发明所述的面向街道级的IP定位过程示意图;
图8为本发明所述的城市级定位结果示意图;
图9为本发明所述的香港定位结果散点图;
图10为本发明所述的北京定位结果散点图;
图11为本发明所述的上海定位结果散点图;
图12为本发明所述的深圳定位结果散点图;
图13为NNG、SLG和本发明所述算法对香港定位结果的对比示意图;
图14为NNG、SLG和本发明所述算法对北京定位结果的对比示意图;
图15为NNG、SLG和本发明所述算法对上海定位结果的对比示意图;
图16为NNG、SLG和本发明所述算法对深圳定位结果的对比示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1和2所示,本发明包括如下步骤:
a.对地标的划分,地标是地理位置确定的IP节点,在定位过程中通常起到基准点的作用,因为本文方法需要两个地标集分别用来得到定位的结果以及估计误差,所以需要将地标数据划分为两部分,因无法保证目标城市的地标数量,故采用自助法对目标城市地标集进行采样,自助法为,在采样时,有放回地从地标集中采样,在达到样本数量的次数后停止采样,将被选中过的地标放入训练集,未被选中过的地标放入验证集,从而划分出训练集和验证集,所述训练集用于提取目标城市的城域网并得到网络中各路由器的位置估计,所述验证集用于得到城域网中各路由器的误差估计。
在统计学中,自助法是一种从给定样本集中有放回的均匀抽样,该方法对包含D个样本的数据集有放回的抽样D次,产生包含D个样本的训练集,而没有进入该训练集的样本最终形成验证集。显然每个样本被选中的概率是1/D,因此未被选中的概率就是1-1/D。当D趋于无穷大时,样本未在训练集出现过的概率就将趋近于e-1=0.368,留在训练集中的样本占总数据集的63.2%左右。在样本不足时,采用自助法将样本划分为训练集与验证集,可以在一定程度上减轻样本数量对定位的影响。如图3、4和5所示,分别展示了郑州市地标的原始地标分布、使用自助法采样后的自助法采样训练集和自助法采样验证集。经自助法采样后,样本地标分布与原始地标分布相比差别不大,因此,使用自助法将地标集划分为训练集和验证集,有效减轻了划分过程对样本分布的影响。
获得目标城市的城域网需要大量的探测数据,而仅仅通过对已知地标进行路径探测提取出的拓扑信息与真实网络差距过大,需要对训练集进行扩展,Neehar Mukne等经研究发现,处于同一/24子网的IP往往集中在同一地理区域。
b.对训练集按子网进行扩展,具体为,利用上述处于同一/24子网的IP往往集中在同一地理区域这一规律,对所有在训练集中的地标,探测其所在/24子网中的所有其他节点,如果节点对探测有响应,则将其放入探测集,最后将训练集中的所有节点放入探测集,得到探测集,所述探测集用于对目标城市城域网的获取。
c.对路由器进行提取,通过采集探测源到探测集节点的路径,从中提取出目标城市的拓扑网络,得到目标城市的城域网路由器,所述采集探测源到探测集节点的路径具体为,使用多个探测源对探测集、训练集和验证集中所有节点分别进行路径探测,并按照时延分布规律去除骨干网节点与其他城市节点,保留属于目标城市的IP节点,分别得到探测路径集、训练路径集和验证路径集,在进行跨城市的路径探测时,路径中的单跳时延会呈现一种“低-高-低”的分布规律,根据此规律找到路径中城市的交界点,从而将路径中不属于目标城市的IP节点去除掉,来减少运算负担,同时也能消除计算误差。所述提取目标城市的拓扑网络具体为,对探测路径集进行别名解析,合并同一路由器对应的不同IP节点,整理城市内部路由节点间连接关系,得到城域网拓扑。
城域网中路由器主要负责城市内部的数据接入、交换和传输工作,数据包通过各个路由器后,最终到达目标终端,城域网内路由器越接近核心路由器,管理的用户越多,用户的地理位置越不容易确定,反之,越接近接入路由器,管理的用户越少,用户的地理位置往往倾向于集中在某一块特定区域,能通过获得目标城市网络中各路由器与地标的连接情况来推断其用户的位置范围,来对路由器所连接的用户进行定位。
在城域网中,不同路由器负责的用户数量和分布范围都有差别,通常距离骨干网路由器跳数越多,负责的用户数量越少,用户分布更集中,因此,针对路由器所具有的这种特性,利用已知的地标数据,通过模拟定位过程来得到城域网路由器的业务范围,也就是其误差范围。具体如下:
d.对路由器进行训练,通过到训练集节点的路径来训练路由器定位结果,通过训练集中的地标来标记每个路由器的位置,具体步骤为,首先获取目标城市的城域网路由器,使用多个探测源,通过对探测集进行路径采集,来得到多个目标城市的城域网路由器,若路由器的位置已知,就可以将该位置标记为路由器的定位结果,若路由器的位置不可知,比对训练路径集与城域网拓扑的重合关系,按照先跳数后时延的优先级顺序确定城域网中各路由节点对应的最近地标,并将其定为该路由节点的位置,其探测路径未与训练路径集重合的路由节点所具有的定位能力与其更高一层的相邻路由节点相同。通过到验证集节点的路径来训练路由器定位误差,具体步骤为,比对验证路径集与城域网拓扑的重合关系,将距离路由节点最远的地标与该节点的距离定为其定位估计误差,对于只具有城市级定位能力的路由节点,其最大误差定为该城市的实际半径。
如图6所示,经过大量地标数据的训练,可以确定负责地标L1、L2、L3和L4接入工作的路由器R2的用户分布范围,将距R2最近的地标L3的位置定为R2的定位结果,将与R2相连的地标间的最大距离定为R2的误差估计;同样,也能得到路由器R3的定位结果和误差范围,而R2和R3的上一级路由器R1的定位结果定为R2和R3中距离路由器最近的地标,误差范围则为两个路由器所负责的地标间的最大距离。
在完成城域网拓扑的提取与训练后,拥有了城域网范围内路由器所连地标的情况与各路由所管辖区域的大致范围,通过这些信息,对目标进行位置估计,在对目标进行路径探测时,同样采用上文中所述的方法,即在进行跨城市的路径探测时,路径中的单跳时延会呈现一种“低-高-低”的分布规律这一方法,保存路径中属于目标城市的部分。具体步骤如下:
e.对IP进行面向街道级的定位,面向街道级的IP定位,应首先对目标进行探测并记录其探测路径信息,采集探测源到目标的路径后,按照时延分布规律去除路径中的骨干网节点与其他城市节点,保留属于目标城市的IP节点,然后寻找其与目标城市城域网拓扑重合部分,即将上述所得探测源到目标的路径中的路由节点按从目标至探测源的顺序从城域网中进行匹配,若搜索到相同的路由器,则将对应路由器的定位地标和误差输出为定位结果,即得到了最终定位结果。
在对目标进行探测的过程中,探测报文在到达目标前,需要经过目标所在城市的城域网路由器。因此能够分析通向目标的探测路径,查看对比其所经过的城域网路由器,并根据路由器的业务范围,完成对目标的位置估计。
在探测路径中,不仅包含了通向目标IP的路由器信息,同时也包含了路由器间的时延和跳数信息。可以结合这些信息来尽可能得到城域网路由器的业务范围。通过比较各地标到各路由器的跳数与时延,从训练集中选出距离各路由器最近的地标。对测试集进行路径采集后,对比路径中路由器所连接的测试集地标与上一步得到的对应地标,从而得到各路由器的误差范围。最后,对目标进行路径探测,根据其经过的城域网路由器,完成对其的位置估计。
从上述内容已知R2已经具有了定位结果与误差范围。如图7所示,在向目标T1发送探测报文时,能发现其所经过最近的路由器为R2,即可将R2的定位结果和误差范围输出为T1的位置估计。而在对目标T2定位时,距离其最近的路由器R3并没有直接相连的地标,需要沿探测报文路径向上追溯至路由器R1,将R1的定位结果和误差范围输出为T2的位置估计。此外,本方法在定位过程中并不需要到达目标IP。只要能够保证探测路径确实通向目标IP,便可通过路径中所包含的路由器确定目标所处的位置区域。因此本发明能够有效地完成对某些探测不可达的目标IP的位置估计。
为验证本方法的定位能力,本方法进行了相关实验并与LBG、SLG、NNG等典型定位算法进行了比较,结果表明,本方法具有较好的单次定位误差估计能力。此外,本方法在拥有最高城市级定位成功率的同时,在城市内定位时也能得到更低的定位误差。实验步骤如下:
在搭建实验环境时,共部署探测源6个,其中中国大陆4个,分别位于郑州、上海、北京和成都,韩国首尔1个,美国洛杉矶1个。由于城市级定位是街道级定位的基础,所以本文在进行实验时,先对城市级的定位结果进行比较分析,而后进行城市内部的定位实验。
因为城市规模和分布不会影响定位算法的成功率,但ISP会对定位过程产生影响,因此本发明选择在同一运营商的网络环境下进行实验。由于SLG算法步骤中使用的CBG算法在中国网络运营商间独立性高及分层现象明显条件下效果很差,本发明在实验过程中仅使用SLG算法的后半部分,人工对其提供地标信息并以此定位。由于LBG算法并不具备城市内部定位能力,故不参与城市内定位的结果分析。
此外,本发明在探测目标网络拓扑信息时,综合使用ICMP、TCP、UDP、ICMP-paris、UDP-paris五种类型的协议,通过采用多协议路径探测,提高拓扑信息获取规模。ICMP-paris和UDP-paris协议还会避免错误路径信息的产生。实验设置如表1所示:
表1实验设置结果
为确保最基本的城市级定位能力,本文在中国挑选了12个城市在同一ISP下进行定位实验,城市级定位结果如图8所示。
经过统计,在同一ISP环境下,LBG算法城市级定位成功率为73.36%,SLG算法城市级定位成功率为93.87%,本发明算法城市级定位成功率为97.72%。与LBG、SLG算法相比,本文算法拥有更高的城市级定位成功率。
在城市级定位的基础上,本文在中国香港、北京、上海和深圳等城市内进行定位实验,香港、北京、上海和深圳的定位结果分别如图9、10、11和12所示。在图9、10、11和12中,点到横轴的距离代表着定位的精度,距离越近则表示精度越高;同时,点到两坐标轴角平分线的距离代表着估计误差与实际误差之间的差距,距离越近意味着差距越小。从图中可以看出,大部分的定位结果都维持在误差较低的水平。经统计,本文算法的中值误差可以达到8.73km,均值误差可以达到11.16km,同时估计误差有72.81%的概率与实际误差相差不超过5km。
如图13、14、15和16所示,展示了定位实验的累计误差概率,即小于给定定位误差的结果占全部定位结果的比例。在图13、14、15和16中,曲线越接近左上角,则误差距离越小,定位结果越好。经统计,NNG、SLG和本文算法的定位中值误差为16.8km、15.6km和8.72km。可以看出,本文算法的定位结果要优于SLG、NNG等定位算法。
最后,本文将各项实验结果汇总至表2中。如表2所示,通过对城市内部路由器的提取和训练,相比LBG、SLG、NNG等典型算法,本文提出的算法进一步提高了定位能力,将定位成功率提升至97.72%,将定位中值误差降低至8.72km,同时还具有较好的误差估计能力。
表2实验结果汇总
Claims (6)
1.一种基于路由器误差训练的IP定位方法,其特征在于,包括如下步骤:
a.对地标的划分,对目标城市地标集进行采样,划分出训练集和验证集,所述训练集用于提取目标城市的城域网并得到网络中各路由器的位置估计,所述验证集用于得到城域网中各路由器的误差估计;
b.对训练集按子网进行扩展,得到探测集,所述探测集用于对目标城市城域网的获取;
c.对路由器进行提取,通过采集探测源到探测集节点的路径,从中提取出目标城市的城域网拓扑;
d.对路由器进行训练,通过到训练集节点的路径来训练路由器定位结果,通过到验证集节点的路径来训练路由器定位误差;训练路由器定位结果具体为,比对训练路径集与城域网拓扑的重合关系,按照先跳数后时延的优先级顺序确定城域网中各路由节点对应的最近地标,并将其定为该路由节点的位置,其探测路径未与训练路径集重合的路由节点所具有的定位能力与其更高一层的相邻路由节点相同;训练路由器定位误差具体为,比对验证路径集与城域网拓扑的重合关系,将距离路由节点最远的地标与该节点的距离定为其定位估计误差,对于只具有城市级定位能力的路由节点,其最大误差定为该城市的实际半径;
e.对IP进行面向街道级的定位,采集探测源到目标的路径,寻找其与目标城市城域网拓扑的重合部分,并得到最终定位结果。
2.根据权利要求1所述的基于路由器误差训练的IP定位方法,其特征在于:所述的步骤a中,通过自助法对目标城市地标集进行采样,有放回地从地标集中采样,在达到样本数量的次数后停止采样,将被选中过的地标放入训练集,未被选中过的地标放入验证集。
3.根据权利要求1所述的基于路由器误差训练的IP定位方法,其特征在于:所述的步骤b中,对训练集按子网进行扩展具体为,对所有在训练集中的地标,探测其所在/24子网中的所有其他节点,如果节点对探测有响应,则将其放入探测集,最后将训练集中的所有节点放入探测集。
4.根据权利要求1所述的基于路由器误差训练的IP定位方法,其特征在于:所述的步骤c中,采集探测源到探测集节点的路径具体为,使用多个探测源对探测集、训练集和验证集中所有节点分别进行路径探测,并按照时延分布规律去除骨干网节点与其他城市节点,保留属于目标城市的IP节点,分别得到探测路径集、训练路径集和验证路径集。
5.根据权利要求1所述的基于路由器误差训练的IP定位方法,其特征在于:所述的步骤c中,提取目标城市的城域网拓扑具体为,对探测路径集进行别名解析,合并同一路由器对应的不同IP节点,整理城市内部路由节点间连接关系,得到城域网拓扑。
6.根据权利要求1所述的基于路由器误差训练的IP定位方法,其特征在于:所述的步骤e具体为,对目标进行探测并记录其探测路径信息,按照时延分布规律去除路径中的骨干网节点与其他城市节点,保留属于目标城市的IP节点,将所得路径中的路由节点按从目标至探测源的顺序从城域网拓扑中进行匹配,若搜索到相同的路由器,则将对应路由器的定位地标和误差输出为定位结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911280052.8A CN110995885B (zh) | 2019-12-13 | 2019-12-13 | 一种基于路由器误差训练的ip定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911280052.8A CN110995885B (zh) | 2019-12-13 | 2019-12-13 | 一种基于路由器误差训练的ip定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110995885A CN110995885A (zh) | 2020-04-10 |
CN110995885B true CN110995885B (zh) | 2022-02-22 |
Family
ID=70093299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911280052.8A Active CN110995885B (zh) | 2019-12-13 | 2019-12-13 | 一种基于路由器误差训练的ip定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110995885B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111343301B (zh) * | 2020-04-21 | 2022-08-16 | 北京字节跳动网络技术有限公司 | 一种定位方法、定位装置、电子设备及存储介质 |
CN112769702B (zh) * | 2021-01-06 | 2023-07-21 | 郑州埃文计算机科技有限公司 | 一种基于路由器别名和基准点地理特征的路由器定位方法 |
CN113242332B (zh) * | 2021-05-19 | 2022-10-04 | 郑州埃文计算机科技有限公司 | 一种形成街道级定位库的改进方法 |
CN113395211B (zh) * | 2021-06-08 | 2022-11-18 | 哈尔滨工业大学(威海) | 一种基于聚类思想的路由ip定位优化方法 |
CN114520799B (zh) * | 2021-12-27 | 2023-05-05 | 中国人民解放军战略支援部队信息工程大学 | 基于最小圆覆盖的城市内ip定位及误差估计方法及系统 |
CN115102925B (zh) * | 2022-06-10 | 2023-06-30 | 中国人民解放军战略支援部队信息工程大学 | 基于IP2vec模型的街道级IP定位方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104506591A (zh) * | 2014-12-11 | 2015-04-08 | 罗向阳 | 一种基于最近共同路由器的目标ip地理位置定位方法 |
CN105227688A (zh) * | 2015-08-31 | 2016-01-06 | 罗向阳 | 一种基于路径特征的区域级目标ip定位方法 |
CN105227689A (zh) * | 2015-08-31 | 2016-01-06 | 罗向阳 | 基于局部时延分布相似性度量的目标ip定位算法 |
CN105262849A (zh) * | 2015-08-31 | 2016-01-20 | 罗向阳 | 基于可容忍误差的ip定位方法 |
CN107277121A (zh) * | 2017-06-05 | 2017-10-20 | 中国科学院信息工程研究所 | 一种网络设备定位方法及装置 |
CN110012120A (zh) * | 2019-03-14 | 2019-07-12 | 罗向阳 | 一种基于PoP网络拓扑的IP城市级定位算法 |
CN110474843A (zh) * | 2019-07-03 | 2019-11-19 | 上海交通大学 | 基于路由跳数的ip定位方法 |
-
2019
- 2019-12-13 CN CN201911280052.8A patent/CN110995885B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104506591A (zh) * | 2014-12-11 | 2015-04-08 | 罗向阳 | 一种基于最近共同路由器的目标ip地理位置定位方法 |
CN105227688A (zh) * | 2015-08-31 | 2016-01-06 | 罗向阳 | 一种基于路径特征的区域级目标ip定位方法 |
CN105227689A (zh) * | 2015-08-31 | 2016-01-06 | 罗向阳 | 基于局部时延分布相似性度量的目标ip定位算法 |
CN105262849A (zh) * | 2015-08-31 | 2016-01-20 | 罗向阳 | 基于可容忍误差的ip定位方法 |
CN107277121A (zh) * | 2017-06-05 | 2017-10-20 | 中国科学院信息工程研究所 | 一种网络设备定位方法及装置 |
CN110012120A (zh) * | 2019-03-14 | 2019-07-12 | 罗向阳 | 一种基于PoP网络拓扑的IP城市级定位算法 |
CN110474843A (zh) * | 2019-07-03 | 2019-11-19 | 上海交通大学 | 基于路由跳数的ip定位方法 |
Non-Patent Citations (2)
Title |
---|
City-Level IP Geolocation Algorithm Based on PoP Network Topology;SHUODI ZU, XIANGYANG LUO , SIQI LIU, YAN LIU;《IEEE access》;20181130;全文 * |
基于网络节点聚类的目标IP城市级定位方法;李明月;《计算机研究与发展》;20190315;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110995885A (zh) | 2020-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110995885B (zh) | 一种基于路由器误差训练的ip定位方法 | |
JP6920294B2 (ja) | ルート追跡を用いて地理位置を特定するための方法、システムおよび装置 | |
Huffaker et al. | DRoP: DNS-based router positioning | |
CN102246463B (zh) | 网络设备的地理位置映射 | |
CN110012120A (zh) | 一种基于PoP网络拓扑的IP城市级定位算法 | |
Youn et al. | Statistical geolocation of internet hosts | |
CN104506591A (zh) | 一种基于最近共同路由器的目标ip地理位置定位方法 | |
CN105227688A (zh) | 一种基于路径特征的区域级目标ip定位方法 | |
CN111064817B (zh) | 一种基于节点排序的城市级ip定位方法 | |
Zhao et al. | IP Geolocation based on identification routers and local delay distribution similarity | |
CN114520799B (zh) | 基于最小圆覆盖的城市内ip定位及误差估计方法及系统 | |
Mátray et al. | On the spatial properties of internet routes | |
CN110912756B (zh) | 一种面向ip定位的网络拓扑边界路由ip识别算法 | |
Zu et al. | IP-geolocater: a more reliable IP geolocation algorithm based on router error training | |
Hillmann et al. | On the path to high precise ip geolocation: A self-optimizing model | |
Chen et al. | A landmark calibration-based IP geolocation approach | |
CN105245628B (zh) | 一种适用于弱连接网络的网络实体地理位置定位方法 | |
CN111985569A (zh) | 基于多源点聚类思想的匿名节点定位方法 | |
Zhao et al. | City-level geolocation based on routing feature | |
Ding et al. | A street-level IP geolocation method based on delay-distance correlation and multilayered common routers | |
Xiang et al. | No-jump-into-latency in china's internet! toward last-mile hop count based ip geo-localization | |
CN109639510A (zh) | 一种基于子网分析的区域PoP划分方法 | |
CN113242332B (zh) | 一种形成街道级定位库的改进方法 | |
CN113395211B (zh) | 一种基于聚类思想的路由ip定位优化方法 | |
Zu et al. | A delay deviation tolerance IP geolocation method with error estimation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200728 Address after: 450001 No. 62 science Avenue, hi tech Zone, Henan, Zhengzhou Applicant after: Information Engineering University of the Chinese People's Liberation Army Strategic Support Force Address before: 450001 Information Engineering University, 62 science Avenue, hi tech Zone, Henan, Zhengzhou Applicant before: Luo Xiangyang |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |