CN107920115B - 一种基于时延和地理一致性约束的城市级ip定位方法 - Google Patents
一种基于时延和地理一致性约束的城市级ip定位方法 Download PDFInfo
- Publication number
- CN107920115B CN107920115B CN201711144496.XA CN201711144496A CN107920115B CN 107920115 B CN107920115 B CN 107920115B CN 201711144496 A CN201711144496 A CN 201711144496A CN 107920115 B CN107920115 B CN 107920115B
- Authority
- CN
- China
- Prior art keywords
- city
- verified
- time delay
- geographic
- avg
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/52—Network services specially adapted for the location of the user terminal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/69—Types of network addresses using geographic information, e.g. room number
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于时延和地理一致性约束的城市级IP定位方法,该方法首先通过大量测量建立测量点与目标城市的时延区间;然后,测量测量点对待验证的IP的时延并获取网络路径的逐跳IP;之后,检验待验证的IP的时延是否在目标城市的时延区间内,同时检验待验证IP网络路径内同一时延区间最后几跳的IP地理位置进行一致性验证确定待验证IP的最大可能位置。通过本发明可以对IP定位库中IP定位结果进行检验,广泛应用于网络攻击跟踪溯源、定向广告、在线防欺诈、网络空间态势呈现等领域,可有效改善IP定位的精度。
Description
技术领域
本发明涉及目标IP城市级定位技术领域,尤其涉及基于时延和地理一致性约束的城市级IP定位方法。
背景技术
目前,IP定位的常用方法是利用IP设备的名字、注册信息或时延信息来估计其地理位置。定位算法设计基本原则是在保证定位精度的情况下,尽量减少测量开销,同时兼具良好扩展性,且不需要客户端支持。最初的定位算法,通过向DNS服务器查询或者挖掘隐含在主机名中的信息来推测IP设备的地理位置。近年来,基于概率的定位算法重新成为研究热点,通过寻找时延与地理距离的分布规律来进行定位。由于IP定位算法很多,可以按照是否需要客户端的支持、定位原理等不同的标准进行分类。在现有定位算法中,基于客户端的定位算法精度最高,但是往往要借助GPS、蜂窝基站、WiFi接入点等基础设施,这些数据或来源于Whois数据的解析,或来源于运营商数据,或来源于网络数据的分析,其定位精度和准确性均无法获得保证,从而大大影响了IP定位数据的使用范围。虽然研究人员提出了很多IP定位算法,但是由于缺乏大量的基准节点,无法进行大范围部署从而获得高准确性的结果。
发明内容
本发明为克服现有技术存在的以上问题,提出了一种基于时延和地理一致性约束的城市级IP定位方法,利用网路时延的阶跃性作为约束,通过不断迭代计算平均时延来判定数据库中不一致性数据,从而去除数据库中的错误数据,最后获得一个具有高准确度的IP定位数据。通过这种方法可以有效消除数据库中错误数据,提高IP定位库的准确性。为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
步骤1:目标城市IP地址集构建,从IP定位数据库中提取目标城市IP地址集;
步骤2:目标城市时延区间测量,通过测量服务器测量从同一测量点到目标城市IP地址的时延区间,并通过不断迭代计算目标城市IP地址的平均时延davg;
步骤3:待验证IP时延测量,通过测量服务器采用Traceroute测量从同一测量点到待验证IP的时延并获取逐跳IP;
步骤4:通过逆向扫描网络路径获取最后几跳同一时延区间内的所有IP;
步骤5:对待验证IP进行定位,通过时延区间和最后几跳IP地理位置进行一致性验证确定待验证IP的最大可能位置。
上述方案中,所述步骤1中,目标城市IP地址集构建是按照城市粒度提取所有IP地址,表示为:
IPc←Retrieve(DB,IP,C) (1)
其中,DB表示待验证的IP定位数据库,C表示待验证的城市。
上述方案中,所述步骤2中,通过测量服务器从同一测量点测量到目标城市IP地址,IPC中任意IP的时延DC={d1,d2,…,dn},计算平均时延davg,对于任意di若不在区间[davg/α,α·davg]内,则将di从DC中移除,并重新计算平均时延davg,直到所有di均在区间[davg/α,α·davg]内,则停止迭代,时延区间表示为[davg±δ];
其中,α为阈值,若测量点到目标城市IP的地理距离≤500km,α取值为1.5,若测量点到目标城市IP的地理距离>500km,α取值为1.2;
δ为调整因子,取值区间为1ms-3ms。
上述方案中,所述步骤4中,通过测量服务器采用Traceroute测量从同一测量点到待验证IP的网络路径获取逐跳IP,并对整个路径采用逆向扫描法,即从最后一个跳开始,找出同一时延区间内的所有IP,表示为;
RMC={IPC 1,IPC 2,…,IPC n} (3)
上述方案中,所述步骤5中,通过待验证IP的时延与目标城市IP的平均时延davg作对比,筛选出与待验证IP时延相一致的目标城市,记为待验证城市C'。
上述方案中,所述步骤5中,对待验证IP最后几跳同一时延区间内RMC={IPC1,IPC2,…,IPCn}与待验证城市C'进行地理一致性验证;
若RMC为空集,则判定待验证IP的地理位置不在待验证城市C'中;
如果RMC不为空,则对RMC中所有的IP与待验证城市C'的IP进行对比,统计RMC中IP位于待验证城市C'的数量,若≤|RMC|/2,则判定待验证IP的地理位置不在待验证城市C'中;若>|RMC|/2则待验证IP的地理位置位于待验证城市C'中;
其中location(IP)表示从IP数据库中解析得到待验证IP所在的地理位置。
本发明针对IP定位算法缺乏大量的基准节点,无法进行大范围部署获得高准确性定位,给出了基于时延和地理位置一致性约束的城市级IP定位方法。该算法通过对任何IP定位数据库任意一条IP定位记录抽象记录为(IP,C),其中C代表该IP地址待验证的城市,通过测量服务器测量从同一测量点到C市IP地址集的时延,并通过不断迭代计算得出更精准的时间区间,然后对待检验IP使用Traceroute进行测量,获得网络路径的逐跳IP和时延,最后通过时延区间的判定和最后几跳IP地理位置进行一致性验证确定待验证IP的最大可能位置。本发明的定位方法具有较高的城市级定位精准度。
附图说明
图1为本发明的定位算法流程图;
图2为本发明的测量示意图;
图3为本发明网络路径逐条响应时延曲线(从上海市发起对北京海淀区IP地址59.252.138.2测量响应的结果);
图4为本发明网络路径逐条响应时延曲线(从南京发起对美国IP地址4.69.132.174测量响应的结果)。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明的一种基于时延和地理一致性约束的城市级IP定位方法,首先从IP定位库中提取目标城市IP的地址集;然后采用启发式算法确定测量点到目标城市的时延区间并对待验证的IP采用Traceroute进行测量获取时延和逐跳IP;再然后,通过逆向扫描网络路径获取最后几跳同一时延区间内的所有IP;最后,对待验证IP进行定位,通过时延区间和最后几跳IP地理位置进行一致性验证确定待验证IP的最大可能位置。详细的算法流程包括以下几个步骤:
步骤一:按照城市粒度,从IP数据库中构建目标城市IP地址集,表示为:
IPc←Retrieve(DB,IP,C)
其中,DB表示待验证的IP定位数据库,C表示待验证的城市。
步骤二:首先确定测量点的位置,然后从IP知识库中抽取所有属于目标城市C的IP地址集合为IPC={IP1,IP2,…,IPn},设测量节点为M,然后对集合NC中的所有IP进行测量,则M到IPC的时延集合DC={d1,d2,…,dn},由DC计算时延区间[dmin,dmax],并计算平均时延davg,对于任意di若不在区间[davg/α,α·davg]内,则将di从DC中移除,并重新计算平均时延davg,直到所有di均在区间[davg/α,α·davg]内,则停止迭代,最后,时延区间表示为[davg±δ];其中,α为阈值,若测量点到目标城市IP的地理距离≤500km,α取值为1.5,若测量点到目标城市IP的地理距离>500km,α取值为1.2;δ为调整因子,取值区间为1ms-3ms。
实际上,根据测量点与目标城市C的关系,可以分为两情况,若测量点与目标节点位于同一个城市内,则只需确定时延上限即可,即[0,davg+δ];若测量点与目标节点位于不同的城市,则要确定上下限,即[davg±δ]。
一般IP定位数据都声称其在区县或城市一级的定位精度可达80%以上甚至更高,尽管这些指标并没有得到证实,但是可以假设有一半以上IP地址的地理位置是准确的,通过不断迭代计算平均时延,从而筛选出地理位置位于目标城市的IP,得出更精准的时延区间。
本实施例中,以验证北京市IP为例,测量点位于南京,对可能位于北京的1000万个IP进行了测量,经过时延迭代算法发现南京到北京的平均时延为18ms,假设δ为3ms,则从南京测量到所有位于北京IP的节点往返时延区间为[15ms,21ms]。以IP地址为例223.27.162.40,IP数据库中记录为北京市,从南京测量发现其实延为85ms,不在时延区间[15ms,21ms]内,因此可以断定不在北京。
步骤三:如图2所示,待验证IP时延测量,通过测量服务器采用Traceroute测量从同一测量点到待验证IP的时延并获取逐跳IP;
图3为从上海市发起对北京海淀区IP地址59.252.138.2测量响应的结果,纵轴为时延,单位ms,横轴为IP地址;可以看出,101.95.207.85、101.95.120.86两个节点的网络时延发生明显的阶跃。
图4为从南京发起对美国IP地址4.69.132.174测量响应的结果,纵轴为时延,单位ms,横轴为IP地址;可以看出,202.97.91.30、202.97.51.6这两个节点的网络时延发生明显的阶段。
根据网络测量发现,网络路径的时延具有明显的阶跃性,在一个城市内部路由器之间的时延大小往往类似。通过这种阶跃效应就可以表示为一个时延区间从而用来对IP的地理位置进行验证。
步骤四:通过测量服务器采用Traceroute测量从同一测量点到待验证IP的网络路径获取逐跳IP,并对整个路径采用逆向扫描法,即从最后一个跳开始,找出同一时延区间内的所有IP,表示为;
RMC={IPC 1,IPC 2,…,IPC n} (3)
步骤五:通过待验证IP的时延与目标城市IP的平均时延davg作对比,筛选出与待验证IP时延相一致的目标城市,记为待验证城市C'。
对待验证IP最后几跳同一时延区间内RMC={IPC 1,IPC 2,…,IPC n}与待验证城市C'进行地理一致性验证;
若RMC为空集,则判定待验证IP的地理位置不在待验证城市C'中;
如果RMC不为空,则对RMC中所有的IP与待验证城市C'的IP进行对比,统计RMC中IP位于待验证城市C'的数量,若≤|RMC|/2,则判定待验证IP的地理位置不在待验证城市C'中;若>|RMC|/2则待验证IP的地理位置位于待验证城市C'中;
其中location(IP)表示从IP定位库中解析得到待验证IP所在的地理位置。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (6)
1.一种基于时延和地理一致性约束的城市级IP定位方法,其特征在于:包括:
步骤1:目标城市IP地址集构建,从IP定位数据库中提取目标城市IP地址集;
步骤2:目标城市时延区间测量,通过测量服务器测量从同一测量点到目标城市IP地址的时延区间,并通过不断迭代计算目标城市IP地址的平均时延davg;
步骤3:待验证IP时延测量,通过测量服务器从同一测量点测量到目标城市IP地址集IPC中的所有IP的时延DC={d1,d2,…,dn},计算平均时延davg,对于任意di若不在区间[davg/α,α·davg]内,则将di从DC中移除,并重新计算平均时延davg,直到所有di均在区间[davg/α,α·davg]内,则停止迭代,时延区间表示为[davg±δ];其中,α为阈值,δ为调整因子;
步骤4:通过逆向扫描网络路径获取最后几跳同一时延区间内的所有IP;
步骤5:对待验证IP进行定位,通过时延区间和最后几跳IP地理位置进行一致性验证确定待验证IP的最大可能位置。
2.如权利要求1所述的基于时延和地理一致性约束的城市级IP定位方法,其特征在于:所述步骤1中,目标城市IP地址集构建是按照城市粒度提取所有IP地址,表示为
IPc←Retrieve(DB,IP,C) (1)
其中,DB表示待验证的IP定位数据库,C表示待验证的城市。
4.如权利要求1所述的基于时延和地理一致性约束的城市级IP定位方法,其特征在于:所述步骤4中,通过测量服务器采用Traceroute测量从同一测量点到待验证IP的网络路径获取逐跳IP,并对整个路径采用逆向扫描法,即从最后一个跳开始,找出同一时延区间内的所有IP,表示为;
RMC={IPC 1,IPC 2,…,IPC n} (3) 。
5.如权利要求1所述的基于时延和地理一致性约束的城市级IP定位方法,其特征在于:所述步骤5中,通过待验证IP的时延与目标城市IP的平均时延davg作对比,筛选出与待验证IP时延相一致的目标城市,记为待验证城市C'。
6.如权利要求5所述的基于时延和地理一致性约束的城市级IP定位方法,其特征在于:所述步骤5中,对待验证IP最后几跳同一时延区间内RMC={IPC 1,IPC 2,…,IPC n}与待验证城市C'进行地理一致性验证;
若RMC为空集,则判定待验证IP的地理位置不在待验证城市C'中;
如果RMC不为空,则对RMC中所有的IP与待验证城市C'的IP进行对比,统计RMC中IP位于待验证城市C'的数量,若≤|RMC|/2,则判定待验证IP的地理位置不在待验证城市C'中;若>|RMC|/2则待验证IP的地理位置位于待验证城市C'中;
其中location(IP)表示从IP数据库中解析得到待验证IP所在的地理位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711144496.XA CN107920115B (zh) | 2017-11-17 | 2017-11-17 | 一种基于时延和地理一致性约束的城市级ip定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711144496.XA CN107920115B (zh) | 2017-11-17 | 2017-11-17 | 一种基于时延和地理一致性约束的城市级ip定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107920115A CN107920115A (zh) | 2018-04-17 |
CN107920115B true CN107920115B (zh) | 2020-08-11 |
Family
ID=61896599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711144496.XA Active CN107920115B (zh) | 2017-11-17 | 2017-11-17 | 一种基于时延和地理一致性约束的城市级ip定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107920115B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110505237B (zh) * | 2019-09-03 | 2021-08-13 | 中国联合网络通信集团有限公司 | 一种反欺诈方法及系统 |
CN112100471A (zh) * | 2020-09-07 | 2020-12-18 | 北京明略软件系统有限公司 | 分布式爬虫任务调度方法、装置、设备及计算机可读介质 |
CN113411255A (zh) * | 2021-05-12 | 2021-09-17 | 郑州埃文计算机科技有限公司 | 一种自底向上的骨干网路由器分层方法 |
CN113395211B (zh) * | 2021-06-08 | 2022-11-18 | 哈尔滨工业大学(威海) | 一种基于聚类思想的路由ip定位优化方法 |
CN113824810A (zh) * | 2021-08-23 | 2021-12-21 | 南京莱克贝尔信息技术有限公司 | 一种目标驱动的ip地址地理位置推断方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101512375A (zh) * | 2006-07-06 | 2009-08-19 | 高通股份有限公司 | 通信网络上的地理定位终端用户设备 |
CN104506591A (zh) * | 2014-12-11 | 2015-04-08 | 罗向阳 | 一种基于最近共同路由器的目标ip地理位置定位方法 |
CN104715012A (zh) * | 2015-01-15 | 2015-06-17 | 罗向阳 | 基于Internet论坛的网络实体城市级地标挖掘算法 |
CN105116373A (zh) * | 2015-08-31 | 2015-12-02 | 罗向阳 | 基于间接时延的目标ip区域城市级定位算法 |
CN105577477A (zh) * | 2015-12-28 | 2016-05-11 | 哈尔滨工业大学 | 使用概率模型的基于测量的ip地址地理定位系统 |
CN105897944A (zh) * | 2016-03-25 | 2016-08-24 | 胡津瑞 | 一种基于trace的IP地址地理位置库的推断和填充方法 |
CN106571962A (zh) * | 2016-10-27 | 2017-04-19 | 新疆大学 | 基于地理信息的网络延迟情况可视化方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7929535B2 (en) * | 2006-07-07 | 2011-04-19 | Qualcomm Incorporated | Geolocation-based addressing method for IPv6 addresses |
-
2017
- 2017-11-17 CN CN201711144496.XA patent/CN107920115B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101512375A (zh) * | 2006-07-06 | 2009-08-19 | 高通股份有限公司 | 通信网络上的地理定位终端用户设备 |
CN104506591A (zh) * | 2014-12-11 | 2015-04-08 | 罗向阳 | 一种基于最近共同路由器的目标ip地理位置定位方法 |
CN104715012A (zh) * | 2015-01-15 | 2015-06-17 | 罗向阳 | 基于Internet论坛的网络实体城市级地标挖掘算法 |
CN105116373A (zh) * | 2015-08-31 | 2015-12-02 | 罗向阳 | 基于间接时延的目标ip区域城市级定位算法 |
CN105577477A (zh) * | 2015-12-28 | 2016-05-11 | 哈尔滨工业大学 | 使用概率模型的基于测量的ip地址地理定位系统 |
CN105897944A (zh) * | 2016-03-25 | 2016-08-24 | 胡津瑞 | 一种基于trace的IP地址地理位置库的推断和填充方法 |
CN106571962A (zh) * | 2016-10-27 | 2017-04-19 | 新疆大学 | 基于地理信息的网络延迟情况可视化方法及系统 |
Non-Patent Citations (4)
Title |
---|
A Compelete Evaluation of the Chinese IP Geolocation Database;Han Li;《2015 8th International Conference on Intelligent Compution Technology and Automation(ICICTA)》;20150614;全文 * |
IP定位技术的研究;王占丰;《软件学报》;20140731;第25卷(第7期);1527-1540 * |
Modelling of IP geolocation by use of latency measurements;Peter Hillmann;《2015 11th International Congerence on Network and Service Management(CNSM)》;20151109;全文 * |
基于网络测量的IP地理位置定位模型研究;姬祥;《中国优秀硕士学位论文全文数据库信息科技辑》;20150831;I139-96 * |
Also Published As
Publication number | Publication date |
---|---|
CN107920115A (zh) | 2018-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107920115B (zh) | 一种基于时延和地理一致性约束的城市级ip定位方法 | |
Laki et al. | Spotter: A model based active geolocation service | |
Huffaker et al. | DRoP: DNS-based router positioning | |
Katz-Bassett et al. | Towards IP geolocation using delay and topology measurements | |
Scheitle et al. | HLOC: Hints-based geolocation leveraging multiple measurement frameworks | |
Youn et al. | Statistical geolocation of internet hosts | |
CN104506591A (zh) | 一种基于最近共同路由器的目标ip地理位置定位方法 | |
US20100088405A1 (en) | Determining Network Delay and CDN Deployment | |
CN105227688B (zh) | 一种基于路径特征的区域级目标ip定位方法 | |
CN105227689B (zh) | 基于局部时延分布相似性度量的目标ip定位算法 | |
WO2020103908A1 (zh) | 确定终端位置的方法、装置及存储介质 | |
Laitinen et al. | Access point significance measures in WLAN-based location | |
Eriksson et al. | Posit: a lightweight approach for IP geolocation | |
CN105262849B (zh) | 基于可容忍误差的ip定位方法 | |
WO2016180124A1 (zh) | 一种基于定位数据的基站优化方法和装置 | |
Ciavarrini et al. | Geolocation of Internet hosts: Accuracy limits through Cramér–Rao lower bound | |
CN114520799B (zh) | 基于最小圆覆盖的城市内ip定位及误差估计方法及系统 | |
CN111064817B (zh) | 一种基于节点排序的城市级ip定位方法 | |
Ghany et al. | A parametric TDoA technique in the IoT localization context | |
Zu et al. | IP-geolocater: a more reliable IP geolocation algorithm based on router error training | |
CN111711707B (zh) | 基于邻居关系的ip地址定位方法 | |
Chen et al. | A landmark calibration-based IP geolocation approach | |
CN111770528B (zh) | 基于信道参数萃取方法的视距与非视距识别方法及装置 | |
Ghany et al. | A pre-processing algorithm utilizing a paired CRLB for TDoA based IoT positioning | |
Kwon et al. | Passive localization: Large size sensor network localization based on environmental events |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20221209 Address after: No.14 tiantangxin village, Qinhuai District, Nanjing, Jiangsu 210001 Patentee after: NANJING LEXBELL INFORMATION TECHNOLOGY CO.,LTD. Patentee after: Jiangsu Zijin Communication Network Security Engineering Research Center Address before: No.14 tiantangxin village, Qinhuai District, Nanjing, Jiangsu 210001 Patentee before: NANJING LEXBELL INFORMATION TECHNOLOGY CO.,LTD. |
|
TR01 | Transfer of patent right |