CN114520799B - 基于最小圆覆盖的城市内ip定位及误差估计方法及系统 - Google Patents
基于最小圆覆盖的城市内ip定位及误差估计方法及系统 Download PDFInfo
- Publication number
- CN114520799B CN114520799B CN202111610018.XA CN202111610018A CN114520799B CN 114520799 B CN114520799 B CN 114520799B CN 202111610018 A CN202111610018 A CN 202111610018A CN 114520799 B CN114520799 B CN 114520799B
- Authority
- CN
- China
- Prior art keywords
- metropolitan area
- area network
- positioning
- error
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/74—Address processing for routing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Mobile Radio Communication Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明属于IP定位技术领域,特别涉及一种基于最小圆覆盖的城市内IP定位及误差估计方法及系统,通过将目标城市地标集划分为用于估计城域网中各路由器服务范围中心位置的训练集和用于估计各路由器服务范围半径的验证集并分别进行路径探测获取探测路径数据,利用训练集中路径数据从探测路径数据中提取城域网节点拓扑,通过统计地标分布获取位置估计,并利用验证集中路径数据中路径终起点与城域网位置关系来获取路由器定位误差,并依此获取最小圆覆盖的圆心和半径,使用得到的城域网拓扑来获取目标IP定位结果及误差范围。本发明不仅能够提升目标IP定位精度,同时也能够使定位误差范围估计更加准确,以进一步提升目标IP定位效果,便于实际场景应用。
Description
技术领域
本发明属于IP定位技术领域,特别涉及一种基于最小圆覆盖的城市内IP定位及误差估计方法及系统。
背景技术
随着网络的不断发展,个性化服务受到追捧。而获得用户位置来为用户提供定制的服务是个性化服务的重要基础。IP定位技术能够提供不依赖于用户协助的定位服务,在广告投放、社交网络、版权控制等方面应用广泛。在商业应用方面,服务提供商可以根据用户的地理位置为用户提供广告推送、天气预报、网站内容推荐等服务,移动应用程序还可以将IP地理定位技术与GPS技术结合起来,提供更精确的地理定位服务。在网络管理方面,管理者可以通过IP确定目标的位置,解决网络拥塞、节点故障等问题,提高网络管理性能,实现用户访问控制。在网络安全领域,安全机构可以通过IP地理定位技术确定网络犯罪来源的地理位置,有效抑制网络谣言的传播,实现网络犯罪证据的收集。因此,对IP定位的研究具有重要意义和迫切需求。
IP定位通过实现途径可以分为基于数据库的、基于数据挖掘的和基于网络测量的三大类。1)、基于数据库的IP定位通过查询IP位置数据库、比对多种数据库以及数据库间的数据融合来得到定位的结果。但将现有IP地理位置数据库在多个场景中的准确性进行测试后,发现这些数据库在国家级别的准确性几乎为100%,但在区域级别的准确性低于50%,在城市级别的最佳定位精度约为30%。除了精度之外,基于数据库的地理定位还有其他缺点。一方面,很难保证数据库的准确性,数据库只提供查询服务,不能保证查询信息的真实性。事实上,现有文献指出不同的数据库查询结果是不一致的。另一方面,数据库更新不及时。地理位置数据通常来自多年前的注册数据,数据的及时性非常差。2)、基于数据挖掘的IP定位通过挖掘网站、社交网络以及移动应用中的用户数据,并对其进行筛选分析来得到用户的位置信息。与基于数据库的地理定位算法相比,基于数据挖掘的地理定位算法具有实时性高、主动性强的优点,但也存在着定位精度由组织主页和网络服务提供商提供的信息精度决定的缺点。此外,在服务器托管和非协作环境下,获取的信息量和访问效率受到限制,无法达到良好的地理定位效果。3)、基于网络测量的IP定位通过对网络中地标、时延、拓扑等信息的测量与分析,实现对IP的定位。地标是指地理位置已知且不变的特定IP,在此类定位方法过程中扮演重要角色。基于网络测量的地理定位算法具有不依赖用户、实时性高的特点,具有前两种定位算法在非合作条件下所不具备的优点。但为了实现非协作条件下的定位,该类方法也存在探测数据需求量大、定位精度不够高的问题。且在对目标进行定位时出现误差的大小能反映出定位算法的性能。然而,现有关于基于网络测量的IP定位研究往往无法给出单次定位结果的误差范围估计。这种现象导致在得到定位结果后,只能依照算法的经验误差来估计定位结果的误差范围,降低了结果的可信度。
发明内容
为此,本发明提供一种基于最小圆覆盖的城市内IP定位及误差估计方法及系统,不仅能够提升定位精度,同时也能够使定位误差范围估计更加准确,以进一步提升目标IP定位效果。
按照本发明所提供的设计方案,一种基于最小圆覆盖的城市内IP定位及误差估计方法,包含如下内容:
将目标城市地标集划分为用于估计城域网中各路由器服务范围中心位置的训练集和用于估计各路由器服务范围半径的验证集,并通过路径探测来获取对应的路径数据;
利用训练集中路径数据提取目标城市城域网节点,并通过统计城域网节点下辖地标来获取位置估计及目标城市的城域网路由拓扑,其中,位置估计为下辖地标分布的最小圆覆盖圆心;
利用验证集中路径数据中每条路径终起点与城域网位置关系来获取对应城域网节点定位误差,并依据每个城域网节点定位误差来获取用于作为范围估计的最小方差半径,其中,定位误差为路径终点与相应城域网节点所对应的最小圆覆盖圆心之间的地理距离;
对目标进行路径探测获取探测路径中路由节点,并将路由节点按从目标到探测源顺序从城域网路由拓扑中进行匹配,依据匹配到的路由节点的位置估计及范围估计来输出目标的最终定位结果。
作为本发明基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,对目标城市地标集进行划分中,有放回地从地标集中进行采样,达到样本数量后停止采样,将采样选中的地标放入训练集,未选中的地标放入验证集。
作为本发明基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,针对训练集中地标数据,依据/24子网特性对地标数据进行调整,调整内容包含:若地标所属/24子网数量大于预设上限,则随机选取上限数值个所述/24子网,若小于预设上限,则遍历探测地标所属/24子网中所有其他IP,将存活IP地址加入训练集,直至该/24子网IP数量达到预设上限或满足遍历结束条件,结束遍历。
作为本发明基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,路径探测中,利用多个探测源对训练集和验证集中所有地标IP节点进行探测,并按照时延分布规律筛选出属于目标城市的IP节点,得到训练集及验证集中的探测路径数据,其中,筛选过程包含:去除骨干网节点和其他城市节点,保留属于目标城市的IP节点。
作为本发明基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,利用训练集中路径数据提取目标城市城域网中,首先,对训练集中路径数据进行别名解析,然后,合并同一路由器对应的不同IP节点,依据城市内部路由节点间连接关系来获取城域网节点拓扑。
作为本发明基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,获取位置估计及目标城市的城域网路由拓扑中,首先,通过遍历训练集路径数据,对每个探测目标,将其IP作为下辖地标并记录至路径中各城域网路由器属性;然后,遍历目标城市城域网节点,根据每个路由器下辖地标地理分布来计算对应最小圆覆盖,并将最小圆覆盖的半径及作为位置估计的圆心记录至城域网节点属性。
作为本发明基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,针对城域网节点属性,通过构建城域网节点数据库进行存储,数据库中每条记录属性字段至少包含路由器IP、下辖地标列表、最小圆覆盖圆心及半径。
作为本发明基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,获取对应城域网节点定位误差中,遍历验证集路径数据,对于每条探测路径,按照从终点到起点的顺序依次判断是否出现在城域网中,针对出现的情形,获取路径终点与城域网节点所对应的最小圆覆盖圆心之间的距离,将该距离标记为定位误差并添加至城域网节点误差列表属性。
作为本发明基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,依据每个城域网节点定位误差来获取最小方差半径中,遍历城域网节点,对于每个路由器,计算误差列表属性中定位误差的均值,并结合最小圆覆盖半径通过公式来计算得到作为范围估计最小方差半径,其中,计算公式表示为:Ri为最小圆覆盖半径,Errori为误差列表定位误差的均值,n为城域网节点个数。
进一步地,本发明还提供一种基于最小圆覆盖的城市内IP定位及误差估计系统,包含:数据获取模块、位置估计模块、误差计算模块及目标定位模块,其中,
数据获取模块,用于将目标城市地标集划分为用于估计城域网中各路由器服务范围中心位置的训练集和用于估计各路由器服务范围半径的验证集,并通过路径探测来获取对应的路径数据;
位置估计模块,用于利用训练集中路径数据提取目标城市城域网节点,并通过统计城域网节点下辖地标来获取位置估计及目标城市的城域网路由拓扑,其中,位置估计为下辖地标分布的最小圆覆盖圆心;
误差计算模块,用于利用验证集中路径数据中每条路径终起点与城域网位置关系来获取对应城域网节点定位误差,并依据每个城域网节点定位误差来获取用于作为范围估计的最小方差半径,其中,定位误差为路径终点与相应城域网路由节点所对应的最小圆覆盖圆心之间的地理距离;
目标定位模块,用于对目标进行路径探测获取探测路径中路由节点,并将路由节点按从目标到探测源顺序从城域网路由拓扑中进行匹配,依据匹配到的路由节点的位置估计及范围估计来输出目标的最终定位结果。
本发明的有益效果:
本发明通过划分地标集并进行路径探测,从路径数据中提取城域网节点,统计地标分布与路由器定位误差,并依此获取最小圆覆盖的圆心和半径,使用得到的城域网拓扑进行IP定位,得到定位结果及误差范围,在提高定位结果精度的同时,能给出本次定位的误差范围,便于实际场景应用。进一步经过实验数据验证,相比现有SLG、NNG、RNBG、ETBG等典型定位算法,本案方案算法在提高城市级定位成功率和降低城市内定位中值误差的同时,还能够增强城市内定位误差估计能力,具有较好的应用前景。
附图说明:
图1为实施例中基于最小圆覆盖的城市内IP定位及误差估计方法流程示意;
图2为实施例中基于误差训练的定位原理示意;
图3为实施例中两种服务范围确定方案示意;
图4为实施例中目标IP定位及误差估计算法框架示意;
图5为实施例中对比算法城市级定位能力示意;
图6为实施例中对比算法城市级定位实验累计误差概率示意;
图7为实施例中对比算法城市级定位误差评估能力示意。
具体实施方式:
为使本发明的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本发明作进一步详细的说明。
城域网(Metropolitan Area Network,MAN)是在一个城市范围内建立的宽带局域网,将同一城市内部不同地点的主机、服务器和局域网等相互联接起来。MAN多使用多层网络架构来提高网络的安全性和稳定性,而不同层次的路由器所负责的终端数量是有差别的。层次高的路由器会承担更大范围,甚至是整个城市范围的终端的数据交换;层次低的路由器往往只负责特定区域的终端。而得到某个路由器负责的区域范围后,就可以依此来对与其相连的目标进行位置估计。通过IP确定用户的地理位置是开展基于位置的网络服务的重要手段。受传输时延不稳定、地标数量不足等因素的制约,现有IP定位算法还存在定位精度低、误差估计不够精确等问题,难以满足网络服务对定位精度以及可靠性的要求。为此,本发明实施例,提供一种基于最小圆覆盖的城市内IP定位及误差估计方法,参见图1所示,包含如下内容:
S101、将目标城市地标集划分为用于估计城域网中各路由器服务范围中心位置的训练集和用于估计各路由器服务范围半径的验证集,并通过路径探测来获取对应的路径数据;
S102、利用训练集中路径数据提取目标城市城域网节点,并通过统计城域网节点下辖地标来获取位置估计及目标城市的城域网路由拓扑,其中,位置估计为下辖地标分布的最小圆覆盖圆心;
S103、利用验证集中路径数据中每条路径终起点与城域网位置关系来获取对应城域网路由节点定位误差,并依据每个城域网节点定位误差来获取用于作为范围估计的最小方差半径,其中,定位误差为路径终点与相应城域网路由节点所对应的最小圆覆盖圆心之间的地理距离;
S104、对目标进行路径探测获取探测路径中路由节点,并将路由节点按从目标到探测源顺序从城域网路由拓扑中进行匹配,依据匹配到的路由节点的位置估计及范围估计来输出目标的最终定位结果。
通过划分地标集并进行路径探测,从路径数据中提取城域网节点,统计地标分布与路由器定位误差,并依此获取最小圆覆盖的圆心和半径,使用得到的城域网拓扑进行IP定位,得到定位结果及误差范围,在提高定位结果精度的同时,能给出本次定位的误差范围,便于实际场景应用。
作为本发明实施例中基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,对目标城市地标集进行划分中,有放回地从地标集中进行采样,达到样本数量后停止采样,将采样选中的地标放入训练集,未选中的地标放入验证集。
地标是地理位置确定或者可以被确定的IP节点,在定位过程中通常起到基准点的作用。本案实施例中利用两个地标集分别用来得到定位的位置估计及误差范围估计。进一步地,针对训练集中地标数据,依据/24子网特性对地标数据进行调整,调整内容包含:若地标所属/24子网数量大于预设上限,则随机选取上限数值个所述/24子网,若小于预设上限,则遍历探测地标所属/24子网中所有其他IP,将存活IP地址加入训练集,直至该/24子网IP数量达到预设上限或满足遍历结束条件,结束遍历。
在获得目标城市的城域网拓扑后,通过计算城域网中各路由器节点的服务区域并估计目标位置。地标是地理位置确定的IP节点。现有的主流方法对位于目标城市的地标进行探测后,根据探测路径分析路径中间节点,最终得到对应的网络拓扑。处于同一/24子网的IP往往集中在同一地理区域。本案实施例中,可利用这一规律,寻找训练集中地标所在/24子网中的其他可探测节点,并将其放入训练集中,用于目标城市城域网的获取。且基于46001个IP的实验结果表明,对同一/24子网的IP仅选取一个或数个进行探测时,得到的网络拓扑节点数量能够达到探测所有IP时的98%。
对某地市的50000个城市级地标,分别对每个/24子网使用1个、2个、3个、4个、5个、6个和所有可用IP进行探测,获得的拓扑结果如下表所示。
表1 /24子网探测IP数量结果对比
从表中可以看出,当每个/24子网选用2个IP进行探测时,所用时间较短,同时能获得足够多的城域网节点。因此,本案实施例中,可对探测集以每个/24子网至多2个可探测IP为规则进行改良。
作为本发明实施例中基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,路径探测中,利用多个探测源对训练集和验证集中所有地标IP节点进行探测,并按照时延分布规律筛选出属于目标城市的IP节点,得到训练集及验证集中的探测路径数据,其中,筛选过程包含:去除骨干网节点和其他城市节点,保留属于目标城市的IP节点。
训练集路径数据集和验证集路径数据集。在实际实现中,因为在进行跨城市的路径探测时,路径中的单跳时延会呈现一种“低-高-低”的分布规律。因此,在得到探测路径后,可根据节点间时延变化只保留位于目标城市的部分,以此减少运算负担并降低计算误差。
作为本发明实施例中基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,利用训练集中路径数据提取目标城市城域网中,首先,对训练集中路径数据进行别名解析,然后,合并同一路由器对应的不同IP节点,依据城市内部路由节点间连接关系来获取城域网节点拓扑。进一步地,获取位置估计及目标城市的城域网路由拓扑中,首先,通过遍历训练集路径数据,对每个探测目标,将其IP作为下辖地标并记录至路径中各城域网路由器属性;然后,遍历目标城市城域网节点,根据每个路由器下辖地标地理分布来计算对应最小圆覆盖,并将最小圆覆盖的半径及作为位置估计的圆心记录至城域网节点属性。
城域网中路由器负责城市内部的数据接入、交换与传输工作。数据包经过各个路由器的转发,最终到达目标终端。城域网内路由器越接近核心路由器,管理的用户越多,这些用户的地理位置越不容易确定;反之,越接近接入路由器,管理的用户越少,对应用户的地理位置往往倾向于集中在某一块特定区域。本案实施例中,通过确定这些区域的位置与大小来估计由对应路由器管辖的IP用户的地理位置,具体算法可为如算法1所示:
获取每个城域网节点对应的下辖地标列表并依此计算最小圆覆盖是本步骤的关键点。Alg.1描述了该部分的具体实现。代码行1到10,通过遍历训练集路径数据集,统计与城域网中各节点相连的地标,并记录在城域网节点属性中。代码行11到14,遍历城域网中的每个节点,可使用Welzl算法,通过其下辖地标的分布计算得到对应最小圆覆盖的圆心和半径,并记录在城域网节点属性中。在城域网中,更高一层的路由器的下辖地标为其下一层所有路由器下辖地标的并集。在实际实现中,进一步可通过构建城域网节点数据库来存储对应属性数据,每条记录的字段包含路由器IP、下辖地标列表、计算得到后得到的最小圆覆盖圆心和半径等属性。经过上述内容,可得到目标城市的城域网拓扑,其中每个路由节点都拥有了各自的位置估计。
在城域网中,不同路由器负责的用户数量和分布范围都有差别,通常距离骨干网路由器跳数越多,负责的用户数量越少,用户分布更集中。因此,本案实施例中,针对路由器所具有的这种特性,利用已知的地标数据,通过模拟定位过程来得到城域网节点的业务范围,也就是其误差范围。
现有使用路由器划分后模拟定位的方式来确定各路由器的定位结果,分析路径集与城域网拓扑的重合关系,按照先跳数后时延的优先级顺序确定城域网中各路由节点对应的最近地标,以该地标位置为该路由节点的定位结果。在图2所示,将距R2最近的地标L3的位置定为R2的定位结果,将与R2相连的地标间的最大距离定为R2的误差估计半径。然而,跳数和时延在高精度定位过程中并不一定存在与地理距离间的正相关关系。当地标与路由器间时延最小但地理距离较大时,该方法会产生较大误差。本案实施例方案在实验过程中,测试了两种确定服务范围中心的方法。一种是根据路由器下辖地标的分布,计算其对应的最小圆覆盖,得到对应的圆心和半径;另一种是计算路由器下辖地标的算术中心作为服务范围中心,以距离算术中心最远的地标与该中心间的距离作为服务范围半径。图3展示两个服务范围确定方式的示意图。可以看出,基于最小圆覆盖的方式获得的服务范围通常更小,而基于算术中心的方式获得的圆心更能够体现出该范围地标的聚集中心。因此,可利用位于A地市的5442个街道级地标进行对比实验,实验结果见表2。
如表2所示,基于最小圆覆盖的方式以降低6%的定位精度为代价,提升了20%的误差估计精度,且此时定位精度也高于已有算法。因此,本案实施例方案中采用基于最小圆覆盖的方式确定服务范围中心和半径,能够获得更好的估计效果。
表2三种服务范围确定方式性能对比
作为本发明实施例中基于最小圆覆盖的城市内IP定位及误差估计方法,进一步地,获取对应城域网路由节点定位误差中,遍历验证集路径数据,对于每条探测路径,按照从终点到起点的顺序依次判断是否出现在城域网中,针对出现的情形,获取路径终点与城域网路由节点所对应的最小圆覆盖圆心之间的距离,将该距离标记为定位误差并添加至城域网节点误差列表属性。进一步地,依据每个城域网节点定位误差来获取最小方差半径中,遍历城域网节点,对于每个路由器,计算误差列表属性中定位误差的均值,并结合最小圆覆盖半径通过公式来计算得到作为范围估计最小方差半径。
通过获得目标城市网络中各路由器与地标的连接情况来推断其用户的位置范围,对路由器所连接的用户进行定位。并通过验证集路径数据统计路由器定位误差,并计算误差方差最小时最小圆覆盖的半径,通过此途径计算此城市的地标分布与定位误差间的关系,估计路由器的服务范围,其实现算法可如算法2所示:
从步骤1到步骤7,遍历验证集路径数据集,计算得到每条路径终点与路径中距离终点跳数最少的城域网节点所对应的最小圆覆盖圆心之间的地理距离,记为误差并列入该城域网节点的误差列表中。代码行8到10,遍历城域网中的每个节点,计算其误差列表的均值,并上方公式计算其对应的半径,记录在属性中。通过以上内容,可进一步完善目标城市的城域网拓扑的各个属性,每个路由节点都拥有了各自的范围估计。
通过路由器下辖地标的分布计算得到了最小圆覆盖。其属性包括圆心和半径。圆心可以作为城域网节点的位置中心估计,而服务范围半径却不一定能用最小圆覆盖的半径。众所周知,服务范围半径越大,面积越大,而未知IP目标所位于此范围的概率也会越大。但一味地追求大范围是意义不大。如何使估计的服务范围尽可能小的同时,让此范围能够包含尽可能多的节点。本案实施例中,采用最小方差的策略来计算城域网节点的服务范围。计算得到的最小圆覆盖半径,通常不能作为最佳的服务范围半径,而使其乘以一个参数,即可以得到最小方差条件下的服务范围半径,最小方差的计算公式推导过程可设计为如下:
对于每个城域网节点,它的误差均值为Errori,计算得到的最小圆覆盖半径为Ri,则每个城域网节点的定位误差与半径的差值为|Errori-Ri|。
对于该城市的城域网,其节点定位误差与最小圆覆盖半径间差值的方差为
若使此方差最小,可变动的参数为Ri。为方便计算,使Ri乘以一个参数a,有
其导数为
容易看出,当
时,方差取极小值。进而推导得到
通过上述公式,计算得到各城域网节点误差方差最小条件下最小圆覆盖的半径,进而可以进行定位误差的估计。
在完成对城域网节点属性的完善后,利用城域网节点下辖地标的列表与各路由所管辖区域的大致位置和范围对目标进行位置估计。对目标进行探测并记录其探测路径,并按照时延分布规律去除路径中的骨干网节点与其他城市节点,保留属于目标城市的IP节点;将所得路径中的路由节点按从目标至探测源的顺序从城域网中进行匹配,若找到相同的路由器,则将对应路由器属性中的位置估计和范围估计输出为定位结果;在实现目标位置估计的同时,还能得出定位结果的范围估计,增加定位结果的可信度。
进一步地,基于上述的方法,本发明实施例还提供一种基于最小圆覆盖的城市内IP定位及误差估计系统,包含:数据获取模块、位置估计模块、误差计算模块及目标定位模块,其中,
数据获取模块,用于将目标城市地标集划分为用于估计城域网中各路由器服务范围中心位置的训练集和用于估计各路由器服务范围半径的验证集,并通过路径探测来获取对应的路径数据;
位置估计模块,用于利用训练集中路径数据提取目标城市城域网节点,并通过统计城域网节点下辖地标来获取位置估计及目标城市的城域网路由拓扑,其中,位置估计为下辖地标分布的最小圆覆盖圆心;
误差计算模块,用于利用验证集中路径数据中每条路径终起点与城域网位置关系来获取对应城域网路由节点定位误差,并依据每个城域网节点定位误差来获取用于作为范围估计的最小方差半径,其中,定位误差为路径终点与相应城域网路由节点所对应的最小圆覆盖圆心之间的地理距离;
目标定位模块,用于对目标进行路径探测获取探测路径中路由节点,并将路由节点按从目标到探测源顺序从城域网路由拓扑中进行匹配,依据匹配到的路由节点的位置估计及范围估计来输出目标的最终定位结果。
为验证本案方案有效性,下面结合实验数据做进一步解释说明:
本案实施例方案实现算法可如图4所示,包含地标集处理与路径探测、城域网路由器提取与位置估计、路由器服务范围估计、城市内IP定位及误差估计,每一部分的实现过程如上内容所述。实验中,已知位置的IP数据主要采用如下两种方法获得:中国街道级地标:从已有公开数据库IPIP、IP2Location中,查询返回结果中具有街道级位置的IP,并对其声称位置的可信度进行评估,保留位置可靠的IP地址。在搭建实验环境时,共部署探测源4个。由于城市级定位是街道级定位的基础,所以在进行实验时,先对城市级的定位结果进行比较分析,而后进行城市内部的定位实验。
使用CAIDA开发的Scamper对目标发起路径探测。在探测目标网络拓扑信息时,综合使用ICMP、TCP、UDP、ICMP-paris、UDP-paris五种类型的协议,通过采用多协议路径探测,提高拓扑信息获取规模。ICMP-paris和UDP-paris协议还会避免错误路径信息的产生。使用SLG、RNBG、ETBG等方法作为对比方法,详细配置如下表3所示。
表3实验设置
为确保最基本的城市级定位能力,本案实验在挑选12个城市在同一ISP下进行定位实验。实验结果图5所示。经过统计,在同一ISP环境下,SLG算法城市级定位成功率为94.23%,RNBG城市级定位成功率为97.78%,ETBG定位成功率为97.73%,本案算法城市级定位成功率为97.76%。与SLG算法相比,本案算法拥有更高的城市级定位成功率。在与RNBG算法有相近的城市级定位能力的同时,本案算法与ETBG一样,能够对城市内部的目标更高精度的进行位置估计。
随后,在上述城市内部使用多种定位算法进行实验。图6展示定位实验的累计误差概率,即小于给定定位误差的结果占全部定位结果的比例。图中,曲线越接近左上角,则误差距离越小,定位结果越好。经统计,SLG、ETBG和本案算法的定位均值误差为16.81km、10.82km和6.58km,中值误差为15.12km,7.91km和4.83km。可以看出,本案算法方案的定位结果要优于SLG、ETBG等定位算法。
在城市内定位的基础上,在中国12个进行城市内定位误差估计实验,结果如表4及图7所示。
表4定位误差评估能力汇总
在图7中,点到横轴的距离代表着定位的精度,距离越近则表示精度越高;同时,点到两坐标轴角平分线的距离代表着估计误差与实际误差之间的差距,距离越近意味着差距越小。从图中可以看出,大部分的定位结果都维持在误差较低的水平。经统计,ETBG和本案算法评估的误差分别有62.73%和76.31%的概率与实际误差相差不超过5km,78.82%和90.29%的概率实际误差相差不超过10km。并将各项实验结果汇总至表5中。
表5实验结果汇总
如表5所示,通过对城市内部路由器的提取和训练,相比LBG、SLG、ETBG等典型算法,本案方案算法进一步提高了定位能力,将定位成功率提升至97.72%,将定位中值误差降低至4.78km,同时还将定位估计误差降低至3.69km。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
基于上述的方法和/或系统,本发明实施例还提供一种服务器,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的方法。
基于上述的方法和/或系统,本发明实施例还提供一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现上述的方法。
在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种基于最小圆覆盖的城市内IP定位及误差估计方法,其特征在于,包含如下内容:
将目标城市地标集划分为用于估计城域网中各路由器服务范围中心位置的训练集和用于估计各路由器服务范围半径的验证集,并通过路径探测来获取对应的路径数据;
利用训练集中路径数据提取目标城市城域网节点,并通过统计城域网节点下辖地标来获取位置估计及目标城市的城域网路由拓扑,其中,位置估计为下辖地标分布的最小圆覆盖圆心;
利用验证集中路径数据中每条路径终起点与城域网位置关系来获取对应城域网节点定位误差,并依据每个城域网节点定位误差来获取用于作为范围估计的最小方差半径,其中,定位误差为路径终点与相应城域网节点所对应的最小圆覆盖圆心之间的地理距离;
对目标进行路径探测获取探测路径中路由节点,并将路由节点按从目标到探测源顺序从城域网路由拓扑中进行匹配,依据匹配到的路由节点的位置估计及范围估计来输出目标的最终定位结果。
2.根据权利要求1所述的基于最小圆覆盖的城市内IP定位及误差估计方法,其特征在于,对目标城市地标集进行划分中,有放回地从地标集中进行采样,达到样本数量后停止采样,将采样选中的地标放入训练集,未选中的地标放入验证集。
3.根据权利要求1或2所述的基于最小圆覆盖的城市内IP定位及误差估计方法,其特征在于,针对训练集中地标数据,依据/24子网特性对地标数据进行调整,调整内容包含:若地标所属/24子网数量大于预设上限,则随机选取上限数值个所述/24子网,若小于预设上限,则遍历探测地标所属/24子网中所有其他IP,将存活IP地址加入训练集,直至该/24子网IP数量达到预设上限或满足遍历结束条件,结束遍历。
4.根据权利要求1所述的基于最小圆覆盖的城市内IP定位及误差估计方法,其特征在于,路径探测中,利用多个探测源对训练集和验证集中所有地标IP节点进行探测,并按照时延分布规律筛选出属于目标城市的IP节点,得到训练集及验证集中的探测路径数据,其中,筛选过程包含:去除骨干网节点和其他城市节点,保留属于目标城市的IP节点。
5.根据权利要求1所述的基于最小圆覆盖的城市内IP定位及误差估计方法,其特征在于,利用训练集中路径数据提取目标城市城域网中,首先,对训练集中路径数据进行别名解析,然后,合并同一路由器对应的不同IP节点,依据城市内部路由节点间连接关系来获取城域网节点拓扑。
6.根据权利要求1或5所述的基于最小圆覆盖的城市内IP定位及误差估计方法,其特征在于,获取位置估计及目标城市的城域网路由拓扑中,首先,通过遍历训练集路径数据,对每个探测目标,将其IP作为下辖地标并记录至路径中各城域网路由器属性;然后,遍历目标城市城域网节点,根据每个路由器节点下辖地标地理分布来计算对应最小圆覆盖,并将最小圆覆盖的半径及作为位置估计的圆心记录至城域网节点属性。
7.根据权利要求6所述的基于最小圆覆盖的城市内IP定位及误差估计方法,其特征在于,针对城域网路由器节点属性,通过构建城域网节点数据库进行存储,数据库中每条记录属性字段至少包含路由器IP、下辖地标列表、最小圆覆盖圆心及半径。
8.根据权利要求1所述的基于最小圆覆盖的城市内IP定位及误差估计方法,其特征在于,获取对应城域网节点定位误差中,遍历验证集路径数据,对于每条探测路径,按照从终点到起点的顺序依次判断是否出现在城域网中,针对出现的情形,获取路径终点与城域网节点所对应的最小圆覆盖圆心之间的距离,将该距离标记为定位误差并添加至城域网节点误差列表属性。
10.一种基于最小圆覆盖的城市内IP定位及误差估计系统,其特征在于,包含:数据获取模块、位置估计模块、误差计算模块及目标定位模块,其中,
数据获取模块,用于将目标城市地标集划分为用于估计城域网中各路由器服务范围中心位置的训练集和用于估计各路由器服务范围半径的验证集,并通过路径探测来获取对应的路径数据;
位置估计模块,用于利用训练集中路径数据提取目标城市城域网节点,并通过统计城域网节点下辖地标来获取位置估计及目标城市的城域网路由拓扑,其中,位置估计为下辖地标分布的最小圆覆盖圆心;
误差计算模块,用于利用验证集中路径数据中每条路径终起点与城域网位置关系来获取对应城域网节点定位误差,并依据每个城域网节点定位误差来获取用于作为范围估计的最小方差半径,其中,定位误差为路径终点与相应城域网节点所对应的最小圆覆盖圆心之间的地理距离;
目标定位模块,用于对目标进行路径探测获取探测路径中路由节点,并将路由节点按从目标到探测源顺序从城域网路由拓扑中进行匹配,依据匹配到的路由节点的位置估计及范围估计来输出目标的最终定位结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111610018.XA CN114520799B (zh) | 2021-12-27 | 2021-12-27 | 基于最小圆覆盖的城市内ip定位及误差估计方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111610018.XA CN114520799B (zh) | 2021-12-27 | 2021-12-27 | 基于最小圆覆盖的城市内ip定位及误差估计方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114520799A CN114520799A (zh) | 2022-05-20 |
CN114520799B true CN114520799B (zh) | 2023-05-05 |
Family
ID=81596067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111610018.XA Active CN114520799B (zh) | 2021-12-27 | 2021-12-27 | 基于最小圆覆盖的城市内ip定位及误差估计方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114520799B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114826933B (zh) * | 2022-06-29 | 2022-09-09 | 中国人民解放军国防科技大学 | 一种基于节点位置未知的非协作式拓扑推断方法 |
CN115665237B (zh) * | 2022-12-28 | 2023-03-14 | 中国电子信息产业集团有限公司第六研究所 | 一种ip地址实时定位方法及系统 |
CN116192722B (zh) * | 2022-12-31 | 2024-08-02 | 中国人民解放军战略支援部队信息工程大学 | 基于多源数据融合分析的网络边界识别方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102223710A (zh) * | 2003-06-27 | 2011-10-19 | 高通股份有限公司 | 用于无线网络混合定位的方法和设备 |
CN104833370A (zh) * | 2014-02-08 | 2015-08-12 | 本田技研工业株式会社 | 用于映射、定位和位姿校正的系统和方法 |
CN105262849A (zh) * | 2015-08-31 | 2016-01-20 | 罗向阳 | 基于可容忍误差的ip定位方法 |
CN107317891A (zh) * | 2017-05-10 | 2017-11-03 | 郑州埃文计算机科技有限公司 | 一种面向动态ip多区域性分布的地理位置定位方法 |
CN110119437A (zh) * | 2019-04-03 | 2019-08-13 | 中国人民解放军战略支援部队信息工程大学 | 具有误差上限的网络实体地标评估方法及装置 |
CN110995885A (zh) * | 2019-12-13 | 2020-04-10 | 罗向阳 | 一种基于路由器误差训练的ip定位方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100020776A1 (en) * | 2007-11-27 | 2010-01-28 | Google Inc. | Wireless network-based location approximation |
US10338209B2 (en) * | 2015-04-28 | 2019-07-02 | Edh Us Llc | Systems to track a moving sports object |
US11620518B2 (en) * | 2019-05-13 | 2023-04-04 | Nec Corporation | Landmark-based classification model updating |
-
2021
- 2021-12-27 CN CN202111610018.XA patent/CN114520799B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102223710A (zh) * | 2003-06-27 | 2011-10-19 | 高通股份有限公司 | 用于无线网络混合定位的方法和设备 |
CN104833370A (zh) * | 2014-02-08 | 2015-08-12 | 本田技研工业株式会社 | 用于映射、定位和位姿校正的系统和方法 |
CN105262849A (zh) * | 2015-08-31 | 2016-01-20 | 罗向阳 | 基于可容忍误差的ip定位方法 |
CN107317891A (zh) * | 2017-05-10 | 2017-11-03 | 郑州埃文计算机科技有限公司 | 一种面向动态ip多区域性分布的地理位置定位方法 |
CN110119437A (zh) * | 2019-04-03 | 2019-08-13 | 中国人民解放军战略支援部队信息工程大学 | 具有误差上限的网络实体地标评估方法及装置 |
CN110995885A (zh) * | 2019-12-13 | 2020-04-10 | 罗向阳 | 一种基于路由器误差训练的ip定位方法 |
Non-Patent Citations (2)
Title |
---|
Shuodi Zu,Xiangyang Luo,Fan Zhang."IP-geolocater: a more reliable IP geoloation algorithm based on router error training".《SpringerLink Frontiers of Computer Sience》.2021,全文. * |
杨文."网络实体地标挖掘数研究".《中国优秀硕士学位论文全文数据库》.2020,全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114520799A (zh) | 2022-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114520799B (zh) | 基于最小圆覆盖的城市内ip定位及误差估计方法及系统 | |
US7296088B1 (en) | System and method for determining the geographic location of internet hosts | |
Huffaker et al. | DRoP: DNS-based router positioning | |
Katz-Bassett et al. | Towards IP geolocation using delay and topology measurements | |
CN104506591B (zh) | 一种基于最近共同路由器的目标ip地理位置定位方法 | |
CN102246463B (zh) | 网络设备的地理位置映射 | |
CN110995885B (zh) | 一种基于路由器误差训练的ip定位方法 | |
CN105227688B (zh) | 一种基于路径特征的区域级目标ip定位方法 | |
Youn et al. | Statistical geolocation of internet hosts | |
Zhao et al. | IP Geolocation based on identification routers and local delay distribution similarity | |
CN111064817B (zh) | 一种基于节点排序的城市级ip定位方法 | |
CN110012128A (zh) | 基于路由跳数的网络实体地标筛选方法 | |
US11792110B2 (en) | Geolocation system and method | |
Chen et al. | Towards IP location estimation using the nearest common router | |
Zu et al. | IP-geolocater: a more reliable IP geolocation algorithm based on router error training | |
Chen et al. | A landmark calibration-based IP geolocation approach | |
CN108848203A (zh) | 一种中国网络边界的识别方法及系统 | |
Xiang et al. | No-jump-into-latency in china's internet! toward last-mile hop count based ip geo-localization | |
Hillmann et al. | On the path to high precise ip geolocation: A self-optimizing model | |
CN105245628B (zh) | 一种适用于弱连接网络的网络实体地理位置定位方法 | |
Zhao et al. | City-level geolocation based on routing feature | |
CN113395211B (zh) | 一种基于聚类思想的路由ip定位优化方法 | |
Hillmann et al. | Dragoon: advanced modelling of IP geolocation by use of latency measurements | |
Wong et al. | Geolocalization on the Internet through Constraint Satisfaction. | |
Zu et al. | GUI: A Geolocation Method for Unreachable IP |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |