CN115086411A - 一种ip定位方法、系统、存储介质及电子设备 - Google Patents
一种ip定位方法、系统、存储介质及电子设备 Download PDFInfo
- Publication number
- CN115086411A CN115086411A CN202210679210.2A CN202210679210A CN115086411A CN 115086411 A CN115086411 A CN 115086411A CN 202210679210 A CN202210679210 A CN 202210679210A CN 115086411 A CN115086411 A CN 115086411A
- Authority
- CN
- China
- Prior art keywords
- address
- classification result
- positioning
- score
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000000875 corresponding effect Effects 0.000 claims description 59
- 230000003068 static effect Effects 0.000 claims description 50
- 238000000605 extraction Methods 0.000 claims description 42
- 238000013507 mapping Methods 0.000 claims description 39
- 230000002596 correlated effect Effects 0.000 claims description 17
- 238000005516 engineering process Methods 0.000 claims description 12
- 230000002123 temporal effect Effects 0.000 claims description 12
- 238000010801 machine learning Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000005065 mining Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种IP定位方法、系统、存储介质及电子设备,将获取到的待定位IP地址与地理区域进行关联,对关联后的待定位IP地址进行分类得到分类结果,根据时空特征和分类结果,将关联后的待定位IP地址映射到粗粒度区域,通过获取到的定位分数和分类结果确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位。基于上述,通过分类得到的IP类型将待定位IP地址的定位候选区域限制在粗粒度范围内,并通过定位分数和IP类型确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位,由于本方案的IP定位方式不受网络拓扑结构的影响,因此也不会受到网络延时的影响,从而提高IP定位的定位速度和定位精度。
Description
技术领域
本申请涉及定位技术领域,更具体地说,涉及一种IP定位方法、系统、存储介质及电子设备。
背景技术
网际互连协议(Internet Protocol,IP)地理定位geolocation是一种将IP地址与现实世界中一个地理位置相关联的技术。
现有的IP定位技术大致分为两种,一是利用网络拓扑和网络时延的方式;二是利用网络挖掘的方式。
对于网络拓扑和网络时延的方式,通常是从目标targetIP与锚点landmarks之间的报文在网络传输中的网络时延与两者在实际地理空间中的距离相关性出发的,但是当出现网络时延时,网络状态会受到影响,导致网络状态变化起伏,且IP定位精度很大程度上受到landmarks的数量以及网络状态的影响,造成IP定位技术的精度低以及定位速度慢。
对于网络挖掘的方式,通常是利用网络爬虫方式或者分析用户报文的方式,挖掘出服务器与实际地址之间的对应关系,虽然这种网络挖掘的方式不受限于网络状态以及landmarks数量的影响,但是这种IP定位方式是基于数据库(DataBase,DB)的方式,存在IP地址覆盖范围的小等缺点,造成定位精度低。
因此,现有IP定位的定位速度慢,且定位精度低。
发明内容
有鉴于此,本申请公开了一种IP定位方法、系统、存储介质及电子设备,旨在提高IP定位的定位速度和定位精度。
为了实现上述目的,其公开的技术方案如下:
本申请第一方面公开了一种IP定位方法,所述方法包括:
将获取到的待定位IP地址与地理区域进行关联;
对关联后的待定位IP地址进行分类,得到分类结果;所述分类结果用于表征关联后的待定位IP地址对应的IP类型;所述IP类型包括动态IP或静态IP;
根据关联后的待定位IP地址的时空特征和所述分类结果,将关联后的待定位IP地址映射到粗粒度区域;所述粗粒度区域为将所述IP地址的定位限制在候选区域;
获取提取点的时空特征;所述提取点由所述关联后的待定位IP地址在所述粗粒度区域中对应的报点的时间特征和空间特征进行聚类生成的点;
基于所述提取点的时空特征,确定定位分数;
通过所述定位分数和所述分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位。
优选的,所述将获取到的待定位IP地址与地理区域进行关联,包括:
获取待定位IP地址对应的报点信息;所述报点信息用于表征所述待定位IP地址的位置信息;
通过预设空间点索引算法和预设地理围栏匹配技术将所述报点信息与地理区域进行关联。
优选的,所述对关联后的待定位IP地址进行分类,得到分类结果,包括:
分别提取关联后的待定位IP地址的空间特征和关联后的待定位IP地址的时间特征;所述空间特征用于表征关联后的待定位IP地址在不同空间范围的空间特征;所述时间特征用于表征关联后的待定位IP地址在不同时间范围的时间特征;
通过预设机器学习模型对所述关联后的待定位IP地址的空间特征和所述关联后的待定位IP地址的时间特征进行二分类操作,得到分类结果。
优选的,所述根据关联后的待定位IP地址的时空特征和所述分类结果,将关联后的待定位IP地址映射到粗粒度区域,包括:
当所述分类结果为动态IP的分类结果时,将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和动态IP进行加权求和,得到第一空间得分;所述第一空间得分用于表征动态IP的分类结果对应的待定位IP地址在不同空间范围的可信度;
通过所述第一空间得分和预设映射阈值,将关联后的待定位IP地址映射到第一粗粒度区域范围;
或,
当所述分类结果为静态IP的分类结果时,将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和静态IP进行加权求和,得到第二空间得分;所述第二空间得分用于表征静态IP的分类结果对应的待定位IP地址在不同空间范围的可信度;
通过所述第二空间得分和预设映射阈值,将关联后的待定位IP地址映射到第二粗粒度区域范围;所述第二粗粒度区域范围小于所述第一粗粒度区域范围。
优选的,所述基于所述提取点的时空特征,确定定位分数,包括:
通过预设聚类算法,对关联后的待定位IP地址在所述粗粒度区域中对应的报点的时空特征和辅助特征进行聚类,得到多个空间独立的簇;
通过预设定位算法,对所述提取点的时间特征和所述提取点的空间特征进行计算,得到定位分数;所述定位分数为所述IP地址对应所述多个空间独立的簇的定位分数。
优选的,通过所述定位分数和所述分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位,包括:
当分类结果为动态IP的分类结果时,获取动态IP的分类结果的分数阈值;
通过所述定位分数和动态IP的分类结果的分数阈值,从所述多个空间独立的簇中确定动态IP的分类结果对应的第一细粒度区域;
或,
当分类结果为静态IP的分类结果时,获取静态IP的分类结果的分数阈值;
通过所述定位分数和所述静态IP的分类结果的分数阈值,从所述多个空间独立的簇中确定静态IP的分类结果对应的第二细粒度区域;所述第二细粒度区域小于所述第一细粒度区域。
本申请第二方面公开了一种IP定位系统,所述系统包括:
关联单元,用于将获取到的待定位IP地址与地理区域进行关联;
分类单元,用于对关联后的待定位IP地址进行分类,得到分类结果;所述分类结果用于表征关联后的待定位IP地址对应的IP类型;所述IP类型包括动态IP或静态IP;
映射单元,用于根据关联后的待定位IP地址的时空特征和所述分类结果,将关联后的待定位IP地址映射到粗粒度区域;所述粗粒度区域为将所述IP地址的定位限制在候选区域;
获取单元,用于获取提取点的时空特征;所述提取点由所述关联后的待定位IP地址在所述粗粒度区域中对应的报点的时间特征和空间特征进行聚类生成的点;
第一确定单元,用于基于所述提取点的时空特征,确定定位分数;
第二确定单元,用于通过所述定位分数和所述分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位。
优选的,所述关联单元,包括:
获取模块,用于获取待定位IP地址对应的报点信息;所述报点信息用于表征所述待定位IP地址的位置信息;
关联模块,用于通过预设空间点索引算法和预设地理围栏匹配技术将所述报点信息与地理区域进行关联。
本申请第三方面公开了一种存储介质,其特征在于,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如第一方面任意一项所述的IP定位方法。
本申请第四方面公开了一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如第一方面任意一项所述的IP定位方法。
经由上述技术方案可知,本申请公开了一种IP定位方法、系统、存储介质及电子设备,将获取到的待定位IP地址与地理区域进行关联,对关联后的待定位IP地址进行分类,得到分类结果,分类结果用于表征关联后的待定位IP地址对应的IP类型,IP类型包括动态IP或静态IP,根据关联后的待定位IP地址的时空特征和分类结果,将关联后的待定位IP地址映射到粗粒度区域,粗粒度区域为将IP地址的定位限制在候选区域,获取提取点的时空特征,提取点由关联后的待定位IP地址在粗粒度区域中对应的报点的时间特征和空间特征进行聚类生成的点,基于提取点的时空特征,确定定位分数,通过定位分数和分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位。基于上述,通过分类得到的IP类型将待定位IP地址的定位候选区域限制在粗粒度范围内,并通过定位分数和IP类型确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位,由于本方案的IP定位方式不受网络拓扑结构的影响,因此也不会受到网络延时的影响,从而提高IP定位的定位速度和定位精度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的一种IP定位装置的架构图;
图2为本申请实施例公开的Map Match子模块14将报点信息与地理区域进行关联的示意图;
图3为本申请实施例公开的IP Classification子模块15关联后的待定位IP地址进行分类,得到分类结果的示意图;
图4为本申请实施例公开的Majority Voting子模块16将关联后的待定位IP地址映射到粗粒度区域的示意图;
图5为本申请实施例公开的Cluster子模块17得到多个空间独立的簇的示意图;
图6为本申请实施例公开的Score Calculate子模块18得到定位分数的示意图;
图7为本申请实施例公开的Location Selection子模块19确定待定位IP地址所属的细粒度区域的示意图;
图8为本申请实施例公开的一种IP定位方法的流程示意图;
图9为本申请实施例公开的一种IP定位系统的结构示意图;
图10为本申请实施例公开的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,现有的IP定位技术大致分为两种,一是利用网络拓扑和网络时延的方式;二是利用网络挖掘的方式。利用网络拓扑和网络时延的方式造成IP定位技术的精度低以及定位速度慢,而网络挖掘的方式基于数据库(DataBase,DB)的方式,存在IP地址覆盖范围的小等缺点,造成定位精度低。因此,现有IP定位的定位速度慢,且定位精度低。
为了解决上述问题,本申请公开了一种IP定位方法、系统、存储介质和电子设备,通过分类得到的IP类型将待定位IP地址的定位候选区域限制在粗粒度范围内,并通过定位分数和IP类型确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位,由于本方案的IP定位方式不受网络拓扑结构的影响,因此也不会受到网络延时的影响,从而提高IP定位的定位速度和定位精度。具体实现方式通过下述实施例具体进行说明。
本方案进行IP定位处理所涉及到的用户的报点信息均已提前获取用户授权,IP定位处理均符合相关法律法规要求。
以下首先介绍本申请的一种IP定位方法及系统所适用的IP定位装置的架构图,具体参考图1所示,该IP定位装置包括客户端11、粗粒度模块12和细粒度模块13,其中,粗粒度模块12中设置地图匹配Map Match子模块14、网际互连协议分类IP Classification子模块15和Majority Voting子模块16,细粒度模块13中设置集群Cluster子模块17、分数计算Score Calculate子模块18和位置选择Location Selection子模块19。
Map Match子模块14、IP Classification子模块15、Majority Voting子模块16、Cluster子模块17、分数计算Score Calculate子模块18和Location Selection子模块19之间的数据交互的过程如下:
Map Match子模块14将获取到的待定位IP地址与地理区域进行关联。
具体的,Map Match子模块14获取待定位IP地址对应的报点信息;报点信息用于表征待定位IP地址的位置信息;通过预设空间点索引算法和预设地理围栏匹配技术将报点信息与地理区域进行关联。
其中,报点信息包括网络类型、上网时间等信息。
Map Match子模块14通过预设空间点索引算法和预设地理围栏匹配技术将报点信息与地理区域进行关联,具体可参考图2进行举例说明。
图2中,比如报点信息(120.441038,36.15112)经过预设空间点索引算法和预设地理围栏匹配技术与山东省青岛市李沧区相关联。
IP Classification子模块15对关联后的待定位IP地址进行分类,得到分类结果;分类结果用于表征关联后的待定位IP地址对应的IP类型;IP类型包括动态IP或静态IP。
IP Classification子模块15对关联后的待定位IP地址进行分类,得到分类结果的过程,结合图3进行说明。
图3中,首先,IP Classification子模块15分别提取关联后的待定位IP地址的空间特征(IP地址的空间特征)和关联后的待定位IP地址的时间特征(IP地址的时间特征)。
其中,空间特征用于表征关联后的待定位IP地址在不同空间范围的空间特征;时间特征用于表征关联后的待定位IP地址在不同时间范围的时间特征。
不同空间范围指省、市、区、县等空间范围。
然后,IP Classification子模块15通过预设机器学习模型对关联后的待定位IP地址的空间特征和关联后的待定位IP地址的时间特征进行二分类操作,得到分类结果。
IP Classification子模块15根据分类结果将IP的候选区域限制在nation、province、city、county等不同程度粗粒度范围。粗粒度模块12将IP地址映射到粗粒度的区域,通过该模块,可以将IP对应的区域进行粗略的确定,并且可以打大幅减少IP对应的报点数量,加速后续处理流程。
IP Classification子模块15将关联后的待定位IP地址的空间特征和关联后的待定位IP地址的时间特征发送至Score Calculate子模块18。
当分类结果为动态IP的分类结果时,Score Calculate子模块18将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和动态IP进行加权求和,得到第一空间得分;第一空间得分用于表征动态IP的分类结果对应的待定位IP地址在不同空间范围的可信度。
Majority Voting子模块16通过第一空间得分和预设映射阈值,将关联后的待定位IP地址映射到第一粗粒度区域范围。
当分类结果为静态IP的分类结果时,Score Calculate子模块18将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和静态IP进行加权求和,得到第二空间得分;第二空间得分用于表征静态IP的分类结果对应的待定位IP地址在不同空间范围的可信度。
Majority Voting子模块16通过第二空间得分和预设映射阈值,将关联后的待定位IP地址映射到第二粗粒度区域范围;第二粗粒度区域范围小于第一粗粒度区域范围。
其中,预设映射阈值的取值范围在100-75。预设映射阈值由技术人员根据实际情况进行设置,本申请不做具体限定。
Majority Voting子模块16将关联后的待定位IP地址映射到粗粒度区域的过程,结合图4进行说明。
图4中,Majority Voting子模块16通过投票模型,将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和IP类型特征设置投票策略,即通过空间得分(第一空间得分或第二空间得分)、预设映射阈值和IP类型,将关联后的待定位IP地址初步映射到省、市、区、县等相对粗粒度区域。
Cluster子模块17获取提取点的时空特征(提取点的时间特征和提取点的空间特征);提取点由关联后的待定位IP地址在粗粒度区域中对应的报点的时间特征和空间特征进行聚类生成的点。
报点的时空特征(报点的时间特征和报点的空间特征)为报点在粗粒度区域中出现的空间分布、时间变化等的特征。
Cluster子模块17通过预设聚类算法对关联后的待定位IP地址在粗粒度区域中对应的报点的时空特征和其他辅助特征进行聚类,得到多个空间独立的簇。
其中,其他辅助特征包括网络类型,密度分布,时间频次等。
Cluster子模块17得到多个空间独立的簇的过程,结合图5进行说明。
图5中,对于每个IP,Cluster子模块17提取粗粒度区域的提取点的位置信息和其他辅助特征(网络类型,密度分布,时间频次等),使用时空聚类算法进行聚类,得到多个空间上相对独立的簇(簇1、簇2、…簇N,其中N的取值为大于等于1的整数),后续从这些簇中选择IP的细粒度区域。
Score Calculate子模块18通过预设定位算法,对提取点的时间特征和提取点的空间特征进行计算,得到定位分数;定位分数为IP地址对应多个空间独立的簇的定位分数。
具体Score Calculate子模块18得到定位分数的过程,结合图6进行说明。
图6中,对于每个IP,Score Calculate子模块18根据对提取点的时间特征和提取点的空间特征,利用特定计分算法学习一个定位分数,该定位分数将作为后续IP地址对应的细粒度区域的选择依据。
Location Selection子模块19通过定位分数和分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位。
Location Selection子模块19确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位的过程,结合图7进行说明。
图7中,针对每个关联后的待定位IP地址,Location Selection子模块19利用待定位IP地址对应每个簇的定位分数以及分类结果(动态IP或静态IP)来进行区域选择,待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位。
具体的,当分类结果为动态IP的分类结果时,Location Selection子模块19获取动态IP的分类结果的分数阈值。
Location Selection子模块19通过定位分数和动态IP的分类结果的分数阈值,从多个空间独立的簇中确定动态IP的分类结果对应的第一细粒度区域。
当分类结果为动态IP的分类结果时,Location Selection子模块19获取静态IP的分类结果的分数阈值。
Location Selection子模块19通过定位分数和静态IP的分类结果的分数阈值,从多个空间独立的簇中确定静态IP的分类结果对应的第二细粒度区域;第二细粒度区域小于第一细粒度区域。
其中,这里动态IP的细粒度区域和静态IP的细粒度区域的区别在于,动态IP区域覆盖面积大,静态IP区域区域覆盖面积小。
其中,Location Selection子模块19获取动态IP的分数阈值或静态IP的分数阈值,并通过定位分数、动态IP的分数阈值或静态IP的分数阈值,从多个空间独立的簇中确定待定位IP地址所属的细粒度区域。
Location Selection子模块19实时更新IP地址的细粒度区域。
本申请的优势在于:
1)不受网络拓扑结构的影响,因此具备较好的稳定性。
2)使用的位置信息较web mining得到的位置信息更为精细,可以做到更细粒度的位置。
3)可以根据设置更新时间阈值做到实时更新IP的所在位置,因此实时性较好。
4)针对IP随时间的变化这一特性,本申请可以做到历史位置信息的追溯,更加适应于特定场景下的IP信息追踪。
本申请实施例中,通过分类得到的IP类型将待定位IP地址的定位候选区域限制在粗粒度范围内,并通过定位分数和IP类型确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位,由于本方案的IP定位方式不受网络拓扑结构的影响,因此也不会受到网络延时的影响,从而提高IP定位的定位速度和定位精度。
参考图8所示,为本申请实施例公开的一种IP定位方法,该IP定位方法主要包括如下步骤:
S801:将获取到的待定位IP地址与地理区域进行关联。
在S801中,获取待定位IP地址对应的报点信息;报点信息用于表征待定位IP地址的位置信息;通过预设空间点索引算法和预设地理围栏匹配技术将报点信息与地理区域进行关联。
获取用户通过客户端11进行上网过程中的报点信息,并通过报点信息得到用户的IP地址。
其中,报点信息具体括当前使用的IP信息、网络类型、上网时间等信息。
由于用户的上网浏览时会实时上传的当前使用的IP、时间、实时位置信息,当用户数量增多以及浏览时间、次数的增加,越来越多的IP、时间、位置信息被记录,就可以使用IP的历史位置信息来推断出IP的实际区域。
S802:对关联后的待定位IP地址进行分类,得到分类结果;分类结果用于表征关联后的待定位IP地址对应的IP类型;IP类型包括动态IP或静态IP。
具体对关联后的待定位IP地址进行分类,得到分类结果的过程如下:
首先,分别提取关联后的待定位IP地址的空间特征和关联后的待定位IP地址的时间特征;空间特征用于表征关联后的待定位IP地址在不同空间范围的空间特征;时间特征用于表征关联后的待定位IP地址在不同时间范围的时间特征。
然后,通过预设机器学习模型对关联后的待定位IP地址的空间特征和关联后的待定位IP地址的时间特征进行二分类操作,得到分类结果。
S803:根据关联后的待定位IP地址的时空特征和分类结果,将关联后的待定位IP地址映射到粗粒度区域;粗粒度区域为将IP地址的定位限制在候选区域。
具体根据关联后的待定位IP地址的时空特征和分类结果,将关联后的待定位IP地址映射到粗粒度区域的过程如下:
当分类结果为动态IP的分类结果时,将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和动态IP进行加权求和,得到第一空间得分;第一空间得分用于表征动态IP的分类结果对应的待定位IP地址在不同空间范围的可信度。
通过第一空间得分和预设映射阈值,将关联后的待定位IP地址映射到第一粗粒度区域范围。
或,
当分类结果为静态IP的分类结果时,将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和静态IP进行加权求和,得到第二空间得分;第二空间得分用于表征静态IP的分类结果对应的待定位IP地址在不同空间范围的可信度。
通过第二空间得分和预设映射阈值,将关联后的待定位IP地址映射到第二粗粒度区域范围;第二粗粒度区域范围小于第一粗粒度区域范围。
其中,动态IP的细粒度区域和静态IP的细粒度区域的区别在于,动态IP区域覆盖面积大,静态ip区域区域覆盖面积小。
S804:获取提取点的时间特征和提取点的空间特征;提取点由关联后的待定位IP地址在粗粒度区域中对应的报点的时间特征和空间特征进行聚类生成的点。
其中,报点的时空特征为报点在粗粒度区域中出现的空间分布、时间变化等的特征;辅助特征包括网络类型,密度分布,时间频次等。
S805:基于提取点的时空特征,确定定位分数。
其中,根据对提取点的时间特征和提取点的空间特征,利用特定算法学习一个定位分数,该定位分数将作为后续IP地址对应的细粒度区域的选择依据。
具体基于提取点的时间特征和提取点的空间特征,确定定位分数的过程如下:
首先,通过预设聚类算法,对关联后的待定位IP地址在粗粒度区域中对应的报点的时空特征和辅助特征进行聚类,得到多个空间独立的簇。
预设聚类算法的确定本申请不做具体限定。
其中,使用时空聚类算法进行聚类,得到多个空间上相对独立的簇。
然后,通过预设定位算法,对提取点的时间特征和提取点的空间特征进行计算,得到定位分数;定位分数为IP地址对应多个空间独立的簇的定位分数。
其中,预设定位算法的确定本申请不做具体限定。
S806:通过定位分数和分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位。
具体通过定位分数和分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位的过程如下:
当分类结果为动态IP的分类结果时,获取动态IP的分类结果的分数阈值。
其中,动态IP的分数阈值的取值范围为100-75。
通过定位分数和动态IP的分类结果的分数阈值,从多个空间独立的簇中确定动态IP的分类结果对应的第一细粒度区域。
或,
当分类结果为静态IP的分类结果时,获取静态IP的分类结果的分数阈值。
其中,静态IP的分数阈值的取值范围为100-80。
通过定位分数和静态IP的分类结果的分数阈值,从多个空间独立的簇中确定静态IP的分类结果对应的第二细粒度区域;第二细粒度区域小于第一细粒度区域。
本申请实施例中,通过分类得到的IP类型将待定位IP地址的定位候选区域限制在粗粒度范围内,并通过定位分数和IP类型确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位,由于本方案的IP定位方式不受网络拓扑结构的影响,因此也不会受到网络延时的影响,从而提高IP定位的定位速度和定位精度。
基于上述实施例图8公开的一种IP定位方法,本申请实施例还对应公开了一种IP定位系统,如图9所示,该IP定位系统包括关联单元901、分类单元902、映射单元903、获取单元904、第一确定单元905和第二确定单元906。
关联单元901,用于将获取到的待定位IP地址与地理区域进行关联。
分类单元902,用于对关联后的待定位IP地址进行分类,得到分类结果;分类结果用于表征关联后的待定位IP地址对应的IP类型;IP类型包括动态IP或静态IP。
映射单元903,用于根据关联后的待定位IP地址的时空特征和所述分类结果,将关联后的待定位IP地址映射到粗粒度区域;粗粒度区域为将IP地址的定位限制在候选区域。
获取单元904,用于获取提取点的时空特征;提取点由关联后的待定位IP地址在粗粒度区域中对应的报点的时间特征和空间特征进行聚类生成的点。
第一确定单元905,用于基于提取点的时空特征,确定定位分数。
第二确定单元906,用于通过定位分数和所述分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位。
进一步的,关联单元901包括第一获取模块和关联模块。
第一获取模块,用于获取待定位IP地址对应的报点信息;报点信息用于表征待定位IP地址的位置信息。
关联模块,用于通过预设空间点索引算法和预设地理围栏匹配技术将报点信息与地理区域进行关联。
进一步的,分类单元902包括提取模块和分类模块。
提取模块,用于分别提取关联后的待定位IP地址的空间特征和关联后的待定位IP地址的时间特征;空间特征用于表征关联后的待定位IP地址在不同空间范围的空间特征;时间特征用于表征关联后的待定位IP地址在不同时间范围的时间特征。
分类模块,用于通过预设机器学习模型对关联后的待定位IP地址的空间特征和关联后的待定位IP地址的时间特征进行二分类操作,得到分类结果。
进一步的,映射单元903包括:
第一加权求和模块,用于当分类结果为动态IP的分类结果时,将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和动态IP进行加权求和,得到第一空间得分;第一空间得分用于表征动态IP的分类结果对应的待定位IP地址在不同空间范围的可信度。
第一映射模块,用于通过第一空间得分和预设映射阈值,将关联后的待定位IP地址映射到第一粗粒度区域范围。
或,
第二加权求和模块,用于当分类结果为静态IP的分类结果时,将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和静态IP进行加权求和,得到第二空间得分;第二空间得分用于表征静态IP的分类结果对应的待定位IP地址在不同空间范围的可信度。
第二映射模块,用于通过第二空间得分和预设映射阈值,将关联后的待定位IP地址映射到第二粗粒度区域范围;第二粗粒度区域范围小于第一粗粒度区域范围。
进一步的,第一确定单元905包括聚类模块和计算模块。
聚类模块,用于通过预设聚类算法,对关联后的待定位IP地址在粗粒度区域中对应的报点的时空特征和辅助特征进行聚类,得到多个空间独立的簇。
计算模块,用于通过预设定位算法,对提取点的时间特征和提取点的空间特征进行计算,得到定位分数;定位分数为IP地址对应多个空间独立的簇的定位分数。
进一步的,第二确定单元906包括:
第二获取模块,用于当分类结果为动态IP的分类结果时,获取动态IP的分类结果的分数阈值。
第一确定模块,用于通过定位分数和动态IP的分类结果的分数阈值,从多个空间独立的簇中确定动态IP的分类结果对应的第一细粒度区域。
或,
第三获取模块,用于当分类结果为静态IP的分类结果时,获取静态IP的分类结果的分数阈值。
第二确定模块,用于通过定位分数和静态IP的分类结果的分数阈值,从多个空间独立的簇中确定静态IP的分类结果对应的第二细粒度区域;第二细粒度区域小于所述第一细粒度区域。
本申请实施例中,通过分类得到的IP类型将待定位IP地址的定位候选区域限制在粗粒度范围内,并通过定位分数和IP类型确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位,由于本方案的IP定位方式不受网络拓扑结构的影响,因此也不会受到网络延时的影响,从而提高IP定位的定位速度和定位精度。
本申请实施例还提供了一种存储介质,存储介质包括存储的指令,其中,在指令运行时控制存储介质所在的设备执行上述IP定位方法。
本申请实施例还提供了一种电子设备,其结构示意图如图10所示,具体包括存储器1001,以及一个或者一个以上的指令1002,其中一个或者一个以上指令1002存储于存储器1001中,且经配置以由一个或者一个以上处理器1003执行所述一个或者一个以上指令1002执行上述IP定位方法。
上述各个实施例的具体实施过程及其衍生方式,均在本申请的保护范围之内。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种IP定位方法,其特征在于,所述方法包括:
将获取到的待定位IP地址与地理区域进行关联;
对关联后的待定位IP地址进行分类,得到分类结果;所述分类结果用于表征关联后的待定位IP地址对应的IP类型;所述IP类型包括动态IP或静态IP;
根据关联后的待定位IP地址的时空特征和所述分类结果,将关联后的待定位IP地址映射到粗粒度区域;所述粗粒度区域为将所述IP地址的定位限制在候选区域;
获取提取点的时空特征;所述提取点由所述关联后的待定位IP地址在所述粗粒度区域中对应的报点的时间特征和空间特征进行聚类生成的点;
基于所述提取点的时空特征,确定定位分数;
通过所述定位分数和所述分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位。
2.根据权利要求1所述的方法,其特征在于,所述将获取到的待定位IP地址与地理区域进行关联,包括:
获取待定位IP地址对应的报点信息;所述报点信息用于表征所述待定位IP地址的位置信息;
通过预设空间点索引算法和预设地理围栏匹配技术将所述报点信息与地理区域进行关联。
3.根据权利要求1所述的方法,其特征在于,所述对关联后的待定位IP地址进行分类,得到分类结果,包括:
分别提取关联后的待定位IP地址的空间特征和关联后的待定位IP地址的时间特征;所述空间特征用于表征关联后的待定位IP地址在不同空间范围的空间特征;所述时间特征用于表征关联后的待定位IP地址在不同时间范围的时间特征;
通过预设机器学习模型对所述关联后的待定位IP地址的空间特征和所述关联后的待定位IP地址的时间特征进行二分类操作,得到分类结果。
4.根据权利要求3所述的方法,其特征在于,所述根据关联后的待定位IP地址的时空特征和所述分类结果,将关联后的待定位IP地址映射到粗粒度区域,包括:
当所述分类结果为动态IP的分类结果时,将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和动态IP进行加权求和,得到第一空间得分;所述第一空间得分用于表征动态IP的分类结果对应的待定位IP地址在不同空间范围的可信度;
通过所述第一空间得分和预设映射阈值,将关联后的待定位IP地址映射到第一粗粒度区域范围;
或,
当所述分类结果为静态IP的分类结果时,将关联后的待定位IP地址的时间特征、关联后的待定位IP地址的空间特征和静态IP进行加权求和,得到第二空间得分;所述第二空间得分用于表征静态IP的分类结果对应的待定位IP地址在不同空间范围的可信度;
通过所述第二空间得分和预设映射阈值,将关联后的待定位IP地址映射到第二粗粒度区域范围;所述第二粗粒度区域范围小于所述第一粗粒度区域范围。
5.根据权利要求4所述的方法,其特征在于,所述基于所述提取点的时空特征,确定定位分数,包括:
通过预设聚类算法,对关联后的待定位IP地址在所述粗粒度区域中对应的报点的时空特征和辅助特征进行聚类,得到多个空间独立的簇;
通过预设定位算法,对所述提取点的时间特征和所述提取点的空间特征进行计算,得到定位分数;所述定位分数为所述IP地址对应所述多个空间独立的簇的定位分数。
6.根据权利要求5所述的方法,其特征在于,通过所述定位分数和所述分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位,包括:
当分类结果为动态IP的分类结果时,获取动态IP的分类结果的分数阈值;
通过所述定位分数和动态IP的分类结果的分数阈值,从所述多个空间独立的簇中确定动态IP的分类结果对应的第一细粒度区域;
或,
当分类结果为静态IP的分类结果时,获取静态IP的分类结果的分数阈值;
通过所述定位分数和所述静态IP的分类结果的分数阈值,从所述多个空间独立的簇中确定静态IP的分类结果对应的第二细粒度区域;所述第二细粒度区域小于所述第一细粒度区域。
7.一种IP定位系统,其特征在于,所述系统包括:
关联单元,用于将获取到的待定位IP地址与地理区域进行关联;
分类单元,用于对关联后的待定位IP地址进行分类,得到分类结果;所述分类结果用于表征关联后的待定位IP地址对应的IP类型;所述IP类型包括动态IP或静态IP;
映射单元,用于根据关联后的待定位IP地址的时空特征和所述分类结果,将关联后的待定位IP地址映射到粗粒度区域;所述粗粒度区域为将所述IP地址的定位限制在候选区域;
获取单元,用于获取提取点的时空特征;所述提取点由所述关联后的待定位IP地址在所述粗粒度区域中对应的报点的时间特征和空间特征进行聚类生成的点;
第一确定单元,用于基于所述提取点的时空特征,确定定位分数;
第二确定单元,用于通过所述定位分数和所述分类结果,确定待定位IP地址所属的细粒度区域,完成对待定位IP地址的定位。
8.根据权利要求7所述的系统,其特征在于,所述关联单元,包括:
获取模块,用于获取待定位IP地址对应的报点信息;所述报点信息用于表征所述待定位IP地址的位置信息;
关联模块,用于通过预设空间点索引算法和预设地理围栏匹配技术将所述报点信息与地理区域进行关联。
9.一种存储介质,其特征在于,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如权利要求1至6任意一项所述的IP定位方法。
10.一种电子设备,其特征在于,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如权利要求1至6任意一项所述的IP定位方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210679210.2A CN115086411B (zh) | 2022-06-16 | 2022-06-16 | 一种ip定位方法、系统、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210679210.2A CN115086411B (zh) | 2022-06-16 | 2022-06-16 | 一种ip定位方法、系统、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115086411A true CN115086411A (zh) | 2022-09-20 |
CN115086411B CN115086411B (zh) | 2023-12-05 |
Family
ID=83253476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210679210.2A Active CN115086411B (zh) | 2022-06-16 | 2022-06-16 | 一种ip定位方法、系统、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115086411B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115665237A (zh) * | 2022-12-28 | 2023-01-31 | 中国电子信息产业集团有限公司第六研究所 | 一种ip地址实时定位方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100287178A1 (en) * | 2009-05-08 | 2010-11-11 | Google Inc. | Refining location estimates and reverse geocoding based on a user profile |
WO2019072092A1 (zh) * | 2017-10-11 | 2019-04-18 | 北京三快在线科技有限公司 | Ip地址定位方法及装置,电子设备及存储介质 |
CN109728934A (zh) * | 2018-12-03 | 2019-05-07 | 清华大学 | 网络空间地图模型创建方法及装置 |
CN111343301A (zh) * | 2020-04-21 | 2020-06-26 | 北京字节跳动网络技术有限公司 | 一种定位方法、定位装置、电子设备及存储介质 |
CN114124895A (zh) * | 2022-01-24 | 2022-03-01 | 中国电子信息产业集团有限公司第六研究所 | 域名数据处理方法、域名描述方法、电子设备及存储介质 |
-
2022
- 2022-06-16 CN CN202210679210.2A patent/CN115086411B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100287178A1 (en) * | 2009-05-08 | 2010-11-11 | Google Inc. | Refining location estimates and reverse geocoding based on a user profile |
WO2019072092A1 (zh) * | 2017-10-11 | 2019-04-18 | 北京三快在线科技有限公司 | Ip地址定位方法及装置,电子设备及存储介质 |
CN109728934A (zh) * | 2018-12-03 | 2019-05-07 | 清华大学 | 网络空间地图模型创建方法及装置 |
CN111343301A (zh) * | 2020-04-21 | 2020-06-26 | 北京字节跳动网络技术有限公司 | 一种定位方法、定位装置、电子设备及存储介质 |
CN114124895A (zh) * | 2022-01-24 | 2022-03-01 | 中国电子信息产业集团有限公司第六研究所 | 域名数据处理方法、域名描述方法、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
费高雷 等: "基于网络结构特征的IP所属区域识别", 电子与信息学报, vol. 41, no. 5 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115665237A (zh) * | 2022-12-28 | 2023-01-31 | 中国电子信息产业集团有限公司第六研究所 | 一种ip地址实时定位方法及系统 |
CN115665237B (zh) * | 2022-12-28 | 2023-03-14 | 中国电子信息产业集团有限公司第六研究所 | 一种ip地址实时定位方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115086411B (zh) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104317918B (zh) | 基于复合大数据gis的异常行为分析及报警系统 | |
CN104301431B (zh) | 一种基于多源大数据gis的重点人群实时监控系统 | |
CN109151890A (zh) | 一种移动终端定位方法及装置 | |
CN111597445A (zh) | 信息推荐方法及装置 | |
CN114513488B (zh) | 资源访问方法、装置、计算机设备和存储介质 | |
CN111639092B (zh) | 一种人员流动分析方法、装置、电子设备及存储介质 | |
CN111983655B (zh) | 城市峡谷区域的确定方法、装置、电子设备及存储介质 | |
US20210400438A1 (en) | High fidelity geolocation using machine learning | |
CN111935820A (zh) | 基于无线网络的定位实现方法及相关设备 | |
CN109993184A (zh) | 一种数据融合的方法以及数据融合设备 | |
CN109902681B (zh) | 用户群体关系确定方法、装置、设备及存储介质 | |
US10963527B2 (en) | Associating user logs using geo-point density | |
CN115086411A (zh) | 一种ip定位方法、系统、存储介质及电子设备 | |
CN115393681A (zh) | 一种目标融合方法、装置、电子设备及存储介质 | |
CN113327628A (zh) | 音频处理方法、装置、可读介质和电子设备 | |
CN104915393A (zh) | 一种用于方向定向搜索的方法与设备 | |
CN114741185A (zh) | 面向多目标视频监控的边缘计算系统及其工作方法 | |
CN113518072B (zh) | 一种基于物联网的大数据分析方法 | |
CN116958267B (zh) | 位姿处理方法、装置、电子设备及存储介质 | |
CN113242332A (zh) | 一种形成街道级定位库的改进方法 | |
CN117435819A (zh) | 时空动态感知的兴趣点推荐方法、系统和存储介质 | |
CN110619090B (zh) | 一种区域吸引力评估方法及设备 | |
CN103853437A (zh) | 一种获取候选项的方法及装置 | |
CN116915432A (zh) | 一种算力网络安全编排方法、装置、设备及存储介质 | |
CN111328013B (zh) | 移动终端定位方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |