CN113407796A - 一种基于ip历史位置的静态ip楼宇级定位方法 - Google Patents
一种基于ip历史位置的静态ip楼宇级定位方法 Download PDFInfo
- Publication number
- CN113407796A CN113407796A CN202110522044.0A CN202110522044A CN113407796A CN 113407796 A CN113407796 A CN 113407796A CN 202110522044 A CN202110522044 A CN 202110522044A CN 113407796 A CN113407796 A CN 113407796A
- Authority
- CN
- China
- Prior art keywords
- historical
- static
- data
- point data
- building
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003068 static effect Effects 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000004140 cleaning Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000012216 screening Methods 0.000 claims abstract description 8
- 238000007405 data analysis Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/69—Types of network addresses using geographic information, e.g. room number
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供了一种基于IP历史位置的静态IP楼宇级定位方法,包括步骤1、利用大数据处理技术,采集并清洗IP的历史基准点数据;步骤2、筛选静态IP的历史基准点数据;步骤3、使用聚类算法对IP的历史基准点数据进行聚类处理,实现对静态IP的定位。该基于IP历史位置的静态IP楼宇级定位方法,结合IP的网络特征和地理特征,使用聚类算法对静态IP的历史位置信息进行聚类,形成一个中心位置的经度、纬度和对应的半径,实现对静态IP的楼宇级的定位。
Description
技术领域
本发明涉及IP定位领域,具体而言,涉及了一种基于IP历史位置的静态IP楼宇级定位方法。
背景技术
近年来,IP地址定位技术受到越来越多的关注,目前在互联网行业基于位置的服务已经成为趋势,基于地理位置的网络应用层出不穷,IP地址定位已广泛应用于网络安全、在线安全支付、大数据分析、反欺诈风控、大数据征信等领域。高精准IP地址定位技术在互联网领域中越来越重要。许多研究机构和学者已围绕如何提升IP地址定位技术的定位精度、应用场景等不同问题进行了系统的研究。
目前,IP定位产品大多是将IP定位到宽泛或具体的地理位置,定位精度有国家、省份、城市或者是街道,针对静态IP而言还无法做到楼宇级别的定位,存在数据陈旧、定位颗粒度粗糙(大多仅能达到城市级别)等问题。
发明内容
为了解决背景技术中所存在的问题,本发明提出了一种基于IP历史位置的静态IP楼宇级定位方法。
一种基于IP历史位置的静态IP楼宇级定位方法,包括
步骤1、利用大数据处理技术,采集并清洗IP的历史基准点数据;
步骤2、筛选静态IP的历史基准点数据;
步骤3、使用聚类算法对IP的历史基准点数据进行聚类处理,实现对静态IP的定位。
基于上述,步骤1中,利用大数据处理技术,搭建分布式的数据采集平台,对不同的数据源采用定制化的采集策略,采集至少包括WHOIS类型、主机名类型、移动APP类型和网站WEB类型的历史基准点数据。
基于上述,步骤1中,根据数据特征的来源,设定特定的清洗规则,对初始采集的历史基准点数据进行清洗过滤,以得到有效的基准点数据。
基于上述,步骤2中,从清洗得到的历史基准点数据中,根据历史基准点数据的分布特征,筛选应用场景为静态IP类型的历史位置数据;静态IP类型的应用场景至少包括学校单位和企业专线。
基于上述,步骤3中,针对每个IP,使用以距离远近来聚类的聚类算法,对每个IP的历史基准点数据进行聚类,聚类结果以一个中心位置的经度、纬度和对应的半径表示,实现对静态IP的楼宇级定位。
基于上述,所述聚类算法至少包括K-MEANS算法、DBSCAN算法和均值飘逸聚类算法中一种或多种。
本发明相对现有技术具有突出的实质性特点和显著的进步,具体的说,本发明结合IP的网络特征和地理特征,使用聚类算法对静态IP的历史位置信息进行聚类,形成一个中心位置的经度、纬度和对应的半径,实现对静态IP的楼宇级的定位。
附图说明
图1是本发明一个实例的静态单IP的历史基准点分布和聚类结果示意图。
图中,1)倒水滴状的点表示历史基准点数据;2)圆圈表示聚类结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于IP历史位置的静态IP楼宇级定位方法,以对一个静态IP的处理为例进行说明。
步骤1、利用大数据处理技术,采集并清洗IP的历史基准点数据。
首先,利用大数据处理技术,搭建基于高效的、分布式的数据采集平台,对不同的数据源采用定制化的采集策略,采集WHOIS类型、主机名类型、移动APP类型和网站WEB类型等类型的基准点数据。针对指定的IP,利用大数据处理技术,采集其对应的WHOIS数据和相关的WEB数据,并通过地图服务将WHOIS数据和WEB数据中的地理位置信息转换成经纬度信息,形成WHOIS类型和WEB类型的历史基准点数据;同时,从采集到的APP类型数据中,提取该IP的历史位置数据,形成APP类型的历史基准点数据。
其次,针对得到的历史基准点数据,根据不同来源的数据特征,使用特定的清洗规则,对初始的基准点数据进行清洗过滤,得到指定IP的有效基准点数据。例如,对于WHOIS类型基准点,根据IP注册机构的类型、地域、历史信息变动次数以及登记的时间等指标,确定WHOIS基准点的可用度,选取在注册机构类型、地域、历史信息变动次数和登记时间方面满足要求的基准点。
步骤2、筛选静态IP的历史基准点数据。
从清洗得到的历史基准点数据中,根据历史基准点的分布特征,筛选应用场景为静态IP类型的历史位置数据。静态IP类型的应用场景包含学校单位和企业专线等,其基准点的地理分布特征表现为:单个IP历史基准点集中,相邻IP段甚至一个IP段中不同IP的历史基准点地理分布相对独立。根据静态IP单个IP历史基准点集中的特征如图1中的基准点分布情况,筛选静态IP。
步骤3、使用聚类算法对历史基准点数据进行聚类,实现对静态IP的定位。
针对该静态IP,使用DBSCAN聚类算法对其历史基准点数据进行聚类,聚类结果以一个中心位置的经度、纬度和对应的半径表示,实现对静态IP的楼宇级定位。在其他实施例中还可以采用K-MEANS算法、DBSCAN算法和均值飘逸聚类算法等聚类算法。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
Claims (6)
1.一种基于IP历史位置的静态IP楼宇级定位方法,其特征在于:包括
步骤1、利用大数据处理技术,采集并清洗IP的历史基准点数据;
步骤2、筛选静态IP的历史基准点数据;
步骤3、使用聚类算法对IP的历史基准点数据进行聚类处理,实现对静态IP的定位。
2.根据权利要求1所述的基于IP历史位置的静态IP楼宇级定位方法,其特征在于:步骤1中,利用大数据处理技术,搭建分布式的数据采集平台,对不同的数据源采用定制化的采集策略,采集至少包括WHOIS类型、主机名类型、移动APP类型和网站WEB类型的历史基准点数据。
3.根据权利要求1所述的基于IP历史位置的静态IP楼宇级定位方法,其特征在于:步骤1中,根据数据特征的来源,设定特定的清洗规则,对初始采集的历史基准点数据进行清洗过滤,以得到有效的基准点数据。
4.根据权利要求1所述的基于IP历史位置的静态IP楼宇级定位方法,其特征在于:步骤2中,从清洗得到的历史基准点数据中,根据历史基准点数据的分布特征,筛选应用场景为静态IP类型的历史位置数据;静态IP类型的应用场景至少包括学校单位和企业专线。
5.根据权利要求1所述的基于IP历史位置的静态IP楼宇级定位方法,其特征在于:步骤3中,针对每个IP,使用以距离远近来聚类的聚类算法,对每个IP的历史基准点数据进行聚类,聚类结果以一个中心位置的经度、纬度和对应的半径表示,实现对静态IP的楼宇级定位。
6.根据权利要求5所述的基于IP历史位置的静态IP楼宇级定位方法,其特征在于:所述聚类算法至少包括K-MEANS算法、DBSCAN算法和均值飘逸聚类算法中一种或多种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110522044.0A CN113407796A (zh) | 2021-05-13 | 2021-05-13 | 一种基于ip历史位置的静态ip楼宇级定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110522044.0A CN113407796A (zh) | 2021-05-13 | 2021-05-13 | 一种基于ip历史位置的静态ip楼宇级定位方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113407796A true CN113407796A (zh) | 2021-09-17 |
Family
ID=77678544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110522044.0A Pending CN113407796A (zh) | 2021-05-13 | 2021-05-13 | 一种基于ip历史位置的静态ip楼宇级定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113407796A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104253879A (zh) * | 2014-09-15 | 2014-12-31 | 北京锐安科技有限公司 | 一种基于ip地址的位置标定方法和装置 |
US20150201298A1 (en) * | 2013-03-30 | 2015-07-16 | Tsinghua University | Method for positioning ip location and server |
CN105933294A (zh) * | 2016-04-12 | 2016-09-07 | 晶赞广告(上海)有限公司 | 网络用户定位方法、装置及终端 |
CN106027693A (zh) * | 2016-06-30 | 2016-10-12 | 百度在线网络技术(北京)有限公司 | 基于ip地址的定位方法及装置 |
CN106131242A (zh) * | 2016-08-17 | 2016-11-16 | 郑州埃文计算机科技有限公司 | 一种ip应用场景的分类方法 |
CN107317891A (zh) * | 2017-05-10 | 2017-11-03 | 郑州埃文计算机科技有限公司 | 一种面向动态ip多区域性分布的地理位置定位方法 |
CN112769702A (zh) * | 2021-01-06 | 2021-05-07 | 郑州埃文计算机科技有限公司 | 一种基于路由器别名和基准点地理特征的路由器定位方法 |
-
2021
- 2021-05-13 CN CN202110522044.0A patent/CN113407796A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150201298A1 (en) * | 2013-03-30 | 2015-07-16 | Tsinghua University | Method for positioning ip location and server |
CN104253879A (zh) * | 2014-09-15 | 2014-12-31 | 北京锐安科技有限公司 | 一种基于ip地址的位置标定方法和装置 |
CN105933294A (zh) * | 2016-04-12 | 2016-09-07 | 晶赞广告(上海)有限公司 | 网络用户定位方法、装置及终端 |
CN106027693A (zh) * | 2016-06-30 | 2016-10-12 | 百度在线网络技术(北京)有限公司 | 基于ip地址的定位方法及装置 |
CN106131242A (zh) * | 2016-08-17 | 2016-11-16 | 郑州埃文计算机科技有限公司 | 一种ip应用场景的分类方法 |
CN107317891A (zh) * | 2017-05-10 | 2017-11-03 | 郑州埃文计算机科技有限公司 | 一种面向动态ip多区域性分布的地理位置定位方法 |
CN112769702A (zh) * | 2021-01-06 | 2021-05-07 | 郑州埃文计算机科技有限公司 | 一种基于路由器别名和基准点地理特征的路由器定位方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ahas et al. | Using mobile positioning data to model locations meaningful to users of mobile phones | |
CN105933294B (zh) | 网络用户定位方法、装置及终端 | |
CN107526786A (zh) | 基于多源数据的地名地址数据整合的方法和系统 | |
JP7210086B2 (ja) | エリアの分割方法と装置、電子装置およびプログラム | |
CN110008414B (zh) | 地理信息点的确定方法和装置 | |
CN110967461B (zh) | 一种基于gis技术实现河流水质动态分布的方法 | |
CN106162544A (zh) | 一种地理围栏的生成方法和设备 | |
KR20140099370A (ko) | 사용자 타겟 서비스를 제공하는 서버 및 그 서비스 제공방법 | |
Zhao et al. | Mapping population distribution based on XGBoost using multisource data | |
CN112861972A (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
Kim et al. | Relationship between spatio-temporal travel patterns derived from smart-card data and local environmental characteristics of Seoul, Korea | |
Sun et al. | Identifying tourists and locals by K-means clustering method from mobile phone signaling data | |
CN111209487B (zh) | 用户数据分析方法、服务器及计算机可读存储介质 | |
CN111191817B (zh) | 一种基于换乘客流量的公交线网拓扑划分方法 | |
Battarra et al. | Indicators and actions for the smart and sustainable city: a study on Italian metropolitan cities | |
CN104794164B (zh) | 基于开源数据识别住区车位匹配社会停车需求的方法 | |
Hui et al. | Hotspots identification and classification of dockless bicycle sharing service under electric fence circumstances | |
Ženka et al. | Micro-Geographies of Information and communication technology firms in a shrinking medium-sized industrial City of Ostrava (Czechia) | |
Wescoat Jr et al. | Habitations, villages, and gram panchayats: local drinking water planning in rural India with a Pune district case study | |
CN113407796A (zh) | 一种基于ip历史位置的静态ip楼宇级定位方法 | |
CN117079148A (zh) | 城市功能区的识别方法、装置、设备和介质 | |
CN109977190B (zh) | 面向大规模矢量地图数据的面积查询处理方法及装置 | |
CN110633890A (zh) | 一种土地利用效率判断方法和系统 | |
Hong et al. | Beyond Desakota: the urbanization process and spatial restructuring in contemporary Vietnam | |
Koti et al. | (Re) Defining Peri‐Urban Residential Space Using Participatory GIS in Kenya |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210917 |