CN106131238B - Ip地址的分类方法及装置 - Google Patents

Ip地址的分类方法及装置 Download PDF

Info

Publication number
CN106131238B
CN106131238B CN201610507591.0A CN201610507591A CN106131238B CN 106131238 B CN106131238 B CN 106131238B CN 201610507591 A CN201610507591 A CN 201610507591A CN 106131238 B CN106131238 B CN 106131238B
Authority
CN
China
Prior art keywords
address
cluster
type
specified
apart
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610507591.0A
Other languages
English (en)
Other versions
CN106131238A (zh
Inventor
刘懿
李成洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610507591.0A priority Critical patent/CN106131238B/zh
Publication of CN106131238A publication Critical patent/CN106131238A/zh
Application granted granted Critical
Publication of CN106131238B publication Critical patent/CN106131238B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5007Internet protocol [IP] addresses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/30Types of network names

Abstract

本发明提供一种IP地址的分类方法及装置。本发明实施例通过获取具有指定IP地址的终端的至少一个历史定位数据,若所述至少一个历史定位数据中每个历史定位数据每个历史定位数据中所包含的网络连接指示均指示终端上网连接为Wi‑Fi网络连接,则可以将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据,进而再通过根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇,使得能够根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型,由于采用了海量的历史定位数据这一定位大数据,使得IP地址的识别更加精准,从而提高了IP地址分类的可靠性。

Description

IP地址的分类方法及装置
【技术领域】
本发明涉及互联网技术,尤其涉及一种IP地址的分类方法及装置。
【背景技术】
IP是英文Internet Protocol的缩写,意思是“网络之间互连的协议”,在因特网(Internet)中,它是能使连接到网上的所有计算机网络实现相互通信的一套规则,规定了计算机在Internet上进行通信时应当遵守的规则。因此,IP也可以叫做“因特网协议”。IP地址被用来给Internet上的终端一个编号,每台联网的终端上都需要有IP地址,才能正常通信。为了更准确地为指定类型的用户提供更好的服务,需要准确地判断出一个用户所使用的终端的IP地址是否是指定类型IP地址。
现有技术中,可以根据某个IP地址所对应的终端数目来识别此IP地址是否为指定类型的IP地址,这种方法的可靠性不高。
【发明内容】
本发明的多个方面提供一种IP地址的分类方法及装置,用以提高IP地址分类的可靠性。
本发明的一方面,提供一种IP地址的分类方法,包括:
获取具有指定IP地址的终端的至少一个历史定位数据,所述至少一个历史定位数据中每个历史定位数据中包含网络连接指示;
若所述每个历史定位数据中所包含的网络连接指示均指示终端上网连接为Wi-Fi网络连接,将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据;
根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇;
根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取具有指定IP地址的终端的至少一个历史定位数据,所述至少一个历史定位数据中每个历史定位数据中包含网络连接指示,包括:
采集全部终端的历史定位数据;
将相同IP地址作为所述指定IP地址,获取具有所述指定IP地址的终端的所述至少一个历史定位数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型,包括:
若获得一个所述距离簇,则所述指定IP地址的IP地址类型为第一类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为有序排列,则所述指定IP地址的IP地址类型为第二类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量小于或等于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第三类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量大于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第二类型或第四类型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量大于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第二类型或第四类型,包括:
根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于时间的密度聚类处理,以获得至少一个时间簇;
根据所述指定IP地址的采集点的采集点数据,对所述至少一个时间簇中每个时间簇内的采集点,进行基于距离的密度聚类处理,以获得所述每个时间簇内的至少一个子距离簇;
若任一时间簇内获得一个所述子距离簇,则在所述任一时间簇内所述指定IP地址的IP地址类型为第一类型;
若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为有序排列,则在所述任一时间簇内所述指定IP地址的IP地址类型为第二类型;
若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为无序排列,且所述子距离簇的数量小于或等于预先设置的数量阈值,则在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型;
若在所述每个时间簇内所述指定IP地址的IP地址类型为所述第一类型或所述第二类型,则所述指定IP地址的IP地址类型为第二类型;
若在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型,则所述指定IP地址的IP地址类型为第四类型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于时间的密度聚类处理,以获得至少一个时间簇之前,还包括:
获取所述指定IP地址的每个采集点的定位时间;
根据所述指定IP地址的每个采集点的定位时间,获得所述指定IP地址的采集点转移时间;
将所述采集点转移时间,作为所述基于时间的密度聚类处理的时间阈值。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,
所述第一类型为固定分配单中心点类型;
所述第二类型为动态分配单中心点类型;
所述第三类型为固定分配多中心点类型;
所述第四类型为动态分配多中心点类型。
本发明的另一方面,提供一种IP地址的分类装置,包括:
获取单元,用于获取具有指定IP地址的终端的至少一个历史定位数据,所述至少一个历史定位数据中每个历史定位数据中包含网络连接指示;
准备单元,用于若所述每个历史定位数据中所包含的网络连接指示均指示终端上网连接为Wi-Fi网络连接,将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据;
聚类单元,用于根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇;
识别单元,用于根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取单元,具体用于
采集全部终端的历史定位数据;以及
将相同IP地址作为所述指定IP地址,获取具有所述指定IP地址的终端的所述至少一个历史定位数据。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述识别单元,具体用于
若获得一个所述距离簇,则所述指定IP地址的IP地址类型为第一类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为有序排列,则所述指定IP地址的IP地址类型为第二类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量小于或等于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第三类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量大于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第二类型或第四类型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述识别单元,具体用于
根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于时间的密度聚类处理,以获得至少一个时间簇;
根据所述指定IP地址的采集点的采集点数据,对所述至少一个时间簇中每个时间簇内的采集点,进行基于距离的密度聚类处理,以获得所述每个时间簇内的至少一个子距离簇;
若任一时间簇内获得一个所述子距离簇,则在所述任一时间簇内所述指定IP地址的IP地址类型为第一类型;
若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为有序排列,则在所述任一时间簇内所述指定IP地址的IP地址类型为第二类型;
若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为无序排列,且所述子距离簇的数量小于或等于预先设置的数量阈值,则在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型;
若在所述每个时间簇内所述指定IP地址的IP地址类型为所述第一类型或所述第二类型,则所述指定IP地址的IP地址类型为第二类型;
若在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型,则所述指定IP地址的IP地址类型为第四类型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述识别单元,还用于
获取所述指定IP地址的每个采集点的定位时间;
根据所述指定IP地址的每个采集点的定位时间,获得所述指定IP地址的采集点转移时间;以及
将所述采集点转移时间,作为所述基于时间的密度聚类处理的时间阈值。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,
所述第一类型为固定分配单中心点类型;
所述第二类型为动态分配单中心点类型;
所述第三类型为固定分配多中心点类型;
所述第四类型为动态分配多中心点类型。
由上述技术方案可知,本发明实施例通过获取具有指定IP地址的终端的至少一个历史定位数据,若所述至少一个历史定位数据中每个历史定位数据每个历史定位数据中所包含的网络连接指示均指示终端上网连接为Wi-Fi网络连接,则可以将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据,进而再通过根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇,使得能够根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型,由于采用了海量的历史定位数据这一定位大数据,使得IP地址的识别更加精准,从而提高了IP地址分类的可靠性。
另外,采用本发明所提供的技术方案,能够有效地提高用户的体验。
【附图说明】
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的IP地址的分类方法的流程示意图;
图2为本发明另一实施例提供的IP地址的分类装置的结构示意图。
【具体实施方式】
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、个人电脑(Personal Computer,PC)、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明一实施例提供的IP地址的分类方法的流程示意图,如图1所示。
101、获取具有指定IP地址的终端的至少一个历史定位数据,所述至少一个历史定位数据中每个历史定位数据中包含网络连接指示。
102、若所述每个历史定位数据中所包含的网络连接指示均指示终端上网连接为无线相容性认证(Wireless Fidelity,Wi-Fi)网络连接,将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据。
103、根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇。
104、根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型。
需要说明的是,101~104的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopment Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
这样,通过获取具有指定IP地址的终端的至少一个历史定位数据,若所述至少一个历史定位数据中每个历史定位数据每个历史定位数据中所包含的网络连接指示均指示终端上网连接为Wi-Fi网络连接,则可以将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据,进而再通过根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇,使得能够根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型,由于采用了海量的历史定位数据这一定位大数据,使得IP地址的识别更加精准,从而提高了IP地址分类的可靠性。
在本发明中,所获取的历史定位数据,可以为采用任何定位方式获取终端的定位结果的相关记录数据,例如,全球定位系统(Global Positioning System,GPS)定位方式、Wi-Fi定位或基站定位等。具体来说,任一终端的历史定位数据可以包括但不限于终端的IP地址、定位时间、定位结果、以及网络连接指示,本实施例对此不进行特别限定。其中,所述网络连接指示,可以用于指示终端上网连接是否为Wi-Fi网络连接,例如,上网类型标识或是否有连接Wi-Fi网络指示等。
所谓的指定IP地址,是指任一真实存在的IP地址,并没有特别的特殊含义,任何一个IP地址,都可以作为指定IP地址。可选地,在本实施例的一个可能的实现方式中,在101中,具体可以采集全部终端的历史定位数据,进而,则可以将相同IP地址作为所述指定IP地址,获取具有所述指定IP地址的终端的所述至少一个历史定位数据。
可选地,在本实施例的一个可能的实现方式中,在102中,具体可以根据所述指定IP地址的采集点的采集点数据中的定位结果即采集点的地理位置数据,对所述指定IP地址的采集点,以距离阈值,进行基于距离的密度聚类处理,以获得至少一个距离簇。
其中,所述距离阈值,可以为预先设置的经验值,或者还可以为根据所述指定IP地址的采集点的地理位置数据计算获得,本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,在104中,具体可以根据所获得的距离簇的数量、分布等分布数据,获得所述指定IP地址的IP地址类型。
具体来说,所述指定IP地址的IP地址类型,可以包括但不限于第一类型、第二类型、第三类型或第四类型,本实施例对此不进行特别限定。
举例来说,所述第一类型为固定分配单中心点类型;所述第二类型为动态分配单中心点类型;所述第三类型为固定分配多中心点类型;所述第四类型为动态分配多中心点类型。
所谓的固定分配单中心点类型,这种类型的IP地址是指给分布集中在一个区域的终端所分配的固定IP地址。例如,学校的某个校区、公司的某个办公大楼等场所的终端。
所谓的动态分配单中心点类型,这种类型的IP地址是指在指定时间范围之内给分布集中在一个区域的终端所分配的空闲IP地址。例如,小区的终端。
所谓的固定分配多中心点类型,这种类型的IP地址是指给分布集中在多个区域的终端所分配的固定IP地址,其分布的区域较少,一般不超过6个。例如,学校的全部校区、公司的全部办公大楼等场所的终端。
所谓的动态分配多中心点类型,这种类型的IP地址是指在指定时间范围之内给分布集中在多个区域的终端所分配的空闲IP地址,其分布的区域较多,一般至少有6个。例如,很多小区的终端。
在一个具体的实现过程中,若获得一个所述距离簇,则所述指定IP地址的IP地址类型为第一类型。
在另一个具体的实现过程中,若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为有序排列,则所述指定IP地址的IP地址类型为第二类型。
在另一个具体的实现过程中,若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量小于或等于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第三类型。
在另一个具体的实现过程中,若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量大于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第二类型或第四类型。
具体来说,在该实现过程中,具体可以根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,以时间阈值,进行基于时间的密度聚类处理,以获得至少一个时间簇。进而,则可以根据所述指定IP地址的采集点的采集点数据,对所述至少一个时间簇中每个时间簇内的采集点,进行基于距离的密度聚类处理,以获得所述每个时间簇内的至少一个子距离簇。若任一时间簇内获得一个所述子距离簇,则在所述任一时间簇内所述指定IP地址的IP地址类型为第一类型;若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为有序排列,则在所述任一时间簇内所述指定IP地址的IP地址类型为第二类型;若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为无序排列,且所述子距离簇的数量小于或等于预先设置的数量阈值,则在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型。那么,若在所述每个时间簇内所述指定IP地址的IP地址类型为所述第一类型或所述第二类型,则所述指定IP地址的IP地址类型为第二类型;若在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型,则所述指定IP地址的IP地址类型为第四类型。
在进行基于时间的密度聚类处理,还可以进一步获得所述基于时间的密度聚类处理的时间阈值。例如,可以获取所述指定IP地址的每个采集点的定位时间,进而,则可以根据所述指定IP地址的每个采集点的定位时间,获得所述指定IP地址的采集点转移时间,将所述采集点转移时间,作为所述基于时间的密度聚类处理的时间阈值。
本发明提供的IP地址的分类方法,不但可以作为高精度IP定位的依据,还可以分析所有请求用户的类型,并根据用户类型给出最优的产品方案来提高收益,也可以分析异常流量,来防止作弊现象和网络抓取现象的发生。
本实施例中,通过获取具有指定IP地址的终端的至少一个历史定位数据,若所述至少一个历史定位数据中每个历史定位数据每个历史定位数据中所包含的网络连接指示均指示终端上网连接为Wi-Fi网络连接,则可以将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据,进而再通过根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇,使得能够根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型,由于采用了海量的历史定位数据这一定位大数据,使得IP地址的识别更加精准,从而提高了IP地址分类的可靠性。
另外,采用本发明所提供的技术方案,能够有效地提高用户的体验。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本发明另一实施例提供的IP地址的分类装置的结构示意图,如图2所示。本实施例的IP地址的分类装置可以包括获取单元21、准备单元22、聚类单元23和识别单元24。其中,获取单元21,用于获取具有指定IP地址的终端的至少一个历史定位数据,所述至少一个历史定位数据中每个历史定位数据中包含网络连接指示;准备单元22,用于若所述每个历史定位数据中所包含的网络连接指示均指示终端上网连接为Wi-Fi网络连接,将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据;聚类单元23,用于根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇;识别单元24,用于根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型。
需要说明的是,本实施例所提供的IP地址的分类装置的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,所述获取单元21,具体可以用于采集全部终端的历史定位数据;以及将相同IP地址作为所述指定IP地址,获取具有所述指定IP地址的终端的所述至少一个历史定位数据。
可选地,在本实施例的一个可能的实现方式中,所述识别单元24,具体可以用于若获得一个所述距离簇,则所述指定IP地址的IP地址类型为第一类型;若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为有序排列,则所述指定IP地址的IP地址类型为第二类型;若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量小于或等于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第三类型;若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量大于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第二类型或第四类型。
具体来说,所述指定IP地址的IP地址类型,可以包括但不限于第一类型、第二类型、第三类型或第四类型,本实施例对此不进行特别限定。
举例来说,所述第一类型为固定分配单中心点类型;所述第二类型为动态分配单中心点类型;所述第三类型为固定分配多中心点类型;所述第四类型为动态分配多中心点类型。
具体来说,所述识别单元24,具体可以用于根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于时间的密度聚类处理,以获得至少一个时间簇;根据所述指定IP地址的采集点的采集点数据,对所述至少一个时间簇中每个时间簇内的采集点,进行基于距离的密度聚类处理,以获得所述每个时间簇内的至少一个子距离簇;若任一时间簇内获得一个所述子距离簇,则在所述任一时间簇内所述指定IP地址的IP地址类型为第一类型;若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为有序排列,则在所述任一时间簇内所述指定IP地址的IP地址类型为第二类型;若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为无序排列,且所述子距离簇的数量小于或等于预先设置的数量阈值,则在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型;若在所述每个时间簇内所述指定IP地址的IP地址类型为所述第一类型或所述第二类型,则所述指定IP地址的IP地址类型为第二类型;若在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型,则所述指定IP地址的IP地址类型为第四类型。
进一步地,所述识别单元24,还可以进一步用于获取所述指定IP地址的每个采集点的定位时间;根据所述指定IP地址的每个采集点的定位时间,获得所述指定IP地址的采集点转移时间;以及将所述采集点转移时间,作为所述基于时间的密度聚类处理的时间阈值。
需要说明的是,图1对应的实施例中方法,可以由本实施例提供的IP地址的分类装置实现。详细描述可以参见图1对应的实施例中的相关内容,此处不再赘述。
本实施例中,通过获取单元获取具有指定IP地址的终端的至少一个历史定位数据,准备单元若所述至少一个历史定位数据中每个历史定位数据每个历史定位数据中所包含的网络连接指示均指示终端上网连接为Wi-Fi网络连接,则可以将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据,进而再通过聚类单元根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇,使得识别单元能够根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型,由于采用了海量的历史定位数据这一定位大数据,使得IP地址的识别更加精准,从而提高了IP地址分类的可靠性。
另外,采用本发明所提供的技术方案,能够有效地提高用户的体验。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种IP地址的分类方法,其特征在于,包括:
获取具有指定IP地址的终端的至少一个历史定位数据,所述至少一个历史定位数据中每个历史定位数据中包含网络连接指示;
若所述每个历史定位数据中所包含的网络连接指示均指示终端上网连接为Wi-Fi网络连接,将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据;
根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇;
根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型。
2.根据权利要求1所述的方法,其特征在于,所述获取具有指定IP地址的终端的至少一个历史定位数据,所述至少一个历史定位数据中每个历史定位数据中包含网络连接指示,包括:
采集全部终端的历史定位数据;
将相同IP地址作为所述指定IP地址,获取具有所述指定IP地址的终端的所述至少一个历史定位数据。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型,包括:
若获得一个所述距离簇,则所述指定IP地址的IP地址类型为第一类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为有序排列,则所述指定IP地址的IP地址类型为第二类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量小于或等于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第三类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量大于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第二类型或第四类型。
4.根据权利要求3所述的方法,其特征在于,所述若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量大于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第二类型或第四类型,包括:
根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于时间的密度聚类处理,以获得至少一个时间簇;
根据所述指定IP地址的采集点的采集点数据,对所述至少一个时间簇中每个时间簇内的采集点,进行基于距离的密度聚类处理,以获得所述每个时间簇内的至少一个子距离簇;
若任一时间簇内获得一个所述子距离簇,则在所述任一时间簇内所述指定IP地址的IP地址类型为第一类型;
若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为有序排列,则在所述任一时间簇内所述指定IP地址的IP地址类型为第二类型;
若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为无序排列,且所述子距离簇的数量小于或等于预先设置的数量阈值,则在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型;
若在所述每个时间簇内所述指定IP地址的IP地址类型为所述第一类型或所述第二类型,则所述指定IP地址的IP地址类型为第二类型;
若在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型,则所述指定IP地址的IP地址类型为第四类型。
5.根据权利要求4所述的方法,其特征在于,所述根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于时间的密度聚类处理,以获得至少一个时间簇之前,还包括:
获取所述指定IP地址的每个采集点的定位时间;
根据所述指定IP地址的每个采集点的定位时间,获得所述指定IP地址的采集点转移时间;
将所述采集点转移时间,作为所述基于时间的密度聚类处理的时间阈值。
6.根据权利要求3所述的方法,其特征在于,
所述第一类型为固定分配单中心点类型,该类型的IP地址是指给分布集中在一个区域的终端所分配的固定IP地址;
所述第二类型为动态分配单中心点类型,该类型的IP地址是指在指定时间范围之内给分布集中在一个区域的终端所分配的空闲IP地址;
所述第三类型为固定分配多中心点类型,该类型的IP地址是指给分布集中在多个区域的终端所分配的固定IP地址;
所述第四类型为动态分配多中心点类型,该类型的IP地址是指在指定时间范围之内给分布集中在多个区域的终端所分配的空闲IP地址。
7.一种IP地址的分类装置,其特征在于,包括:
获取单元,用于获取具有指定IP地址的终端的至少一个历史定位数据,所述至少一个历史定位数据中每个历史定位数据中包含网络连接指示;
准备单元,用于若所述每个历史定位数据中所包含的网络连接指示均指示终端上网连接为Wi-Fi网络连接,将所述至少一个历史定位数据,作为所述指定IP地址的采集点的采集点数据;
聚类单元,用于根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于距离的密度聚类处理,以获得至少一个距离簇;
识别单元,用于根据所述至少一个距离簇的分布数据,获得所述指定IP地址的IP地址类型。
8.根据权利要求7所述的装置,其特征在于,所述获取单元,具体用于采集全部终端的历史定位数据;以及
将相同IP地址作为所述指定IP地址,获取具有所述指定IP地址的终端的所述至少一个历史定位数据。
9.根据权利要求7或8所述的装置,其特征在于,所述识别单元,具体用于
若获得一个所述距离簇,则所述指定IP地址的IP地址类型为第一类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为有序排列,则所述指定IP地址的IP地址类型为第二类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量小于或等于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第三类型;
若获得至少两个所述距离簇,且所述至少两个所述距离簇中每个距离簇在时间上为无序排列,且所述距离簇的数量大于预先设置的数量阈值,则所述指定IP地址的IP地址类型为第二类型或第四类型。
10.根据权利要求9所述的装置,其特征在于,所述识别单元,具体用于
根据所述指定IP地址的采集点的采集点数据,对所述指定IP地址的采集点,进行基于时间的密度聚类处理,以获得至少一个时间簇;
根据所述指定IP地址的采集点的采集点数据,对所述至少一个时间簇中每个时间簇内的采集点,进行基于距离的密度聚类处理,以获得所述每个时间簇内的至少一个子距离簇;
若任一时间簇内获得一个所述子距离簇,则在所述任一时间簇内所述指定IP地址的IP地址类型为第一类型;
若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为有序排列,则在所述任一时间簇内所述指定IP地址的IP地址类型为第二类型;
若任一时间簇内获得至少两个所述子距离簇,且所述至少两个所述子距离簇中每个子距离簇在时间上为无序排列,且所述子距离簇的数量小于或等于预先设置的数量阈值,则在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型;
若在所述每个时间簇内所述指定IP地址的IP地址类型为所述第一类型或所述第二类型,则所述指定IP地址的IP地址类型为第二类型;
若在所述任一时间簇内所述指定IP地址的IP地址类型为第三类型,则所述指定IP地址的IP地址类型为第四类型。
11.根据权利要求10所述的装置,其特征在于,所述识别单元,还用于
获取所述指定IP地址的每个采集点的定位时间;
根据所述指定IP地址的每个采集点的定位时间,获得所述指定IP地址的采集点转移时间;以及
将所述采集点转移时间,作为所述基于时间的密度聚类处理的时间阈值。
12.根据权利要求9所述的装置,其特征在于,
所述第一类型为固定分配单中心点类型,该类型的IP地址是指给分布集中在一个区域的终端所分配的固定IP地址;
所述第二类型为动态分配单中心点类型,该类型的IP地址是指在指定时间范围之内给分布集中在一个区域的终端所分配的空闲IP地址;
所述第三类型为固定分配多中心点类型,该类型的IP地址是指给分布集中在多个区域的终端所分配的固定IP地址;
所述第四类型为动态分配多中心点类型,该类型的IP地址是指在指定时间范围之内给分布集中在多个区域的终端所分配的空闲IP地址。
CN201610507591.0A 2016-06-30 2016-06-30 Ip地址的分类方法及装置 Active CN106131238B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610507591.0A CN106131238B (zh) 2016-06-30 2016-06-30 Ip地址的分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610507591.0A CN106131238B (zh) 2016-06-30 2016-06-30 Ip地址的分类方法及装置

Publications (2)

Publication Number Publication Date
CN106131238A CN106131238A (zh) 2016-11-16
CN106131238B true CN106131238B (zh) 2019-05-28

Family

ID=57467751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610507591.0A Active CN106131238B (zh) 2016-06-30 2016-06-30 Ip地址的分类方法及装置

Country Status (1)

Country Link
CN (1) CN106131238B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108259640B (zh) * 2017-12-29 2021-02-12 东软集团股份有限公司 网络地址分类的方法、装置和存储介质以及电子设备
CN110875834A (zh) * 2018-08-31 2020-03-10 马上消费金融股份有限公司 一种风控模型的创建方法、风控评估方法及相关装置
CN110661899A (zh) * 2018-12-29 2020-01-07 北京奇虎科技有限公司 一种ip地址的物理地址确定方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2785020A1 (en) * 2013-03-29 2014-10-01 Televic Rail NV Method and system for distributing location-based addresses in a network
CN104504753A (zh) * 2014-12-18 2015-04-08 深圳先进技术研究院 一种基于增强现实的互联网三维ip地图系统及方法
CN104680336A (zh) * 2015-03-24 2015-06-03 深圳市中兴云服务有限公司 员工位置确定方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2785020A1 (en) * 2013-03-29 2014-10-01 Televic Rail NV Method and system for distributing location-based addresses in a network
CN104504753A (zh) * 2014-12-18 2015-04-08 深圳先进技术研究院 一种基于增强现实的互联网三维ip地图系统及方法
CN104680336A (zh) * 2015-03-24 2015-06-03 深圳市中兴云服务有限公司 员工位置确定方法及系统

Also Published As

Publication number Publication date
CN106131238A (zh) 2016-11-16

Similar Documents

Publication Publication Date Title
CN106027693B (zh) 基于ip地址的定位方法及装置
CN106210163B (zh) 基于ip地址的定位方法及装置
CN104239453B (zh) 数据处理方法及装置
CN108415845A (zh) Ab测试系统指标置信区间的计算方法、装置和服务器
CN113412608B (zh) 内容推送方法、装置、服务端及存储介质
CN106131238B (zh) Ip地址的分类方法及装置
CN105025068B (zh) 网络数据下载方法和装置
CN105338619A (zh) 定位方法及装置
CN105338537B (zh) 一种新增基站站址共享分析的方法及终端
CN107846507A (zh) 信息发送方法、装置、计算机装置及计算机可读存储介质
CN108985954A (zh) 一种建立各标识的关联关系的方法以及相关设备
CN104320354B (zh) 一种数据的处理方法及装置
CN108600399A (zh) 信息推送方法及相关产品
CN109413363A (zh) 一种会议预约方法和装置、以及存储介质
CN104935462A (zh) 一种端服务器部署方法及装置
CN110198267B (zh) 一种流量调度方法、系统及服务器
CN106875279A (zh) 信息推送方法和装置
CN109033148A (zh) 一种面向多分类的不平衡数据预处理方法、装置及设备
CN107748739A (zh) 一种短信文本模版的提取方法及相关装置
CN109951804A (zh) 一种人流量估计方法及装置
CN108846708A (zh) 用户购买行为预测方法、装置、设备及存储介质
CN105959306A (zh) Ip地址的识别方法及装置
CN110162959A (zh) 基于设备指纹的数据处理方法及装置
CN109086289A (zh) 一种媒体数据处理方法、客户端、介质和设备
CN109428774B (zh) 一种dpi设备的数据处理方法及相关的dpi设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant