CN105933294A - 网络用户定位方法、装置及终端 - Google Patents
网络用户定位方法、装置及终端 Download PDFInfo
- Publication number
- CN105933294A CN105933294A CN201610224580.1A CN201610224580A CN105933294A CN 105933294 A CN105933294 A CN 105933294A CN 201610224580 A CN201610224580 A CN 201610224580A CN 105933294 A CN105933294 A CN 105933294A
- Authority
- CN
- China
- Prior art keywords
- geographical position
- data point
- distance
- network user
- address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/02—Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
- H04L63/0227—Filtering policies
- H04L63/0236—Filtering by address, protocol, port number or service, e.g. IP-address or URL
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/69—Types of network addresses using geographic information, e.g. room number
Abstract
一种网络用户定位方法、装置及终端,所述网络用户定位方法包括:获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。本发明技术方案提高了网络用户定位的准确性。
Description
技术领域
本发明涉及数据挖掘领域,尤其涉及一种网络用户定位方法、装置及终端。
背景技术
随着互联网技术的发展以及大数据领域的不断扩张,互联网用户数据日益剧增。其中,在网络平台,可以统计到互联网用户的数据,用户数据包括用户的年龄、性别、职业等用户信息,则可以通过计算不同性别网民的地域分布,以及年龄、职业、消费能力等地域分布,可以有效的帮助公司和政府做出经济决策或市场定位。
现有技术中,确定网络用户的地理位置有以下方式,一种是利用用户上网时的IP地址,根据IP地址可以查到上网用户对应的地理区域,例如,IP地址为[210.22.119.158]对应的地理区域为上海市浦东新区;另一种是通过采集用户上网时的cookie信息,然后从cookie信息中筛选出用户当前的经纬度信息。
但是,现有技术中,通过IP地址获取到的用户位置为地理区域,精确性低;而通过cookie信息筛选出的经纬度信息,由于网络互联的复杂多样性,同一个IP会筛选到多个地理位置,用户定位的精准性依然很低。
发明内容
本发明解决的技术问题是如何提高网络用户定位的准确性。
为解决上述技术问题,本发明实施例提供一种网络用户定位方法,网络用户定位方法包括:获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。
可选的,获取用户的所述网络行为信息之后还包括:过滤所述地理位置。
可选的,过滤所述地理位置包括:基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。
可选的,所述网络用户定位方法按照设定时间周期性地执行。
可选的,所述网络用户定位方法还包括:将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。
可选的,所述地理位置采用经纬度的形式表示。
可选的,根据所述多个地理位置之间的距离对所述多个地理位置进行聚类包括:形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;计算所述第一集合内的数据点两两之间的距离,为距离最大的两个数据点分别建立新集合并列入所述集合列表;剔除所述第一集合内的距离最大的两个数据点;遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。
可选的,基于聚类的结果确定所述IP地址的位置信息包括:确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。
可选的,对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置;基于聚类的结果确定所述IP地址的所述位置信息包括:确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。
为解决上述技术问题,本发明实施例还公开了一种网络用户定位装置,所述网络用户定位装置包括:采集单元,适于获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;聚类单元,适于根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;判定单元,适于基于聚类的结果确定所述IP地址的位置信息。
可选的,所述网络用户定位装置还包括:过滤单元,适于在所述采集单元获取所述网络行为信息之后过滤所述地理位置。
可选的,所述过滤单元适于基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。
可选的,所述网络用户定位装置还包括:控制单元,适于控制所述采集单元、所述聚类单元和所述判定单元周期性地工作。
可选的,所述网络用户定位装置还包括:存储单元,适于将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。
可选的,所述地理位置采用经纬度的形式表示。
可选的,所述聚类单元包括:集合形成子单元,适于形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;距离计算子单元,适于计算所述第一集合内的数据点两两之间的距离,并为距离最大的两个数据点分别建立新集合并列入所述集合列表;剔除子单元,适于剔除所述第一集合内的距离最大的两个数据点;遍历子单元,适于遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。
可选的,所述判定单元包括:第一确定子单元,确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;第一位置计算子单元,适于将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。
可选的,所述聚类单元对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置;所述判定单元包括:第二确定子单元,适于确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;第二位置计算子单元,适于将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。
为解决上述技术问题,本发明实施例还公开了一种终端,所述终端包括所述网络用户定位装置。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
本发明实施例的网络用户定位方法通过获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;基于聚类的结果确定所述IP地址的位置信息。通过采集用户的网络行为信息,并基于IP地址对多个地理位置进行聚类处理,基于聚类的结果确定IP地址对应的位置信息,也就是确定了用户的位置信息,提高了网络用户定位的准确性。
进一步,所述网络用户定位方法按照设定时间周期性地执行,在提高了网络用户定位的准确性的基础上,可以实现实时获取网络用户的地理位置信息。
附图说明
图1是本发明实施例一种网络用户定位方法的流程图;
图2是本发明实施例另一种网络用户定位方法的流程图;
图3是本发明实施例一种地理位置聚类方法的流程图;
图4是本发明实施例一种网络用户定位装置的结构示意图;
图5是本发明实施例另一种网络用户定位装置的结构示意图。
具体实施方式
如背景技术中所述,现有技术中,通过IP地址获取到的用户位置为地理区域,精确性低;而通过cookie信息筛选出的经纬度信息,由于网络互联的复杂多样性,同一个IP会筛选到多个地理位置,用户定位的精准性依然很低。
本发明实施例中,IP地址是指互联网协议地址(Internet Protocol Address)。IP地址是IP协议提供的一种统一的地址格式,为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。网络用户在产生网络行为时,会对应一个IP地址,本发明的网络用户定位方法是基于IP地址进行定位的。
本发明通过采集用户的网络行为信息,并基于IP地址对多个地理位置进行聚类处理,基于聚类的结果确定IP地址对应的位置信息,也就是确定了用户的位置信息,提高了网络用户定位的准确性。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明实施例一种网络用户定位方法的流程图,下面结合图1对所述网络用户定位方法做详细的说明。
所述网络用户定位方法包括,步骤S101:获取用户的网络行为信息。其中,所述网络行为信息包括IP地址及其对应的多个地理位置。
在具体实施中,可以按照网络入口规则获取用户的网络行为信息,例如,网络入口可以是,用户使用WIFI、有线网络或移动基站上网,获取用户网络行为的入口IP地址;采集用户在上网时产生的cookie信息或URL信息,筛选出地理位置。同时由于网络互联的复杂性,采集到的每个IP地址对应多个地理位置,所以,对网络用户进行精准的定位时,可以对多个地理位置进行处理。
具体地,所述地理位置可以采用经纬度的形式表示。经纬度精度可以由用户进行自定义配置,例如经纬度精度可以是小数点第五位;所述经纬度可以是在GPS坐标系,也可以是其他任意可实施的卫星坐标体系。当然,地理位置的表示形式并不限于经纬度,还可以采用其他任何适当的方式来表示。
可以理解的是,本发明实施例获取到的网络行为信息,是用户在一定的上网时间内产生的。例如,网络行为信息可以是在多天内采集到的,其中,对所述地理位置进行天内去重,保留跨天相同的地理位置。由此,采集到的多个地理位置是有可能重合的。
步骤S102:根据所述多个地理位置之间的距离对所述多个地理位置进行聚类。
本实施例中,在每个IP地址对应多个地理位置时,根据多个地理位置之间的距离对所述多个地理位置进行聚类处理,将多个地理位置聚类为距离相近的多个集合。也可以说,对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置。具体地,当所述地理位置为经纬度时,两个地理位置之间的距离可以采用经纬度数值进行计算,例如可以采用公式S=r×arccos[sin(y1)×sin(y2)×cos(x1-x2)+cos(y1)×cos(y2)]来计算,其中,S表示距离,r表示地球半径,x1表示其中一个地理位置的经度,y1表示其中一个地理位置的纬度,x2表示另一个地理位置的经度,y2表示另一个地理位置的纬度。
可以理解的是,对所述多个地理位置进行聚类的过程可以采用任意可实施的算法。
步骤S103:基于聚类的结果确定所述IP地址的位置信息。
本实施例中,根据聚类结果,确定包括地理位置的数量最多的集合,计算所述集合的中心点作为网络用户的所述位置信息,由于IP地址对应的所述地理位置未做去重处理,由此,也可以确定所述集合中出现频率最大的地理位置,作为网络用户的所述位置信息。
具体实施中,确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为网络用户的所述位置信息。
本发明实施例通过采集用户的网络行为信息,并基于IP地址对多个地理位置进行聚类处理,基于聚类的结果确定IP地址对应的位置信息,也就是确定了用户的位置信息,提高了网络用户定位的准确性。
具体地,所述网络用户定位方法按照设定时间周期性地执行。由此,所述用户的位置信息也可以进行周期性的更新,在提高了网络用户定位的准确性的基础上,可以实现实时获取网络用户的地理位置信息。
图2是本发明实施例另一种网络用户定位方法的流程图,下面结合图2对所述网络用户定位方法做详细的说明。
所述网络用户定位方法包括,步骤S201:获取用户的网络行为信息。其中,所述网络行为信息包括IP地址及其对应的多个地理位置。
本实施例中,获取到用户的网络行为信息后,过滤出所述IP地址及其对应的多个地理位置,剔除脏数据。
步骤S202:过滤所述地理位置。
本实施例中,基于IP地址对地理位置进行过滤,基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置,也就是说,基于同一个IP地址,剔除偏离的不可信的地理位置。网络用户的行为信息中IP地址仅对应一个地理位置时,对于网络用户的定位得到的位置信息仅存在一个地理位置,准确性低,故也可以剔除只对应一个地理位置的网络行为信息。
步骤S203:根据所述多个地理位置之间的距离对所述多个地理位置进行聚类。
具体实施中,根据所述多个地理位置之间的距离对所述多个地理位置进行聚类,聚类后得到多个集合,每一集合包括一个或多个所述地理位置。其中,每个集合中每个地理位置与同一集合内其他地理位置之间的距离小于每个地理位置与其他集合的距离,所述地理位置与其他集合的距离为所述地理位置与其他集合内每一地理位置的距离的最大值。
可以理解的是,对所述多个地理位置进行聚类的算法,可以采用任意可实施的方式,本发明实施例对此不做限制,
步骤S204:基于聚类的结果确定所述IP地址的位置信息。
本实施例中,根据聚类结果,确定包括地理位置的数量最多的集合,计算所述集合的中心点作为网络用户的所述位置信息,由于IP地址对应的所述地理位置未做去重处理,由此,也可以确定所述集合中出现频率最大的地理位置,作为网络用户的所述位置信息。
进一步地,确定包括地理位置的数量最多的集合后,根据预设覆盖半径对上述集合进行筛选,例如可以是,在两个地理位置之间的距离大于预设覆盖半径时,剔除所述两个地理位置。从而在减小计算量的同时,进一步提高了定位的准确性。
步骤S205:将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。
具体实施中,确定所述IP地址的位置信息后,将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。由此,用户可以通过IP地址查询对应的位置信息。具体地,所述网络用户定位方法按照设定时间周期性地执行。由此,所述用户的位置信息也可以进行周期性的更新,也就是说,定位数据库中IP地址对应的所述位置信息可以进行周期性的更新,进一步提高了网络用户定位的准确性。
本发明实施例的具体实施方式可参照前述相应实施例,此处不再赘述。
图3是本发明实施例一种地理位置聚类方法的流程图,下面结合图3对所述地理位置聚类方法做详细的说明。
所述地理位置聚类方法可以包括:步骤S301:形成第一集合。其中,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表。
步骤S302:计算所述第一集合内的数据点两两之间的距离,为距离最大的两个数据点分别建立新集合并列入所述集合列表。
本实施例中,将多个地理位置以数据点的形式形成集合,并计算多个数据点之间的距离。具体地,当所述地理位置为经纬度时,两个数据点之间的距离可以采用经纬度数值进行计算,例如可以采用公式S=r×arccos[sin(y1)×sin(y2)×cos(x1-x2)+cos(y1)×cos(y2)]来计算,其中,S表示距离,r表示地球半径,x1表示其中一个数据点的经度,y1表示其中一个数据点的纬度,x2表示另一个数据点的经度,y2表示另一个数据点的纬度。
步骤S303:剔除所述第一集合内的距离最大的两个数据点。
步骤S304:遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。
具体实施中,将IP地址对应的多个地理位置形成第一集合S,多个地理位置为数据点l1,l2,l3,...,lN,数据点的数量为N,N为大于等于2的正整数。具体地,第一集合S中的数据点可以天内去重,保留跨天相同的数据点。
可以理解的是,对于地理位置的去重处理,可以由用户根据实际的应用环境做自定义配置,本发明实施例对此不做限制。
例如,计算各个数据点l1,l2,l3,...,lN之间的距离,得到第一集合S中距离最大的两个点,例如可以是数据点l1和数据点l2,建立形成新集合为S1(l1)和S2(l2),加入集合列表LS[S1,S2],并将数据点l1和数据点l2从S中剔除。计算得到数据点l3和第一集合S中的数据点l3,...,lN的最大距离maxD,数据点l3与新集合S1和S2的距离,分别为maxDX1和maxDX2,例如可以是,计算l3与S1中每个数据点的距离,取最大距离作为maxDX1,计算l3与S2中每个数据点的距离,取最大距离作为maxDX2。比较maxD、maxDX1和maxDX2的大小,如果maxDX1>maxDX且maxDX2>maxDX,则建立形成新集合为S3(l3),加入集合列表LS[S1,S2,S3],并将数据点l3从第一集合S中剔除;如果maxDX1<=maxDX且maxDX2>maxDX,则将数据点l3放入集合S1中,生成S1(l1,l3),将数据点l3从第一集合S中剔除;如果maxDX1>maxDX且maxDX2<=maxDX,则将数据点l3放入集合S2中,生成S2(l2,l3),将数据点l3从第一集合S中剔除;如果maxDX1<=maxDX且maxDX2<=maxDX,则取DX1和DX2的最小值min[maxDX1,maxDX2]对应的集合,例如可以是S1,生成S1(l1,l3),将数据点l3从第一集合S中剔除。形成的集合列表LS和下与第一集合S中的数据点l4…lN继续上述步骤,直至遍历完第一集合S中的所有数据点,也就是说,当第一集合S为空时,迭代完成,可以进行下一步的操作。
具体实施中,聚类完成后,得到聚类的结果,即集合列表LS[S1,S2,…,Sm],其中,m<=N。确定所述集合列表LS中每一集合[S1,S2,…,Sm]包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合,将所述目标集合的中心点作为所述位置信息,或将所述目标集合中出现频次最大的所述数据点作为所述位置信息。具体地,为了提高精准度,可以剔除集合列表LS中数据点的数量为1的集合。具体地,还可以设置所述位置信息的有效期为24小时,在24小时后,所述位置信息被重新计算,也就是说,所述网络用户定位方法按照设定时间24小时周期性地执行。
需要说明的是,所述位置信息的有效期或者所述设定时间可以根据实际的应用环境进行适应性修改和调整,本发明实施例对此不做限制。
图4是本发明实施例一种网络用户定位装置的结构示意图。下面结合图4对所述网络用户定位装置做详细的说明。
所述网络用户定位装置包括:采集单元401、聚类单元402和判定单元403。
其中,采集单元401适于获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;聚类单元402适于根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;判定单元403适于基于聚类的结果确定所述IP地址的位置信息。
本实施例中,采集单元401按照网络入口规则获取用户的网络行为信息,例如,网络入口可以是,用户使用WIFI、有线网络或移动基站上网,获取用户网络行为的入口IP地址;采集用户在上网时产生的cookie信息或URL信息,筛选出地理位置。同时由于网络互联的复杂性,采集到的每个IP地址对应多个地理位置,所以,对网络用户进行精准的定位时,可以对多个地理位置进行处理。具体地,所述地理位置可以采用经纬度的形式表示。经纬度精度可以由用户进行自定义配置,例如经纬度精度可以是小数点第五位;所述经纬度可以是在GPS坐标系,也可以是其他任意可实施的卫星坐标体系。
具体实施中,在每个IP地址对应多个地理位置时,聚类单元402根据多个地理位置之间的距离对所述多个地理位置进行聚类处理,将多个地理位置聚类为距离相近的多个集合。也可以说,聚类单元402对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置。具体地,当所述地理位置为经纬度时,两个地理位置之间的距离可以采用经纬度数值进行计算。
具体实施中,判定单元403确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为网络用户的所述位置信息。
本发明实施例通过采集用户的网络行为信息,并基于IP地址对多个地理位置进行聚类处理,基于聚类的结果确定IP地址对应的位置信息,也就是确定了用户的位置信息,提高了网络用户定位的准确性。
具体地,所述网络用户定位方法按照设定时间周期性地执行。由此,所述用户的位置信息也可以进行周期性的更新,在提高了网络用户定位的准确性的基础上,可以实现实时获取网络用户的地理位置信息。
图5是本发明实施例另一种网络用户定位装置的结构示意图。下面结合图5对所述网络用户定位装置做详细的说明。
所述网络用户定位装置包括:采集单元501、过滤单元502、聚类单元503、集合形成子单元504、距离计算子单元505、剔除子单元506、遍历子单元507、判定单元508、存储单元509和控制单元510。
具体地,所述网络用户定位装置按照设定时间周期性地执行网络用户定位方法。
其中,采集单元501适于获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;过滤单元502适于在所述采集单元501获取所述网络行为信息之后过滤所述地理位置。具体地,在采集单元501采集到的数据量大的情况下,为了减小聚类单元503在聚类时的运算量,减小运算时间,同时提高定位的精准度,过滤单元502适于基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。过滤单元502还可以在所述IP地址仅对应一个所述地理位置时,剔除所述IP地址和所述地理位置。具体地,聚类单元503在对过滤后的多个地理位置进行聚类后,可以得到多个集合,每一集合包括一个或多个所述地理位置;判定单元508根据聚类单元503的聚类结果确定IP地址的位置信息。
具体实施中,判定单元508可以包括:第二确定子单元(图未示)和第二位置计算子单元(图未示)。第二确定子单元确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;第二位置计算子单元将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。
本实施例中,聚类单元503可以包括集合形成子单元504、距离计算子单元505、剔除子单元506和遍历子单元507。具体地,集合形成子单元504形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;距离计算子单元505计算所述第一集合内的数据点两两之间的距离,并为距离最大的两个数据点分别建立新集合并列入所述集合列表;剔除子单元506适于剔除所述第一集合内的距离最大的两个数据点;遍历子单元507遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。
具体地,所述判定单元508可以包括:第一确定子单元(图未示)和第一位置计算子单元(图未示)。第一确定子单元确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;第一位置计算子单元将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。
本实施例中,存储单元509适于将所述IP地址和确定的所述位置信息进行存储,形成可查询的定位数据库。由此,用户可以通过IP地址查询对应的位置信息。
具体实施中,控制单元510可以控制所述采集单元501、所述聚类单元503和所述判定单元508周期性地工作;也可以是,控制单元510控制所述采集单元501、过滤单元502、所述聚类单元503和所述判定单元508周期性地工作。由此,所述用户的位置信息也可以进行周期性的更新,也就是说,定位数据库中IP地址对应的所述位置信息可以进行周期性的更新,进一步提高了网络用户定位的准确性。
本发明实施例还公开了一种终端,所述终端包括所述网络用户定位装置。所述终端可以是计算机设备、平台等,可以支持配置所述网络用户定位装置,执行所述网络用户定位方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于以计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (19)
1.一种网络用户定位方法,其特征在于,包括:
获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;
根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;
基于聚类的结果确定所述IP地址的位置信息。
2.根据权利要求1所述的网络用户定位方法,其特征在于,获取用户的所述网络行为信息之后还包括:
过滤所述地理位置。
3.根据权利要求2所述的网络用户定位方法,其特征在于,过滤所述地理位置包括:
基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。
4.根据权利要求1所述的网络用户定位方法,其特征在于,所述网络用户定位方法按照设定时间周期性地执行。
5.根据权利要求1所述的网络用户定位方法,其特征在于,还包括:
将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。
6.根据权利要求1至5任一项所述的网络用户定位方法,其特征在于,所述地理位置采用经纬度的形式表示。
7.根据权利要求1所述的网络用户定位方法,其特征在于,根据所述多个地理位置之间的距离对所述多个地理位置进行聚类包括:
形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;
计算所述第一集合内的数据点两两之间的距离,为距离最大的两个数据点分别建立新集合并列入所述集合列表;
剔除所述第一集合内的距离最大的两个数据点;
遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。
8.根据权利要求7所述的网络用户定位方法,其特征在于,基于聚类的结果确定所述IP地址的位置信息包括:
确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;
将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。
9.根据权利要求1所述的网络用户定位方法,其特征在于,对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置;
基于聚类的结果确定所述IP地址的所述位置信息包括:
确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;
将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。
10.一种网络用户定位装置,其特征在于,包括:
采集单元,适于获取用户的网络行为信息,所述网络行为信息包括IP地址及其对应的多个地理位置;
聚类单元,适于根据所述多个地理位置之间的距离对所述多个地理位置进行聚类;
判定单元,适于基于聚类的结果确定所述IP地址的位置信息。
11.根据权利要求10所述的网络用户定位装置,其特征在于,还包括:
过滤单元,适于在所述采集单元获取所述网络行为信息之后过滤所述地理位置。
12.根据权利要求11所述的网络用户定位装置,其特征在于,所述过滤单元适于基于所述IP地址所属的地域范围,剔除所述地域范围以外的所述地理位置。
13.根据权利要求10所述的网络用户定位装置,其特征在于,还包括:
控制单元,适于控制所述采集单元、所述聚类单元和所述判定单元周期性地工作。
14.根据权利要求10所述的网络用户定位装置,其特征在于,还包括:
存储单元,适于将所述IP地址和所述位置信息进行存储,形成可查询的定位数据库。
15.根据权利要求10至14任一项所述的网络用户定位装置,其特征在于,所述地理位置采用经纬度的形式表示。
16.根据权利要求10所述的网络用户定位装置,其特征在于,所述聚类单元包括:
集合形成子单元,适于形成第一集合,所述第一集合内的数据点为所述IP地址对应的所述多个地理位置,将所述第一集合列入集合列表;
距离计算子单元,适于计算所述第一集合内的数据点两两之间的距离,并为距离最大的两个数据点分别建立新集合并列入所述集合列表;
剔除子单元,适于剔除所述第一集合内的距离最大的两个数据点;
遍历子单元,适于遍历所述第一集合内的数据点,确定所述数据点与所述第一集合内的其他数据点之间的最大距离,并计算所述数据点与所述集合列表中每一集合的距离,所述数据点与所述集合的距离为所述数据点与所述集合内每一数据点的距离的最大值,所述最大距离小于所述数据点与所述集合列表中每一集合的距离时,为所述数据点建立新集合并列入所述集合列表,否则将所述数据点加入与所述集合列表中距离最小的集合内。
17.根据权利要求16所述的网络用户定位装置,其特征在于,所述判定单元包括:
第一确定子单元,确定所述集合列表中每一集合包含的所述数据点的数量,将所述数据点的数量最大的集合作为目标集合;
第一位置计算子单元,适于将所述目标集合的中心点或所述目标集合中出现频次最大的所述数据点作为所述位置信息。
18.根据权利要求10所述的网络用户定位装置,其特征在于,所述聚类单元对所述多个地理位置进行聚类后得到多个集合,每一集合包括一个或多个所述地理位置;
所述判定单元包括:
第二确定子单元,适于确定所述多个集合中每一集合包含的所述地理位置的数量,将所述地理位置的数量最大的集合作为目标集合;
第二位置计算子单元,适于将所述目标集合的中心点或所述目标集合中出现频次最大的所述地理位置作为所述位置信息。
19.一种终端,其特征在于,包括如权利要求10至18任一项所述的网络用户定位装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610224580.1A CN105933294B (zh) | 2016-04-12 | 2016-04-12 | 网络用户定位方法、装置及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610224580.1A CN105933294B (zh) | 2016-04-12 | 2016-04-12 | 网络用户定位方法、装置及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105933294A true CN105933294A (zh) | 2016-09-07 |
CN105933294B CN105933294B (zh) | 2019-08-16 |
Family
ID=56838051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610224580.1A Active CN105933294B (zh) | 2016-04-12 | 2016-04-12 | 网络用户定位方法、装置及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105933294B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106789411A (zh) * | 2016-12-07 | 2017-05-31 | 北京亚鸿世纪科技发展有限公司 | 一种机房内活跃ip数据的采集方法和装置 |
CN106878105A (zh) * | 2017-02-14 | 2017-06-20 | 广州启生信息技术有限公司 | 一种基于b/s架构实现ip定位修正的方法和装置 |
CN107317891A (zh) * | 2017-05-10 | 2017-11-03 | 郑州埃文计算机科技有限公司 | 一种面向动态ip多区域性分布的地理位置定位方法 |
CN107566542A (zh) * | 2017-08-21 | 2018-01-09 | 郑州埃文计算机科技有限公司 | 一种将企业专线ip定位到企业的方法 |
CN107613034A (zh) * | 2017-08-21 | 2018-01-19 | 郑州埃文计算机科技有限公司 | 一种将住宅ip定位到住宅小区的方法 |
CN107659675A (zh) * | 2017-08-21 | 2018-02-02 | 郑州埃文计算机科技有限公司 | 基于多边形定位形式的动态ip多区域定位方法 |
CN108011987A (zh) * | 2017-10-11 | 2018-05-08 | 北京三快在线科技有限公司 | Ip地址定位方法及装置,电子设备及存储介质 |
CN109474712A (zh) * | 2018-11-06 | 2019-03-15 | 网宿科技股份有限公司 | 一种ip地理信息确定方法、服务器及存储介质 |
CN109769202A (zh) * | 2019-02-25 | 2019-05-17 | 上海晶赞融宣科技有限公司 | 流量数据的定位方法及装置、存储介质、服务器 |
CN109787961A (zh) * | 2018-12-24 | 2019-05-21 | 上海晶赞融宣科技有限公司 | 虚假流量的识别方法及装置、存储介质、服务器 |
WO2019128355A1 (zh) * | 2017-12-29 | 2019-07-04 | 北京京东尚科信息技术有限公司 | 确定精确地理位置的方法和装置 |
CN110661899A (zh) * | 2018-12-29 | 2020-01-07 | 北京奇虎科技有限公司 | 一种ip地址的物理地址确定方法和装置 |
CN110798543A (zh) * | 2019-11-04 | 2020-02-14 | 北京数字联盟网络科技有限公司 | Ip定位方法及装置、计算机存储介质、计算设备 |
CN111898624A (zh) * | 2020-01-21 | 2020-11-06 | 北京畅行信息技术有限公司 | 定位信息的处理方法、装置、设备及存储介质 |
CN112153091A (zh) * | 2019-06-27 | 2020-12-29 | 北京百度网讯科技有限公司 | 用于确定设备的相关性的方法及装置 |
CN113313876A (zh) * | 2021-05-26 | 2021-08-27 | 北京云迹科技有限公司 | 一种移动酒店售货机器人 |
CN113407796A (zh) * | 2021-05-13 | 2021-09-17 | 郑州埃文计算机科技有限公司 | 一种基于ip历史位置的静态ip楼宇级定位方法 |
CN116561120A (zh) * | 2023-04-21 | 2023-08-08 | 清华大学 | 一种用于时序数据库的数据文件快速合并方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103220376A (zh) * | 2013-03-30 | 2013-07-24 | 清华大学 | 利用移动终端的位置数据来定位ip位置的方法 |
CN103248723A (zh) * | 2013-04-10 | 2013-08-14 | 腾讯科技(深圳)有限公司 | 一种ip地址所在区域的确定方法及装置 |
CN104253879A (zh) * | 2014-09-15 | 2014-12-31 | 北京锐安科技有限公司 | 一种基于ip地址的位置标定方法和装置 |
CN104333609A (zh) * | 2014-10-15 | 2015-02-04 | 北京百度网讯科技有限公司 | Ip地址定位方法和装置 |
CN104935676A (zh) * | 2014-03-17 | 2015-09-23 | 阿里巴巴集团控股有限公司 | 确定ip地址段及其对应的经纬度的方法及装置 |
US20150327007A1 (en) * | 2014-05-12 | 2015-11-12 | Alibaba Group Holding Limited | Method, apparatus, and system for determining a location of a terminal |
-
2016
- 2016-04-12 CN CN201610224580.1A patent/CN105933294B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103220376A (zh) * | 2013-03-30 | 2013-07-24 | 清华大学 | 利用移动终端的位置数据来定位ip位置的方法 |
CN103248723A (zh) * | 2013-04-10 | 2013-08-14 | 腾讯科技(深圳)有限公司 | 一种ip地址所在区域的确定方法及装置 |
CN104935676A (zh) * | 2014-03-17 | 2015-09-23 | 阿里巴巴集团控股有限公司 | 确定ip地址段及其对应的经纬度的方法及装置 |
US20150327007A1 (en) * | 2014-05-12 | 2015-11-12 | Alibaba Group Holding Limited | Method, apparatus, and system for determining a location of a terminal |
CN104253879A (zh) * | 2014-09-15 | 2014-12-31 | 北京锐安科技有限公司 | 一种基于ip地址的位置标定方法和装置 |
CN104333609A (zh) * | 2014-10-15 | 2015-02-04 | 北京百度网讯科技有限公司 | Ip地址定位方法和装置 |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106789411A (zh) * | 2016-12-07 | 2017-05-31 | 北京亚鸿世纪科技发展有限公司 | 一种机房内活跃ip数据的采集方法和装置 |
CN106789411B (zh) * | 2016-12-07 | 2020-01-21 | 北京亚鸿世纪科技发展有限公司 | 一种机房内活跃ip数据的采集方法和装置 |
CN106878105A (zh) * | 2017-02-14 | 2017-06-20 | 广州启生信息技术有限公司 | 一种基于b/s架构实现ip定位修正的方法和装置 |
CN106878105B (zh) * | 2017-02-14 | 2020-05-12 | 广州启生信息技术有限公司 | 一种基于b/s架构实现ip定位修正的方法和装置 |
CN107317891A (zh) * | 2017-05-10 | 2017-11-03 | 郑州埃文计算机科技有限公司 | 一种面向动态ip多区域性分布的地理位置定位方法 |
CN107566542A (zh) * | 2017-08-21 | 2018-01-09 | 郑州埃文计算机科技有限公司 | 一种将企业专线ip定位到企业的方法 |
CN107613034A (zh) * | 2017-08-21 | 2018-01-19 | 郑州埃文计算机科技有限公司 | 一种将住宅ip定位到住宅小区的方法 |
CN107659675A (zh) * | 2017-08-21 | 2018-02-02 | 郑州埃文计算机科技有限公司 | 基于多边形定位形式的动态ip多区域定位方法 |
CN108011987A (zh) * | 2017-10-11 | 2018-05-08 | 北京三快在线科技有限公司 | Ip地址定位方法及装置,电子设备及存储介质 |
CN108011987B (zh) * | 2017-10-11 | 2020-09-04 | 北京三快在线科技有限公司 | Ip地址定位方法及装置,电子设备及存储介质 |
WO2019128355A1 (zh) * | 2017-12-29 | 2019-07-04 | 北京京东尚科信息技术有限公司 | 确定精确地理位置的方法和装置 |
CN109995884A (zh) * | 2017-12-29 | 2019-07-09 | 北京京东尚科信息技术有限公司 | 确定精确地理位置的方法和装置 |
CN109474712A (zh) * | 2018-11-06 | 2019-03-15 | 网宿科技股份有限公司 | 一种ip地理信息确定方法、服务器及存储介质 |
CN109787961A (zh) * | 2018-12-24 | 2019-05-21 | 上海晶赞融宣科技有限公司 | 虚假流量的识别方法及装置、存储介质、服务器 |
CN109787961B (zh) * | 2018-12-24 | 2021-08-10 | 上海晶赞融宣科技有限公司 | 虚假流量的识别方法及装置、存储介质、服务器 |
CN110661899A (zh) * | 2018-12-29 | 2020-01-07 | 北京奇虎科技有限公司 | 一种ip地址的物理地址确定方法和装置 |
CN109769202A (zh) * | 2019-02-25 | 2019-05-17 | 上海晶赞融宣科技有限公司 | 流量数据的定位方法及装置、存储介质、服务器 |
CN112153091A (zh) * | 2019-06-27 | 2020-12-29 | 北京百度网讯科技有限公司 | 用于确定设备的相关性的方法及装置 |
CN112153091B (zh) * | 2019-06-27 | 2022-05-13 | 北京百度网讯科技有限公司 | 用于确定设备的相关性的方法及装置 |
CN110798543A (zh) * | 2019-11-04 | 2020-02-14 | 北京数字联盟网络科技有限公司 | Ip定位方法及装置、计算机存储介质、计算设备 |
CN111898624A (zh) * | 2020-01-21 | 2020-11-06 | 北京畅行信息技术有限公司 | 定位信息的处理方法、装置、设备及存储介质 |
CN111898624B (zh) * | 2020-01-21 | 2024-04-02 | 北京畅行信息技术有限公司 | 定位信息的处理方法、装置、设备及存储介质 |
CN113407796A (zh) * | 2021-05-13 | 2021-09-17 | 郑州埃文计算机科技有限公司 | 一种基于ip历史位置的静态ip楼宇级定位方法 |
CN113313876A (zh) * | 2021-05-26 | 2021-08-27 | 北京云迹科技有限公司 | 一种移动酒店售货机器人 |
CN116561120A (zh) * | 2023-04-21 | 2023-08-08 | 清华大学 | 一种用于时序数据库的数据文件快速合并方法及系统 |
CN116561120B (zh) * | 2023-04-21 | 2023-12-26 | 清华大学 | 一种用于时序数据库的数据文件快速合并方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105933294B (zh) | 2019-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105933294A (zh) | 网络用户定位方法、装置及终端 | |
CN108181607B (zh) | 基于指纹库的定位方法、装置及计算机可读存储介质 | |
KR101355269B1 (ko) | 네트워크 기반 위치 결정 시스템을 위한 위치 데이터베이스 관리 | |
KR101343219B1 (ko) | 위치 데이터베이스를 이용한 모바일 장치의 위치 결정 | |
US9426044B2 (en) | Radio access network geographic information system with multiple format | |
CN102063499A (zh) | 构建电子地图定位数据库的方法及系统 | |
CN105282758A (zh) | WiFi室内定位系统指纹数据库自适应动态构建方法 | |
CN109688532B (zh) | 一种划分城市功能区域的方法及装置 | |
WO2017107800A1 (zh) | 获取交通道路中路线热度的方法及装置 | |
CN105491529B (zh) | 移动终端位置数据的内存映射处理方法及大数据平台 | |
CN109963285B (zh) | 确定小区覆盖范围的方法、装置、电子设备和存储介质 | |
CN110020221A (zh) | 职住分布确认方法、装置、服务器及计算机可读存储介质 | |
CN103822638B (zh) | 用户位置信息的处理方法和装置 | |
PH12014501098B1 (en) | Method and server for searching for nearby user in social networking services | |
CN104837142A (zh) | 一种无线定位系统中定位参考点的标定方法及系统 | |
CN106708837B (zh) | 兴趣点搜索方法、装置 | |
CN105847310A (zh) | 一种确定位置的方法及装置 | |
CN106817674A (zh) | 一种定位方法及装置 | |
CN106255054A (zh) | 确定移动终端定位间隔的方法、移动终端及服务器 | |
CN108281023B (zh) | 一种通过移动终端展示实时路况的方法和系统 | |
CN103826299A (zh) | 基于无线信号感知的室内增强现实实现方法 | |
CN111475746B (zh) | 兴趣点位置挖掘方法、装置、计算机设备和存储介质 | |
CN103856893A (zh) | 一种过滤定位信息的方法及装置 | |
CN117217460A (zh) | 一种巡检方案生成方法、装置、电子设备及存储介质 | |
CN107978219B (zh) | 一种构建数字地图的道路网的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |