CN114584532B - 地理位置信息库的更新方法、装置及服务器 - Google Patents

地理位置信息库的更新方法、装置及服务器 Download PDF

Info

Publication number
CN114584532B
CN114584532B CN202210231042.0A CN202210231042A CN114584532B CN 114584532 B CN114584532 B CN 114584532B CN 202210231042 A CN202210231042 A CN 202210231042A CN 114584532 B CN114584532 B CN 114584532B
Authority
CN
China
Prior art keywords
position information
geographic position
subnet mask
address
mask length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210231042.0A
Other languages
English (en)
Other versions
CN114584532A (zh
Inventor
张恒
张立坤
邓桂英
孙从友
赵彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Internet Network Information Center
Original Assignee
China Internet Network Information Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Internet Network Information Center filed Critical China Internet Network Information Center
Priority to CN202210231042.0A priority Critical patent/CN114584532B/zh
Publication of CN114584532A publication Critical patent/CN114584532A/zh
Application granted granted Critical
Publication of CN114584532B publication Critical patent/CN114584532B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请公开一种地理位置信息库的更新方法、装置及服务器。该方法包括:基于地理位置信息库生成分布信息集合;确定分布信息集合中的每个子网掩码长度的权重;根据子网掩码长度的权重,确定地理位置信息库中各条IP地址地理位置信息的权重,进而确定IP地址地理位置信息的概率质量;根据IP地址地理位置信息的概率质量,从地理位置信息库中抽样出指定数量的目标IP地址地理位置信息;从可信数据源获取目标IP地址地理位置信息所包含的IP地址对应的地理位置信息;利用获取到的地理位置信息对地理位置信息库进行更新。基于本申请公开的方案,能够基于较少的查询次数保证地理位置信息库存储的IP地址和地理位置信息具有较高的准确性。

Description

地理位置信息库的更新方法、装置及服务器
技术领域
本申请属于计算机网络技术领域,尤其涉及一种地理位置信息库的更新方法、装置及服务器。
背景技术
IP地址与地理位置信息的映射关系可以应用到很多方面,例如,基于用户所在的地域为用户提供更加精准的服务。
目前,一种方案是通过已公开的可信数据源查询IP地址对应的地理位置信息。但是,已公开的可信数据源通常设置有查询次数限制。为了解决这一问题,在本地创建IP地址的地理位置信息库,当可信数据源发生查询异常或者查询次数达到查询上限时,从本地的地理位置信息库查询IP地址对应的地理位置信息。
因此,如何对本地的地理位置信息库进行更新,保证地理位置信息库存储的IP地址和地理位置信息具有较高的准确性,是本领域技术人员亟待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种地理位置信息库的更新方法、装置及服务器,以保证地理位置信息库存储的IP地址和地理位置信息具有较高的准确性。
为实现上述目的,本申请提供如下技术方案:
本申请提供一种地理位置信息库的更新方法,包括:
基于所述地理位置信息库生成分布信息集合,其中,所述地理位置信息库包括多条IP地址地理位置信息,每条IP地址地理位置信息包括IP地址、子网掩码长度和地理位置信息,所述分布信息集合包括所述地理位置信息库中出现的子网掩码长度和各个子网掩码长度的出现频次;
针对所述分布信息集合中的每个子网掩码长度,根据所述子网掩码长度的出现频次、所述分布信息集合中最高频次的子网掩码长度以及所述最高频次的子网掩码长度的出现频次,确定所述子网掩码长度的权重;
根据所述分布信息集合中各个子网掩码长度的权重,确定所述地理位置信息库中各条IP地址地理位置信息的权重;
针对所述地理位置信息库中的每条IP地址地理位置信息,根据所述IP地址地理位置信息的权重确定所述IP地址地理位置信息的概率质量,其中,IP地址地理位置信息的概率质量与所述IP地址地理位置信息的权重呈正相关关系;
根据IP地址地理位置信息的概率质量,从所述地理位置信息库中抽样出指定数量的目标IP地址地理位置信息;
从可信数据源获取所述目标IP地址地理位置信息所包含的IP地址对应的地理位置信息;
利用获取到的地理位置信息对所述地理位置信息库进行更新。
可选的,所述根据所述子网掩码长度的出现频次、所述分布信息集合中最高频次的子网掩码长度以及所述最高频次的子网掩码长度的出现频次,确定所述子网掩码长度的权重,包括:
比较所述子网掩码长度R.netmasklen与所述最高频次的子网掩码长度most_netmasklen;
如果所述子网掩码长度R.netmasklen大于或等于所述最高频次的子网掩码长度most_netmasklen,则确定所述子网掩码长度的权重为most_amount/R.amount;
如果所述子网掩码长度R.netmasklen小于所述最高频次的子网掩码长度most_netmasklen,则比较所述子网掩码长度的出现频次R.amount和所述指定数量size的乘积与所述地理位置信息库中IP地址地理位置信息的总量total;
如果所述乘积小于所述总量total,则确定所述子网掩码长度的权重为total/(R.amount*size);
如果所述乘积大于或等于所述总量total,则所述子网掩码长度的权重保持初始化数值;
其中,most_amount为所述最高频次的子网掩码长度的出现频次,R.amount为所述子网掩码长度的出现频次。
可选的,所述根据所述IP地址地理位置信息的权重确定所述IP地址地理位置信息的概率质量,包括:
确定所述地理位置信息库中全部IP地址地理位置信息的权重的累加值;
将所述IP地址地理位置位置信息的权重和所述累加值的比值确定为所述IP地址地理位置信息的概率质量。
本申请还提供一种地理位置信息库的更新装置,包括:
集合生成单元,用于基于所述地理位置信息库生成分布信息集合,其中,所述地理位置信息库包括多条IP地址地理位置信息,每条IP地址地理位置信息包括IP地址、子网掩码长度和地理位置信息,所述分布信息集合包括所述地理位置信息库中出现的子网掩码长度和各个子网掩码长度的出现频次;
第一权重确定单元,用于针对所述分布信息集合中的每个子网掩码长度,根据所述子网掩码长度的出现频次、所述分布信息集合中最高频次的子网掩码长度以及所述最高频次的子网掩码长度的出现频次,确定所述子网掩码长度的权重;
第二权重确定单元,用于根据所述分布信息集合中各个子网掩码长度的权重,确定所述地理位置信息库中各条IP地址地理位置信息的权重;
概率质量确定单元,用于针对所述地理位置信息库中的每条IP地址地理位置信息,根据所述IP地址地理位置信息的权重确定所述IP地址地理位置信息的概率质量,其中,IP地址地理位置信息的概率质量与所述IP地址地理位置信息的权重呈正相关关系;
抽样单元,用于根据IP地址地理位置信息的概率质量,从所述地理位置信息库中抽样出指定数量的目标IP地址地理位置信息;
地理位置信息获取单元,用于从可信数据源获取所述目标IP地址地理位置信息所包含的IP地址对应的地理位置信息;
更新单元,用于利用获取到的地理位置信息对所述地理位置信息库进行更新。
可选的,所述第一权重确定单元具体用于:
比较所述子网掩码长度R.netmasklen与所述最高频次的子网掩码长度most_netmasklen;如果所述子网掩码长度R.netmasklen大于或等于所述最高频次的子网掩码长度most_netmasklen,则确定所述子网掩码长度的权重为most_amount/R.amount;如果所述子网掩码长度R.netmasklen小于所述最高频次的子网掩码长度most_netmasklen,则比较所述子网掩码长度的出现频次R.amount和指定数量size的乘积与所述地理位置信息库中IP地址地理位置信息的总量total;如果所述乘积小于所述总量total,则确定所述子网掩码长度的权重为total/(R.amount*size);如果所述乘积大于或等于所述总量total,则所述子网掩码长度的权重保持初始化数值;
其中,most_amount为所述最高频次的子网掩码长度的出现频次,R.amount为所述子网掩码长度的出现频次。
可选的,所述概率质量确定单元具体用于:
确定所述地理位置信息库中全部IP地址地理位置信息的权重的累加值;将所述IP地址地理位置位置信息的权重和所述累加值的比值确定为所述IP地址地理位置信息的概率质量。
本申请还提供一种服务器,包括处理器和存储器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如上述任一种方法的各个步骤。
由此可见,本申请的有益效果为:
本申请公开的地理位置信息库的更新方法及装置,从地理位置信息库中确定出的目标IP地址地理位置信息,其包含的IP地址的地理位置信息在可信数据源中发生更新的概率较高,因此,能够基于较少的查询次数保证地理位置信息库存储的IP地址和地理位置信息具有较高的准确性。在可信数据源的查询次数受限的前提下,使得地理位置信息库和可信数据源的数据一致性达到最大化。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请公开的一种地理位置信息库的更新方法的流程图;
图2为本申请公开的一种确定子网掩码长度的权重的方法的流程图;
图3为本申请公开的一种地理位置信息库的更新装置的结构示意图;
图4为本申请公开的一种服务器的硬件结构图;
图5为本申请公开的服务器的应用场景示意图。
具体实施方式
本申请公开一种地理位置信息库的更新方法、装置及服务器,以保证地理位置信息库存储的IP地址和地理位置信息具有较高的准确性。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,图1为本申请公开的一种地理位置信息库的更新方法的流程图。该方法应用于电子设备,如终端(手机、平板电脑等)、服务器。该方法包括以下步骤:
S101:基于地理位置信息库生成分布信息集合。
其中,地理位置信息库包括多条IP地址地理位置信息,每条IP地址地理位置信息包括IP地址、子网掩码长度和地理位置信息。分布信息集合包括地理位置信息库中出现的子网掩码长度和各个子网掩码长度的出现频次。
实施中,对地理位置信息库中全部IP地址地理位置信息中的子网掩码长度进行统计,确定出地理位置信息库中出现的子网掩码长度,以及各个子网掩码长度的出现频次,根据统计结果生成分布信息集合。
例如,地理位置信息库包括A条IP地址地理位置信息,A条IP地址地理位置信息中的子网掩码长度共有B种,需要说明的是,通常会有多条IP地址地理位置信息中的子网掩码长度是相同的,因此,B通常小于A。基于该地理位置信息库生成的分布信息集合,包含地理位置信息库中出现的B种子网掩码长度和各子网掩码长度的出现频次。可选的,基于该地理位置信息库生成的分布信息集合包含B条记录,每条记录包括一种子网掩码长度和该子网掩码长度的出现频次。
这里对子网掩码和子网掩码长度进行说明。
子网掩码(subnet mask)又称为网络掩码、地址掩码。子网掩码包含32位的二进制数据,通过对子网掩码与IP地址进行与运算,将IP地址划分为网络标识和主机标识。子网掩码长度是指子网掩码中包含的二进制数据1的数量。
S102:针对分布信息集合中的每个子网掩码长度,根据子网掩码长度的出现频次、分布信息集合中最高频次的子网掩码长度、以及最高频次的子网掩码长度的出现频次,确定子网掩码长度的权重。
对分布信息集合进行分析,确定出分布信息集合中出现频次最高的子网掩码长度、以及该子网掩码长度的出现频次。之后,分别确定分布信息集合中的每个子网掩码长度的权重。其中,确定任意一个子网掩码长度的权重,包括:根据该子网掩码长度的出现频次、分布信息集合中最高频次的子网掩码长度、以及最高频次的子网掩码长度的出现频次,确定该子网掩码长度的权重。
S103:根据分布信息集合中各个子网掩码长度的权重,确定地理位置信息库中各条IP地址地理位置信息的权重。
在步骤S102中确定出了各个子网掩码长度的权重,在步骤S103中,从步骤S102的处理结果中,获取与IP地址地理位置信息中的子网掩码长度对应的权重作为IP地址地理位置信息的权重。
实施中,确定任意一条IP地址地理位置信息的权重,包括:将IP地址地理位置信息中的子网掩码长度作为索引,从步骤S102的处理结果(即各个子网掩码长度的权重)中获得对应的权重,将获得的权重作为IP地址地理位置信息的权重。
S104:针对地理位置信息库中的每条IP地址地理位置信息,根据IP地址地理位置信息的权重确定IP地址地理位置信息的概率质量。
其中,IP地址地理位置信息的概率质量与IP地址地理位置信息的权重呈正相关关系。也就是说,IP地址地理位置信息的权重越大,该IP地址地理位置信息的概率质量越大。
S105:根据IP地址地理位置信息的概率质量,从地理位置信息库中抽样出指定数量的目标IP地址地理位置信息。
实施中,利用抽样函数从地理位置信息库中抽样出指定数量的IP地址地理位置信息,将抽样出的指定数量的IP地址地理位置信息作为目标IP地址地理位置信息。
抽样函数为:S=Sample(A,P,Size)。其中,Sample()为基于概率分布的抽样函数,A为地理位置信息库,P为IP地址地理位置信息的概率质量,Size为指定数量,S为抽样结果,也就是指定数量的目标IP地址地理位置信息。
其中,IP地址地理位置信息的概率质量的大小与该IP地址地理位置信息被抽样出的概率呈正相关关系。也就是说,IP地址地理位置信息的概率质量越大,该IP地址地理位置信息被抽样出的概率越大,相应的,IP地址地理位置信息的概率质量越小,该IP地址地理位置信息被抽样出的概率越小。
S106:从可信数据源获取目标IP地址地理位置信息所包含的IP地址对应的地理位置信息。
S107:利用获取到的地理位置信息对地理位置信息库进行更新。
在抽样出指定数量的目标IP地址地理位置信息后,向可信数据源发送查询请求,查询请求携带有前述目标IP地址地理位置信息包含的IP地址。之后,接收可信数据源反馈的地理位置信息,利用接收到的地理位置信息对地理位置信息库中相应的IP地址地理位置信息中的地理位置信息进行替换,实现对地理位置信息库的更新。
本申请公开的地理位置信息库的更新方法,利用已公开的可信数据源对地理位置信息库进行更新。由于已公开的可信数据源通常设置有查询次数限制,因此,如何基于较少的查询次数保证地理位置信息库存储的IP地址和地理位置信息具有较高的准确性是技术难点。
申请人发现:如果从地理位置信息库中随机地选择一部分IP地址,之后从已公开的可信数据源查询前述IP地址对应的地理位置信息,基于查询到的地理位置信息对地理位置信息库进行更新,效果较差,也就是说,地理位置信息库存储的IP地址和地理位置信息的准确度较低。
申请人发现导致这一问题的原因是:如果向已公开的可信数据源发送的查询请求所携带的IP地址,在已公开的可信数据源中没有更新该IP地址对应的地理位置信息,那么本次查询配额被浪费。而从地理位置信息库中随机地选择IP地址,会导致查询配额被浪费的可能性较高,进而导致当已公开的可信数据源中更新某些IP地址对应的地理位置信息后,并未对地理位置信息库中的相应信息进行更新,最终导致地理位置信息库存储的IP地址和地理位置信息的准确度较低。
经过进一步研究,申请人发现:IP地址对应的子网掩码分布越密集,在已公开的可信数据源中,该IP地址的地理位置信息被更新的概率越大;IP地址对应的子网掩码长度越大,在已公开的可信数据源中,该IP地址的地理位置信息被更新的概率越大。
因此,本申请中,针对地理位置信息库中出现的每种子网掩码长度,根据子网掩码长度的出现频次、分布信息集合中最高频次的子网掩码长度、以及最高频次的子网掩码长度的出现频次,确定子网掩码长度的权重。之后,根据子网掩码长度的权重确定地理位置信息库中IP地址地理位置信息的权重,根据IP地址地理位置信息的权重确定IP地址地理位置信息的概率质量,并且,IP地址地理位置信息的概率质量与IP地址地理位置信息的权重呈正相关关系。也就是说,质量概率大的IP地址地理位置信息中的IP地址与质量概率小的IP地址地理位置信息中的IP地址相比,其对应的地理位置信息在已公开的可信数据源中被更新的概率更大。因此,根据IP地址地理位置信息的概率质量,从地理位置信息库中抽样出的指定数量的目标IP地址地理位置信息,其所包含的IP地址的地理位置信息在已公开的可信数据源中发生更新的概率较高,能够基于较少的查询次数保证地理位置信息库存储的IP地址和地理位置信息具有较高的准确性。
本申请公开的地理位置信息库的更新方法,首先,基于地理位置信息库生成分布信息集合,其中,分布信息集合包括地理位置信息库中出现的子网掩码长度和各个子网掩码长度的出现频次;之后,针对分布信息集合中的每个子网掩码长度,根据子网掩码长度的出现频次、分布信息集合中最高频次的子网掩码长度、以及最高频次的子网掩码长度的出现频次,确定子网掩码长度的权重;之后,根据分布信息集合中各个子网掩码长度的权重,确定地理位置信息库中各条IP地址地理位置信息的权重,并根据各条IP地址地理位置信息的权重确定各条IP地址地理位置信息的概率质量;之后,根据IP地址地理位置信息的概率质量,从地理位置信息库中抽样出指定数量的目标IP地址地理位置信息;之后,从可信数据源获取目标IP地址地理位置信息所包含的IP地址对应的地理位置信息,利用获取到的地理位置信息对地理位置信息库进行更新。本申请公开的方案,从地理位置信息库中确定出的目标IP地址地理位置信息,其所包含的IP地址的地理位置信息在可信数据源中发生更新的概率较高,因此,能够基于较少的查询次数保证地理位置信息库存储的IP地址和地理位置信息具有较高的准确性。在可信数据源的查询次数受限的前提下,使得地理位置信息库和可信数据源的数据一致性达到最大化。
在本申请的另一个实施例中,针对任意一个子网掩码长度,根据该子网掩码长度的出现频次、分布信息集合中最高频次的子网掩码长度、以及最高频次的子网掩码长度的出现频次,确定该子网掩码长度的权重,采用如图2所示的方案,具体包括:
S201:比较子网掩码长度R.netmasklen与最高频次的子网掩码长度most_netmasklen。
S202:如果子网掩码长度R.netmasklen大于或等于最高频次的子网掩码长度most_netmasklen,那么按照公式R.weight=most_amount/R.amount确定子网掩码长度的权重。
如果子网掩码长度大于或等于最高频次的子网掩码长度,那么在可信数据源中,与该子网掩码长度对应的IP地址的地理位置信息被更新的概率,不低于最高频次的子网掩码长度对应的IP地址的地理位置信息被更新的概率,因此将该子网掩码长度的权重设置为most_amount/R.amount,以保证该子网掩码长度所在的IP地址地理位置信息在抽样结果中出现的概率,不低于最高频次的子网掩码长度所在的IP地址地理位置信息在抽样结果中出现的概率。
S203:如果子网掩码长度R.netmasklen小于最高频次的子网掩码长度most_netmasklen,那么比较子网掩码长度的出现频次R.amount和指定数量size的乘积与地理位置信息库中IP地址地理位置信息的总量total。
S204:如果该乘积小于总量total,那么按照公式R.weight=total/(R.amount*size)确定子网掩码长度的权重。
如果子网掩码长度小于最高频次的子网掩码长度,并且子网掩码长度的出现频次R.amount和指定数量size的乘积小于地理位置信息库中IP地址地理位置信息的总量total,将该子网掩码长度的权重设置为total/(R.amount*size),以使得该子网掩码长度所在的一条IP地址地理位置信息出现在抽样结果中。
S205:如果R.amount*size大于total,那么子网掩码长度的权重保持初始化数值。
其中,各子网掩码长度的权重被初始化为预设数值。实施中,在基于地理位置信息库生成分布信息集合后,将分布信息集合中各子网掩码长度的权重初始化为预设数值。可选的,各子网掩码长度的权重被初始化为1。
在以上两个公式中,R.weight为子网掩码长度的权重,most_amount为最高频次的子网掩码长度的出现频次,R.amount为该子网掩码长度的出现频次,size为指定数量,total为地理位置信息库中IP地址地理位置信息的总量。
在本申请的另一个实施例中,根据IP地址地理位置信息的权重确定IP地址地理位置信息的概率质量,采用如下方案,具体包括:
确定地理位置信息库中全部IP地址地理位置信息的权重的累加值;
将IP地址地理位置位置信息的权重和累加值的比值确定为IP地址地理位置信息的概率质量。
实施中,按照公式P(r)=r.weight/sum(weight)确定IP地址地理位置信息的概率质量。其中,P(r)为第r条IP地址地理位置信息的概率质量,r.weight为第r条IP地址地理位置信息的权重,sum(weight)为地理位置信息库中全部IP地址地理位置信息的权重的累加值。
本申请上述公开了地理位置信息库的更新方法,相应的,本申请还公开地理位置信息库的更新装置。参见图3,图3为本申请公开的一种地理位置信息库的更新装置的结构示意图,包括:
集合生成单元301,用于基于地理位置信息库生成分布信息集合。其中,地理位置信息库包括多条IP地址地理位置信息,每条IP地址地理位置信息包括IP地址、子网掩码长度和地理位置信息。分布信息集合包括地理位置信息库中出现的子网掩码长度和各个子网掩码长度的出现频次。
第一权重确定单元302,用于针对分布信息集合中的每个子网掩码长度,根据子网掩码长度的出现频次、分布信息集合中最高频次的子网掩码长度以及最高频次的子网掩码长度的出现频次,确定子网掩码长度的权重。
第二权重确定单元303,用于根据分布信息集合中各个子网掩码长度的权重,确定地理位置信息库中各条IP地址地理位置信息的权重。
概率质量确定单元304,用于针对地理位置信息库中的每条IP地址地理位置信息,根据IP地址地理位置信息的权重确定IP地址地理位置信息的概率质量。其中,IP地址地理位置信息的概率质量与IP地址地理位置信息的权重呈正相关关系。
抽样单元305,用于根据IP地址地理位置信息的概率质量,从地理位置信息库中抽样出指定数量的目标IP地址地理位置信息。
地理位置信息获取单元306,用于从可信数据源获取目标IP地址地理位置信息所包含的IP地址对应的地理位置信息。
更新单元307,用于利用获取到的地理位置信息对地理位置信息库进行更新。
本申请公开的地理位置信息库的更新装置,从地理位置信息库中确定出的目标IP地址地理位置信息,其包含的IP地址的地理位置信息在可信数据源中发生更新的概率较高,因此,能够基于较少的查询次数保证地理位置信息库存储的IP地址和地理位置信息具有较高的准确性。在可信数据源的查询次数受限的前提下,使得地理位置信息库和可信数据源的数据一致性达到最大化。
可选的,第一权重确定单元302具体用于:
比较所述子网掩码长度R.netmasklen与所述最高频次的子网掩码长度most_netmasklen;如果所述子网掩码长度R.netmasklen大于或等于所述最高频次的子网掩码长度most_netmasklen,则确定所述子网掩码长度的权重为most_amount/R.amount;如果所述子网掩码长度R.netmasklen小于所述最高频次的子网掩码长度most_netmasklen,则比较所述子网掩码长度的出现频次R.amount和指定数量size的乘积与所述地理位置信息库中IP地址地理位置信息的总量total;如果所述乘积小于所述总量total,则确定所述子网掩码长度的权重为total/(R.amount*size);如果所述乘积大于或等于所述总量total,则所述子网掩码长度的权重保持初始化数值。其中,most_amount为所述最高频次的子网掩码长度的出现频次,R.amount为所述子网掩码长度的出现频次。
可选的,概率质量确定单元304具体用于:
确定所述地理位置信息库中全部IP地址地理位置信息的权重的累加值;将所述IP地址地理位置位置信息的权重和所述累加值的比值确定为所述IP地址地理位置信息的概率质量。
本申请还提供一种服务器。参见图4和图5,图4示出了服务器的硬件结构,图5示出了服务器的应用场景。该服务器可以包括:至少一个处理器401,至少一个通信接口402,至少一个存储器403和至少一个通信总线404。
在本申请实施例中,处理器401、通信接口402、存储器403、通信总线404的数量为至少一个,且处理器401、通信接口402、存储器403通过通信总线404完成相互间的通信。
处理器401可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等。
存储器403可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器。
其中,存储器403存储有程序,处理器401可调用存储器403存储的程序,所述程序用于:
基于所述地理位置信息库生成分布信息集合,其中,所述地理位置信息库包括多条IP地址地理位置信息,每条IP地址地理位置信息包括IP地址、子网掩码长度和地理位置信息,所述分布信息集合包括所述地理位置信息库中出现的子网掩码长度和各个子网掩码长度的出现频次;
针对所述分布信息集合中的每个子网掩码长度,根据所述子网掩码长度的出现频次、所述分布信息集合中最高频次的子网掩码长度以及所述最高频次的子网掩码长度的出现频次,确定所述子网掩码长度的权重;
根据所述分布信息集合中各个子网掩码长度的权重,确定所述地理位置信息库中各条IP地址地理位置信息的权重;
针对所述地理位置信息库中的每条IP地址地理位置信息,根据所述IP地址地理位置信息的权重确定所述IP地址地理位置信息的概率质量,其中,IP地址地理位置信息的概率质量与所述IP地址地理位置信息的权重呈正相关关系;
根据IP地址地理位置信息的概率质量,从所述地理位置信息库中抽样出指定数量的目标IP地址地理位置信息;
从可信数据源获取所述目标IP地址地理位置信息所包含的IP地址对应的地理位置信息;
利用获取到的地理位置信息对所述地理位置信息库进行更新。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请还提供一种可读存储介质,该可读存储介质存储有适于处理器执行的程序,所述程序用于:
基于所述地理位置信息库生成分布信息集合,其中,所述地理位置信息库包括多条IP地址地理位置信息,每条IP地址地理位置信息包括IP地址、子网掩码长度和地理位置信息,所述分布信息集合包括所述地理位置信息库中出现的子网掩码长度和各个子网掩码长度的出现频次;
针对所述分布信息集合中的每个子网掩码长度,根据所述子网掩码长度的出现频次、所述分布信息集合中最高频次的子网掩码长度以及所述最高频次的子网掩码长度的出现频次,确定所述子网掩码长度的权重;
根据所述分布信息集合中各个子网掩码长度的权重,确定所述地理位置信息库中各条IP地址地理位置信息的权重;
针对所述地理位置信息库中的每条IP地址地理位置信息,根据所述IP地址地理位置信息的权重确定所述IP地址地理位置信息的概率质量,其中,IP地址地理位置信息的概率质量与所述IP地址地理位置信息的权重呈正相关关系;
根据IP地址地理位置信息的概率质量,从所述地理位置信息库中抽样出指定数量的目标IP地址地理位置信息;
从可信数据源获取所述目标IP地址地理位置信息所包含的IP地址对应的地理位置信息;
利用获取到的地理位置信息对所述地理位置信息库进行更新。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置及服务器而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (5)

1.一种地理位置信息库的更新方法,其特征在于,包括:
基于所述地理位置信息库生成分布信息集合,其中,所述地理位置信息库包括多条IP地址地理位置信息,每条IP地址地理位置信息包括IP地址、子网掩码长度和地理位置信息,所述分布信息集合包括所述地理位置信息库中出现的子网掩码长度和各个子网掩码长度的出现频次;
针对所述分布信息集合中的每个子网掩码长度,根据所述子网掩码长度的出现频次、所述分布信息集合中最高频次的子网掩码长度以及所述最高频次的子网掩码长度的出现频次,确定所述子网掩码长度的权重;
根据所述分布信息集合中各个子网掩码长度的权重,确定所述地理位置信息库中各条IP地址地理位置信息的权重;
针对所述地理位置信息库中的每条IP地址地理位置信息,根据所述IP地址地理位置信息的权重确定所述IP地址地理位置信息的概率质量,其中,IP地址地理位置信息的概率质量与所述IP地址地理位置信息的权重呈正相关关系;
根据IP地址地理位置信息的概率质量,从所述地理位置信息库中抽样出指定数量的目标IP地址地理位置信息;
从可信数据源获取所述目标IP地址地理位置信息所包含的IP地址对应的地理位置信息;
利用获取到的地理位置信息对所述地理位置信息库进行更新;
其中,所述根据所述子网掩码长度的出现频次、所述分布信息集合中最高频次的子网掩码长度以及所述最高频次的子网掩码长度的出现频次,确定所述子网掩码长度的权重,包括:
比较所述子网掩码长度R.netmasklen与所述最高频次的子网掩码长度most_netmasklen;
如果所述子网掩码长度R.netmasklen大于或等于所述最高频次的子网掩码长度most_netmasklen,则确定所述子网掩码长度的权重为most_amount/R.amount;
如果所述子网掩码长度R.netmasklen小于所述最高频次的子网掩码长度most_netmasklen,则比较所述子网掩码长度的出现频次R.amount和所述指定数量size的乘积与所述地理位置信息库中IP地址地理位置信息的总量total;
如果所述乘积小于所述总量total,则确定所述子网掩码长度的权重为total/(R.amount*size);
如果所述乘积大于或等于所述总量total,则所述子网掩码长度的权重保持初始化数值;
其中,most_amount为所述最高频次的子网掩码长度的出现频次,R.amount为所述子网掩码长度的出现频次。
2.根据权利要求1所述的方法,其特征在于,所述根据所述IP地址地理位置信息的权重确定所述IP地址地理位置信息的概率质量,包括:
确定所述地理位置信息库中全部IP地址地理位置信息的权重的累加值;
将所述IP地址地理位置位置信息的权重和所述累加值的比值确定为所述IP地址地理位置信息的概率质量。
3.一种地理位置信息库的更新装置,其特征在于,包括:
集合生成单元,用于基于所述地理位置信息库生成分布信息集合,其中,所述地理位置信息库包括多条IP地址地理位置信息,每条IP地址地理位置信息包括IP地址、子网掩码长度和地理位置信息,所述分布信息集合包括所述地理位置信息库中出现的子网掩码长度和各个子网掩码长度的出现频次;
第一权重确定单元,用于针对所述分布信息集合中的每个子网掩码长度,根据所述子网掩码长度的出现频次、所述分布信息集合中最高频次的子网掩码长度以及所述最高频次的子网掩码长度的出现频次,确定所述子网掩码长度的权重;
第二权重确定单元,用于根据所述分布信息集合中各个子网掩码长度的权重,确定所述地理位置信息库中各条IP地址地理位置信息的权重;
概率质量确定单元,用于针对所述地理位置信息库中的每条IP地址地理位置信息,根据所述IP地址地理位置信息的权重确定所述IP地址地理位置信息的概率质量,其中,IP地址地理位置信息的概率质量与所述IP地址地理位置信息的权重呈正相关关系;
抽样单元,用于根据IP地址地理位置信息的概率质量,从所述地理位置信息库中抽样出指定数量的目标IP地址地理位置信息;
地理位置信息获取单元,用于从可信数据源获取所述目标IP地址地理位置信息所包含的IP地址对应的地理位置信息;
更新单元,用于利用获取到的地理位置信息对所述地理位置信息库进行更新;
其中,所述第一权重确定单元具体用于:
比较所述子网掩码长度R.netmasklen与所述最高频次的子网掩码长度most_netmasklen;如果所述子网掩码长度R.netmasklen大于或等于所述最高频次的子网掩码长度most_netmasklen,则确定所述子网掩码长度的权重为most_amount/R.amount;如果所述子网掩码长度R.netmasklen小于所述最高频次的子网掩码长度most_netmasklen,则比较所述子网掩码长度的出现频次R.amount和指定数量size的乘积与所述地理位置信息库中IP地址地理位置信息的总量total;如果所述乘积小于所述总量total,则确定所述子网掩码长度的权重为total/(R.amount*size);如果所述乘积大于或等于所述总量total,则所述子网掩码长度的权重保持初始化数值;
其中,most_amount为所述最高频次的子网掩码长度的出现频次,R.amount为所述子网掩码长度的出现频次。
4.根据权利要求3所述的装置,其特征在于,所述概率质量确定单元具体用于:
确定所述地理位置信息库中全部IP地址地理位置信息的权重的累加值;将所述IP地址地理位置位置信息的权重和所述累加值的比值确定为所述IP地址地理位置信息的概率质量。
5.一种服务器,其特征在于,包括处理器和存储器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1至2中任一项所述的方法的各个步骤。
CN202210231042.0A 2022-03-10 2022-03-10 地理位置信息库的更新方法、装置及服务器 Active CN114584532B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210231042.0A CN114584532B (zh) 2022-03-10 2022-03-10 地理位置信息库的更新方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210231042.0A CN114584532B (zh) 2022-03-10 2022-03-10 地理位置信息库的更新方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN114584532A CN114584532A (zh) 2022-06-03
CN114584532B true CN114584532B (zh) 2023-10-24

Family

ID=81774133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210231042.0A Active CN114584532B (zh) 2022-03-10 2022-03-10 地理位置信息库的更新方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN114584532B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103167052A (zh) * 2011-12-16 2013-06-19 北京思博途信息技术有限公司 一种自动优化ip地域信息库的方法及系统
CN103729378A (zh) * 2012-10-16 2014-04-16 腾讯科技(深圳)有限公司 一种ip地理信息的更新方法和装置
CN105119827A (zh) * 2015-07-14 2015-12-02 中国互联网络信息中心 一种路由器地理位置的判断方法
CN105939264A (zh) * 2015-08-13 2016-09-14 杭州迪普科技有限公司 一种路由的管理方法和装置
CN111327714A (zh) * 2018-12-17 2020-06-23 中国电信股份有限公司 域名递归查询方法、系统以及服务器、dns系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6223172B1 (en) * 1997-10-31 2001-04-24 Nortel Networks Limited Address routing using address-sensitive mask decimation scheme

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103167052A (zh) * 2011-12-16 2013-06-19 北京思博途信息技术有限公司 一种自动优化ip地域信息库的方法及系统
CN103729378A (zh) * 2012-10-16 2014-04-16 腾讯科技(深圳)有限公司 一种ip地理信息的更新方法和装置
CN105119827A (zh) * 2015-07-14 2015-12-02 中国互联网络信息中心 一种路由器地理位置的判断方法
CN105939264A (zh) * 2015-08-13 2016-09-14 杭州迪普科技有限公司 一种路由的管理方法和装置
CN111327714A (zh) * 2018-12-17 2020-06-23 中国电信股份有限公司 域名递归查询方法、系统以及服务器、dns系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"IPCIS系统中IPv4位置库有效性研究";胡津瑞;《中国优秀硕士论文数据库》;全文 *
V Chandrakanth."VLSI implementation of sliding window DFT".《IEEE》.2013,全文. *

Also Published As

Publication number Publication date
CN114584532A (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN111163072B (zh) 机器学习模型中特征值的确定方法、装置及电子设备
CN101355595A (zh) 定位ip地址的物理所在地的方法和装置
US20080126311A1 (en) Automatic index creation based on unindexed search evaluation
CN112347377B (zh) Ip地址段查找方法与业务调度方法、装置、电子设备
CN111639092B (zh) 一种人员流动分析方法、装置、电子设备及存储介质
US11595427B2 (en) Systems and methods for rapidly generating security ratings
CN111447292B (zh) 一种IPv6地理位置定位方法、装置、设备及存储介质
CN111629081A (zh) 互联网协议ip地址数据处理方法、装置及电子设备
CN110516752A (zh) 聚类簇质量评估方法、装置、设备及存储介质
CN114584532B (zh) 地理位置信息库的更新方法、装置及服务器
CN110532254A (zh) 融合数据表的方法和装置
WO2000026743A2 (en) Computer network size growth forecasting method and system
CN110727895B (zh) 一种敏感词发送方法、装置、电子设备及存储介质
US20230308933A1 (en) Data transmission method, related network node and storage medium
CN115037720A (zh) 域名解析请求的处理方法、装置、电子设备及存储介质
CN110263082B (zh) 数据库的数据分布分析方法、装置、电子设备及存储介质
CN114268608A (zh) 一种地址段检索方法、装置、电子设备及存储介质
CN114429177A (zh) 设备指纹特征筛选方法、装置、电子设备及存储介质
CN112261134B (zh) 网络数据访问审计方法、装置、设备及存储介质
CN108573018B (zh) Ip库生成方法、装置、电子设备及计算机可读存储介质
CN111510512A (zh) 一种快速获取域名所有ip的方法
CN111159199A (zh) 一种指标数据获取方法及装置
CN112165530B (zh) 一种服务调用关系分析方法及装置
CN109769202A (zh) 流量数据的定位方法及装置、存储介质、服务器
CN113568924B (zh) 一种数据处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant