CN105430115A - 一种优化ip库的方法、装置及计算设备 - Google Patents
一种优化ip库的方法、装置及计算设备 Download PDFInfo
- Publication number
- CN105430115A CN105430115A CN201510810818.4A CN201510810818A CN105430115A CN 105430115 A CN105430115 A CN 105430115A CN 201510810818 A CN201510810818 A CN 201510810818A CN 105430115 A CN105430115 A CN 105430115A
- Authority
- CN
- China
- Prior art keywords
- address
- storehouse
- latitude
- longitude
- geography information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/69—Types of network addresses using geographic information, e.g. room number
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种优化IP库的方法、装置及计算设备,其中优化IP库的方法适于在计算设备中执行,该方法包括以下步骤:从用户日志中获取GPS信息和关联的IP地址,形成第一经纬度IP库,所述GPS信息包括经纬度信息,解析所述经纬度信息获取地理信息;对第一经纬度IP库进行IP地址过滤,保留唯一对应一个地理信息的IP地址;对IP地址过滤后的第一经纬度IP库,按照IP地址进行排序,合并地理位置相同的相邻IP地址,形成第二经纬度IP库;利用预定IP库对第二经纬度IP库进行补充,获得优化后的IP库。
Description
技术领域
本发明涉及互联网领域,特别涉及一种优化IP库的方法、装置及计算设备。
背景技术
Internet(互联网)依靠TCP(TransmissionControlProtocol,传输控制协议)/IP(InternetProtocol,互联网协议),在全球范围内实现不同硬件结构、不同操作系统、不同网络系统的互联。在Internet上,每一个节点都依靠唯一的IP地址互相区分和相互联系。每一台联网的计算设备无权自行设定IP地址,由IANA(InternetAssignedNumbersAuthority,互联网数字分配机构)负责IP地址的分配。
IP库是IP地址与地理信息的对应数据库,常用于定位网络地址与地理意义的地址,其中记录各个IP地址段所属的地理区域。目前IP库的优化主要是以中国广告协会IP库为基准,融合多个现有IP库,如IPIP、IP特例库等,对差异进行第三方投票,如淘宝、新浪等,最后合并得到的IP段获取正式IP库。但上述方案的数据来源质量会对IP库准确度产生影响,且辅助投票方式并不一定能选出正确的IP地址。
发明内容
为此,本发明提供一种优化IP库的方案,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供一种优化IP库的方法,适于在计算设备中执行。该方法包括如下步骤。首先,从用户日志中获取GPS信息和关联的IP地址,形成第一经纬度IP库,其中GPS信息包括经纬度信息,解析经纬度信息获取地理信息;对第一经纬度IP库进行IP地址过滤,保留唯一对应一个地理信息的IP地址;对IP地址过滤后的第一经纬度IP库,按照IP地址进行排序,合并地理位置相同的相邻IP地址,形成第二经纬度IP库;利用预定IP库对第二经纬度IP库进行补充,获得优化后的IP库。
可选地,在根据本发明的优化IP库的方法中,对第一经纬度IP库进行IP地址过滤,保留唯一对应一个地理信息的IP地址包括:判断同一IP地址对应的地理信息是否超过一个;如果所述IP地址对应的地理信息超过一个,则将其过滤;如果所述IP地址对应的地理信息仅为一个,则将其保留。
可选地,在根据本发明的优化IP库的方法中,按照IP地址进行排序,合并地理位置相同的相邻IP地址,形成第二经纬度IP库包括:将IP地址从二进制转换为十进制,进行排序;将地理信息相同且相邻的IP地址进行合并,获得地理信息对应的IP地址段;移除对应地理信息单点的IP地址,形成第二经纬度IP库,其中,对应地理信息单点包括当前IP地址对应的地理信息与前一IP地址和后一IP地址对应的地理信息均不一致。
可选地,在根据本发明的优化IP库的方法中,利用预定IP库对第二经纬度IP库进行补充,获得优化后的IP库,包括以第二经纬度IP库为基准,对其中缺失的IP段,利用预定IP库进行补充。
可选地,在根据本发明的优化IP库的方法中,地理信息为省级地址或市级地址。
根据本发明的又一个方面,提供一种优化IP库的装置,适于驻留在计算设备中。该装置包括第一经纬度IP库形成模块、IP地址过滤模块、第二经纬度IP库形成模块和IP库优化模块。第一经纬度IP库形成模块,适于从用户日志中获取GPS信息和关联的IP地址,形成第一经纬度IP库,其中GPS信息包括经纬度信息,解析经纬度信息获取地理信息。IP地址过滤模块,适于对第一经纬度IP库进行IP地址过滤,保留唯一对应一个地理信息的IP地址。第二经纬度IP库形成模块,适于对IP地址过滤后的第一经纬度IP库,按照IP地址进行排序,合并地理位置相同的相邻IP地址,形成第二经纬度IP库。IP库优化模块,适于利用预定IP库对第二经纬度IP库进行补充,获得优化后的IP库。
可选地,在根据本发明的优化IP库的装置中,IP地址过滤模块还包括:判断子模块,适于判断同一IP地址对应的地理信息是否超过一个;过滤子模块,适于过滤对应地理信息超过一个的IP地址;保留子模块,适于保留对应地理信息仅为一个的IP地址。
可选地,在根据本发明的优化IP库的装置中,第二经纬度IP库形成模块还包括:排序子模块,适于将IP地址从二进制转换为十进制并进行排序;合并子模块,适于将地理信息相同且相邻的IP地址进行合并,获得地理信息对应的IP地址段;移除子模块,适于移除对应地理信息单点的IP地址,其中对应地理信息单点包括当前IP地址对应的地理信息与前一IP地址和后一IP地址对应的地理信息均不一致。
可选地,在根据本发明的优化IP库的装置中,IP库优化模块进一步适于以第二经纬度IP库为基准,对其中缺失的IP段,利用预定IP库进行补充。
根据本发明的又一个方面,还提供一种计算设备,包括根据本发明的优化IP库的装置。
根据本发明的优化IP库的技术方案,通过从用户日志获取GPS信息和关联的IP地址,解析GPS信息中包含的经纬度信息以获得地理信息,过滤对应地理信息超过一个的IP地址后进行排序,合并相邻的IP地址,形成经纬度IP库,改善了数据源的质量。同时,针对获得的经纬度IP库覆盖度不完整的情况,利用预定IP库补充缺失的IP段,从而实现IP库的优化,提升了IP库的准确度。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1为根据本发明的示例计算设备100的框图;
图2示出了根据本发明一个实施例的优化IP库的方法200流程图;以及
图3示出了根据本发明一个实施例的优化IP库的装置300示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器((μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备100可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100被配置为执行根据本发明的优化IP库的方法。应用122包括根据本发明的优化IP库的装置500。
图2示出了根据本发明一个实施例的优化IP库的方法200流程图。优化IP库的方法200适于在计算设备(例如图1所示的计算设备100)中执行。
如图2所示,方法200始于步骤S210。在步骤S210中,首先从用户日志中获取GPS信息和关联的IP地址,形成第一经纬度IP库,并解析GPS信息中包含的经纬度信息以得到地理信息。本实施例中的第一经纬度IP库如表1所示,包括经度、纬度、IP地址、省级邮编、市级邮编、省级地址和市级地址,其中省级邮编、市级邮编、省级地址和市级地址都是解析经纬度信息获得的地理信息。
表1
随后在步骤S220中,对步骤S210得到的第一经纬度IP库进行IP地址过滤,保留唯一对应一个地理信息的IP地址。如果同一IP地址对应的地理信息超过一个,则认为是漂移IP,需要进行移除。首先,判断同一IP地址对应的地理信息是否超过一个。对照表1中可以发现,IP地址59.37.145.204对应了2个不同的地理信息,分别是海南省海口市和广东省湛江市,因此IP地址59.37.145.204是漂移IP,和与其关联的经纬度信息、地理信息一并从第一经纬度IP库中移除。而其余IP地址均值唯一对应一个地理信息,因此都予以保留,从而获得过滤后的第一经纬度IP库。本实施例中过滤后的第一经纬度IP库如表2所示。
表2
在对第一经纬度IP库进行IP地址过滤后,步骤S230中按照IP地址排序,合并地理位置相同的相邻IP地址,形成第二经纬度IP库。在进行IP地址排序前,先要将IP地址从二进制转换成十进制,获得IP值。本实施例中进行IP地址转换后的第一经纬度IP库如表3所示。
表3
获得IP地址对应的IP值后,对IP值进行排序,本实施例中对IP值正向排序,得到IP值正向排序的第一经纬度IP库如表4所示。
表4
对IP值正向排序后的第一经纬度IP库,将其中地理信息相同且相邻的IP地址进行合并,获得地理信息对应的IP地址段,形成第二经纬度IP库。表4中IP值236543175、992314092和992317934对应的地理信息均是广东省湛江市,且这3个IP值排列位置依次相邻,合并成IP值段为236543175~992317934,对应的IP地址段是14.25.92.199~59.37.145.238;IP值1782143134、1782148404、1996815498和2000583873对应的地理信息均是云南省西双版纳傣族自治州,且这4个IP值排列位置依次相邻,合并成IP值段为1782143134~2000583873,对应的IP地址段是106.57.88.158~119.62.124.193;IP值3748135212和3748135352对应的地理信息均是广东省湛江市,且这2个IP值排列位置依次相邻,合并成IP值段为3748135212~3748135352,对应的IP地址段是223.104.1.44~223.104.1.184。
同时,还应移除对应地理信息单点的IP地址,对应地理信息单点是指当前IP地址对应的地理信息与前一IP地址和后一IP地址对应的地理信息均不一致。表4中的IP值2566915814对应的地理信息是广东省湛江市,而其前一IP值2000583873和后一IP值3661621485对应的地理信息均是云南省西双版纳傣族自治州,则应移除IP值2566915814及其关联的信息;IP值3661621485对应的地理信息是云南省西双版纳傣族自治州,而其前一IP值2566915814和后一IP值3661621485对应的地理信息均是广东省湛江市,则应移除IP值3661621485及其关联的信息。
计算设备合并地理信息相同的相邻IP地址并移除对应地理信息单点的IP地址形成第二经纬度IP库的关键代码如下:
本实施例中的第二经纬度IP库如表5所示,其中经度和纬度略去未显示。
表5
随后,方法进入步骤S240,利用预定IP库对第二经纬度IP库进行补充,获得优化后的IP库,其中预定IP库包括现有IP库,如中国广告协会IP库、IPIP和IP特例库等。在本实施例中,预定IP库如表6所示。其中经度、纬度、起始IP地址和结束IP地址略去未显示。
省级邮编 | 市级邮编 | 省级地址 | 市级地址 | 起始IP值 | 结束IP值 |
pid_a | cid_a | pa省 | ca市 | 10000000 | 236543140 |
pid_b | cid_b | pb省 | cb市 | 236543141 | 4036543141 |
pid_c | cid_c | pc省 | cc市 | 4036543142 | 9000000000 |
表6
在如表6所示的预定IP库中,pa省ca市对应的IP值段是10000000~236543140,pid_a表示pa省的邮编,cid_a表示ca市的邮编。pb省cb市对应的IP值段是236543141~4036543141,pid_b表示pb省的邮编,cid_b表示cb市的邮编。pc省cc市对应的IP值段是4036543142~9000000000,pid_c表示pc省的邮编,cid_c表示cc市的邮编。
以第二经纬度IP库为基准,将第二经纬度IP库中缺失的IP段利用预定IP库进行补充,得到优化后的IP库。第二经纬度IP库中,广东省湛江市对应的第一个IP值段是236543175~992317934,预定IP库中的pb省cb市对应的IP值段是236543141~4036543141,两者具有交叠部分,以广东省湛江市对应的第一个IP值段为基准,pb省cb市对应的IP值段进行补充,得到:
pb省cb市对应的IP值段为236543141~236543175;
广东省湛江市对应的第一个IP值段为236543175~992317934。
广东省湛江市对应的第二个IP值段是3748135212~3748135352,pc省cc市对应的IP值段是403654314~900000000,两者具有交叠部分,以广东省湛江市对应的第二个IP值段为基准,pc省cc市对应的IP值段进行补充,得到:
广东省湛江市对应的第二个IP值段为3748135212~4036543141;
pc省cc市对应的IP值段为4036543142~900000000。
计算设备利用预定IP库对第二经纬度IP库进行补充,获得优化后的IP库的关键代码如下:
gpsfile,ipdatafile=args
gps=fromfile(gpsfile)|select([4,5,2,3])|transform(segmentiptolong)
ipdata=fromfile(ipdatafile)|select([0,1,3,4])|
transform(segmentiptolong)
gps|stepjoin(ipdata,getnext=minendipindex)|transform(intersegment)|
explode()|transform(segmentlongtoip)
在本实施例中,优化后的IP库如表7所示,其中经度、纬度、起始IP地址和结束IP地址略去未显示。
表7
利用本方法200,通过从用户日志获取GPS信息和关联的IP地址,解析GPS信息中包含的经纬度信息以获得地理信息,过滤对应地理信息超过一个的IP地址后进行排序,合并相邻的IP地址,形成经纬度IP库,改善了数据源的质量。同时,针对获得的经纬度IP库覆盖度不完整的情况,利用现有IP库补充缺失的IP段,从而实现IP库的优化,提升了IP库的准确度。
为检验本方法200的效果,利用线索订单中用户选择城市和用户所持终端所在城市相同,且IP不在多个城市出现的情况作为样本,校验优化后的IP库准确度是否提升,结果如表8所示。
终端 | OL | MO | M1 |
手机 | 80.28% | 84.03% | 84.30% |
PC | 86.81% | 91.28% | 91.33% |
表8
表8中展示了预定IP库和优化后的IP库的IP地址准确度。其中,OL表示目前线上IP库,同预定IP库;MO表示截止到指定日期的经纬度IP库合并线上IP库的方法获得的IP库;M1表示指定日期近90天的经纬度IP库合并线上IP库的方法获得的IP库。
对于手机终端,MO较OL的IP地址准确度提升了3.75%,M1较OL的IP地址准确度提升了4.02%;对于PC终端,MO较OL的IP地址准确度提升了4.47%,M1较OL的IP地址准确度提升了4.52%。可见,本方法对IP地址准确度的提升明显,说明本发明实现了IP库的优化。
图3示出了根据本发明一个实施例的优化IP库的装置300示意图。该装置包括:第一经纬度IP库形成模块、IP地址过滤模块、第二经纬度IP库形成模块以及IP库优化模块。
第一经纬度IP库形成模块310适于从用户日志中获取GPS信息和关联的IP地址,形成第一经纬度IP库,其中GPS信息包括经纬度信息,解析经纬度信息获取地理信息。根据本发明的实施方式,地理信息是省级地址或市级地址。
IP地址过滤模块320,适于对第一经纬度IP库进行IP地址过滤,保留唯一对应一个地理信息的IP地址。具体地,IP地址过滤模块320还包括判断同一IP地址对应的地理信息是否超过一个的判断子模块321,过滤对应地理信息超过一个的IP地址的过滤子模块322以及保留对应地理信息仅为一个的IP地址的保留子模块322。根据判断子模块321的判断结果,如果IP地址对应的地理信息超过一个,则过滤子模块322执行操作,将该IP地址及其关联的信息过滤;如果IP地址对应的地理信息仅为一个,则保留子模块323执行操作,将该IP地址及其关联的信息予以保留。
第二经纬度IP库形成模块330,适于对IP地址过滤后的第一经纬度IP库,按照IP地址进行排序,合并地理位置相同的相邻IP地址,形成第二经纬度IP库。具体地,第二经纬度IP库形成模块330包括排序子模块331、合并子模块332和移除子模块333。排序子模块331适于将IP地址从二进制转换为十进制并进行排序;合并子模块332适于将地理信息相同且相邻的IP地址进行合并,获得地理信息对应的IP地址段;移除子模块333,适于移除对应地理信息单点的IP地址,其中对应地理信息单点包括当前IP地址对应的地理信息与前一IP地址和后一IP地址对应的地理信息均不一致。
IP库优化模块340适于以第二经纬度IP库为基准,对其中缺失的IP段,利用预定IP库进行补充。
关于优化IP库的具体步骤以及实施例,在基于图2的描述中已经详细公开,此处不再赘述。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (10)
1.一种优化IP库的方法,所述IP库包括IP地址与地理信息的对应关系,所述方法在计算设备中执行,并包括如下步骤:
从用户日志中获取GPS信息和关联的IP地址,形成第一经纬度IP库,所述GPS信息包括经纬度信息,解析所述经纬度信息获取地理信息;
对第一经纬度IP库进行IP地址过滤,保留唯一对应一个地理信息的IP地址;
对IP地址过滤后的第一经纬度IP库,按照IP地址进行排序,合并地理位置相同的相邻IP地址,形成第二经纬度IP库;
利用预定IP库对第二经纬度IP库进行补充,获得优化后的IP库。
2.如权利要求1所述的方法,所述对第一经纬度IP库进行IP地址过滤,保留唯一对应一个地理信息的IP地址,包括:
判断同一IP地址对应的地理信息是否超过一个;
如果所述IP地址对应的地理信息超过一个,则将其过滤;
如果所述IP地址对应的地理信息仅为一个,则将其保留。
3.如权利要求1所述的方法,所述按照IP地址进行排序,合并地理位置相同的相邻IP地址,形成第二经纬度IP库,包括:
将IP地址从二进制转换为十进制,进行排序;
将地理信息相同且相邻的IP地址进行合并,获得地理信息对应的IP地址段;
移除对应地理信息单点的IP地址,形成第二经纬度IP库,其中,所述对应地理信息单点包括当前IP地址对应的地理信息与前一IP地址和后一IP地址对应的地理信息均不一致。
4.如权利要求1所述的方法,所述利用预定IP库对第二经纬度IP库进行补充,获得优化后的IP库,包括:
以第二经纬度IP库为基准,对其中缺失的IP段,利用预定IP库进行补充。
5.如权利要求1所述的方法,所述地理信息为省级地址或者市级地址。
6.一种优化IP库的装置,所述装置包括:
第一经纬度IP库形成模块,适于从用户日志中获取GPS信息和关联的IP地址,形成第一经纬度IP库,所述GPS信息包括经纬度信息,解析所述经纬度信息获取地理信息;
IP地址过滤模块,适于对第一经纬度IP库进行IP地址过滤,保留唯一对应一个地理信息的IP地址;
第二经纬度IP库形成模块,适于对IP地址过滤后的第一经纬度IP库,按照IP地址进行排序,合并地理位置相同的相邻IP地址,形成第二经纬度IP库;
IP库优化模块,适于利用预定IP库对第二经纬度IP库进行补充,获得优化后的IP库。
7.如权利要求6所述的装置,所述IP地址过滤模块包括:
判断子模块,适于判断同一IP地址对应的地理信息是否超过一个;
过滤子模块,适于过滤对应地理信息超过一个的IP地址;
保留子模块,适于保留对应地理信息仅为一个的IP地址。
8.如权利要求6所述的装置,所述第二经纬度IP库形成模块包括:
排序子模块,适于将IP地址从二进制转换为十进制并进行排序;
合并子模块,适于将地理信息相同且相邻的IP地址进行合并,获得地理信息对应的IP地址段;
移除子模块,适于移除对应地理信息单点的IP地址,所述对应地理信息单点包括当前IP地址对应的地理信息与前一IP地址和后一IP地址对应的地理信息均不一致。
9.如权利要求6所述的装置,所述IP库优化模块,进一步适于以第二经纬度IP库为基准,对其中缺失的IP段,利用预定IP库进行补充。
10.一种计算设备,包括如权利要求6~9中任一项所述的优化IP库的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510810818.4A CN105430115B (zh) | 2015-11-20 | 2015-11-20 | 一种优化ip库的方法、装置及计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510810818.4A CN105430115B (zh) | 2015-11-20 | 2015-11-20 | 一种优化ip库的方法、装置及计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105430115A true CN105430115A (zh) | 2016-03-23 |
CN105430115B CN105430115B (zh) | 2018-11-23 |
Family
ID=55508051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510810818.4A Active CN105430115B (zh) | 2015-11-20 | 2015-11-20 | 一种优化ip库的方法、装置及计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105430115B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304193A (zh) * | 2017-08-24 | 2018-07-20 | 智车优行科技(北京)有限公司 | 一种gps数据解析方法及系统 |
CN112733898A (zh) * | 2020-12-30 | 2021-04-30 | 光通天下网络科技股份有限公司 | 基于特征权重的数据鉴别方法、装置、电子设备及介质 |
CN113127448A (zh) * | 2021-04-23 | 2021-07-16 | 深圳市酷开网络科技股份有限公司 | 一种地域维度表生成方法、装置、服务器及存储介质 |
CN114465979A (zh) * | 2021-12-21 | 2022-05-10 | 天翼云科技有限公司 | 一种ip库生成方法、系统及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102104635A (zh) * | 2009-12-17 | 2011-06-22 | 阿里巴巴集团控股有限公司 | 一种更新互联网协议ip地址库的方法和装置 |
CN103164475A (zh) * | 2011-12-16 | 2013-06-19 | 北京思博途信息技术有限公司 | 多个ip地域信息库的合并方法及系统 |
CN103729378A (zh) * | 2012-10-16 | 2014-04-16 | 腾讯科技(深圳)有限公司 | 一种ip地理信息的更新方法和装置 |
CN104935676A (zh) * | 2014-03-17 | 2015-09-23 | 阿里巴巴集团控股有限公司 | 确定ip地址段及其对应的经纬度的方法及装置 |
-
2015
- 2015-11-20 CN CN201510810818.4A patent/CN105430115B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102104635A (zh) * | 2009-12-17 | 2011-06-22 | 阿里巴巴集团控股有限公司 | 一种更新互联网协议ip地址库的方法和装置 |
CN103164475A (zh) * | 2011-12-16 | 2013-06-19 | 北京思博途信息技术有限公司 | 多个ip地域信息库的合并方法及系统 |
CN103729378A (zh) * | 2012-10-16 | 2014-04-16 | 腾讯科技(深圳)有限公司 | 一种ip地理信息的更新方法和装置 |
CN104935676A (zh) * | 2014-03-17 | 2015-09-23 | 阿里巴巴集团控股有限公司 | 确定ip地址段及其对应的经纬度的方法及装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304193A (zh) * | 2017-08-24 | 2018-07-20 | 智车优行科技(北京)有限公司 | 一种gps数据解析方法及系统 |
CN112733898A (zh) * | 2020-12-30 | 2021-04-30 | 光通天下网络科技股份有限公司 | 基于特征权重的数据鉴别方法、装置、电子设备及介质 |
CN113127448A (zh) * | 2021-04-23 | 2021-07-16 | 深圳市酷开网络科技股份有限公司 | 一种地域维度表生成方法、装置、服务器及存储介质 |
CN114465979A (zh) * | 2021-12-21 | 2022-05-10 | 天翼云科技有限公司 | 一种ip库生成方法、系统及电子设备 |
CN114465979B (zh) * | 2021-12-21 | 2024-01-02 | 天翼云科技有限公司 | 一种ip库生成方法、系统及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN105430115B (zh) | 2018-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105988836B (zh) | 一种应用推荐方法及装置 | |
CN105430115A (zh) | 一种优化ip库的方法、装置及计算设备 | |
CN105989122A (zh) | 一种应用推荐方法及装置 | |
CN105740405B (zh) | 存储数据的方法和装置 | |
CN106557307B (zh) | 业务数据的处理方法及处理系统 | |
CN110737604A (zh) | 一种自动清理内存的方法、装置、电子设备及存储介质 | |
CN105045928A (zh) | 一种待清理数据展示方法、装置及电子设备 | |
CN111767144A (zh) | 交易数据的交易路由确定方法、装置、设备及系统 | |
CN113110944A (zh) | 信息查找方法、装置、服务器、可读存储介质及程序产品 | |
CN111274204B (zh) | 终端识别方法、生成移动设备标识组合码的方法及其装置 | |
CN110990350A (zh) | 日志的解析方法及装置 | |
CN102982147A (zh) | 一种提高数据信息整合效率的方法和装置 | |
CN108776665B (zh) | 一种数据处理方法及装置 | |
CN110399026B (zh) | 基于fpga的多源单输出复位方法、装置及相关设备 | |
CN105653540B (zh) | 文件属性信息的处理方法和装置 | |
CN114611039B (zh) | 异步加载规则的解析方法、装置、存储介质和电子设备 | |
CN106156169B (zh) | 离散数据的处理方法和装置 | |
CN105094881A (zh) | 一种终端以及管理终端应用的方法 | |
CN112532414B (zh) | 确定isp归属的方法、装置、设备及计算机存储介质 | |
CN112329424A (zh) | 业务数据的处理方法和装置、存储介质和电子设备 | |
CN111737040A (zh) | 程序代码修复方法及装置 | |
CN107302605B (zh) | 电视代理服务器的配置方法及装置、电视及存储介质 | |
CN110598072A (zh) | 一种特征数据聚合方法及装置 | |
CN112181865A (zh) | 地址编码方法、装置、解码方法、装置及计算机存储介质 | |
CN111143355A (zh) | 数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |