CN103716282B - 一种修正ip库的方法和系统 - Google Patents

一种修正ip库的方法和系统 Download PDF

Info

Publication number
CN103716282B
CN103716282B CN201210371865.XA CN201210371865A CN103716282B CN 103716282 B CN103716282 B CN 103716282B CN 201210371865 A CN201210371865 A CN 201210371865A CN 103716282 B CN103716282 B CN 103716282B
Authority
CN
China
Prior art keywords
address
address section
geographic area
section
user account
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210371865.XA
Other languages
English (en)
Other versions
CN103716282A (zh
Inventor
咸德玉
刘建东
丁大强
刘茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Feinno Communication Technology Co Ltd
Original Assignee
Beijing Feinno Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Feinno Communication Technology Co Ltd filed Critical Beijing Feinno Communication Technology Co Ltd
Priority to CN201210371865.XA priority Critical patent/CN103716282B/zh
Publication of CN103716282A publication Critical patent/CN103716282A/zh
Application granted granted Critical
Publication of CN103716282B publication Critical patent/CN103716282B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开一种修正IP库的方法和系统,所述方法包括:步骤1,获取用户的当前登录信息,根据所述当前登录信息获得用户账号登录所用的IP地址,从配置的记录中获得所述用户账号归属的第一地理区域,其中所述用户账号为具有对应地理区域信息的业务账号;步骤2,根据所述用户账号登录所用的IP地址和所述第一地理区域,确定所述用户账号登录所用的IP地址所属的IP地址段归属的第二地理区域,得到所述IP地址段与第二地理区域的对应关系;步骤3,使用所述IP地址段与第二地理区域的对应关系对已有IP库进行修正。本发明能够解决IP库中记录准确率低的问题。

Description

一种修正IP库的方法和系统
技术领域
本发明涉及计算机领域,特别涉及一种修正IP库的方法和系统。
背景技术
Internet(互联网)依靠TCP(Transmission Control Protocol,传输控制协议)/IP(Internet Protocol,互联网协议),在全球范围内实现不同硬件结构、不同操作系统、不同网络系统的互联。在Internet上,每一个节点都依靠唯一的IP地址互相区分和相互联系。每一台联网的计算机无权自行设定IP地址,由IANA(Internet Assigned NumbersAuthority,互联网数字分配机构)责任IP地址的分配。
IP地址是Internet的基础数据,用于定位与连接主机资源。目前,IPv4资源紧张,网络运营商经常调用其它城市IP资源,用于解决本地IP地址紧张的问题。
IP库是IP地址与地理信息的对应数据库,常用于定位网络地址与地理意义的地址,其中记录各个IP地址段所属的地理区域。现有技术中已有的IP库都是长达十几年的积累数据,主要通过人工收集与更新,费时费力,有效数据有限,存在大量错误记录,IP库中记录的准确率低。
发明内容
本发明提供了一种修正IP库的方法和系统,以解决IP库中记录准确率低的问题。
本发明公开了一种修正IP库的方法,其特征在于,所述方法包括:
步骤1,获取用户的当前登录信息,根据所述当前登录信息获得用户账号登录所用的IP地址,从配置的记录中获得所述用户账号归属的第一地理区域,其中所述用户账号为具有对应地理区域信息的业务账号;
步骤2,根据所述用户账号登录所用的IP地址和所述第一地理区域,确定所述用户账号登录所用的IP地址所属的IP地址段归属的第二地理区域,得到所述IP地址段与第二地理区域的对应关系;
步骤3,使用所述IP地址段与第二地理区域的对应关系对已有IP库进行修正。
其中,所述根据所述用户账号登录所用IP地址和所述第一地理区域,确定所述用户账号登录所用IP地址所在的IP地址段归属的第二地理区域具体包括:
将所述用户账号归属的第一地理区域作为所述用户账号登录所用的IP地址所属IP地址段的待确定归属区域;
根据所述IP地址段的待确定归属区域和配置的匹配条件确定所述IP地址段归属的第二地理区域。
其中,所述根据所述IP地址段的待确定归属区域和配置的匹配条件确定所述IP地址段归属的第二地理区域具体包括:
对所述IP地址段的待确定归属区域中的用户登录信息进行统计,得到统计结果;
将所述统计结果中满足配置的匹配条件的待确定归属区域确定为所述IP地址段归属的第二地理区域。
其中,所述从配置的记录中获得所述用户账号归属的第一地理区域具体包括:
从配置的记录中获得所述用户账号所属的号段对应的地理区域,将所述号段对应的地理区域作为所述用户账号归属的第一地理区域;
所述根据所述用户账号登录所用IP地址和所述第一地理区域,确定所述用户账号登录所用的IP地址所属的IP地址段归属的第二地理区域具体包括:
将所述号段与所述号段中所述用户账号登录所用的IP地址所属的IP地址段对应;
将所述号段对应的地理区域作为所述IP地址段归属的第二地理区域。
其中,所述使用所述IP地址段与第二地理区域的对应关系对已有IP库进行修正后还包括:
将所述修正已有IP库的IP地址段设为免校验IP地址段;
对于除所述免校验IP地址段之外的IP地址段按预设时长,周期地执行步骤1至步骤3。
其中,所述步骤2前还包括:
依据异常用户特征从登录的用户中筛除掉异常用户;
利用筛除后保留的非异常用户的信息执行所述步骤2。
本发明还公开了一种修正IP库的系统,所述系统包括:
信息获取模块,用于获取用户的当前登录信息,根据所述当前登录信息获得用户账号登录所用的IP地址,从配置的记录中获得所述用户账号归属的第一地理区域,其中所述用户账号为具有对应地理区域信息的业务账号;
归属地理区域确定模块,用于根据所述用户账号登录所用的IP地址和所述第一地理区域,确定所述用户账号登录所用的IP地址所属的IP地址段归属的第二地理区域,得到所述IP地址段与第二地理区域的对应关系;
IP库修正模块,用于使用所述IP地址段与第二地理区域的对应关系对已有IP库进行修正。
其中,所述归属地理区域确定模块具体用于:将所述用户账号归属的第一地理区域作为所述用户账号登录所用的IP地址所属IP地址段的待确定归属区域,根据所述IP地址段的待确定归属区域和配置的匹配条件确定所述IP地址段归属的第二地理区域。
其中,所述归属地理区域确定模块在根据所述IP地址段的待确定归属区域和配置的匹配条件确定所述IP地址段归属的第二地理区域时具体用于:对所述IP地址段的待确定归属区域中的用户登录信息进行统计,得到统计结果,将所述统计结果中满足配置的匹配条件的待确定归属区域确定为所述IP地址段归属的第二地理区域。
其中,所述信息获取模块具体用于:从配置的记录中获得所述用户账号所属的号段对应的地理区域,将所述号段对应的地理区域作为所述用户账号归属的地理区域;
所述归属地理区域确定模块具体用于:将所述号段与所述号段中所述用户账号登录所用的IP地址所属的IP地址段对应,将所述号段对应的地理区域作为所述IP地址段归属的第二地理区域。
本发明的有益效果是:通过获取用户的当前登录信息,根据用户账号与登录所用IP地址间的对应关系和用户账号归属的第一地理区域,确定IP地址所属的IP地址段归属的第二地理区域,使用IP地址段与IP地址段归属的第二地理区域的准确对应关系对已有IP库进行修正,该用户的当前登录信息为实时获取的准确的有效数据,使得能够在短时间内进行IP库数据的修正,并大幅提高IP库数据的准确度。
附图说明
图1为本发明修正IP库的方法的流程图;
图2为本发明修正IP库的方法实施例中循环校验流程的概要示意图;
图3为本发明修正IP库的方法实施例中循环校验流程的详细示意图;
图4为本发明修正IP库的系统的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
参见图1,为本发明提供的修正IP库的方法的流程图。所述方法包括如下步骤。
步骤S100,获取用户的当前登录信息,根据所述当前登录信息获得用户账号登录所用IP地址,从配置的记录中获得用户账号归属的第一地理区域,其中所述用户账号为具有对应地理区域信息的业务账号。
具体的,服务器获取用户的当前登录信息,该用户的当前登录信息为服务器实时获取的用户的有效数据,可以保证后续用最新的最有效的IP数据修正并更新已有的IP数据库。
记录中包含配置的用户账号与用户账号归属的第一地理区域间的对应关系。该对应关系可以为各个用户账号与地理区域对应,也可以为用户账号的号段与地理区域对应。
其中,用户账号为具有对应地理区域信息的业务账号,具体的,所述用户账号可以是运营商收费账号,如手机号码,或上网账号(如ADSL账号),为了便于计费,运营商的收费账号与地理区域相对应,可作为准确的判断依据,记录中运营商的收费账号与归属的地理区域间是准确的对应关系。用户账号也可以是其他具有对应地理区域信息的业务账号,例如水电收费账号、电子商务中用户账号(与快递地址绑定)、IPTV(交互式网络电视)账号、联网的GPS设备或其它包含IP地址和对应的所属地理区域信息的账号数据。
步骤S200,根据所述用户账号登录所用的IP地址和所述第一地理区域,确定用户账号登录所用的IP地址所属的IP地址段归属的第二地理区域,得到该IP地址段与第二地理区域的对应关系。
所述根据用户账号登录所用IP地址和所述第一地理区域,确定IP地址段归属的第二地理区域可以通过多种具体方式实现。
举例而言,用户账号为手机号码,配置记录中包括手机号段与省市间的对应关系。可以以手机号段为基准进行正向对应,对手机号段中的手机号码登录所用IP地址进行整理,得出手机号段与IP地址段间的对应关系,然后依据手机号段与省市的对应关系,得出IP地址段与IP地址段归属的省市间对应关系。其中手机号段与省市间的对应关系是运营商的数据,因为涉及收费,所以是准确的一一对应关系;登录用手机号码与IP地址间对应关系是用户的登录日志数据,也为准确的一一对应关系,由此得到登录的IP地址段与省市地区间对应关系也是准确的一一对应关系,即将对应的省市地区作为IP地址段的归属的地理区域。
例如,用户账号为手机号码159****0010,该手机号码对应的手机号段为159****0000~159****1111,该手机号段所属的地理区域为北京,该手机号码登录所用的IP地址为IPa,该IPa对应的IP地址段为IPA~IPB;正向对应为:对用户账号所属的手机号段159****0000~159****1111中的手机号码登录所用的IP地址进行整理,得出手机号段159****0000~159****1111与IP地址段IPA~IPB间的对应关系,根据手机号段所属的地理区域北京,得出IP地址段IPA~IPB与北京的对应关系。
也可以,进行反向对应,例如按IP地址段中用户登录的顺序关系,判断使用IP地址段中IP地址登录的用户账号是否属于同一个地理区域,登录用户账号属于同一个地理区域满足一定概率,比如达到90%以上,即可以认定该地理区域为该IP地址段归属的地理区域。
也可以将正向对应与反向对应联合使用,以进一步提高准确性。
步骤S300,使用IP地址段与第二地理区域的对应关系对已有IP库进行修正。
其中,修正包括将IP库中错误数据进行修改,遗漏数据进行补充等多种操作进行分析整合,从而建立精准的IP库。
其中实时精确IP库有着丰富的使用场景,如可以用于业务异常判断、精确数据推送等,其发展前景良好。
在一具体实施方式中,所述根据用户账号登录所用的IP地址和所述第一地理区域确定IP地址段归属的第二地理区域具体包括:
步骤S210,将用户账号归属的第一地理区域作为该用户账号登录所用的IP地址所属IP地址段的待确定归属区域。
待确定归属区域为IP地址段可能归属的地理区域。
步骤S220,根据IP地址段的待确定归属区域和配置的匹配条件确定IP地址段归属的第二地理区域。
进一步地,所述根据IP地址段的待确定归属区域和配置的匹配条件确定IP地址段归属的第二地理区域具体包括:对IP地址段的待确定归属区域中的用户登录信息进行统计,得到统计结果;将统计结果中满足配置的匹配条件的待确定归属区域确定为IP地址段归属的第二地理区域。
举例而言,所述匹配条件包括:IP地址段中登录的用户数量超过第一阀值,IP地址段中登录的IP地址的数量超过第二阀值,IP地址段中在待确定归属区域中登录用户的数量与IP地址段中登录的用户的总数量的比值超过第三阀值,IP地址段中在待确定归属区域中登录IP地址的数量与IP地址段中登录的IP地址的总数量的比值超过第四阀值;所述匹配条件还包括:使用IP地址段中IP地址登录的用户账号属于待确定归属区域的比例超过第五阀值,具体可参照上述反向对应的相关描述。其中,第一阀值、第二阀值、第三阀值、第四阀值和第五阀值均为经验值,可以由用户根据运行统计结果自行进行设置,在此不做赘述,优选的所述第三阀值、第四阀值和第五阀值均可为90%。在具体实现中,可以选择上述匹配条件中的一条或多条,这些匹配条件间可以为与的关系,可以为或的关系。或者,某些条件间为与的关系,这些条件同另一些条件间为或的关系。
通过上述方法,能够进一步提高IP库的准确度。特别是对于单IP多用户登录的情况,例如,酒店、咖啡厅、网吧等公共上网场所,其中,使用同一IP地址有多个用户登录,而且可能存在用户异地登录的情况,即用户账号归属的地理区域与IP地址归属的地理区域不一致,本实施方式中通过使用匹配条件定义IP地址段的待确定归属区域的选择条件,实现从多个待确定归属区域中选择出实际IP地址段的归属的地理区域。
进一步地,所述使用IP地址段与第二地理区域的对应关系对已有IP库进行修正后还包括:将所述修正已有IP库的IP地址段设为免校验IP地址段;对于除所述免校验IP地址段之外的IP地址段按预设时长,周期地执行步骤S100至步骤S300进行循环校验,其中优选的预设时长可以为30分钟;具体的,在执行S 100时,需要在获得用户账号登录所用的IP地址后,根据免校验IP地址段,在用户账号登录所用的IP地址中去除不需要循环校验的准确的IP地址,对于除所述免校验IP地址段之外的IP地址段进行循环校验,进而修正并更新已有的IP库。
在该实施方式中,对所述修正已有IP库的IP地址段不再进行校验,设为免校验IP地址段,对除所述免校验IP地址段之外的IP地址段按预设时长周期基于登录的用户信息进行循环校验,能够既提高校验的效率又不断提高IP库的准确度。
在循环校验中,可以基于每个预设时长的周期内登录的用户信息进行循环校验,也可以基于到校验时为止的整个时长内登录的用户信息进行循环校验,此处没有特别限制。
在一具体实施方式中,配置的记录中信息为用户账号所属的号段与地理区域的对应关系,所述从配置的记录中获得用户账号归属的第一地理区域具体包括:从配置的记录中获得用户账号所属的号段对应的地理区域,将所述号段对应的地理区域作为该用户账号归属的第一地理区域。
所述根据用户账号登录所用IP地址和第一地理区域,确定用户账号登录所用的IP地址所属的IP地址段归属的地第二理区域具体包括:将号段与号段中用户账号登录所用的IP地址所属的IP地址段对应;将号段对应的地理区域作为所述IP地址段归属的第二地理区域。
采用该实施方式,能够以用户账号的号段为基准,依据号段中用户账号登录所用IP地址得出号段与IP地址段间的对应关系,号段对应的地理区域为配置信息,因而能够得出IP地址段所属的第二地理区域。
例如,用户账号为手机号码159****0010,该手机号码对应的手机号段为159****0000~159****1111,该手机号段所属的地理区域为北京,该手机号码登录所用的IP地址为IPa,该IPa所属的IP地址段为IPA~IPB;以手机号段为159****0000~159****1111为基准,将手机号段159****0000~159****1111与IPa所属的IP地址段为IPA~IPB对应,将该手机号段所属的地理区域北京作为IP地址段为IPA~IPB归属的第二地理区域,即IPA~IPB与北京对应。
进一步地,所述使用IP地址段与第二地理区域的对应关系对已有IP库进行修正后还包括:将所述修正已有IP库的IP地址段设为免校验IP地址段;对于除所述免校验IP地址段之外的IP地址段按预设时长,周期地执行步骤S100至步骤S300进行循环校验;具体的,在执行S100时,需要在获得用户账号登录所用的IP地址后,根据免校验IP地址段,在用户账号登录所用的IP地址中去除不需要循环校验的准确的IP地址,对于除所述免校验IP地址段之外的IP地址段进行循环校验,进而不断修正和更新已有的IP库,,能够既提高校验的效率又不断提高IP库的准确度。
在一具体实施方式中,所述步骤S200前还包括:依据异常用户特征从登录的用户中筛除掉异常用户;利用筛除后保留的非异常用户信息执行所述步骤S200,其中所述非异常用户信息包括非异常用户对应的用户账号、该用户账号登录所用的IP地址和该用户账号归属的第一地理区域等信息。
其中,异常用户为在异地进行登录的用户。某些异常用户自身具有特征,根据该特征识别出异常用户,例如,异常用户中的卡商用户,其登录、注册时间、登录次数、好友关系等属性具有明显特征,应用已知通用方法便可识别出来。将识别出的异常用户排除掉,使用非异常用户的信息执行步骤S200,能够排除异常用户的干扰,进一步提高IP库的准确度。
实施例
用户账号为手机号码,实现对多个IP库的整合。对于多个IP库的重合部分,根据用户账号与登录所用IP地址间的对应关系和用户账号归属的第一地理区域确定IP地址段归属的第二地理区域,使用确定的准确的IP地址段与归属的地理区域对IP库的重合部分进行验证,并将匹配度100%的数据作为核心数据,且将IP库中记录修改为所述确定的准确的IP地址段与归属的地理区域的对应关系,保持IP库中数据的准确一致。
对于多个IP库的非重合部分按预设时长,本实施例中为30分钟,进行如图2所示的循环校验。以下将预设时长称为粒度,以30分钟粒度对IP库进行循环校验。
循环校验包括:
步骤S201,登录信息获取过程,提取预设时长内的登录信息,从登录信息中去除掉免校验IP地址段中登录的用户信息;使用剩余数据进行后续校验。
具体如图3所示,依据登录信息得出登录手机号码所用的IP地址,将上述信息记录到登录日志表_粒度和粒度登录日志汇总表中。登录日志表_粒度中记录本次周期内登录手机号码所用的IP地址。粒度登录日志汇总表中就各个周期内登录手机号码所用的IP地址。
根据登录日志表_粒度中的记录对单个IP地址的本周期内登录信息进行统计生成散列IP表_粒度。根据散列IP表_粒度和运营商记录的手机号码所属的地理区域,整理出散列IP总表,散列IP总表中记录单个IP地址的统计信息。统计信息包括:IP地址的登录用户数量,使用该IP地址的登录用户归属的地理区域,以及各个地理区域中的登录用户的数量。其中,散列表示应用散列方式进行记录。
步骤S202,归属区域确定过程,将用户账号归属的第一地理区域作为用户账号登录所用IP地址所属IP地址段的待确定归属区域,根据配置的匹配条件对散列IP总表中IP地址的统计信息进行处理,计算出判断所用参数值,依据匹配条件进行判断,从待确定归属区域中确定出IP地址段归属的第二地理区域。
具体如图3所示,根据散列IP总表中IP地址的统计信息得出IP地址段的待确定归属区域。计算出判断所用参数值记录到参数分析表_粒度中,并将参数分析表_粒度中信息记录到参数分析日志表中。
判断所用参数包括:
IP地址段中登录的用户数量;
IP地址段中登录的IP地址的数量;
IP地址段的待确定归属区域中登录用户的数量与IP地址段中登录的用户数量的比值;
IP地址段的待确定归属区域中登录IP地址的数量与IP地址段中登录的IP地址的数量的比值。
根据匹配条件对IP地址段的待确定归属区域进行筛选,将对应参数值满足匹配条件的待确定归属区域确定为IP地址段归属的地理区域,记录到规则筛选表粒度中,并将规则筛选表粒_度中信息记录到规则筛选日志表。
步骤S203,IP库修正过程,根据确定的IP地址段归属的第二地理区域对IP库的非重合部分中IP地址段归属的地理区域进行修正。
具体如图3所示,依据规则筛选表_粒度中记录的IP地址段归属的第二地理区域修正IP库的非重合部分,并在校验/更正日志表中进行记录,记录中包含确认的IP地址段。
步骤S204,免校校验确定过程,根据所述确定的IP地址段更新免校验IP地址段表。
具体如图3所示,将所述确定的IP地址段作为免校验IP地址段,根据所述确定的IP地址段校验/更正日志表中记录的免校验IP地址段表。
一种修正IP库的系统如图4所示。所述系统包括:
信息获取模块100,用于获取用户的当前登录信息,根据所述当前登录信息获得用户账号登录所用IP地址,从配置的记录中获得用户账号归属的第一地理区域,其中所述用户账号为具有对应地理区域信息的业务账号。
归属地理区域确定模块200,用于根据用户账号登录所用的IP地址和所述第一地理区域,确定所述用户账号登录所用的IP地址所属的IP地址段归属的第二地理区域,得到所述IP地址段与第二地理区域的对应关系。
IP库修正模块300,用于使用IP地址段与第二地理区域的对应关系对已有IP库进行修正。
其中,所述信息获取模块100、归属地理区域确定模块200和IP库修正模块300的功能可以由处理器来实现。
其中,该用户的当前登录信息为服务器实时获取的用户的有效数据,可以保证后续用最新的最有效的IP数据修正并更新已有的IP数据库。
记录中包含配置的用户账号与用户账号归属的第一地理区域间的对应关系。该对应关系可以为各个用户账号与地理区域对应,也可以为用户账号的号段与地理区域对应。
用户账号为具有对应地理区域信息的业务账号,具体的,所述用户账号可以是运营商收费账号,如手机号码,或上网账号(如ADSL账号),为了便于计费,运营商的收费账号与地理区域相对应,可作为准确的判断依据,记录中运营商的收费账号与归属的地理区域间是准确的对应关系。用户账号也可以是其他具有对应地理区域信息的业务账号,例如水电收费账号、电子商务中用户账号(与快递地址绑定)、IPTV(交互式网络电视)账号、联网的GPS设备或其它包含IP地址和对应的所属地理区域信息的账号数据。
其中,修正包括将IP库中错误数据进行修改,遗漏数据进行补充等多种操作。
所述根据用户账号登录所用IP地址和所述第一地理区域,确定IP地址段归属的第二地理区域可以通过多种具体方式实现。
举例而言,用户账号为手机号码,配置记录中包括手机号段与省市间的对应关系。可以以手机号段为基准进行正向对应,对手机号段中的手机号码登录所用IP地址进行整理,得出手机号段与IP地址段间的对应关系,然后依据手机号段与省市的对应关系,得出IP地址段与IP地址段归属的省市间对应关系。手机号段与省市间的对应关系是运营商的数据,因为涉及收费,所以是准确的一一对应关系;登录用手机号码与IP地址间对应关系是用户的登录日志数据,也为准确的一一对应关系,由此得到登录的IP地址段与省市地区间准确对应关系也是准确的一一对应关系,即将对应的省市地区作为IP地址段的归属的地理区域。
也可以,进行反向对应,例如按IP地址段中用户登录的顺序关系,判断使用IP地址段中IP地址登录的用户账号是否属于同一个地理区域,登录用户账号属于同一个地理区域满足一定概率,比如达到90%以上,即可以认定该地理区域为该IP地址段归属的地理区域。
也可以将正向对应与反向对应联合使用,以进一步提高准确性。
在一具体实施方式中,所述归属地理区域确定模块200具体用于:将用户账号归属的第一地理区域作为所述用户账号登录所用的IP地址所属IP地址段的待确定归属区域,根据IP地址段的待确定归属区域和配置的匹配条件确定IP地址段归属的地理区域。
进一步地,所述归属地理区域确定模块200在根据IP地址段的待确定归属区域和配置的匹配条件确定IP地址段归属的第二地理区域时具体用于:对IP地址段的各个待确定归属区域中的用户登录信息进行统计,得到统计结果,将统计结果中满足配置的匹配条件的待确定归属区域确定为IP地址段归属的第二地理区域。
举例而言,所述匹配条件包括:IP地址段中登录的用户数量超过第一阀值,IP地址段中登录的IP地址的数量超过第二阀值,IP地址段中在待确定归属区域中登录用户的数量与IP地址段中登录的用户数量的比值超过第三阀值,IP地址段中在待确定归属区域中登录IP地址的数量与IP地址段中登录的IP地址的数量的比值超过第四阀值;所述匹配条件还包括:使用IP地址段中IP地址登录的用户账号属于待确定归属区域的比例超过第五阀值,具体可参照上述反向对应的相关描述。其中第一阀值、第二阀值、第三阀值、第四阀值和第五阀值均为经验值,可以由用户根据运行统计结果自行进行设置,在此不做赘述,优选的所述第三阀值、第四阀值和第五阀值均可为90%。在具体实现中,可以选择上述匹配条件中的一条或多条,该些匹配条件间可以为与的关系,可以为或的关系,或者某些条件间为与的关系,该些条件同另一些条件间为或的关系。
通过上述实施方式,能够进一步提高IP库的准确度。特别是对于单IP多用户登录的情况,例如,酒店、咖啡厅、网吧等公共上网场所,其中,使用同一IP地址有多个用户登录,而且可能存在用户异地登录的情况,即用户账号归属的地理区域与IP地址归属的地理区域不一致,本实施方式中通过使用匹配条件定义IP地址段的待确定归属区域的选择条件,实现从多个待确定归属区域中选择出IP地址段的归属的地理区域。
进一步地,所述系统还包括:免校验IP地址段确定模块,用于将所述修正已有IP库的IP地址段设为免校验IP地址段,按预设时长,周期地调用信息获取模块100、归属地理区域确定模块200和IP库修正模块300对于除所述免校验IP地址段之外的IP地址段进行循环校验并修正更新已有IP库。
在该实施方式中,对所述修正已有IP库的IP地址段不再进行校验,设为免校验IP地址段,对除所述免校验IP地址段之外的IP地址段按预设时长周期基于登录的用户信息进行循环校验,能够既提高校验的效率又不断提高IP库的准确度。
在循环校验中,可以基于每个预设时长的周期内登录的用户信息进行循环校验,也可以基于到校验时为止的整个时长内登录的用户信息进行循环校验,此处没有特别限制。
在一具体实施方式中,所述信息获取模块100具体用于:从配置的记录中获得用户账号所属的号段对应的地理区域,将所述号段对应的地理区域作为该用户账号归属的第一地理区域。
所述归属地理区域确定模块200具体用于:将号段与号段中用户账号登录所用IP地址所属的IP地址段对应;讲号段对应的地理区域作为所述IP地址段归属的第二地理区域。
采用该实施方式,能够以用户账号的号段为基准,依据号段中用户账号登录所用IP地址得出号段与IP地址段间的对应关系,号段对应的地理区域为配置信息,因而能够得出IP地址段所属的第二地理区域。
进一步地,所述系统还包括:免校验IP地址段确定模块,用于将所述修正已有IP库的IP地址段设为免校验IP地址段,按预设时长周期地调用信息获取模块100、归属地理区域确定模块200和IP库修正模块300对于除所述免校验IP地址段之外的IP地址段进行校验和IP库修正。
在一具体实施方式中,所述调用归属地理区域确定模块200前调用异常用户排除模块,用于依据异常用户特征从登录的用户中筛除掉异常用户;利用筛除后保留的非异常用户调用归属地理区域确定模块200和IP库修正模块300进行IP库修正。
其中,异常用户为在异地进行登录的用户。某些异常用户自身具有特征,根据该特征识别出异常用户,例如,异常用户中的卡商用户,其登录、注册时间、登录次数、好友关系等属性具有明显特征,应用已知通用方式便可识别出来。将识别出的异常用户排除掉,能够排除异常用户的干扰,进一步提高IP库的准确度。
其中,所述修正IP库的系统可以集成于服务器上实现,也可以独立于服务器,由服务器统一管理实现。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其它变体意在涵盖非排它性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (5)

1.一种修正IP库的方法,其特征在于,所述方法包括:
步骤1,获取用户的当前登录信息,根据所述当前登录信息获得用户账号登录所用的IP地址,从配置的记录中获得所述用户账号归属的第一地理区域,其中所述用户账号为具有对应地理区域信息的业务账号;
步骤2,根据所述用户账号登录所用的IP地址和所述第一地理区域,确定所述用户账号登录所用的IP地址所属的IP地址段归属的第二地理区域,得到所述IP地址段与第二地理区域的对应关系;
所述根据所述用户账号登录所用IP地址和所述第一地理区域,确定所述用户账号登录所用的IP地址所属的IP地址段归属的第二地理区域具体包括:将所述用户账号归属的第一地理区域作为所述用户账号登录所用的IP地址所属IP地址段的待确定归属区域;根据所述IP地址段的待确定归属区域和配置的匹配条件确定所述IP地址段归属的第二地理区域;所述匹配条件包括:IP地址段中登录的用户数量超过第一阀值,IP地址段中登录的IP地址的数量超过第二阀值,IP地址段中在待确定归属区域中登录用户的数量与IP地址段中登录的用户的总数量的比值超过第三阀值,IP地址段中在待确定归属区域中登录IP地址的数量与IP地址段中登录的IP地址的总数量的比值超过第四阀值;
步骤3,使用所述IP地址段与第二地理区域的对应关系对已有IP库进行修正,将所述修正已有IP库的IP地址段设为免校验IP地址段;对于除所述免校验IP地址段之外的IP地址段按预设时长,周期地执行步骤1至步骤3,对所述免校验IP地址段之外的IP地址段进行循环校验,进而不断修正和更新已有的IP库;
所述根据所述IP地址段的待确定归属区域和配置的匹配条件确定所述IP地址段归属的第二地理区域具体包括:
对所述IP地址段的待确定归属区域中的用户登录信息进行统计,得到统计结果;
将所述统计结果中满足配置的匹配条件的待确定归属区域确定为所述IP地址段归属的第二地理区域。
2.根据权利要求1所述的方法,其特征在于,
所述从配置的记录中获得所述用户账号归属的第一地理区域具体包括:
从配置的记录中获得所述用户账号所属的号段对应的地理区域,将所述号段对应的地理区域作为所述用户账号归属的第一地理区域。
3.根据权利要求1所述的方法,其特征在于,
所述步骤2前还包括:
依据异常用户特征从登录的用户中筛除掉异常用户;
利用筛除后保留的非异常用户的信息执行所述步骤2。
4.一种修正IP库的系统,其特征在于,所述系统包括:
信息获取模块,用于获取用户的当前登录信息,根据所述当前登录信息获得用户账号登录所用的IP地址,从配置的记录中获得所述用户账号归属的第一地理区域,其中所述用户账号为具有对应地理区域信息的业务账号;
归属地理区域确定模块,用于根据所述用户账号登录所用的IP地址和所述第一地理区域,确定所述用户账号登录所用的IP地址所属的IP地址段归属的第二地理区域,得到所述IP地址段与第二地理区域的对应关系;
具体用于:将所述用户账号归属的第一地理区域作为所述用户账号登录所用的IP地址所属IP地址段的待确定归属区域,根据所述IP地址段的待确定归属区域和配置的匹配条件确定所述IP地址段归属的第二地理区域;所述匹配条件包括:IP地址段中登录的用户数量超过第一阀值,IP地址段中登录的IP地址的数量超过第二阀值,IP地址段中在待确定归属区域中登录用户的数量与IP地址段中登录的用户的总数量的比值超过第三阀值,IP地址段中在待确定归属区域中登录IP地址的数量与IP地址段中登录的IP地址的总数量的比值超过第四阀值;
IP库修正模块,用于使用所述IP地址段与第二地理区域的对应关系对已有IP库进行修正;
免校验IP地址段确定模块,用于将所述修正已有IP库的IP地址段设为免校验IP地址段,按预设时长周期地调用信息获取模块、归属地理区域确定模块和IP库修正模块对于除所述免校验IP地址段之外的IP地址段进行循环校验并修正更新已有IP库;
所述归属地理区域确定模块在根据所述IP地址段的待确定归属区域和配置的匹配条件确定所述IP地址段归属的第二地理区域时具体用于:对所述IP地址段的待确定归属区域中的用户登录信息进行统计,得到统计结果,将所述统计结果中满足配置的匹配条件的待确定归属区域确定为所述IP地址段归属的第二地理区域。
5.根据权利要求4所述的系统,其特征在于,
所述信息获取模块具体用于:从配置的记录中获得所述用户账号所属的号段对应的地理区域,将所述号段对应的地理区域作为所述用户账号归属的地理区域。
CN201210371865.XA 2012-09-28 2012-09-28 一种修正ip库的方法和系统 Active CN103716282B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210371865.XA CN103716282B (zh) 2012-09-28 2012-09-28 一种修正ip库的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210371865.XA CN103716282B (zh) 2012-09-28 2012-09-28 一种修正ip库的方法和系统

Publications (2)

Publication Number Publication Date
CN103716282A CN103716282A (zh) 2014-04-09
CN103716282B true CN103716282B (zh) 2017-10-10

Family

ID=50408871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210371865.XA Active CN103716282B (zh) 2012-09-28 2012-09-28 一种修正ip库的方法和系统

Country Status (1)

Country Link
CN (1) CN103716282B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104202441B (zh) * 2014-09-10 2018-02-23 北京国双科技有限公司 Ip地址数据的数据处理方法和装置
CN105491172B (zh) * 2014-09-17 2019-04-09 阿里巴巴集团控股有限公司 一种用于确定网络地址的归属地信息的方法与设备
CN104333616B (zh) * 2014-11-06 2018-08-24 中国科学院计算机网络信息中心 一种ip地址库的推断和填充方法
CN106302843B (zh) * 2015-05-26 2019-08-06 上海帝联信息科技股份有限公司 一种ip地址库更新方法及装置
CN104933148A (zh) * 2015-06-19 2015-09-23 北京奇虎科技有限公司 数据筛选的方法、装置及服务器
CN106899703B (zh) * 2015-12-17 2021-08-20 北京奇虎科技有限公司 一种ip地址修正方法和装置
CN105554174B (zh) * 2015-12-22 2020-08-18 腾讯科技(深圳)有限公司 网络协议地址的归属地管理方法及归属地管理系统
CN107622065B (zh) * 2016-07-14 2020-10-16 腾讯科技(深圳)有限公司 一种数据处理方法及服务器
CN107277188B (zh) * 2017-06-19 2020-01-14 网宿科技股份有限公司 一种确定ip地址归属信息的方法、客户端、服务器及业务系统
CN108573018B (zh) * 2018-01-12 2020-08-07 北京金山云网络技术有限公司 Ip库生成方法、装置、电子设备及计算机可读存储介质
CN108694547B (zh) * 2018-06-15 2021-10-29 顺丰科技有限公司 账号异常识别方法、装置、设备和储存介质
CN109274725B (zh) * 2018-08-31 2020-05-26 阿里巴巴集团控股有限公司 互联网交易定位方法、装置及服务器
CN110661901B (zh) * 2019-08-08 2022-11-04 网宿科技股份有限公司 一种ip库的采信方法、整合方法、电子设备和可存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101355595A (zh) * 2008-09-17 2009-01-28 北京搜狗科技发展有限公司 定位ip地址的物理所在地的方法和装置
CN201601725U (zh) * 2010-02-08 2010-10-06 深圳市同洲电子股份有限公司 一种可查询手机联系人位置的手机

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6684250B2 (en) * 2000-04-03 2004-01-27 Quova, Inc. Method and apparatus for estimating a geographic location of a networked entity
CN1845555A (zh) * 2005-04-07 2006-10-11 深圳市沃通通信服务有限公司 因特网网站访问者定位技术的实现方法以及应用
CN101150528B (zh) * 2006-09-21 2010-06-09 腾讯科技(深圳)有限公司 一种向即时通信用户推送同域用户的系统、设备及方法
CN101374249B (zh) * 2007-08-21 2011-08-17 彭亮 一种基于移动终端ip地址获取该终端的实时精确地理位置的方法
CN101404607B (zh) * 2008-11-19 2011-04-13 腾讯科技(深圳)有限公司 更新数据的方法、装置和系统
CN101420376B (zh) * 2008-11-19 2010-12-22 腾讯科技(深圳)有限公司 更新数据的方法和装置
CN101572629B (zh) * 2009-05-31 2011-08-31 腾讯科技(深圳)有限公司 一种ip数据的处理方法及装置
CN102014366B (zh) * 2009-09-04 2015-05-13 腾讯科技(深圳)有限公司 更新ip地址归属地信息的方法、装置和系统
CN102104635B (zh) * 2009-12-17 2014-07-16 阿里巴巴集团控股有限公司 一种更新互联网协议ip地址库的方法和装置
CN102394944B (zh) * 2011-09-16 2014-01-29 北京新媒传信科技有限公司 一种Web访问中的IP地址库修正方法和设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101355595A (zh) * 2008-09-17 2009-01-28 北京搜狗科技发展有限公司 定位ip地址的物理所在地的方法和装置
CN201601725U (zh) * 2010-02-08 2010-10-06 深圳市同洲电子股份有限公司 一种可查询手机联系人位置的手机

Also Published As

Publication number Publication date
CN103716282A (zh) 2014-04-09

Similar Documents

Publication Publication Date Title
CN103716282B (zh) 一种修正ip库的方法和系统
CN105357054B (zh) 网站流量分析方法、装置和电子设备
CN101990003B (zh) 一种基于ip地址属性的用户行为监控系统与方法
CN103324566B (zh) 一种网页产品多版本测试方法及装置
CN103647800B (zh) 推荐应用资源的方法及系统
US6741990B2 (en) System and method for efficient and adaptive web accesses filtering
CN106469376B (zh) 一种风险控制方法和设备
CN102469435B (zh) 一种提高移动终端的终端型号识别准确率的方法及装置
CN105022960A (zh) 基于网络流量的多特征移动终端恶意软件检测方法及系统
CN106202117A (zh) 数据处理方法、装置和服务器
CN102541884B (zh) 数据库优化方法和装置
CN106354800A (zh) 一种基于多维度特征的不良网站检测方法
CN105426502A (zh) 基于社交网络的人物信息搜索与关系网绘制的方法
CN103457909B (zh) 一种僵尸网络检测方法及装置
CN106296301A (zh) 一种房产销售线索的挖掘方法
CN105022939B (zh) 信息验证方法及装置
CN103605714A (zh) 网站异常数据的识别方法及装置
CN107979569A (zh) 一种互联网应用的注册信息管理装置、方法及系统
CN114328962A (zh) 一种基于知识图谱的web日志异常行为识别方法
CN105930427A (zh) 数据库审计方法及装置
CN106067879A (zh) 信息的检测方法及装置
CN102571922B (zh) 一种数据流处理方法及装置
CN105354249A (zh) 多账号关联方法、装置及电子设备
CN105357335A (zh) 一种dns权威日志信息挖掘处理方法
CN105827432A (zh) 基于shell脚本的流量日志统计方法及统计系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: Room 810, 8 / F, 34 Haidian Street, Haidian District, Beijing 100080

Patentee after: BEIJING D-MEDIA COMMUNICATION TECHNOLOGY Co.,Ltd.

Address before: 100089 Beijing city Haidian District wanquanzhuang Road No. 28 Wanliu new building 6 storey block A room 602

Patentee before: BEIJING D-MEDIA COMMUNICATION TECHNOLOGY Co.,Ltd.