CN104580546A - Ip 地址属性信息的获取方法和装置 - Google Patents
Ip 地址属性信息的获取方法和装置 Download PDFInfo
- Publication number
- CN104580546A CN104580546A CN201410812337.2A CN201410812337A CN104580546A CN 104580546 A CN104580546 A CN 104580546A CN 201410812337 A CN201410812337 A CN 201410812337A CN 104580546 A CN104580546 A CN 104580546A
- Authority
- CN
- China
- Prior art keywords
- address
- information
- attribute information
- browser
- visit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/50—Address allocation
- H04L61/5007—Internet protocol [IP] addresses
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/02—Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
- H04L63/0227—Filtering policies
- H04L63/0236—Filtering by address, protocol, port number or service, e.g. IP-address or URL
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种IP地址属性信息的获取方法和装置。其中,该方法包括:在网站的网页上嵌入至少一个第一子域名下的URL和至少一个第二子域名下的URL;获取用户终端的浏览器访问第一子域名下的URL和第二子域名下的URL的访问日志信息;获取访问日志信息中用户终端的浏览器的标识相同、访问时间的间隔符合预设时间间隔、且浏览器的IP地址的类型不同的第一访问信息和第二访问信息;使用第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息。通过本发明,解决了现有技术中获取IPv6地址的效率低、准确率低的问题,实现了自动获取第二类型的IP地址的属性信息且获取到的信息准确有效地效果。
Description
技术领域
本发明涉及数据处理领域,具体而言,涉及一种IP地址属性信息的获取方法和装置。
背景技术
IPv6是Internet Protocol Version 6的缩写,其中Internet Protocol译为“互联网协议”。IPv6是IETF(互联网工程任务组,Internet Engineering Task Force)设计的用于替代现行版本IP协议(即IPv4)的下一代IP协议。目前IP协议的版本号是4(简称为IPv4),它的下一个版本就是IPv6。
与IPV4相比,IPV6具有以下几个优势:IPv6具有更大的地址空间。IPv4中规定IP地址长度为32,最大地址个数为2^32;而IPv6中IP地址的长度为128,即最大地址个数为2^128。与32位地址空间相比,其地址空间增加了2^128-2^32个;现在,IPv4采用32位地址长度,约有43亿地址,而IPv6采用128位地址长度可以忽略不计无限制的地址,有足够的地址资源。地址的丰富将完全删除在IPv4互联网应用上有很多的限制,如IP地址,每一个电话,每一个带电的东西可以有一个IP地址,从而可以真正形成一个数字家庭。IPv6的技术优势,目前在一定程度上解决IPv4互联网存在的问题,这是IPv4向IPv6演进的重要动力之一。
但是在实际部署中,IPv6由于与IPv4不兼容,应用方面需要长时间的迁移和转换,因此在IPv6的网络部署演进中充满了变数,并且由于规范的建立需要一点时间,在IPv6实际部署中的对于IPv6地址的属性成了一个难题,一是没有完整、固定的规划,而是实践过程中会远远不断的加入新地址、变更已有的地址,因此难以形成从上到下的地址精细化管理。
在内容分发网络(即CDN)服务中,往往需要根据网民用户的IP地址或者是网民使用的域名服务器(DNS)的IP地址来确定网民的一些相关属性,例如网民是从哪家运营商接入的,是在那个地理区域接入的(国家、省、市等)。CDN需要这些信息以决定向网民发出的域名解析请求给予回应,一般地,CDN会返回同一运营商内的,与用户在同一区域(国家、省、市等不同级别,视运营规模而定)的服务器的IP地址,如果没有IP地址的属性信息,则CDN无法完成对用户的请求的合理的判定。
针对现有技术中获取IPv6地址的效率低、准确率低的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种IP地址属性信息的获取方法和装置,以解决获取IPv6地址的效率低、准确率低的问题。
为了实现上述目的,根据本发明实施例的一个方面,提供了一种IP地址属性信息的获取方法。
根据本发明的IP地址属性信息的获取方法包括:在网站的网页上嵌入至少一个第一子域名下的URL和至少一个第二子域名下的URL,其中,所述第一子域名响应第一类型IP的地址解析,所述第二子域名响应第二类型IP的地址解析;在用户终端的浏览器访问所述网站的网页之后,获取所述用户终端的浏览器访问所述第一子域名下的URL和所述第二子域名下的URL的访问日志信息,其中,所述访问日志信息携带有URL的访问时间、浏览器的IP地址以及所述用户终端的浏览器的标识;获取所述访问日志信息中所述用户终端的浏览器的标识相同、所述访问时间的间隔符合预设时间间隔、且所述浏览器的IP地址的类型不同的第一访问信息和第二访问信息,其中,所述第一访问信息为所述用户终端的浏览器访问所述第一子域名下的URL的访问信息,所述第二访问信息为所述用户终端的浏览器访问所述第二子域名下的URL的访问信息;使用所述第一访问信息的第一IP地址的第一属性信息设置所述第二访问信息的第二IP地址的第二属性信息。
进一步地,使用所述第一访问信息的IP地址的第一属性信息设置所述第二访问信息的IP地址的第二属性信息包括:使用所述用户终端的浏览器的标识作为拼接键值,将多个所述第一访问信息的第一IP地址和所述第二访问信息的所述第二IP地址拼接为地址对,得到第一地址对集合;获取所述地址对集合中的多个所述第一IP地址的第一属性信息及所述第一属性信息对应所述第一地址对集合的权重值;将所述权重值最高且所述权重值符合预设阈值的所述第一属性信息作为所述第二IP地址的所述第二属性信息。
进一步地,获取所述地址对集合中的多个所述第一IP地址的第一属性信息及所述第一属性信息对应所述地址对集合的权重值包括:对所述第一地址对集合中的所述地址对进行去重处理,得到第二地址对集合;获取所述第二地址对集合中的多个所述第一IP地址的第一属性信息及所述第一属性信息对应所述第二地址对集合的权重值;对所述第一地址对集合中的所述地址对进行去重处理,得到第二地址对集合包括:获取所述第一地址对集合中各个所述地址对的所述第一IP地址、所述第二IP地址、访问时间所述的访问时间段以及所述用户终端的浏览器的标识;若所述第一地址对集合中存在所述第一IP地址、所述第二IP地址、所述访问时间段以及所述用户终端的浏览器的标识一致的两个所述地址对,则去除其中一个所述地址对,得到所述第二地址对集合。
进一步地,在将所述权重值最高且所述权重值符合预设阈值的所述第一属性信息作为所述第二IP地址的所述第二属性信息之后,所述获取方法还包括:获取所述第二IP地址所属的地址区段;使用所述第二属性信息设置所述地址区段内各个IP地址的属性信息;使用所述第二属性信息设置所述地址区段内各个IP地址的属性信息包括:检测所述地址区段是否具有预存属性信息;若所述地址区段具有所述预存属性信息,则获取所述第二IP地址所属的地址子区段,则使用所述第二属性信息为所述地址子区段内各个IP地址的属性信息赋值;或,获取所述预存属性信息的加权值,使用所述加权值与所述预存属性信息进行加权计算得到信息加权值,基于所述信息加权值确定地址区段内的属性信息;若所述地址区段不具有所述预存属性信息,则使用所述第二属性信息设置所述地址区段内各个IP地址的属性信息。
进一步地,使用所述第一访问信息的第一IP地址的第一属性信息设置所述第二访问信息的第二IP地址的第二属性信息包括:获取所述第一访问信息的第一网站域名信息和所述第二访问信息的第二网站域名信息;若所述第一网站域名信息与所述第二网站域名信息中的身份识别信息一致,则使用所述第一访问信息的所述第一IP地址的所述第一属性信息设置所述第二访问信息的所述第二IP地址的所述第二属性信息。
为了实现上述目的,根据本发明实施例的另一方面,提供了一种IP地址属性信息的获取装置。根据本发明的IP地址属性信息的获取装置包括:域名处理模块,用于在网站的网页上嵌入至少一个第一子域名下的URL和至少一个第二子域名下的URL,其中,所述第一子域名响应第一类型IP的地址解析,所述第二子域名响应第二类型IP的地址解析;第一获取模块,用于在用户终端的浏览器访问所述网站的网页之后,获取所述用户终端的浏览器访问所述第一子域名下的URL和所述第二子域名下的URL的访问日志信息,其中,所述访问日志信息中携带有URL的访问时间、浏览器的IP地址以及所述用户终端的浏览器的标识;第二获取模块,用于获取所述访问日志信息中所述用户终端的浏览器的标识相同、所述访问时间的间隔符合预设时间间隔、且所述浏览器的IP地址的类型不同的第一访问信息和第二访问信息,其中,所述第一访问信息为所述用户终端的浏览器访问所述第一子域名下的URL的访问信息,所述第二访问信息为所述用户终端的浏览器访问所述第二子域名下的URL的访问信息;第一设置模块,用于使用所述第一访问信息的第一IP地址的第一属性信息设置所述第二访问信息的第二IP地址的第二属性信息。
进一步地,所述第一设置模块包括:地址拼接模块,用于使用所述用户终端的浏览器的标识作为拼接键值,将多个所述第一访问信息的第一IP地址和所述第二访问信息的所述第二IP地址拼接为地址对,得到第一地址对集合;第一获取子模块,用于获取所述地址对集合中的多个所述第一IP地址的第一属性信息及所述第一属性信息对应所述第一地址对集合的权重值;设置子模块,用于将所述权重值最高且所述权重值符合预设阈值的所述第一属性信息作为所述第二IP地址的所述第二属性信息。
进一步地,所述第一获取子模块包括:去重模块,用于对所述第一地址对集合中的所述地址对进行去重处理,得到第二地址对集合;信息和权重获取子模块,用于获取所述第二地址对集合中的多个所述第一IP地址的第一属性信息及所述第一属性信息对应所述第二地址对集合的权重值;所述去重模块包括:地址信息获取模块,用于获取所述第一地址对集合中各个所述地址对的所述第一IP地址、所述第二IP地址、访问时间所述的访问时间段以及所述用户终端的浏览器的标识;集合获取模块,用于若所述第一地址对集合中存在所述第一IP地址、所述第二IP地址、所述访问时间段以及所述用户终端的浏览器的标识一致的两个所述地址对,则去除其中一个所述地址对,得到所述第二地址对集合。
进一步地,所述获取装置还包括:地址区段获取模块,用于在将所述权重值最高且所述权重值符合预设阈值的所述第一属性信息作为所述第二IP地址的所述第二属性信息之后,获取所述第二IP地址所属的地址区段;第二设置模块,用于使用所述第二属性信息设置所述地址区段内各个IP地址的属性信息;所述第二设置模块包括:检测模块,用于检测所述地址区段是否具有预存属性信息;第一设置子模块,用于若所述地址区段具有所述预存属性信息,则获取所述第二IP地址所属的地址子区段,则使用所述第二属性信息为所述地址子区段内各个IP地址的属性信息赋值;或,获取所述预存属性信息的加权值,使用所述加权值与所述预存属性信息进行加权计算得到信息加权值,基于所述信息加权值确定地址区段内的属性信息;第二设置子模块,用于若所述地址区段不具有所述预存属性信息,则使用所述第二属性信息设置所述地址区段内各个IP地址的属性信息。
进一步地,所述第一设置模块包括:第二获取子模块,用于获取所述第一访问信息的第一网站域名信息和所述第二访问信息的第二网站域名信息;第三设置子模块,用于若所述第一网站域名信息与所述第二网站域名信息中的身份识别信息一致,则使用所述第一访问信息的所述第一IP地址的所述第一属性信息设置所述第二访问信息的所述第二IP地址的所述第二属性信息。
采用本发明实施例,在符合预设条件的网站的网页嵌入分别响应两个类型IP地址解析的子域名,在用户终端的浏览器访问网页之后,获取访问嵌入的子域名的访问信息,从其中提取用户终端的浏览器的标识相同、访问时间的间隔符合预设时间间隔、且IP地址的类型不同的第一访问信息和第二访问信息,使用第一访问信息的IP地址的属性信息设置第二访问信息的IP地址的属性信息。在上述实施例中,可以使用来自同一浏览器的第一类型IP的属性信息设置第二类型IP的属性信息,从而可以使用已知的IP地址的属性信息完善未知的IP地址的属性信息,从而可以通过自动获取第二类型的IP地址的属性信息,获取属性信息的效率高且属性信息准确有效。通过本发明,解决了现有技术中获取IPv6地址的效率低、准确率低的问题,实现了自动获取第二类型的IP地址的属性信息且获取到的信息准确有效地效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的IP地址属性信息的获取方法的流程图;以及
图2是根据本发明实施例的IP地址属性信息的获取装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种IP地址属性信息的获取方法。
图1是根据本发明实施例的IP地址属性信息的获取方法的流程图。如图1所示,该获取方法包括步骤如下:
步骤S102,在网站的网页上嵌入至少一个第一子域名下的URL和至少一个第二子域名下的URL,其中,第一子域名响应第一类型IP的地址解析,第二子域名响应第二类型IP的地址解析。
具体地,在本发明上述实施例中,可以在符合预设条件的网站的网页上嵌入至少一个第一子域名下的URL和至少一个第二子域名下的URL,并且第一子域名只响应第一类型IP的地址解析,第二子域名只响应第二类型IP的地址解析。
其中,符合预设条件的网站的网页可以是网站的网页的访问量达到预设阈值的网页。
步骤S104,在用户终端的浏览器访问网站的网页之后,网页服务器获取用户终端的浏览器访问第一子域名下的URL和第二子域名下的URL的访问日志信息,其中,访问日志信息中携带有URL的访问时间、浏览器的IP地址以及用户终端的浏览器的标识。
步骤S106,获取访问日志信息中用户终端的浏览器的标识相同、访问时间的间隔符合预设时间间隔、且IP地址的类型不同的第一访问信息和第二访问信息,其中,第一访问信息为用户终端的浏览器访问第一子域名的访问信息,第二访问信息为用户终端的浏览器访问第二子域名的访问信息。
步骤S108,使用第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息。
采用本发明实施例,在符合预设条件的网站的网页嵌入分别响应两个类型IP地址解析的子域名下的URL(例如”http://subdom1.domain.name/file1?随机串”和”http://subdom2.domain.name/file2?随机串”),在用户终端的浏览器访问网页之后,网页会触发浏览器发起对两个url的访问;在服务器(指subdom1.domain.name和subdom1.domain.name对应的服务器)端获取访问嵌入的子域名的访问信息,从其中提取用户终端的浏览器的标识相同、访问时间的间隔符合预设时间间隔、且IP地址的类型不同的第一访问信息和第二访问信息,使用第一访问信息的IP地址的属性信息设置第二访问信息的IP地址的属性信息。在上述实施例中,可以使用来自同一浏览器的第一类型IP的属性信息设置第二类型IP的属性信息,从而可以使用已知的IP地址的属性信息完善未知的IP地址的属性信息,从而可以通过自动获取第二类型的IP地址的属性信息,获取属性信息的效率高且属性信息准确有效。通过本发明,解决了现有技术中获取IPv6地址的效率低、准确率低的问题,实现了自动获取第二类型的IP地址的属性信息且获取到的信息准确有效地效果。
其中,上述实施例中的第一类型IP可以为IPv4,第二类型IP可以为IPv6;上述实施例中的用户终端的浏览器的标识可以为cookie值(即储存在用户本地终端上的数据),cookie发给上述第一子域名和第二子域名共有的上级域名,例如subdom1.domain.name和subdom2.domain.name共有domain.name的上级域名,cookie可以设置在domain.name级别上,这样浏览器访问subdom1.domain.name和subdom2.domain.name时都能携带此cookie。
在现实使用中,IPv4与IPv6将长期并存,先行接入IPv6网络的网民或者用户往往是采用双栈方式,即一台设备同时具有IPv4类地址和IPv6类地址,在访问一个域名时,设备会发出对域名的IPv4类的解析请求和IPv6类的解析请求,针对解析回来的地址,设备会利用本机的IPv4地址去访问解析得到的IPv4目标地址,利用本机的IPv6地址去访问解析得到的IPv6目标地址;两者都得到回复时,设备会根据本机系统或者应用的原则决定先使用哪类地址,本申请使用上述机理,使用来自同一浏览器的IPv4的属性信息完善IPv6的属性信息,实现了自动获取第二类型的IP地址(如IPv6)的属性信息且获取到的信息准确有效地效果。
其中,获取到的第二类型的IP地址的属性信息可以包括:地理位置、所属运营商、IP地址的被使用方式等属性。
可选地,在符合预设条件的网站的网页上嵌入至少一个第一子域名和至少一个第二子域名之前,获取方法还可以包括:将访问量超过预设阈值的网站的网页,作为符合预设条件的网站的网页。
具体地,在被大量访问的互联网网站的网页上,嵌入至少两个不同的子域名(例如name1.domain.com和name2.domain.com)的元素(例如图片或者脚本script),若用户访问该网页,则在用户访问的同时(或者在相邻时间内)发起对两个子域名的内容请求,例如,http://name1.domain.com/file1?随机串,http://name2.domain.com/file2?随机串。
互联网网站在接收到用户终端的浏览器的第一子域名和第二子域名的访问请求之后,网站服务器针对http://name1.domain.com和针对http://name2.domain.com的访问,发放针对网站域名(即domain.com)的cookie值,以保证来自同一浏览器的访问会携带同样的cookie。其中,在对访问发放cookie时,若该访问已经有有效的cookie,则不发放新的cookie;若没有cookie,则发放随机且唯一的cookie。
需要进一步说明的是,域名name1.domain.com和name2.domain.com的地址解析具有如下特点:name1.domain.com只有IPv4的解析;也就是说name1.domain.com的针对IPv6的地址解析没有响应;name2.domain.com只有IPv6的解析;也就是说name2.domain.com的针对IPv4的地址解析没有响应。
在本发明的上述实施例中,第一子域名和第二子域名对不同类型的IP地址解析响应,从而可以保证一个具有双栈的访问能力的设备(如用户终端)能够在访问设计的页面是从第一类型IP(如IPv4)和第二类型(如IPv6)的协议栈各自发出请求。
根据本发明的上述实施例,网站服务器会记录用户终端的浏览器对第一子域名和第二子域名的访问信息(如访问记录),其中,访问信息中至少包括如下数据:用户终端的浏览器的访问时间(如网民访问的时间);访问子域名时使用的IP地址,如网民来访时采用的IP地址(IPv4或者IPv6的地址);访问时的URL地址,如网民访问的url以及用户终端的浏览器的标识,如网民使用的关于domain.com的cookie值。
具体地,可以从服务器上获取网站服务器记录的大量的访问信息,然后对大量的访问信息进行计算,获取多对用户终端的浏览器的标识相同、访问时间的间隔符合预设时间间隔、且IP地址的类型不同的第一访问信息和第二访问信息,即,找出访问时间相近、针对不同子域名(name1.domain.com和name2.domain.com),且cookie值相同的访问信息,使用每对访问信息中的第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息。
需要进一步说明的是,使用第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息可以包括:获取第一访问信息的第一网站域名信息和第二访问信息的第二网站域名信息;若第一网站域名信息与第二网站域名信息中的身份识别信息一致,则使用第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息。其中,上述的身份识别信息可以为cookie值。
通过上述实施例,在使用第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息之前,判断第一访问信息和第二访问信息是否为同一个浏览器发出的访问同一个网站的网页产生的IP地址(如,身份识别信息一致),如果是,则使用第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息;如果不是,则无法确定第一访问信息和第二访问信息为配对的访问信息。采用上述实施例,进一步地保证了获取的属性信息的准确性。
采用上述实施例,综合应用了域名的设计,cookie的标记,以及网站页面多个子域名下的URL的设计,创造了IPv4和IPv6的成对匹配;利用网民访问互联网的过程中不知不觉收集IPv6的地址信息;同时也是利用这样的特征保证了对IPv6的实际使用地址的有效覆盖;利用网络上的访问自动收集IPv6的地址信息,持续有效。
在本发明的上述实施例中,使用第一访问信息的IP地址的第一属性信息设置第二访问信息的IP地址的第二属性信息可以包括:使用用户终端的浏览器的在domain.name的标识(cookie值)作为拼接键值,将多个第一访问信息的第一IP地址和第二访问信息的第二IP地址拼接为地址对,得到第一地址对集合;获取地址对集合中的多个第一IP地址的第一属性信息及第一属性信息对应第一地址对集合的权重值;将一定时间内的累计的权重值最高且权重值符合预设阈值的第一属性信息作为第二IP地址的第二属性信息。
在获取到多对用户终端的浏览器的标识相同、访问时间的间隔符合预设时间间隔、且IP地址的类型不同的第一访问信息和第二访问信息之后,使用Cookie的值作为拼接键值,将第一访问信息(如IPv4访问)与第二访问信息(如IPv6访问)的第一IP地址(如IPv4地址)和第二IP地址(如IPv6)做成地址对,也就是说一个(IPv4,IPv6)地址对在相近时间内以同样的Cookie访问了name1.domain.com和name2.domain.com。
通过本发明的上述实施例,可以得到多个地址对,得到第一地址对集合,针对第一地址对集合中的地址对(IPv4,IPv6)做属性复制和加权。具体地,使用已有的IPv4数据库,查询地址对中的IPv4的属性信息,如:运营商、国家、省以及市,IP地址的使用方式(例如家用,公用,企业用地址)等信息,将该属性信息附加到地址对中的IPv6地址上;同时针对每个第一属性信息做加权统计处理,得到每个第二IP地址的权重值,将其中权重值最高的第一属性信息作为第二属性信息。
具体地,通过本发明的上述实施例得到的地址对可能为同一个第二IP地址对应不同的第一IP地址,则对各个第一IP地址的第一属性信息作加权,将其中权重值最高且符合预设阈值的第一属性信息作为第二属性信息。
在本发明的上述实施例中,获取地址对集合中的多个第一IP地址的第一属性信息及第一属性信息对应地址对集合的权重值可以包括:对第一地址对集合中的地址对进行去重处理,得到第二地址对集合;获取第二地址对集合中的多个第一IP地址的第一属性信息及第一属性信息对应第二地址对集合的权重值;对第一地址对集合中的地址对进行去重处理,得到第二地址对集合可以包括:获取第一地址对集合中各个地址对的第一IP地址、第二IP地址、访问时间的访问时间段以及用户终端的浏览器的标识;若第一地址对集合中存在第一IP地址、第二IP地址、访问时间段以及用户终端的浏览器的标识一致的两个地址对,则去除其中一个地址对,得到第二地址对集合。
在本发明的上述实施例中,在获取到第一地址对集合之后,对其中的重复记录的地址对进行去重处理,从而可以使得加权处理过程中计数的结果更加准确,从而使得得到的第二属性信息更加准确。
具体地,可以采用获取每个地址对的第一IP地址、第二IP地址、访问时间所属的访问时间段以及用户终端的浏览器的标识,得到四个字段的比对信息,若两个地址对的比对信息完全一致,则删除一条地址对的记录。表1示出了比对信息。
表1
地址对编号 | 第一IP地址 | 第二IP地址 | 访问时间段 | 标识 |
1 | A | C | 8:00-9:00 | 123 |
2 | A | D | 10:00-12:00 | 456 |
3 | A | C | 8:00-9:00 | 123 |
4 | B | C | 8:00-9:00 | 456 |
其中,表1中的各个字段的值均是作示例性说明,不对本发明实施例作限定。表1中的地址对编号为1和3的地址对的四个字段均一致,则确定这两个地址对为重复记录的地址对,从第一地址对集合中删除一个地址对即可。
在上述实施例中,通过“cookie+IPv6+IPv4+访问时间段”的方法,将多次出现的同类记录视为同一记录,只计算一次的加权,其余的不计算在内;另外,可以加入对IPv4和IPv6地址区段的数据可信度的加权值。
根据本发明的上述实施例,在将权重值最高且权重值符合预设阈值的第一属性信息作为第二IP地址的第二属性信息之后,获取方法还可以包括:获取第二IP地址所属的地址区段;使用第二属性信息设置地址区段内各个IP地址的属性信息。
具体地,在获取一个第二IP地址的第二属性信息之后,可以使用该第二属性信息设置第二IP地址所属的地址区段内各个IP地址的属性信息。通过该实施例,可以针对收集到的第二IP地址(即IPv6地址)做放大地址空间处理,以子网的形式,分级扩大信息属性并加权。
例如:若IPv6地址是:2001:abcd:efgh:ijkl:mnop:qrst:uvwx:yzAB(其中任一字母是【0-9a-f】中的一个字母),可以逐级放大至地址区段:/120,/112,/104,/96,/88,/80,/72,/64,/56,/48,/40,/32;考虑到现实中的IPv6部署,可以确定分级的上限例如/32;也可以更换分级的步骤(以不同进阶值,该举例说明中给出的是级差为8,进阶值还可以为1-16中任一数字,实际执行时在64位以下时采用级差为1,即/64,/63,/62…)。在该举例说明中,可以通过进阶值确定第二IP地址的地址区段。
通过本发明的上述实施例,可以根据IPv6的地址进行逐级放大;每次可以放大二倍。例如,abcd:efgh:ijkl:mnop:qrst:uvwx:yzAB:CDEF这个地址有一次形成与ipv4地址(IPv4-1)对,这时利用IPv4-1的属性为所说IPv6地址做属性加权(或者说是这个属性值的有效统计量+1);同时为abcd:…..:yzAB:CDEE/127,abcd:…:yzAB:CDEC/126,abcd:…:yzAB:CDE8/125,abcd:….:yzAB:CDE0/124,一直到/32(选择32的原因是一般情况下到32位网络掩码时其所需属性已经会有较大的分布特性。例如是中国电信的,但是分布在世界不同角落,因而对地址的属性也就变成“全世界”,就没有实际的意义了)的属性统计量+1。
进一步地需要说明的是,在根据IPv6的地址进行逐级放大的过程中:在掩码IPv6/x的情况下,含有两个分支:IPv6的第x+1比特为0和1的两种情况。如果有一种情况没有数据,例如x+1位为1的这一个分支;则可以根据x+1位为0的属性统计赋值给IPv6/x这个网段。在上述实施例中,一旦需要判定x+1位为1的网段的属性时,由于这段数据没有积累,所以就借用IPv6/x的属性赋值过来。
可选地,需要查询某个IPv6地址或地址段的属性时,可以依据该地址(段)的本级统计值决定,如果本级没有统计,则向上查询到有统计值的掩码,并根据投票原则选择超过门槛比例值得属性座位查询结果。
通过上述实施例,利用加权和网段放大的方法对可能出现的不同错误和误差进行统计式投票,设置比例门槛,利用多次历史投票确认数据的准确度;IPv6网段放大的方式来有点及面,放大IPv6的属性数据,从而可以很快覆盖更大范围的IPv6地址的信息。
可选地,使用第二属性信息设置地址区段内各个IP地址的属性信息可以包括:检测地址区段是否具有预存属性信息;若地址区段具有预存属性信息,则获取第二IP地址所属的地址子区段,则使用第二属性信息为地址子区段内各个IP地址的属性信息赋值;或,获取所述预存属性信息的加权值,使用所述加权值与所述预存属性信息进行加权计算得到信息加权值,基于信息加权值确定地址区段内的属性信息;若地址区段不具有预存属性信息,则使用第二属性信息设置地址区段内各个IP地址的属性信息。
其中,预存属性信息包括历史的统计数据,预存属性信息的加权值可以按照统计时间确定。例如,三个月前的统计数据的权重值可以为0.5;两个月之前的统计数据的加权值可以为0.8;当前月份的统计数据的加权值可以为1,等。
需要进一步说明的是,获取所述预存属性信息的加权值,使用所述加权值与所述预存属性信息进行加权计算得到信息加权值,基于信息加权值确定地址区段内的属性信息可以通过如下步骤实现:可以使用历史的统计数据的各个统计时间段的统计子数据的数量(如掩码值为A的统计数量)与时间加权值进行加权计算,得到信息加权值。若计算得到的多个信息加权值中最大的信息加权值大于预设加权阈值,则将最大的信息加权值的统计子数据确定为该地址区段内各个IP地址的属性信息。
进一步地,若将加权值最大的统计子数据的加权值不大于预设加权阈值,则不使用统计子数据设置该地址区段内各个IP地址的属性信息。
例如:三个月前的统计子数据(统计的掩码值)为A的数量为a1、统计子数据(统计的掩码值)为B的数量为b1;两个月前的统计子数据(统计的掩码值)为A的数量为a2、统计子数据(统计的掩码值)为B的数量为b2;当前月份的统计子数据(统计的掩码值)为A的数量为a3、统计子数据(统计的掩码值)为B的数量为b3,则计算加权值P1=a1*0.5+a2*0.8+a3*1,P2=b1*0.5+b2*0.8+b3*1。若,P1>P2,且P1大大于预设加权阈值,则使用统计子数据A设置该地址区段内各IP地址的属性信息。
通过上述实施例,在上述实施例中,在对第二地址集合进行分级放大的过程中,将第二地址集合的已有的统计数据进行合并统计。例如,第二地址集合包含了2个子集(子集A和子集B),那么第二地址集合的统计值是将两个子集的统计值合并作为第二地址集合的统计值;如果子集A有数据,子集B也有数据则A+B的上一级的数据统计来自于A+B的总的统计。可选地,第二地址集合以这个值做其向更高级别(例如第三级别)的统计值贡献。
根据本发明的上述实施例,对获取到的第一属性信息以及在分级放大地址区段中针对不同网段地址空间的属性信息得加权,然后分别对不同属性信息作统计分析,利用概率分布门槛确定某一IPv6地址(或地址段)的最终属性值;针对有明显分化的地址子段(例如/32的地址段),放弃对上一级的统一属性收集。
采用本发明上述实施例,通过大量的数据收集和数据迭代,得到最终的IPv6属性数据库;数据的持续运营和数据收集可以保证数据的不断自我修正,同时当有IPv6的数据属性变动的时候(例如IPv6的一些网段被以作他用,或者未分配的地址被释放出来分配)可以通过实际运营过程中逐步收集。
本发明实施例还提供了一种IP地址属性信息的获取装置。该装置可以通过IP地址属性信息的获取方法实现其功能。需要说明的是,本发明实施例的IP地址属性信息的获取装置可以用于执行本发明实施例所提供的IP地址属性信息的获取方法。
图2是根据本发明实施例的IP地址属性信息的获取装置的示意图。如图2所示,该装置可以包括:域名处理模块10、第一获取模块30、第二获取模块50以及第一设置模块70。
其中,域名处理模块10用于在网站的网页上嵌入至少一个第一子域名下的URL和至少一个第二子域名下的URL,其中,第一子域名响应第一类型IP的地址解析,第二子域名响应第二类型IP的地址解析。
具体地,在本发明上述实施例中,可以在符合预设条件的网站的网页上嵌入至少一个第一子域名下的URL和至少一个第二子域名下的URL,并且第一子域名只响应第一类型IP的地址解析,第二子域名只响应第二类型IP的地址解析。
其中,符合预设条件的网站的网页可以是网站的网页的访问量达到预设阈值的网页。
第一获取模块30用于在用户终端的浏览器访问网站的网页之后,网页服务器获取用户终端的浏览器访问第一子域名下URL和第二子域名下URL的访问日志信息,其中,访问日志信息中携带有URL的访问时间、浏览器的IP地址以及用户终端的浏览器的标识。
第二获取模块50用于获取访问日志信息中用户终端的浏览器的标识相同、访问时间的间隔符合预设时间间隔、且IP地址的类型不同的第一访问信息和第二访问信息,其中,第一访问信息为用户终端的浏览器访问第一子域名的访问信息,第二访问信息为用户终端的浏览器访问第二子域名的访问信息。
第一设置模块70用于使用第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息。
采用本发明实施例,在符合预设条件的网站的网页嵌入分别响应两个类型IP地址解析的子域名,在用户终端的浏览器访问网页之后,获取访问嵌入的子域名的访问信息,从其中提取用户终端的浏览器的标识相同、访问时间的间隔符合预设时间间隔、且IP地址的类型不同的第一访问信息和第二访问信息,使用第一访问信息的IP地址的属性信息设置第二访问信息的IP地址的属性信息。在上述实施例中,可以使用来自同一浏览器的第一类型IP的属性信息设置第二类型IP的属性信息,从而可以使用已知的IP地址的属性信息完善未知的IP地址的属性信息,从而可以通过自动获取第二类型的IP地址的属性信息,获取属性信息的效率高且属性信息准确有效。通过本发明,解决了现有技术中获取IPv6地址的效率低、准确率低的问题,实现了自动获取第二类型的IP地址的属性信息且获取到的信息准确有效地效果。
其中,上述实施例中的第一类型IP可以为IPv4,第二类型IP可以为IPv6;上述实施例中的用户终端的浏览器的标识可以为cookie值(即储存在用户本地终端上的数据),cookie发给上述第一子域名和第二子域名共有的上级域名,例如subdom1.domain.name和subdom2.domain.name共有domain.name的上级域名,cookie可以设置在domain.name级别上,这样浏览器访问subdom1.domain.name和subdom2.domain.name时都能携带此cookie。
其中,获取到的第二类型的IP地址的属性信息可以包括:地理位置、所属运营商、IP地址的被使用方式等属性。
可选地,获取装置还可以包括:网页获取模块,用于在符合预设条件的网站的网页上嵌入至少一个第一子域名和至少一个第二子域名之前,将访问量超过预设阈值的网站的网页,作为符合预设条件的网站的网页。
在本发明的上述实施例中,第一子域名和第二子域名对不同类型的IP地址解析响应,从而可以保证一个具有双栈的访问能力的设备(如用户终端)能够在访问设计的页面是从第一类型IP(如IPv4)和第二类型(如IPv6)的协议栈各自发出请求。
根据本发明的上述实施例,网站服务器会记录用户终端的浏览器对第一子域名和第二子域名的访问信息(如访问记录),其中,访问信息中至少包括如下数据:用户终端的浏览器的访问时间(如网民访问的时间);访问子域名时使用的IP地址,如网民来访时采用的IP地址(IPv4或者IPv6的地址);访问时的URL地址,如网民访问的url以及用户终端的浏览器的标识,如网民使用的关于domain.com的cookie值。
具体地,可以从服务器上获取网站服务器记录的大量的访问信息,然后对大量的访问信息进行计算,获取多对用户终端的浏览器的标识相同、访问时间的间隔符合预设时间间隔、且IP地址的类型不同的第一访问信息和第二访问信息,即,找出访问时间相近、针对不同子域名(name1.domain.com和name2.domain.com),且cookie值相同的访问信息,使用每对访问信息中的第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息。
需要进一步说明的是,第一设置模块可以包括:第二获取子模块,用于获取第一访问信息的第一网站域名信息和第二访问信息的第二网站域名信息;第三设置子模块,用于若第一网站域名信息与第二网站域名信息中的身份识别信息一致,则使用第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息。其中,上述的身份识别信息可以为cookie值。
通过上述实施例,在使用第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息之前,判断第一访问信息和第二访问信息是否为同一个浏览器发出的访问同一个网站的网页产生的IP地址(如,身份识别信息一致),如果是,则使用第一访问信息的第一IP地址的第一属性信息设置第二访问信息的第二IP地址的第二属性信息;如果不是,则无法确定第一访问信息和第二访问信息为配对的访问信息。采用上述实施例,进一步地保证了获取的属性信息的准确性。
采用上述实施例,综合应用了域名的设计,cookie的标记,以及网站页面的设计,创造了IPv4和IPv6的成对匹配;利用网民访问互联网的过程中不知不觉收集IPv6的地址信息;同时也是利用这样的特征保证了对IPv6的实际使用地址的有效覆盖;利用网络上的访问自动收集IPv6的地址信息,持续有效。
在本发明的上述实施例中,第一设置模块可以包括:地址拼接模块,用于使用用户终端的浏览器的标识作为拼接键值,将多个第一访问信息的第一IP地址和第二访问信息的第二IP地址拼接为地址对,得到第一地址对集合;第一获取子模块,用于获取地址对集合中的多个第一IP地址的第一属性信息及第一属性信息对应第一地址对集合的权重值;设置子模块,用于将累积后权重值最高且权重值符合预设阈值的第一属性信息作为第二IP地址的第二属性信息。
通过本发明的上述实施例,可以得到多个地址对,得到第一地址对集合,针对第一地址对集合中的地址对(IPv4,IPv6)做属性复制和加权。具体地,使用已有的IPv4数据库,查询地址对中的IPv4的属性信息(如:运营商、国家、省以及市等信息),将该属性信息附加到地址对中的IPv6地址上;同时针对每个第一属性信息做加权处理,得到每个第二IP地址的权重值,将其中权重值最高的第一属性信息作为第二属性信息。
具体地,通过本发明的上述实施例得到的地址对可能为同一个第二IP地址对应不同的第一IP地址,则对各个第一IP地址的第一属性信息作加权,将其中权重值最高且符合预设阈值的第一属性信息作为第二属性信息。
可选地,第一获取子模块可以包括:去重模块,用于对第一地址对集合中的地址对进行去重处理,得到第二地址对集合;信息和权重获取子模块,用于获取第二地址对集合中的多个第一IP地址的第一属性信息及第一属性信息对应第二地址对集合的权重值。其中,去重模块可以包括:地址信息获取模块,用于获取第一地址对集合中各个地址对的第一IP地址、第二IP地址、访问时间的访问时间段以及用户终端的浏览器的标识;集合获取模块,用于若第一地址对集合中存在第一IP地址、第二IP地址、访问时间段以及用户终端的浏览器的标识一致的两个地址对,则去除其中一个地址对,得到第二地址对集合。
在本发明的上述实施例中,在获取到第一地址对集合之后,对其中的重复记录的地址对进行去重处理,从而可以使得加权处理过程中计数的结果更加准确,从而使得得到的第二属性信息更加准确。
在上述实施例中,通过“cookie+IPv6+IPv4+访问时间段”的方法,将多次出现的同类记录视为同一记录,只计算一次的加权,其余的不计算在内;另外,可以加入对IPv4和IPv6地址区段的数据可信度的加权值。
根据本发明的上述实施例,获取装置还可以包括:地址区段获取模块,用于在将权重值最高且权重值符合预设阈值的第一属性信息作为第二IP地址的第二属性信息之后,获取第二IP地址所属的地址区段;第二设置模块,用于使用第二属性信息设置地址区段内各个IP地址的属性信息。
进一步地,第二设置模块可以包括:检测模块,用于检测地址区段是否具有预存属性信息;第一设置子模块,用于若地址区段具有预存属性信息,则获取第二IP地址所属的地址子区段,则使用第二属性信息为地址子区段内各个IP地址的属性信息赋值;或,获取所述预存属性信息的加权值,使用所述加权值与所述预存属性信息进行加权计算得到信息加权值,基于信息加权值确定地址区段内的属性信息;第二设置子模块,用于若地址区段不具有预存属性信息,则使用第二属性信息设置地址区段内各个IP地址的属性信息。
其中,预存属性信息包括历史的统计数据,预存属性信息的加权值可以按照统计时间确定。例如,三个月前的统计数据的权重值可以为0.5;两个月之前的统计数据的加权值可以为0.8;当前月份的统计数据的加权值可以为1,等。
需要进一步说明的是,第一设置子模块可以通过如下方法实现其功能:可以使用历史的统计数据的各个统计时间段的统计子数据的数量(如掩码值为A的统计数量)与时间加权值进行加权计算,得到信息加权值。若计算得到的多个信息加权值中最大的信息加权值大于预设加权阈值,则将最大的信息加权值的统计子数据确定为该地址区段内各个IP地址的属性信息。
进一步地,若将加权值最大的统计子数据的加权值不大于预设加权阈值,则不使用统计子数据设置该地址区段内各个IP地址的属性信息。
具体地,在获取一个第二IP地址的第二属性信息之后,可以使用该第二属性信息设置第二IP地址所属的地址区段内各个IP地址的属性信息。通过该实施例,可以针对收集到的第二IP地址(即IPv6地址)做放大地址空间处理,以子网的形式,分级扩大信息属性并加权。
通过上述实施例,利用加权和网段放大的方法对可能出现的不同错误和误差进行统计式投票,设置比例门槛,利用多次历史投票确认数据的准确度;IPv6网段放大的方式来由点及面,放大IPv6的属性数据,从而可以很快覆盖更大范围的IPv6地址的信息。
采用本发明上述实施例,通过大量的数据收集和数据迭代,得到最终的IPv6属性数据库;数据的持续运营和数据收集可以保证数据的不断自我修正,同时当有IPv6的数据属性变动的时候(例如IPv6的一些网段被挪作他用,或者未分配的地址被释放出来分配)可以通过实际运营过程中逐步收集。
另外,在时间有效性方面,需要考虑较新出现的数据权重可以占较高的比重,可以参考EWMA加权方法。
本实施例中所提供的各个模块与方法实施例对应步骤所提供的使用方法相同、应用场景也可以相同。当然,需要注意的是,上述模块涉及的方案可以不限于上述实施例中的内容和场景,且上述模块可以运行在计算机终端或移动终端,可以通过软件或硬件实现。
从以上的描述中,可以看出,本发明实现了如下技术效果:
采用本发明实施例,在符合预设条件的网站的网页嵌入分别响应两个类型IP地址解析的子域名,在用户终端的浏览器访问网页之后,获取访问嵌入的子域名的访问信息,从其中提取用户终端的浏览器的标识相同、访问时间的间隔符合预设时间间隔、且IP地址的类型不同的第一访问信息和第二访问信息,使用第一访问信息的IP地址的属性信息设置第二访问信息的IP地址的属性信息。在上述实施例中,可以使用来自同一浏览器的第一类型IP的属性信息设置第二类型IP的属性信息,从而可以使用已知的IP地址的属性信息完善未知的IP地址的属性信息,从而可以通过自动获取第二类型的IP地址的属性信息,获取属性信息的效率高且属性信息准确有效。通过本发明,解决了现有技术中获取IPv6地址的效率低、准确率低的问题,实现了自动获取第二类型的IP地址的属性信息且获取到的信息准确有效地效果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、移动终端、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种IP地址属性信息的获取方法,其特征在于,包括:
在网站的网页上嵌入至少一个第一子域名下的URL和至少一个第二子域名下的URL,其中,所述第一子域名响应第一类型IP的地址解析,所述第二子域名响应第二类型IP的地址解析;
在用户终端的浏览器访问所述网站的网页之后,获取所述用户终端的浏览器访问所述第一子域名下的URL和所述第二子域名下的URL的访问日志信息,其中,所述访问日志信息携带有URL的访问时间、浏览器的IP地址以及所述用户终端的浏览器的标识;
获取所述访问日志信息中所述用户终端的浏览器的标识相同、所述访问时间的间隔符合预设时间间隔、且所述浏览器的IP地址的类型不同的第一访问信息和第二访问信息,其中,所述第一访问信息为所述用户终端的浏览器访问所述第一子域名下的URL的访问信息,所述第二访问信息为所述用户终端的浏览器访问所述第二子域名下的URL的访问信息;
使用所述第一访问信息的第一IP地址的第一属性信息设置所述第二访问信息的第二IP地址的第二属性信息。
2.根据权利要求1所述的获取方法,其特征在于,使用所述第一访问信息的IP地址的第一属性信息设置所述第二访问信息的IP地址的第二属性信息包括:
使用所述用户终端的浏览器的标识作为拼接键值,将多个所述第一访问信息的第一IP地址和所述第二访问信息的所述第二IP地址拼接为地址对,得到第一地址对集合;
获取所述地址对集合中的多个所述第一IP地址的第一属性信息及所述第一属性信息对应所述第一地址对集合的权重值;
将所述权重值最高且所述权重值符合预设阈值的所述第一属性信息作为所述第二IP地址的所述第二属性信息。
3.根据权利要求2所述的获取方法,其特征在于,
获取所述地址对集合中的多个所述第一IP地址的第一属性信息及所述第一属性信息对应所述地址对集合的权重值包括:对所述第一地址对集合中的所述地址对进行去重处理,得到第二地址对集合;获取所述第二地址对集合中的多个所述第一IP地址的第一属性信息及所述第一属性信息对应所述第二地址对集合的权重值;
对所述第一地址对集合中的所述地址对进行去重处理,得到第二地址对集合包括:
获取所述第一地址对集合中各个所述地址对的所述第一IP地址、所述第二IP地址、访问时间所述的访问时间段以及所述用户终端的浏览器的标识;
若所述第一地址对集合中存在所述第一IP地址、所述第二IP地址、所述访问时间段以及所述用户终端的浏览器的标识一致的两个所述地址对,则去除其中一个所述地址对,得到所述第二地址对集合。
4.根据权利要求2所述的获取方法,其特征在于,
在将所述权重值最高且所述权重值符合预设阈值的所述第一属性信息作为所述第二IP地址的所述第二属性信息之后,所述获取方法还包括:获取所述第二IP地址所属的地址区段;使用所述第二属性信息设置所述地址区段内各个IP地址的属性信息;
使用所述第二属性信息设置所述地址区段内各个IP地址的属性信息包括:检测所述地址区段是否具有预存属性信息;若所述地址区段具有所述预存属性信息,则获取所述第二IP地址所属的地址子区段,则使用所述第二属性信息为所述地址子区段内各个IP地址的属性信息赋值;或,获取所述预存属性信息的加权值,使用所述加权值与所述预存属性信息进行加权计算得到信息加权值,基于所述信息加权值确定地址区段内的属性信息;若所述地址区段不具有所述预存属性信息,则使用所述第二属性信息设置所述地址区段内各个IP地址的属性信息。
5.根据权利要求1至4中任意一项所述的获取方法,其特征在于,使用所述第一访问信息的第一IP地址的第一属性信息设置所述第二访问信息的第二IP地址的第二属性信息包括:
获取所述第一访问信息的第一网站域名信息和所述第二访问信息的第二网站域名信息;
若所述第一网站域名信息与所述第二网站域名信息中的身份识别信息一致,则使用所述第一访问信息的所述第一IP地址的所述第一属性信息设置所述第二访问信息的所述第二IP地址的所述第二属性信息。
6.一种IP地址属性信息的获取装置,其特征在于,包括:
域名处理模块,用于在网站的网页上嵌入至少一个第一子域名下的URL和至少一个第二子域名下的URL,其中,所述第一子域名响应第一类型IP的地址解析,所述第二子域名响应第二类型IP的地址解析;
第一获取模块,用于在用户终端的浏览器访问所述网站的网页之后,获取所述用户终端的浏览器访问所述第一子域名下的URL和所述第二子域名下的URL的访问日志信息,其中,所述访问日志信息中携带有URL的访问时间、浏览器的IP地址以及所述用户终端的浏览器的标识;
第二获取模块,用于获取所述访问日志信息中所述用户终端的浏览器的标识相同、所述访问时间的间隔符合预设时间间隔、且所述浏览器的IP地址的类型不同的第一访问信息和第二访问信息,其中,所述第一访问信息为所述用户终端的浏览器访问所述第一子域名下的URL的访问信息,所述第二访问信息为所述用户终端的浏览器访问所述第二子域名下的URL的访问信息;
第一设置模块,用于使用所述第一访问信息的第一IP地址的第一属性信息设置所述第二访问信息的第二IP地址的第二属性信息。
7.根据权利要求6所述的获取装置,其特征在于,所述第一设置模块包括:
地址拼接模块,用于使用所述用户终端的浏览器的标识作为拼接键值,将多个所述第一访问信息的第一IP地址和所述第二访问信息的所述第二IP地址拼接为地址对,得到第一地址对集合;
第一获取子模块,用于获取所述地址对集合中的多个所述第一IP地址的第一属性信息及所述第一属性信息对应所述第一地址对集合的权重值;
设置子模块,用于将所述权重值最高且所述权重值符合预设阈值的所述第一属性信息作为所述第二IP地址的所述第二属性信息。
8.根据权利要求7所述的获取装置,其特征在于,
所述第一获取子模块包括:去重模块,用于对所述第一地址对集合中的所述地址对进行去重处理,得到第二地址对集合;信息和权重获取子模块,用于获取所述第二地址对集合中的多个所述第一IP地址的第一属性信息及所述第一属性信息对应所述第二地址对集合的权重值;
所述去重模块包括:
地址信息获取模块,用于获取所述第一地址对集合中各个所述地址对的所述第一IP地址、所述第二IP地址、访问时间所述的访问时间段以及所述用户终端的浏览器的标识;
集合获取模块,用于若所述第一地址对集合中存在所述第一IP地址、所述第二IP地址、所述访问时间段以及所述用户终端的浏览器的标识一致的两个所述地址对,则去除其中一个所述地址对,得到所述第二地址对集合。
9.根据权利要求7所述的获取装置,其特征在于,
所述获取装置还包括:地址区段获取模块,用于在将所述权重值最高且所述权重值符合预设阈值的所述第一属性信息作为所述第二IP地址的所述第二属性信息之后,获取所述第二IP地址所属的地址区段;第二设置模块,用于使用所述第二属性信息设置所述地址区段内各个IP地址的属性信息;
所述第二设置模块包括:检测模块,用于检测所述地址区段是否具有预存属性信息;第一设置子模块,用于若所述地址区段具有所述预存属性信息,则获取所述第二IP地址所属的地址子区段,则使用所述第二属性信息为所述地址子区段内各个IP地址的属性信息赋值;或,获取所述预存属性信息的加权值,使用所述加权值与所述预存属性信息进行加权计算得到信息加权值,基于所述信息加权值确定地址区段内的属性信息;第二设置子模块,用于若所述地址区段不具有所述预存属性信息,则使用所述第二属性信息设置所述地址区段内各个IP地址的属性信息。
10.根据权利要求6至9中任意一项所述的获取装置,其特征在于,所述第一设置模块包括:
第二获取子模块,用于获取所述第一访问信息的第一网站域名信息和所述第二访问信息的第二网站域名信息;
第三设置子模块,用于若所述第一网站域名信息与所述第二网站域名信息中的身份识别信息一致,则使用所述第一访问信息的所述第一IP地址的所述第一属性信息设置所述第二访问信息的所述第二IP地址的所述第二属性信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410812337.2A CN104580546B (zh) | 2014-12-22 | 2014-12-22 | Ip 地址属性信息的获取方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410812337.2A CN104580546B (zh) | 2014-12-22 | 2014-12-22 | Ip 地址属性信息的获取方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104580546A true CN104580546A (zh) | 2015-04-29 |
CN104580546B CN104580546B (zh) | 2017-11-24 |
Family
ID=53095701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410812337.2A Active CN104580546B (zh) | 2014-12-22 | 2014-12-22 | Ip 地址属性信息的获取方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104580546B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109194776A (zh) * | 2018-09-07 | 2019-01-11 | 赛尔网络有限公司 | 一种检测方法、系统、电子设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011020102A2 (en) * | 2009-08-14 | 2011-02-17 | Akamai Technologies, Inc. | Method and apparatus for correlating nameserver ipv6 and ipv4 addresses |
CN102694754A (zh) * | 2012-06-07 | 2012-09-26 | 广州睿哲网络科技有限公司 | 实现IPv4/IPv6网站内容互通的应用网关技术及系统 |
CN102724068A (zh) * | 2012-04-05 | 2012-10-10 | 杭州安恒信息技术有限公司 | 一种在IPv6混合网络中进行审计日志资产识别的方法 |
CN102984398A (zh) * | 2002-06-28 | 2013-03-20 | 高通股份有限公司 | 通过阈值事件进行应用程序管理的系统和方法 |
-
2014
- 2014-12-22 CN CN201410812337.2A patent/CN104580546B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102984398A (zh) * | 2002-06-28 | 2013-03-20 | 高通股份有限公司 | 通过阈值事件进行应用程序管理的系统和方法 |
WO2011020102A2 (en) * | 2009-08-14 | 2011-02-17 | Akamai Technologies, Inc. | Method and apparatus for correlating nameserver ipv6 and ipv4 addresses |
CN102724068A (zh) * | 2012-04-05 | 2012-10-10 | 杭州安恒信息技术有限公司 | 一种在IPv6混合网络中进行审计日志资产识别的方法 |
CN102694754A (zh) * | 2012-06-07 | 2012-09-26 | 广州睿哲网络科技有限公司 | 实现IPv4/IPv6网站内容互通的应用网关技术及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109194776A (zh) * | 2018-09-07 | 2019-01-11 | 赛尔网络有限公司 | 一种检测方法、系统、电子设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104580546B (zh) | 2017-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101355595B (zh) | 定位ip地址的物理所在地的方法和装置 | |
US8756340B2 (en) | DNS wildcard beaconing to determine client location and resolver load for global traffic load balancing | |
CN102664926B (zh) | 用户信息共享方法及系统 | |
TWI639324B (zh) | Method and device for determining IP address segment and its corresponding latitude and longitude | |
CN107169094B (zh) | 信息聚合方法及装置 | |
CN103237094B (zh) | 一种识别用户的方法及装置 | |
CN103051637A (zh) | 用户识别方法与装置 | |
CN102802139A (zh) | 一种物联网网关数据适配系统及方法 | |
CN101464894A (zh) | 数据查询方法和系统 | |
CN104504077A (zh) | 网页访问数据的统计方法和装置 | |
CN108093026B (zh) | 多租户请求的处理方法及装置 | |
CN101808018A (zh) | 接入终端数量的检测方法及设备 | |
CN106301980A (zh) | 一种刷量工具检测方法和装置 | |
CN105099729A (zh) | 一种识别用户身份标识的方法和装置 | |
CN106713242B (zh) | 数据请求的处理方法及处理装置 | |
CN105354249B (zh) | 多账号关联方法、装置及电子设备 | |
CN104506394B (zh) | 一种移动互联网流量统计方法和系统 | |
CN101599857A (zh) | 检测共享接入主机数目的方法、装置及网络检测系统 | |
CN103327036A (zh) | 互联网浏览设备的标识方法以及Cookie服务器 | |
CN103577585B (zh) | 互联网中用户的标识方法和装置 | |
CN103412891A (zh) | 图形码操作信息的采集方法及装置 | |
CN104580546A (zh) | Ip 地址属性信息的获取方法和装置 | |
CN110545335A (zh) | 一种互联网协议地址获取方法、服务器和系统 | |
CN106372973A (zh) | 一种基于多层级关系的渠道商推广效果的统计方法及系统 | |
CN105025115B (zh) | 一种生成集体宿舍ip库的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PP01 | Preservation of patent right | ||
PP01 | Preservation of patent right |
Effective date of registration: 20220225 Granted publication date: 20171124 |