CN109710860A - 一种url分类匹配的方法及装置 - Google Patents

一种url分类匹配的方法及装置 Download PDF

Info

Publication number
CN109710860A
CN109710860A CN201811569675.2A CN201811569675A CN109710860A CN 109710860 A CN109710860 A CN 109710860A CN 201811569675 A CN201811569675 A CN 201811569675A CN 109710860 A CN109710860 A CN 109710860A
Authority
CN
China
Prior art keywords
domain name
address
classification
server
numeric
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811569675.2A
Other languages
English (en)
Other versions
CN109710860B (zh
Inventor
张晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Sipuleng Technology Co Ltd
Original Assignee
Wuhan Sipuleng Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Sipuleng Technology Co Ltd filed Critical Wuhan Sipuleng Technology Co Ltd
Priority to CN201811569675.2A priority Critical patent/CN109710860B/zh
Publication of CN109710860A publication Critical patent/CN109710860A/zh
Application granted granted Critical
Publication of CN109710860B publication Critical patent/CN109710860B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开一种URL分类匹配的方法及装置,所述方法包括:获取第一报文,筛选出所述第一报文中的第一服务器IP地址和第一域名;转换第一服务器IP地址为第一数字地址;查找与平衡二叉搜索树中与第一数字地址相同的第二数字地址,相对应的第二域名,其中,所述平衡二叉搜索树包括数个节点,所述节点包括第二数字地址、第二域名和第二域名分类;判断所述第一域名与所述第二域名是否相同;如果相同,确定第一域名分类为第二域名分类。本申请利用数字地址进行查找和匹配的效率,较利用服务器IP地址字符串形式进行查找和匹配的效率大大提高,并且本申请通过平衡二叉搜索树中的节点,可以快速查找到所述第一域名的第一域名分类。

Description

一种URL分类匹配的方法及装置
技术领域
本申请涉及URL分类技术领域,尤其涉及一种URL分类匹配的方法及装置。
背景技术
URL是指统一资源定位符,对可以从互联网上得到的资源的位置和访问方法的一种 简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,URL包含的信息指出文件的位置以及浏览器应该怎么处理。
随着互联网技术的发展,人们通过URL在网站上访问需要的内容,访问网站已经成为人们获取信息的重要方式。
所以,如何快速且准确的确定URL分类是本领域技术人员亟待解决的问题。
发明内容
本申请提供一种URL分类匹配的方法及装置,以解决现有技术中URL分类效率低的技术问题。
第一方面,本申请提供一种URL分类匹配的方法,所述方法包括:
获取第一报文,筛选出所述第一报文中的第一服务器IP地址和第一域名;
转换第一服务器IP地址为第一数字地址;
查找与平衡二叉搜索树中与第一数字地址相同的第二数字地址,相对应的第二域名, 其中,所述平衡二叉搜索树包括数个节点,所述节点包括第二数字地址、第二域名和第二域名分类;
判断所述第一域名与所述第二域名是否相同;
如果相同,确定第一域名分类为第二域名分类。
结合第一方面,在第一方面的第一种可能的实现方式中,所述方法还包括:
获取第二报文;
筛选出所述第二报文中的第二域名和第二服务器IP地址;
根据所述第二域名,确定所述第二域名分类;
将所述第二服务器IP地址转换为第二数字地址;
以所述第二数字地址为查找维度,将第二域名、第二数字地址以及第二域名分类挂 在平衡二叉搜索树的节点上,形成带有数个节点的平衡二叉搜索树。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中, 所述根据第二域名,确定所述第二域名分类的步骤包括:
对所述第二域名使用hash算法,并查找到所述第二域名的hash位置;
根据所述hash位置,确定所述hash位置上挂载的所有字符串信息;
判断第二域名是否在所述字符串信息内;
如果所述第二域名在所述字符串信息内,确定第二域名分类与所述hash位置对应的 分类相同。
结合第一方面,在第一方面的第三种可能的实现方式中,所述转换第一服务器IP地 址为第一数字地址按照以下公式转换:
Y=a*2563+b*2562+c*2561+d*2560
其中,Y为第一数字地址,所述第一服务器IP地址包括第一段a、第二段b、第三 段c和第四段d。
第二方面,本申请提供一种URL分类匹配的装置,所述装置包括:
第一获取单元,用于获取第一报文,筛选出所述第一报文中的第一服务器IP地址和 第一域名;
第一转换单元,用于转换第一服务器IP地址为第一数字地址;
第一查找单元,用于查找与平衡二叉搜索树中与第一数字地址相同的第二数字地址, 相对应的第二域名,其中,所述平衡二叉搜索树包括数个节点,所述节点包括第二数字地址、第二域名和第二域名分类;
第一判断单元,用于判断所述第一域名与所述第二域名是否相同;
如果相同,确定第一域名分类为第二域名分类。
结合第二方面,在第二方面的第一种可能的实现方式中,所述装置还包括:
第二获取单元,用于获取第二报文;
筛选单元,用于筛选出所述第二报文中的第二域名和第二服务器IP地址;
第一确定单元,用于根据所述第二域名,确定所述第二域名分类;
第二转换单元,用于将所述第二服务器IP地址转换为第二数字地址;
形成单元,用于以所述第二数字地址为查找维度,将第二域名、第二数字地址以及第二域名分类挂在平衡二叉搜索树的节点上,形成带有数个节点的平衡二叉搜索树。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中, 所述第一确定单元包括:
第二查找单元,用于对所述第二域名使用hash算法,并查找到所述第二域名的hash 位置;
第二确定单元,用于根据所述hash位置,确定所述hash位置上挂载的所有字符串信息;
第二判断单元,用于判断第二域名是否在所述字符串信息内;
如果所述第二域名在所述字符串信息内,确定第二域名分类与所述hash位置对应的 分类相同。
结合第二方面,在第二方面的第三种可能的实现方式中,所述转换第一服务器IP地 址为第一数字地址按照以下公式转换:
Y=a*2563+b*2562+c*2561+d*2560
其中,Y为第一数字地址,所述第一服务器IP地址包括第一段a、第二段b、第三 段c和第四段d。
由以上技术可知,本申请提供了一种URL分类匹配的方法及装置,所述方法包括:获取第一报文,筛选出所述第一报文中的第一服务器IP地址和第一域名;转换第一服务 器IP地址为第一数字地址;查找与平衡二叉搜索树中与第一数字地址相同的第二数字地 址,相对应的第二域名,其中,所述平衡二叉搜索树包括数个节点,所述节点包括第二 数字地址、第二域名和第二域名分类;判断所述第一域名与所述第二域名是否相同;如 果相同,确定第一域名分类为第二域名分类。本申请利用数字地址进行查找和匹配的效 率,较利用服务器IP地址字符串形式进行查找和匹配的效率大大提高,并且本申请通过 平衡二叉搜索树中的节点,可以快速查找到所述第一域名的第一域名分类。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单 地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种URL分类匹配的方法的流程图;
图2为本申请实施例提供的另一种URL分类匹配的方法的流程图;
图3为本申请实施例提供的另一种URL分类匹配的方法的流程图;
图4为本申请实施例提供的一种URL分类匹配的装置的结构示意图;
图5为本申请实施例提供的另一种URL分类匹配的装置的结构示意图;
图6为本申请实施例提供的另一种URL分类匹配的装置的结构示意图。
具体实施方式
随着互联网技术的发展,人们通过URL在网站上访问需要的内容,访问网站已经成为人们获取信息的重要方式。本申请提供一种URL分类匹配的方法及装置,可以快速识 别URL的分类,避免用户使用非法网站。
实施例一
参阅图1,本申请实施例提供的一种URL分类匹配的方法的流程图,所述方法包括:
本申请实施例中URL是指:统一资源定位符,对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有 一个唯一的URL,URL包含的信息指出文件的位置以及浏览器应该怎么处理。
步骤S100、获取第一报文,筛选出所述第一报文中的第一服务器IP地址和第一域名;
需要说明的是,所述第一报文为URL,当服务器获取第一报文时,筛选出所述第一报文中的第一服务器IP地址和与所述第一服务器IP地址对应的第一域名。例如,从所 述第一报文中,筛选出的第一域名为www.sina.com.cn,服务器IP地址为 123.126.157.222。
步骤S200、转换第一服务器IP地址为第一数字地址;
具体的,由于服务器IP地址当以字符串的形式存在时,查找和匹配效率较低。本申请实施例将服务器IP地址以数字地址的形式进行使用,数字的查找和匹配效率远高于字符串形式的服务器IP地址。例如,所述第一服务器IP地址为123.126.157.222,转换 后得到的所述第一数字地址为2071895518。
步骤S300、查找与平衡二叉搜索树中与第一数字地址相同的第二数字地址,相对应 的第二域名,其中,所述平衡二叉搜索树包括数个节点,所述节点包括第二数字地址、第二域名和第二域名分类;例如,节点上可以挂载第二数字地址为2071895518,第二域 名为www.sina.com.cn,第二域名分类为新闻门户类。
本申请实施例中的平衡二叉搜索树被称为AVL树,且具有以下性质:AVL树是一棵空树或AVL树的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵 平衡二叉树。平衡二叉树的常用实现方法有红黑树、AVL、替罪羊树、Treap、伸展树等。 最小二叉平衡树的节点总数的公式如下F(n)=F(n-1)+F(n-2)+1这个类似于一个递归的 数列,可以参考斐波那契数列,1是根节点,F(n-1)是左子树的节点数量,F(n-2)是右 子树的节点数量。
本申请实施例中所述平衡二叉搜索树上挂载有通过学习的方法得到的数个节点,每 个节点包括域名、数字地址以及域名分类。
在平衡二叉搜索树中,根据转换后得到的第一数字地址,查找与所述第一数字地址 相对应的第二域名。
步骤S400、判断所述第一域名与所述第二域名是否相同;
如果相同,确定第一域名分类为第二域名分类。
具体的,判断根据第一报文得到的第一域名,与查找得到的第二域名是否相同。如果相同,确定第一域名分类为第二域名分类。
本申请实施例通过对第一报文筛选出第一服务器IP地址和第一域名,将所述第一服 务器IP地址转换为第一数字地址,在所述平衡二叉搜索树查找与所述第一数字地址相同 的节点,比较节点内的第二域名与所述第一域名是否相同,如果相同,确定第一域名分类为第二域名分类。本申请利用数字地址进行查找和匹配的效率,较利用服务器IP地址 字符串形式进行查找和匹配的效率大大提高。
实施例二
参阅图2,本申请实施例提供的另一种URL分类匹配的方法的流程图,所述方法还包 括:
步骤S500、获取第二报文;
具体的,所述第二报文为URL。所述第二报文与所述第一报文的结构相同。
步骤S600、筛选出所述第二报文中的第二域名和第二服务器IP地址;
需要说明的是,所述第二报文中筛选出的第二域名和第二服务器IP地址,判断是否 已经挂载在所述平衡二叉搜索树上,如果已经挂载在所述平衡二叉搜索树中,不对所述第二报文中的内容重复挂载。
步骤S700、根据所述第二域名,确定所述第二域名分类;
步骤S800、将所述第二服务器IP地址转换为第二数字地址;
步骤S900、以所述第二数字地址为查找维度,将第二域名、第二数字地址以及第二域名分类挂在平衡二叉搜索树的节点上,形成带有数个节点的平衡二叉搜索树。
具体的,由于第二数字地址是以数字形式存在的地址,相对于字符串形式的地址,更易搜索,效率更高,所以本申请实施例中在建立平衡二叉搜索树时,以第二数字地址 为查找维度建立。所述平衡二叉搜索树的节点将第二域名、第二数字地址以及第二域名 分类挂载上,当本申请实施例获取第一报文时,可以直接在平衡二叉搜索树上查找第一 报文中第一域名对应的第一域名分类,减少无效的比较次数,提升匹配效率。
实施例三
参阅图3,本申请实施例提供的另一种URL分类匹配的方法的流程图,步骤S700、所述根据第二域名,确定所述第二域名分类的步骤包括:
步骤S701、对所述第二域名使用hash算法,并查找到所述第二域名的hash位置;
需要说明的是,Hash算法就是把任意长度的输入通过散列算法变换成固定长度的输 出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的 输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
散列表是依据关键码值而直接进行访问的数据结构。也就是说,通过把关键码值映 射到表中一个位置来訪问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。本申请实施例中的散列表由URL库生成。URL库为数个URL。由 于目前URL数据量很大,会造成每个hash位置会挂载很大字符串,例如某个hash位置 上有www.baidu.com,www.163.com,mail.qq.com,www.sina.com.cn等很多的URL。
步骤S702、根据所述hash位置,确定所述hash位置上挂载的所有字符串信息;
具体的,根据第二域名,查找到所述第二域名的hash位置,确定所述第二域名的hash位置上挂载的所有字符串信息。
步骤S703、判断第二域名是否在所述字符串信息内;
如果所述第二域名在所述字符串信息内,确定第二域名分类与所述hash位置对应的 分类相同。
例如,从第二报文中获取到相应的第二域名为www.sina.com.cn,对www.sina.com.cn域名做hash,找到对应的hash位置。比较这个hash位置上挂载的所有 字符串信息,逐条比对www.sina.com.cn是否存在在所述hash位置上,如果存在,则www.sina.com.cn为hash位置所对应的分类。
实施例四
本申请实施例提供一种URL分类匹配的方法,所述转换第一服务器IP地址为第一数 字地址按照以下公式转换:
Y=a*2563+b*2562+c*2561+d*2560
其中,Y为第一数字地址,所述第一服务器IP地址包括第一段a、第二段b、第三 段c和第四段d。
例如,所述第一服务器IP地址为123.126.157.222,其中,a=123,b=126,c=157,d=222,最终Y=123*2563+126*2562+157*2561+222*2560=2071895518。
根据上述实施例提供的一种URL分类匹配的方法,本申请还提供一种URL分类匹配的装置,参阅图4,本申请实施例提供的一种URL分类匹配的装置的结构示意图,所述 装置包括:
第一获取单元100,用于获取第一报文,筛选出所述第一报文中的第一服务器IP地址和第一域名;
第一转换单元200,用于转换第一服务器IP地址为第一数字地址;
第一查找单元300,用于查找与平衡二叉搜索树中与第一数字地址相同的第二数字 地址,相对应的第二域名,其中,所述平衡二叉搜索树包括数个节点,所述节点包括第二数字地址、第二域名和第二域名分类;
第一判断单元400,用于判断所述第一域名与所述第二域名是否相同;
如果相同,确定第一域名分类为第二域名分类。
在一些实施例中,参阅图5,本申请实施例提供的另一种URL分类匹配的装置的结构示意图,所述装置还包括:
第二获取单元500,用于获取第二报文;
筛选单元600,用于筛选出所述第二报文中的第二域名和第二服务器IP地址;
第一确定单元700,用于根据所述第二域名,确定所述第二域名分类;
第二转换单元800,用于将所述第二服务器IP地址转换为第二数字地址;
形成单元900,用于以所述第二数字地址为查找维度,将第二域名、第二数字地址以及第二域名分类挂在平衡二叉搜索树的节点上,形成带有数个节点的平衡二叉搜索树。
在一些实施例中,参阅图6,本申请实施例提供的另一种URL分类匹配的装置的结构示意图,所述第一确定单元700包括:
第二查找单元701,用于对所述第二域名使用hash算法,并查找到所述第二域名的hash位置;
第二确定单元702,用于根据所述hash位置,确定所述hash位置上挂载的所有字符串信息;
第二判断单元703,用于判断第二域名是否在所述字符串信息内;
如果所述第二域名在所述字符串信息内,确定第二域名分类与所述hash位置对应的 分类相同。
在一些实施例中,本申请实施例提供的另一种URL分类匹配的装置,所述转换第一服务器IP地址为第一数字地址按照以下公式转换:
Y=a*2563+b*2562+c*2561+d*2560
其中,Y为第一数字地址,所述第一服务器IP地址包括第一段a、第二段b、第三 段c和第四段d。
由以上技术可知,本申请提供了一种URL分类匹配的方法及装置,所述方法包括:获取第一报文,筛选出所述第一报文中的第一服务器IP地址和第一域名;转换第一服务 器IP地址为第一数字地址;查找与平衡二叉搜索树中与第一数字地址相同的第二数字地 址,相对应的第二域名,其中,所述平衡二叉搜索树包括数个节点,所述节点包括第二 数字地址、第二域名和第二域名分类;判断所述第一域名与所述第二域名是否相同;如 果相同,确定第一域名分类为第二域名分类。本申请利用数字地址进行查找和匹配的效 率,较利用服务器IP地址字符串形式进行查找和匹配的效率大大提高,并且本申请通过 平衡二叉搜索树中的节点,可以快速查找到所述第一域名的第一域名分类。
具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的用于URL分类匹配的各实施例中的部分或全 部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory, 简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通 用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说 对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存 储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的 某些部分所述的方法。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于实施例而言, 由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说 明即可。
以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims (8)

1.一种URL分类匹配的方法,其特征在于,所述方法包括:
获取第一报文,筛选出所述第一报文中的第一服务器IP地址和第一域名;
转换第一服务器IP地址为第一数字地址;
查找与平衡二叉搜索树中与第一数字地址相同的第二数字地址,相对应的第二域名,其中,所述平衡二叉搜索树包括数个节点,所述节点包括第二数字地址、第二域名和第二域名分类;
判断所述第一域名与所述第二域名是否相同;
如果相同,确定第一域名分类为第二域名分类。
2.根据权利要求1所述的一种URL分类匹配的方法,其特征在于,所述方法还包括:
获取第二报文;
筛选出所述第二报文中的第二域名和第二服务器IP地址;
根据所述第二域名,确定所述第二域名分类;
将所述第二服务器IP地址转换为第二数字地址;
以所述第二数字地址为查找维度,将第二域名、第二数字地址以及第二域名分类挂在平衡二叉搜索树的节点上,形成带有数个节点的平衡二叉搜索树。
3.根据权利要求2所述的一种URL分类匹配的方法,其特征在于,所述根据第二域名,确定所述第二域名分类的步骤包括:
对所述第二域名使用hash算法,并查找到所述第二域名的hash位置;
根据所述hash位置,确定所述hash位置上挂载的所有字符串信息;
判断第二域名是否在所述字符串信息内;
如果所述第二域名在所述字符串信息内,确定第二域名分类与所述hash位置对应的分类相同。
4.根据权利要求1所述的一种URL分类匹配的方法,其特征在于,所述转换第一服务器IP地址为第一数字地址按照以下公式转换:
Y=a*2563+b*2562+c*2561+d*2560
其中,Y为第一数字地址,所述第一服务器IP地址包括第一段a、第二段b、第三段c和第四段d。
5.一种URL分类匹配的装置,其特征在于,所述装置包括:
第一获取单元,用于获取第一报文,筛选出所述第一报文中的第一服务器IP地址和第一域名;
第一转换单元,用于转换第一服务器IP地址为第一数字地址;
第一查找单元,用于查找与平衡二叉搜索树中与第一数字地址相同的第二数字地址,相对应的第二域名,其中,所述平衡二叉搜索树包括数个节点,所述节点包括第二数字地址、第二域名和第二域名分类;
第一判断单元,用于判断所述第一域名与所述第二域名是否相同;
如果相同,确定第一域名分类为第二域名分类。
6.根据权利要求5所述的一种URL分类匹配的装置,其特征在于,所述装置还包括:
第二获取单元,用于获取第二报文;
筛选单元,用于筛选出所述第二报文中的第二域名和第二服务器IP地址;
第一确定单元,用于根据所述第二域名,确定所述第二域名分类;
第二转换单元,用于将所述第二服务器IP地址转换为第二数字地址;
形成单元,用于以所述第二数字地址为查找维度,将第二域名、第二数字地址以及第二域名分类挂在平衡二叉搜索树的节点上,形成带有数个节点的平衡二叉搜索树。
7.根据权利要求6所述的一种URL分类匹配的装置,其特征在于,所述第一确定单元包括:
第二查找单元,用于对所述第二域名使用hash算法,并查找到所述第二域名的hash位置;
第二确定单元,用于根据所述hash位置,确定所述hash位置上挂载的所有字符串信息;
第二判断单元,用于判断第二域名是否在所述字符串信息内;
如果所述第二域名在所述字符串信息内,确定第二域名分类与所述hash位置对应的分类相同。
8.根据权利要求5所述的一种URL分类匹配的装置,其特征在于,所述转换第一服务器IP地址为第一数字地址按照以下公式转换:
Y=a*2563+b*2562+c*2561+d*2560
其中,Y为第一数字地址,所述第一服务器IP地址包括第一段a、第二段b、第三段c和第四段d。
CN201811569675.2A 2018-12-21 2018-12-21 一种url分类匹配的方法及装置 Active CN109710860B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811569675.2A CN109710860B (zh) 2018-12-21 2018-12-21 一种url分类匹配的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811569675.2A CN109710860B (zh) 2018-12-21 2018-12-21 一种url分类匹配的方法及装置

Publications (2)

Publication Number Publication Date
CN109710860A true CN109710860A (zh) 2019-05-03
CN109710860B CN109710860B (zh) 2021-07-27

Family

ID=66257095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811569675.2A Active CN109710860B (zh) 2018-12-21 2018-12-21 一种url分类匹配的方法及装置

Country Status (1)

Country Link
CN (1) CN109710860B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860969A (zh) * 2021-02-25 2021-05-28 武汉思普崚技术有限公司 域名分类匹配方法及装置
CN113286013A (zh) * 2021-05-19 2021-08-20 苏州瑞立思科技有限公司 一种子网匹配方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101399716A (zh) * 2008-10-28 2009-04-01 深圳市中科新业信息科技发展有限公司 监控办公用计算机使用状态的分布式审计系统和方法
US20100114904A1 (en) * 1996-05-10 2010-05-06 Aol Inc. System and method for geographically organizing and classifying businesses on the world-wide web
CN102521334A (zh) * 2011-12-07 2012-06-27 广东工业大学 一种基于分类特性和平衡二叉树的数据存储、查询方法
CN103838768A (zh) * 2012-11-26 2014-06-04 腾讯科技(深圳)有限公司 一种信息分类的方法及装置
CN104750704A (zh) * 2013-12-26 2015-07-01 中国移动通信集团河南有限公司 一种网页url地址分类识别方法及装置
CN108259544A (zh) * 2016-12-29 2018-07-06 新华三技术有限公司 Url查询方法和url查询服务器
CN108712519A (zh) * 2018-05-31 2018-10-26 康键信息技术(深圳)有限公司 Ip地址的定位方法、装置及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100114904A1 (en) * 1996-05-10 2010-05-06 Aol Inc. System and method for geographically organizing and classifying businesses on the world-wide web
CN101399716A (zh) * 2008-10-28 2009-04-01 深圳市中科新业信息科技发展有限公司 监控办公用计算机使用状态的分布式审计系统和方法
CN102521334A (zh) * 2011-12-07 2012-06-27 广东工业大学 一种基于分类特性和平衡二叉树的数据存储、查询方法
CN103838768A (zh) * 2012-11-26 2014-06-04 腾讯科技(深圳)有限公司 一种信息分类的方法及装置
CN104750704A (zh) * 2013-12-26 2015-07-01 中国移动通信集团河南有限公司 一种网页url地址分类识别方法及装置
CN108259544A (zh) * 2016-12-29 2018-07-06 新华三技术有限公司 Url查询方法和url查询服务器
CN108712519A (zh) * 2018-05-31 2018-10-26 康键信息技术(深圳)有限公司 Ip地址的定位方法、装置及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860969A (zh) * 2021-02-25 2021-05-28 武汉思普崚技术有限公司 域名分类匹配方法及装置
CN113286013A (zh) * 2021-05-19 2021-08-20 苏州瑞立思科技有限公司 一种子网匹配方法和装置
CN113286013B (zh) * 2021-05-19 2023-11-07 苏州瑞立思科技有限公司 一种子网匹配方法和装置

Also Published As

Publication number Publication date
CN109710860B (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
US7739288B2 (en) Systems and methods of directory entry encodings
US6691105B1 (en) System and method for geographically organizing and classifying businesses on the world-wide web
CN104933363B (zh) 检测恶意文件的方法和装置
US9043331B2 (en) System and method for indexing documents on the world-wide web
CA2511098A1 (en) Dispersing search engine results by using page category information
CN108900554B (zh) Http协议资产检测方法、系统、设备及计算机介质
JP4021681B2 (ja) ページレイティング/フィルタリング方法および装置とページレイティング/フィルタリングプログラムおよび該プログラムを記録したコンピュータ読取り可能な記録媒体
US8713071B1 (en) Detecting mirrors on the web
CN109710860A (zh) 一种url分类匹配的方法及装置
CN108228760A (zh) 敏感词过滤的方法、装置、移动终端及存储介质
CN105138912A (zh) 钓鱼网站检测规则的自动生成方法及装置
US7836108B1 (en) Clustering by previous representative
CN104065736A (zh) 一种url重定向方法、装置及系统
KR100999408B1 (ko) 해시트리를 이용한 url 검색방법
US20080133587A1 (en) Extending Existing Data within a Directory Service
CN111061972B (zh) 一种用于url路径匹配的ac查找优化方法和装置
CN103258052B (zh) 一种eMule网络上关联资源的发现方法
CN108549679B (zh) 用于url分析系统的文件扩展名快速匹配方法和装置
CN103778181B (zh) 浏览器收藏夹中图标的导入方法及装置
JPH07234879A (ja) 情報処理装置及びデータベース検索方法
Kniesburges et al. Hashed Patricia Trie: Efficient longest prefix matching in peer-to-peer systems
CN109657108B (zh) 一种域名资产数据存储和查询方法和系统
US9996621B2 (en) System and method for retrieving internet pages using page partitions
US8745030B2 (en) Fast searching of directories
CN108170866B (zh) 一种样本查找方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant