CN109688205B - 网页资源的拦截方法及装置 - Google Patents

网页资源的拦截方法及装置 Download PDF

Info

Publication number
CN109688205B
CN109688205B CN201811496787.XA CN201811496787A CN109688205B CN 109688205 B CN109688205 B CN 109688205B CN 201811496787 A CN201811496787 A CN 201811496787A CN 109688205 B CN109688205 B CN 109688205B
Authority
CN
China
Prior art keywords
resource
rule
interviewer
interception
resource interception
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811496787.XA
Other languages
English (en)
Other versions
CN109688205A (zh
Inventor
李永才
李涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilin Hesheng Network Technology Inc
Original Assignee
Qilin Hesheng Network Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilin Hesheng Network Technology Inc filed Critical Qilin Hesheng Network Technology Inc
Priority to CN201811496787.XA priority Critical patent/CN109688205B/zh
Publication of CN109688205A publication Critical patent/CN109688205A/zh
Application granted granted Critical
Publication of CN109688205B publication Critical patent/CN109688205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例公开了一种网页资源的拦截方法及装置,用以实现个性化地对网页资源进行拦截的效果。所述方法包括:响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;获取预设的资源拦截规则库,资源拦截规则库中包括各访问者类型和与各访问者类型分别对应的资源拦截规则之间的对应关系;根据所述对应关系,获取第一访问者类型所对应的第一资源拦截规则;将第一访问者类型所对应的第一资源拦截规则下发至所述客户端。该技术方案从根本上解决了规则数量过多所引起的内存问题,且保证了资源过滤的准确性。

Description

网页资源的拦截方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种网页资源的拦截方法及装置。
背景技术
目前的广告拦截有两种方法,一种是基于域名字符串的广告拦截规则对广告进行拦截,即,浏览器使用广告拦截规则判断某个资源是否为广告时,只需判断是否有广告拦截规则和资源url(Uniform Resource Locator,统一资源定位符)的域名匹配即可;若有广告拦截规则和资源url的域名匹配,则说明该资源为广告。这种方法匹配速度快、占用内存低,缺点在于广告拦截规则太过简单,导致很多广告拦截不到。另一种是按照Adblock plus制定的规则规范来写的广告拦截规则,由于这种方法制定的广告拦截规则复杂而繁多,因此浏览器采用这种广告拦截规则拦截广告会更精准、匹配速度快,但缺点在于占用内存太高。
发明内容
本申请实施例的目的是提供一种网页资源的拦截方法及装置,用以实现个性化地对网页资源进行拦截的效果。
为解决上述技术问题,本申请实施例是这样实现的:
一方面,本申请实施例提供一种网页资源的拦截方法,应用于服务器端,包括:
响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;
获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;
根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;
将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤。
在一个实施例中,所述响应于接收到客户端对第一网页的访问请求之前,所述方法还包括:
根据所述访问者划分粒度,确定多个访问者类型;
根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则;其中,所述初始拦截规则包括各所述访问者类型分别对应的资源拦截规则的集合;
分别将各所述访问者类型和与所述访问者类型分别对应的资源拦截规则对应存储,以生成所述资源拦截规则库。
在一个实施例中,所述根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则,包括:
获取各所述访问者类型对应的访问者在预设时间段内所访问的多个样本网页;及,获取所述初始拦截规则;
利用所述初始拦截规则分别对各所述样本网页进行资源过滤,以确定出对各所述样本网页进行资源过滤时的规则使用信息;其中,所述规则使用信息包括所使用的第二资源拦截规则、所述第二资源拦截规则的使用频率、使用次数中的至少一项;
根据所述规则使用信息,分别对所述初始拦截规则进行过滤,得到各所述访问者类型分别对应的资源拦截规则。
在一个实施例中,所述根据所述规则使用信息,分别对所述初始拦截规则进行过滤,包括:
根据所述规则使用信息,从所述初始拦截规则中筛选出满足第一预设条件的第三资源拦截规则,以使所述第三资源拦截规则从所述初始拦截规则中过滤出来;
其中,所述第一预设条件包括以下至少一项:所述使用频率高于预设频率、所述使用次数多于预设次数。
在一个实施例中,所述根据所述规则使用信息,对所述初始拦截规则进行过滤,还包括:
按照使用频率和/或使用次数的高低顺序,对筛选出的多个所述第三资源拦截规则进行排序;
从排序后的多个所述第三资源拦截规则中选择出前指定数量个第四资源拦截规则,并确定所述第四资源拦截规则为所述访问者类型对应的资源拦截规则。
在一个实施例中,所述方法还包括:
将各所述访问者类型分别对应的资源拦截规则以键值对的形式存储至哈希表中,以使所述客户端对所述第一网页进行资源过滤时,能够根据所述第一网页的标识信息所对应的键查找所述第一网页对应的资源拦截规则;
其中,所述资源拦截规则对应的网页标识信息为所述键值对的键,所述资源拦截规则为所述键值对的值。
在一个实施例中,在对所述第一网页进行资源过滤之后,所述方法还包括:
对过滤后的所述第一网页中的指定资源进行检测,以判断所述指定资源是否符合第二预设条件;其中,所述第二预设条件包括所述指定资源的数量大于预设阈值;
若否,则生成用于标识所述第一资源拦截规则有误的提示信息,以使所述服务器端根据所述提示信息更新所述第一资源拦截规则。
在一个实施例中,所述访问者划分粒度为国家;所述访问者类型包括各国家的访问者;所述资源拦截规则库中包括所述各国家和与所述各国家分别对应的资源拦截规则之间的对应关系;
所述将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,包括:
将所述第一访问者类型对应的国家所对应的第一资源拦截规则下发至所述客户端。
另一方面,本申请实施例提供一种网页资源的拦截装置,应用于服务器端,包括:
第一确定模块,用于响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;
第一获取模块,用于获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;
第二获取模块,用于根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;
下发模块,用于将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤。
在一个实施例中,所述装置还包括:
第二确定模块,用于在响应于接收到客户端对第一网页的访问请求之前,根据所述访问者划分粒度,确定多个访问者类型;
第三确定模块,用于根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则;其中,所述初始拦截规则包括各所述访问者类型分别对应的资源拦截规则的集合;
第一生成模块,用于分别将各所述访问者类型和与所述访问者类型分别对应的资源拦截规则对应存储,以生成所述资源拦截规则库。
在一个实施例中,所述第三确定模块包括:
获取单元,用于获取各所述访问者类型对应的访问者在预设时间段内所访问的多个样本网页;及,获取所述初始拦截规则;
确定单元,用于利用所述初始拦截规则分别对各所述样本网页进行资源过滤,以确定出对各所述样本网页进行资源过滤时的规则使用信息;其中,所述规则使用信息包括所使用的第二资源拦截规则、所述第二资源拦截规则的使用频率、使用次数中的至少一项;
过滤单元,用于根据所述规则使用信息,分别对所述初始拦截规则进行过滤,得到各所述访问者类型分别对应的资源拦截规则。
在一个实施例中,所述过滤单元还用于:
根据所述规则使用信息,从所述初始拦截规则中筛选出满足第一预设条件的第三资源拦截规则,以使所述第三资源拦截规则从所述初始拦截规则中过滤出来;
其中,所述第一预设条件包括以下至少一项:所述使用频率高于预设频率、所述使用次数多于预设次数。
在一个实施例中,所述过滤单元还用于:
按照使用频率和/或使用次数的高低顺序,对筛选出的多个所述第三资源拦截规则进行排序;
从排序后的多个所述第三资源拦截规则中选择出前指定数量个第四资源拦截规则,并确定所述第四资源拦截规则为所述访问者类型对应的资源拦截规则。
在一个实施例中,所述装置还包括:
存储模块,用于将各所述访问者类型分别对应的资源拦截规则以键值对的形式存储至哈希表中,以使所述客户端对所述第一网页进行资源过滤时,能够根据所述第一网页的标识信息所对应的键查找所述第一网页对应的资源拦截规则;
其中,所述资源拦截规则对应的网页标识信息为所述键值对的键,所述资源拦截规则为所述键值对的值。
在一个实施例中,所述装置还包括:
检测模块,用于在对所述第一网页进行资源过滤之后,对过滤后的所述第一网页中的指定资源进行检测,以判断所述指定资源是否符合第二预设条件;其中,所述第二预设条件包括所述指定资源的数量大于预设阈值;
第二生成模块,用于若所述指定资源不符合所述第二预设条件,则生成用于标识所述第一资源拦截规则有误的提示信息,以使所述服务器端根据所述提示信息更新所述第一资源拦截规则。
在一个实施例中,所述访问者划分粒度为国家;所述访问者类型包括各国家的访问者;所述资源拦截规则库中包括所述各国家和与所述各国家分别对应的资源拦截规则之间的对应关系;
所述下发模块包括:
下发单元,用于将所述第一访问者类型对应的国家所对应的第一资源拦截规则下发至所述客户端。
再一方面,本申请实施例提供一种网页资源的拦截设备,应用于服务器端,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;
获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;
根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;
将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤。
再一方面,本申请实施例提供一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;
获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;
根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;
将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤。
采用本发明实施例的技术方案,在接收到客户端对第一网页的访问请求时,通过确定访问者类型、及获取预设的资源拦截规则库,并根据资源拦截规则库中各访问者类型与资源拦截规则之间的对应关系,确定本次访问的访问者类型所对应的第一资源拦截规则,进而将第一资源拦截规则下发至客户端,以使客户端根据第一资源拦截规则对第一网页进行资源过滤。可见,该技术方案进行网页资源过滤时,并非是所有的网页资源都采用统一的资源拦截规则,而是采用访问者类型所对应的个性化的资源拦截规则,因此从根本上解决了规则数量过多所引起的内存问题,且保证了资源过滤的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明一实施例的一种网页资源的拦截方法的示意性流程图;
图2是根据本发明一实施例的一种网页资源的拦截装置的示意性框图;
图3是根据本发明一实施例的一种网页资源的拦截设备的示意性框图。
具体实施方式
本申请实施例提供一种网页资源的拦截方法及装置,用以实现个性化地对网页资源进行拦截的效果。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
图1是根据本发明一实施例的一种网页资源的拦截方法的示意性流程图,如图1所示,该方法应用于服务器端,包括:
S102,响应于接收到客户端对第一网页的访问请求,根据访问请求的相关访问信息,确定访问请求对应的第一访问者类型。
其中,相关访问信息包括客户端信息和/或访问者的个人信息。
客户端信息包括客户端的IP地址、客户端类型、客户端时区等;访问者的个人信息包括访问者的年龄、性别、爱好、工作类型、地理位置、语言等。其中,客户端的IP地址、客户端类型、客户端时区、访问者的地理位置、语言等信息可通过访问者所使用的终端设备获取到。访问者的年龄、性别、爱好、工作类型等信息可从网络侧获取到,可预先将访问者的这些个人信息存储至网络侧。
第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的。访问者划分粒度不同,导致划分得到的各访问者类型也不同。在访问者划分粒度既定的情况下,确定本次访问请求对应的第一访问者类型时,根据相关访问信息的不同,所确定的第一访问者类型也随之不同。
例如,访问者划分粒度为访问者的年龄时,可按照年龄的不同将访问者划分为青年访问者、中年访问者、老年访问者等类型;假设相关访问信息为“访问者的年龄为30”,则可确定本次访问请求对应的第一访问者类型为中年访问者。
再例如,访问者划分粒度为客户端的IP地址时,可按照IP地址对应的不同区域将访问者划分为多个不同区域分别对应的访问者类型;假设相关访问信息为“客户端的IP地址为‘XXXXXX’”,且IP地址“XXXXXX”对应的区域为北京,则可确定本次访问请求对应的第一访问者类型为北京访问者。
再例如,访问者划分粒度为访问者的语言时,可按照不同语言对应的不同国家将访问者划分为不同国家分别对应的访问者类型;假设相关访问信息为“访问者的语言为汉语”,则可确定本次访问请求对应的第一访问者类型为中国访问者。
S104,获取预设的资源拦截规则库,资源拦截规则库中包括各访问者类型和与各访问者类型分别对应的资源拦截规则之间的对应关系。
S106,根据对应关系,获取第一访问者类型所对应的第一资源拦截规则。
S108,将第一访问者类型所对应的第一资源拦截规则下发至客户端,以使客户端根据第一资源拦截规则对第一网页进行资源过滤。
该步骤中,仅将第一访问者类型所对应的第一资源拦截规则下发至客户端,而除此之外的其他资源拦截规则并不下发至客户端,这使得客户端接收到的资源拦截规则数量大大减少,从而减少对内存的占用。并且,通过有针对性地下发第一访问者类型所对应的第一资源拦截规则,也能保证资源过滤的准确性及有针对性。
在一个实施例中,访问者划分粒度为国家;访问者类型包括各国家的访问者;资源拦截规则库中包括各国家和与各国家分别对应的资源拦截规则之间的对应关系。因此,在将第一访问者类型所对应的第一资源拦截规则下发至客户端时,仅需将第一访问者类型对应的国家所对应的第一资源拦截规则下发至客户端,而其他国家所对应的资源拦截规则无需下发至客户端,以减少资源拦截规则数量过多时对内存的占用,避免了下发与第一访问者类型对应的国家无关的资源拦截规则时对内存的浪费。
因此,采用本发明实施例的技术方案,在接收到客户端对第一网页的访问请求时,通过确定访问者类型、及获取预设的资源拦截规则库,并根据资源拦截规则库中各访问者类型与资源拦截规则之间的对应关系,确定本次访问的访问者类型所对应的第一资源拦截规则,进而将第一资源拦截规则下发至客户端,以使客户端根据第一资源拦截规则对第一网页进行资源过滤。可见,该技术方案进行网页资源过滤时,并非是所有的网页资源都采用统一的资源拦截规则,而是采用访问者类型所对应的个性化的资源拦截规则,因此从根本上解决了规则数量过多所引起的内存问题,且保证了资源过滤的准确性。
在一个实施例中,在响应于接收到客户端对第一网页的访问请求之前,可先生成资源拦截规则库。资源拦截规则库的生成方法可包括以下步骤A1-A3:
步骤A1,根据指定的访问者划分粒度,确定多个访问者类型。
其中,访问者划分粒度可包括客户端信息和/或访问者的个人信息。客户端信息包括客户端的IP地址、客户端类型、客户端时区等;访问者的个人信息包括访问者的年龄、性别、爱好、工作类型、地理位置、语言等。
例如,访问者划分粒度为访问者的年龄时,可按照年龄的不同将访问者划分为青年访问者、中年访问者、老年访问者等类型;访问者划分粒度为客户端的IP地址时,可按照IP地址对应的不同区域将访问者划分为多个不同区域分别对应的访问者类型;访问者划分粒度为访问者的语言时,可按照不同语言对应的不同国家将访问者划分为不同国家分别对应的访问者类型;访问者划分粒度为客户端时区时,可按照不同客户端时区对应的不同国家将访问者划分为不同国家分别对应的访问者类型;等等。
步骤A2,根据各访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各访问者类型分别对应的资源拦截规则。
其中,初始拦截规则包括各访问者类型分别对应的资源拦截规则的集合。
步骤A3,分别将各访问者类型和与访问者类型分别对应的资源拦截规则对应存储,以生成资源拦截规则库。
举例而言,访问者划分粒度为客户端时区,假设不同国家对应不同的时区,则可按照时区的不同将访问者划分为不同国家的访问者,如中国访问者、美国访问者、韩国访问者等。根据各个国家的访问者所访问的历史网页及初始拦截规则,确定出各个国家的访问者分别对应的资源拦截规则,并将各个国家的访问者与其对应的资源拦截规则对应存储起来。假设中国访问者对应的是资源拦截规则A,则当服务器端接收到中国访问者发起的对第一网页的访问请求时,将中国访问者对应的资源拦截规则A下发至客户端,由客户单利用资源拦截规则A对第一网页进行资源过滤。
此处需要说明的是,资源拦截规则A并非是指一个资源拦截规则,而是多个资源拦截规则的集合,在该集合中,中国访问者所访问的每一个或多个网页均对应有各自的资源拦截规则。
以下详细说明步骤A2中如何根据各访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各访问者类型分别对应的资源拦截规则。
首先,获取各访问者类型对应的访问者在预设时间段内所访问的多个样本网页;及,获取初始拦截规则。
该步骤中,可从网络侧的大数据服务器中获取到各类型的访问者在预设时间段内所访问的样本网页。在获取初始拦截规则时,可预先配置要访问的初始拦截规则所在的服务器的地址,初始拦截规则可能有多个来源,当初始拦截规则有多个来源时,可预先配置初始拦截规则所在的多个服务器的地址。
预先配置的初始拦截规则所在的多个服务器的地址(即初始拦截规则的来源)越多,获取到的初始拦截规则中的规则数目越多,从而能够过滤掉更多的资源,确保资源过滤的精准性。
此外,当获取初始拦截规则的来源较多时,可能获取到重复的规则,因此,可在获取初始拦截规则之后,通过遍历的方法删除所有规则中重复的规则,以确保所获取到的初始拦截规则的准确性。
其次,利用初始拦截规则分别对各样本网页进行资源过滤,以确定出对各样本网页进行资源过滤时的规则使用信息。
其中,规则使用信息包括所使用的资源拦截规则、该资源拦截规则的使用频率、使用次数中的至少一项。该步骤中,利用初始拦截规则对各样本网页进行资源过滤时,可采用现有技术中的各类资源过滤方法(如基于域名对资源url进行过滤的方法)对样本网页进行资源过滤。
再次,根据对各样本网页进行资源过滤时的规则使用信息分别对初始拦截规则进行过滤,得到各访问者类型分别对应的资源拦截规则。
该步骤中,可根据规则使用信息从初始拦截规则中筛选出满足第一预设条件的资源拦截规则,以使足第一预设条件的资源拦截规则能够从初始拦截规则中过滤出来;其中,第一预设条件包括以下至少一项:使用频率高于预设频率、使用次数多于预设次数。
以访问者类型——中国访问者为例。假设获取到了中国访问者在最近一周内所访问的多个样本网页,利用初始拦截规则对这多个样本网页进行资源过滤,确定出对这多个样本网页进行资源过滤时的规则使用信息包括如下:使用规则1、2、3的使用次数多于预设次数100,而使用其他规则的使用次数少于预设次数100,则可确定规则1、2、3为中国访问者对应的资源拦截规则。
可见,本实施例中,能够根据各访问者类型分别对应的规则使用信息来确定各访问者类型分别对应的资源拦截规则,从而获得不同类型的访问者所对应的个性化的资源拦截规则,实现个性化的拦截资源的效果。
在一个实施例中,可按照使用频率和/或使用次数的高低顺序对筛选出的多个资源拦截规则进行排序,进而从排序后的多个资源拦截规则中选择出前指定数量个资源拦截规则,并确定选择出的指定数量个资源拦截规则为访问者类型对应的资源拦截规则。
本实施例中,通过筛选出使用频率和/或使用次数高的前指定数量个资源拦截规则,作为访问者类型所对应的最终的资源拦截规则,能够避免资源拦截规则数量过多时占用内存的问题。
在一个实施例中,存储资源拦截规则时,可按照使用频率和/或使用次数的高低顺序进行存储。使用频率和/或使用次数的高低顺序可用于表征对应的资源拦截规则的重要性,即,将使用频率和/或使用次数高的资源拦截规则排在前面。这样,服务器端向客户端下发资源拦截规则时,可优先下发重要性高的资源拦截规则。当某一访问者类型对应的资源拦截规则过多时,服务器端可按照资源拦截规则的重要程度下发前N个资源拦截规则,从而避免资源拦截规则过多时占用客户端内存过多的情况。此外,重要程度较低的资源拦截规则对网页资源的过滤结果可在一定程度上忽略不计,也就是说,即使仅下发前N个重要程度高的资源拦截规则,也能够确保资源拦截的准确性。
在一个实施例中,可将各访问者类型分别对应的资源拦截规则以键值对的形式存储至哈希表中,以使客户端对当前访问的第一网页进行资源过滤时,能够根据第一网页的标识信息所对应的键查找第一网页对应的资源拦截规则。其中,资源拦截规则对应的网页标识信息为键值对的键key,资源拦截规则为键值对的值value。
本实施例中,网页标识信息可以是网页url中的指定位数个子串,此时,第一网页的标识信息为第一网页的url。例如,预设指定位数为前8位,对于网页url“www.abcde.com”,其对应的网页标识信息可以是前8位子串,即:www.abcd。当然,指定位数并不限定于前8位,还可以是从中间位数开始指定,例如从第5位开始的8位子串。
表1示意性地列举了几组网页标识信息与资源拦截规则之间的对应存储关系。
表1
网页标识信息(key) 资源拦截规则(value)
www.abcd 规则a
http://81 规则b
s://email 规则c
在表1中,规则a和规则b对应的网页标识信息为网页url中的前8位子串,规则c对应的网页标识信息为网页url中从第5位开始的8位子串。
当客户端对当前访问的第一网页进行资源过滤时,可根据第一网页的标识信息(如第一网页的url)所对应的键查找第一网页对应的资源拦截规则。例如,若第一网页的url为“https://email.xxx.com/”,则将第一网页的url与哈希表中的键进行匹配,可得到与第一网页的url相匹配的键——“s://email”,因此,确定第一网页对应的资源拦截规则为规则c。此外,若哈希表中不存在与第一网页的url相匹配的键,则不对第一网页中的资源进行拦截。
在一个实施例中,为避免哈希表中存储的各网页标识信息存在冲突的情况,可在每次存储一个键值对时,都通过遍历的方法判断哈希表中是否已存储有与当前待存储的键值对相同的键,若有,则更新当前待存储的键值对的键。
例如,网页“https://email.xxx.com/”对应的规则为规则a,网页“https://email.xxx.com/”对应的网页标识信息为前8位子串,即“https://e”,将该网页标识信息作为键值对的键,规则a为键值对的值。在存储键值对——“https://e”与规则a时,首先判断哈希表中是否已存储有键“https://e”,若有,则将网页“https://email.xxx.com/”对应的网页标识信息更新为其他,如更新为从第5位开始的8位子串——“s://email”。
在一个实施例中,在对第一网页进行资源过滤之后,可对过滤后的第一网页中的指定资源进行检测,以判断指定资源是否符合第二预设条件。若指定资源不符合第二预设条件,则生成用于标识第一资源拦截规则有误的提示信息,以使服务器端根据提示信息更新第一资源拦截规则。其中,第二预设条件包括指定资源的数量大于预设阈值。
其中,指定资源可以是网页中的任意资源,如指定资源为网页中的图片、文本等。
例如,第二预设条件为网页中的文本数大于100,若过滤后的第一网页中的文本小于100,则说明对第一网页进行资源过滤的资源拦截规则有误,此时生成用于标识该资源拦截规则有误的提示信息,以使服务器根据该提示信息更新该资源拦截规则。
再例如,第二预设条件为网页中的图片数量大于或等于1,若过滤后的第一网页中没有图片,则说明对第一网页进行资源过滤的资源拦截规则有误,此时生成用于标识该资源拦截规则有误的提示信息,以使服务器根据该提示信息更新该资源拦截规则。
更新资源拦截规则时,可删除原有的第一网页对应的资源拦截规则,并人工检查资源拦截规则中的错误信息,进而根据该错误信息更新资源拦截规则,以提高资源拦截规则对资源进行过滤的准确性。
综上,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
以上为本申请实施例提供的网页资源的拦截方法,基于同样的思路,本申请实施例还提供一种网页资源的拦截装置。
图2是根据本发明一实施例的一种网页资源的拦截装置的示意性框图,如图2所示,网页资源的拦截装置200应用于服务器端,包括:
第一确定模块210,用于响应于接收到客户端对第一网页的访问请求,根据访问请求的相关访问信息,确定访问请求对应的第一访问者类型;其中,相关访问信息包括客户端信息和/或访问者的个人信息;第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;
第一获取模块220,用于获取预设的资源拦截规则库,资源拦截规则库中包括各访问者类型和与各访问者类型分别对应的资源拦截规则之间的对应关系;
第二获取模块230,用于根据对应关系,获取第一访问者类型所对应的第一资源拦截规则;
下发模块240,用于将第一访问者类型所对应的第一资源拦截规则下发至客户端,以使客户端根据第一资源拦截规则对第一网页进行资源过滤。
在一个实施例中,装置200还包括:
第二确定模块,用于在响应于接收到客户端对第一网页的访问请求之前,根据访问者划分粒度,确定多个访问者类型;
第三确定模块,用于根据各访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各访问者类型分别对应的资源拦截规则;其中,初始拦截规则包括各访问者类型分别对应的资源拦截规则的集合;
第一生成模块,用于分别将各访问者类型和与访问者类型分别对应的资源拦截规则对应存储,以生成资源拦截规则库。
在一个实施例中,第三确定模块包括:
获取单元,用于获取各访问者类型对应的访问者在预设时间段内所访问的多个样本网页;及,获取初始拦截规则;
确定单元,用于利用初始拦截规则分别对各样本网页进行资源过滤,以确定出对各样本网页进行资源过滤时的规则使用信息;其中,规则使用信息包括所使用的第二资源拦截规则、第二资源拦截规则的使用频率、使用次数中的至少一项;
过滤单元,用于根据规则使用信息,分别对初始拦截规则进行过滤,得到访问者类型对应的资源拦截规则。
在一个实施例中,过滤单元还用于:
根据规则使用信息,从初始拦截规则中筛选出满足第一预设条件的第三资源拦截规则,以使第三资源拦截规则从初始拦截规则中过滤出来;
其中,第一预设条件包括以下至少一项:使用频率高于预设频率、使用次数多于预设次数。
在一个实施例中,过滤单元还用于:
按照使用频率和/或使用次数的高低顺序,对筛选出的多个第三资源拦截规则进行排序;
从排序后的多个第三资源拦截规则中选择出前指定数量个第四资源拦截规则,并确定第四资源拦截规则为访问者类型对应的资源拦截规则。
在一个实施例中,装置200还包括:
存储模块,用于将各访问者类型分别对应的资源拦截规则以键值对的形式存储至哈希表中,以使客户端对第一网页进行资源过滤时,能够根据第一网页的标识信息所对应的键查找第一网页对应的资源拦截规则;
其中,资源拦截规则对应的网页标识信息为键值对的键,资源拦截规则为键值对的值。
在一个实施例中,装置200还包括:
检测模块,用于在对第一网页进行资源过滤之后,对过滤后的第一网页中的指定资源进行检测,以判断指定资源是否符合第二预设条件;其中,第二预设条件包括指定资源的数量大于预设阈值;
第二生成模块,用于若指定资源不符合第二预设条件,则生成用于标识第一资源拦截规则有误的提示信息,以使服务器端根据提示信息更新第一资源拦截规则。
在一个实施例中,访问者划分粒度为国家;访问者类型包括各国家的访问者;资源拦截规则库中包括各国家和与各国家分别对应的资源拦截规则之间的对应关系;
下发模块包括:
下发单元,用于将第一访问者类型对应的国家所对应的第一资源拦截规则下发至客户端。
采用本发明实施例的装置,在接收到客户端对第一网页的访问请求时,通过确定访问者类型、及获取预设的资源拦截规则库,并根据资源拦截规则库中各访问者类型与资源拦截规则之间的对应关系,确定本次访问的访问者类型所对应的第一资源拦截规则,进而将第一资源拦截规则下发至客户端,以使客户端根据第一资源拦截规则对第一网页进行资源过滤。可见,该技术方案进行网页资源过滤时,并非是所有的网页资源都采用统一的资源拦截规则,而是采用访问者类型所对应的个性化的资源拦截规则,因此从根本上解决了规则数量过多所引起的内存问题,且保证了资源过滤的准确性。
本领域的技术人员应可理解,上述网页资源的拦截装置能够用来实现前文所述的网页资源的拦截方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
基于同样的思路,本申请实施例还提供一种网页资源的拦截设备,如图3所示。网页资源的拦截设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器301和存储器302,存储器302中可以存储有一个或一个以上存储应用程序或数据。其中,存储器302可以是短暂存储或持久存储。存储在存储器302的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对网页资源的拦截设备中的一系列计算机可执行指令。更进一步地,处理器301可以设置为与存储器302通信,在网页资源的拦截设备上执行存储器302中的一系列计算机可执行指令。网页资源的拦截设备还可以包括一个或一个以上电源303,一个或一个以上有线或无线网络接口304,一个或一个以上输入输出接口305,一个或一个以上键盘306。
具体在本实施例中,网页资源的拦截设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对网页资源的拦截设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;
获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;
根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;
将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
所述响应于接收到客户端对第一网页的访问请求之前,根据所述访问者划分粒度,确定多个访问者类型;
根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则;其中,所述初始拦截规则包括各所述访问者类型分别对应的资源拦截规则的集合;
分别将各所述访问者类型和与所述访问者类型分别对应的资源拦截规则对应存储,以生成所述资源拦截规则库。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
获取各所述访问者类型对应的访问者在预设时间段内所访问的多个样本网页;及,获取所述初始拦截规则;
利用所述初始拦截规则分别对各所述样本网页进行资源过滤,以确定出对各所述样本网页进行资源过滤时的规则使用信息;其中,所述规则使用信息包括所使用的第二资源拦截规则、所述第二资源拦截规则的使用频率、使用次数中的至少一项;
根据所述规则使用信息,分别对所述初始拦截规则进行过滤,得到所述访问者类型对应的资源拦截规则。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
根据所述规则使用信息,从所述初始拦截规则中筛选出满足第一预设条件的第三资源拦截规则,以使所述第三资源拦截规则从所述初始拦截规则中过滤出来;
其中,所述第一预设条件包括以下至少一项:所述使用频率高于预设频率、所述使用次数多于预设次数。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
按照使用频率和/或使用次数的高低顺序,对筛选出的多个所述第三资源拦截规则进行排序;
从排序后的多个所述第三资源拦截规则中选择出前指定数量个第四资源拦截规则,并确定所述第四资源拦截规则为所述访问者类型对应的资源拦截规则。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
将各所述访问者类型分别对应的资源拦截规则以键值对的形式存储至哈希表中,以使所述客户端对所述第一网页进行资源过滤时,能够根据所述第一网页的标识信息所对应的键查找所述第一网页对应的资源拦截规则;
其中,所述资源拦截规则对应的网页标识信息为所述键值对的键,所述资源拦截规则为所述键值对的值。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
在对所述第一网页进行资源过滤之后,对过滤后的所述第一网页中的指定资源进行检测,以判断所述指定资源是否符合第二预设条件;其中,所述第二预设条件包括所述指定资源的数量大于预设阈值;
若否,则生成用于标识所述第一资源拦截规则有误的提示信息,以使所述服务器端根据所述提示信息更新所述第一资源拦截规则。
可选地,所述访问者划分粒度为国家;所述访问者类型包括各国家的访问者;所述资源拦截规则库中包括所述各国家和与所述各国家分别对应的资源拦截规则之间的对应关系;
计算机可执行指令在被执行时,还可以使所述处理器:
将所述第一访问者类型对应的国家所对应的第一资源拦截规则下发至所述客户端。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述网页资源的拦截方法,并具体用于执行:
响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;
获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;
根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;
将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (15)

1.一种网页资源的拦截方法,其特征在于,应用于服务器端,所述方法包括:
响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;
获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;
根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;
将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤;
所述将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,包括:若所述第一资源拦截规则包括多个,则按照各所述第一资源拦截规则的重要程度,向所述客户端下发预定数量个所述第一资源拦截规则。
2.根据权利要求1所述的方法,其特征在于,所述响应于接收到客户端对第一网页的访问请求之前,所述方法还包括:
根据所述访问者划分粒度,确定多个访问者类型;
根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则;其中,所述初始拦截规则包括各所述访问者类型分别对应的资源拦截规则的集合;
分别将各所述访问者类型和与所述访问者类型分别对应的资源拦截规则对应存储,以生成所述资源拦截规则库。
3.根据权利要求2所述的方法,其特征在于,所述根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则,包括:
获取各所述访问者类型对应的访问者在预设时间段内所访问的多个样本网页;及,获取所述初始拦截规则;
利用所述初始拦截规则分别对各所述样本网页进行资源过滤,以确定出对各所述样本网页进行资源过滤时的规则使用信息;其中,所述规则使用信息包括所使用的第二资源拦截规则、所述第二资源拦截规则的使用频率、使用次数中的至少一项;
根据所述规则使用信息,分别对所述初始拦截规则进行过滤,得到各所述访问者类型分别对应的资源拦截规则。
4.根据权利要求3所述的方法,其特征在于,所述根据所述规则使用信息,分别对所述初始拦截规则进行过滤,包括:
根据所述规则使用信息,从所述初始拦截规则中筛选出满足第一预设条件的第三资源拦截规则,以使所述第三资源拦截规则从所述初始拦截规则中过滤出来;
其中,所述第一预设条件包括以下至少一项:所述使用频率高于预设频率、所述使用次数多于预设次数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述规则使用信息,对所述初始拦截规则进行过滤,还包括:
按照使用频率和/或使用次数的高低顺序,对筛选出的多个所述第三资源拦截规则进行排序;
从排序后的多个所述第三资源拦截规则中选择出前指定数量个第四资源拦截规则,并确定所述第四资源拦截规则为所述访问者类型对应的资源拦截规则。
6.根据权利要求2-5中任一项所述的方法,其特征在于,所述方法还包括:
将各所述访问者类型分别对应的资源拦截规则以键值对的形式存储至哈希表中,以使所述客户端对所述第一网页进行资源过滤时,能够根据所述第一网页的标识信息所对应的键查找所述第一网页对应的资源拦截规则;
其中,所述资源拦截规则对应的网页标识信息为所述键值对的键,所述资源拦截规则为所述键值对的值。
7.根据权利要求1所述的方法,其特征在于,在对所述第一网页进行资源过滤之后,所述方法还包括:
对过滤后的所述第一网页中的指定资源进行检测,以判断所述指定资源是否符合第二预设条件;其中,所述第二预设条件包括所述指定资源的数量大于预设阈值;
若否,则生成用于标识所述第一资源拦截规则有误的提示信息,以使所述服务器端根据所述提示信息更新所述第一资源拦截规则。
8.根据权利要求1所述的方法,其特征在于,所述访问者划分粒度为国家;所述访问者类型包括各国家的访问者;所述资源拦截规则库中包括所述各国家和与所述各国家分别对应的资源拦截规则之间的对应关系;
所述将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,包括:
将所述第一访问者类型对应的国家所对应的第一资源拦截规则下发至所述客户端。
9.一种网页资源的拦截装置,其特征在于,应用于服务器端,所述装置包括:
第一确定模块,用于响应于接收到客户端对第一网页的访问请求,根据所述访问请求的相关访问信息,确定所述访问请求对应的第一访问者类型;其中,所述相关访问信息包括客户端信息和/或访问者的个人信息;所述第一访问者类型是根据指定的访问者划分粒度对各访问者进行划分得到的;
第一获取模块,用于获取预设的资源拦截规则库,所述资源拦截规则库中包括各访问者类型和与所述各访问者类型分别对应的资源拦截规则之间的对应关系;
第二获取模块,用于根据所述对应关系,获取所述第一访问者类型所对应的第一资源拦截规则;
下发模块,用于将所述第一访问者类型所对应的第一资源拦截规则下发至所述客户端,以使所述客户端根据所述第一资源拦截规则对所述第一网页进行资源过滤;
所述下发模块,还用于若所述第一资源拦截规则包括多个,则按照各所述第一资源拦截规则的重要程度,向所述客户端下发预定数量个所述第一资源拦截规则。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二确定模块,用于在响应于接收到客户端对第一网页的访问请求之前,根据所述访问者划分粒度,确定多个访问者类型;
第三确定模块,用于根据各所述访问者类型分别对应的访问者所访问的历史网页及初始拦截规则,确定各所述访问者类型分别对应的资源拦截规则;其中,所述初始拦截规则包括各所述访问者类型分别对应的资源拦截规则的集合;
第一生成模块,用于分别将各所述访问者类型和与所述访问者类型分别对应的资源拦截规则对应存储,以生成所述资源拦截规则库。
11.根据权利要求10所述的装置,其特征在于,所述第三确定模块包括:
获取单元,用于获取各所述访问者类型对应的访问者在预设时间段内所访问的多个样本网页;及,获取所述初始拦截规则;
确定单元,用于利用所述初始拦截规则分别对各所述样本网页进行资源过滤,以确定出对各所述样本网页进行资源过滤时的规则使用信息;其中,所述规则使用信息包括所使用的第二资源拦截规则、所述第二资源拦截规则的使用频率、使用次数中的至少一项;
过滤单元,用于根据所述规则使用信息,分别对所述初始拦截规则进行过滤,得到各所述访问者类型分别对应的资源拦截规则。
12.根据权利要求11所述的装置,其特征在于,所述过滤单元还用于:
根据所述规则使用信息,从所述初始拦截规则中筛选出满足第一预设条件的第三资源拦截规则,以使所述第三资源拦截规则从所述初始拦截规则中过滤出来;
其中,所述第一预设条件包括以下至少一项:所述使用频率高于预设频率、所述使用次数多于预设次数。
13.根据权利要求12所述的装置,其特征在于,所述过滤单元还用于:
按照使用频率和/或使用次数的高低顺序,对筛选出的多个所述第三资源拦截规则进行排序;
从排序后的多个所述第三资源拦截规则中选择出前指定数量个第四资源拦截规则,并确定所述第四资源拦截规则为所述访问者类型对应的资源拦截规则。
14.根据权利要求10-13中任一项所述的装置,其特征在于,所述装置还包括:
存储模块,用于将各所述访问者类型分别对应的资源拦截规则以键值对的形式存储至哈希表中,以使所述客户端对所述第一网页进行资源过滤时,能够根据所述第一网页的标识信息所对应的键查找所述第一网页对应的资源拦截规则;
其中,所述资源拦截规则对应的网页标识信息为所述键值对的键,所述资源拦截规则为所述键值对的值。
15.根据权利要求9所述的装置,其特征在于,所述装置还包括:
检测模块,用于在对所述第一网页进行资源过滤之后,对过滤后的所述第一网页中的指定资源进行检测,以判断所述指定资源是否符合第二预设条件;
其中,所述第二预设条件包括所述指定资源的数量大于预设阈值;
第二生成模块,用于若所述指定资源不符合所述第二预设条件,则生成用于标识所述第一资源拦截规则有误的提示信息,以使所述服务器端根据所述提示信息更新所述第一资源拦截规则。
CN201811496787.XA 2018-12-07 2018-12-07 网页资源的拦截方法及装置 Active CN109688205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811496787.XA CN109688205B (zh) 2018-12-07 2018-12-07 网页资源的拦截方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811496787.XA CN109688205B (zh) 2018-12-07 2018-12-07 网页资源的拦截方法及装置

Publications (2)

Publication Number Publication Date
CN109688205A CN109688205A (zh) 2019-04-26
CN109688205B true CN109688205B (zh) 2021-06-22

Family

ID=66186631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811496787.XA Active CN109688205B (zh) 2018-12-07 2018-12-07 网页资源的拦截方法及装置

Country Status (1)

Country Link
CN (1) CN109688205B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110365665A (zh) * 2019-07-01 2019-10-22 珠海天燕科技有限公司 一种广告资源的拦截方法、装置及其设备
CN112181242B (zh) * 2019-07-02 2021-11-02 北京百度网讯科技有限公司 页面展示方法及装置
CN111786940A (zh) * 2020-05-07 2020-10-16 宁波小遛共享信息科技有限公司 一种数据处理方法及装置
CN112149032B (zh) * 2020-09-11 2023-12-08 麒麟合盛网络技术股份有限公司 广告拦截方法及装置
CN113312572A (zh) * 2021-05-17 2021-08-27 深圳市中科明望通信软件有限公司 一种资源处理方法、装置、存储介质及电子设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101035128A (zh) * 2007-04-18 2007-09-12 大连理工大学 基于中文标点符号的三重网页文本内容识别及过滤方法
CN101132404A (zh) * 2007-09-14 2008-02-27 腾讯科技(深圳)有限公司 一种网页内容分级显示系统及方法
CN101309214A (zh) * 2008-06-24 2008-11-19 华为技术有限公司 一种控制网络资源访问的方法及装置
US7769749B2 (en) * 2007-11-13 2010-08-03 Yahoo! Inc. Web page categorization using graph-based term selection
CN102065106A (zh) * 2009-11-16 2011-05-18 中国电信股份有限公司 Web流量梳理器和终端访问Web网页的方法及系统
CN102404114A (zh) * 2010-09-13 2012-04-04 北京中遥地网信息技术有限公司 Web服务监控方法和系统
CN102891826A (zh) * 2011-06-27 2013-01-23 成都市华为赛门铁克科技有限公司 网页访问的控制方法、设备和系统
CN105095236A (zh) * 2014-04-30 2015-11-25 优视科技有限公司 广告过滤方法和装置
CN106027540A (zh) * 2016-06-01 2016-10-12 中青奇未(北京)网络科技有限公司 一种页面拦截方法和系统、以及一种安全桌面
CN106096366A (zh) * 2016-06-08 2016-11-09 北京奇虎科技有限公司 一种信息处理方法、装置和设备
CN106462635A (zh) * 2014-06-20 2017-02-22 微软技术许可有限责任公司 智能网页内容拦截
CN106790589A (zh) * 2016-12-28 2017-05-31 北京奇虎科技有限公司 移动终端客户端中广告过滤方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8015239B2 (en) * 2004-10-19 2011-09-06 Ebay Inc. Method and system to reduce false positives within an automated software-testing environment
CN102857493B (zh) * 2012-06-30 2015-07-08 华为技术有限公司 内容过滤方法和装置
US20180343174A1 (en) * 2012-10-09 2018-11-29 Google Inc. Rule based page processing and network request processing in browsers
CN105591997B (zh) * 2014-10-20 2019-04-09 杭州迪普科技股份有限公司 一种url分类过滤方法及装置
CN106997363A (zh) * 2016-01-26 2017-08-01 华为技术有限公司 一种数据处理方法和设备
US10572924B2 (en) * 2017-01-31 2020-02-25 Walmart Apollo, Llc Automatic generation of featured filters

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101035128A (zh) * 2007-04-18 2007-09-12 大连理工大学 基于中文标点符号的三重网页文本内容识别及过滤方法
CN101132404A (zh) * 2007-09-14 2008-02-27 腾讯科技(深圳)有限公司 一种网页内容分级显示系统及方法
US7769749B2 (en) * 2007-11-13 2010-08-03 Yahoo! Inc. Web page categorization using graph-based term selection
CN101309214A (zh) * 2008-06-24 2008-11-19 华为技术有限公司 一种控制网络资源访问的方法及装置
CN102065106A (zh) * 2009-11-16 2011-05-18 中国电信股份有限公司 Web流量梳理器和终端访问Web网页的方法及系统
CN102404114A (zh) * 2010-09-13 2012-04-04 北京中遥地网信息技术有限公司 Web服务监控方法和系统
CN102891826A (zh) * 2011-06-27 2013-01-23 成都市华为赛门铁克科技有限公司 网页访问的控制方法、设备和系统
CN105095236A (zh) * 2014-04-30 2015-11-25 优视科技有限公司 广告过滤方法和装置
CN106462635A (zh) * 2014-06-20 2017-02-22 微软技术许可有限责任公司 智能网页内容拦截
CN106027540A (zh) * 2016-06-01 2016-10-12 中青奇未(北京)网络科技有限公司 一种页面拦截方法和系统、以及一种安全桌面
CN106096366A (zh) * 2016-06-08 2016-11-09 北京奇虎科技有限公司 一种信息处理方法、装置和设备
CN106790589A (zh) * 2016-12-28 2017-05-31 北京奇虎科技有限公司 移动终端客户端中广告过滤方法及装置

Also Published As

Publication number Publication date
CN109688205A (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
CN109688205B (zh) 网页资源的拦截方法及装置
CN102722563B (zh) 页面显示方法及装置
CN103237094B (zh) 一种识别用户的方法及装置
US20160140232A1 (en) System and Method of Expanding a Search Query
US20190259040A1 (en) Information aggregator and analytic monitoring system and method
US20160140230A1 (en) Implicit Collaborative Searching Based on Search History Database
US20160140130A1 (en) Method of Naming Query Clusters
CN111090797B (zh) 数据获取方法、装置、计算机设备和存储介质
CN107193870B (zh) 网页内容的提取方法和系统
CN103049497A (zh) 用于网址导航的方法和装置
CN109040346B (zh) 一种泛域名解析中有效域名的筛选方法、装置及设备
CN103699544A (zh) 跨页选择数据的方法和系统
CN107526748B (zh) 一种识别用户点击行为的方法和设备
CN110955855B (zh) 一种信息拦截的方法、装置及终端
CN112115328B (zh) 一种页面流量地图构建方法、装置及计算机可读存储介质
CN106897297B (zh) 网站栏目间访问路径的确定方法及装置
CN110825638B (zh) 一种测试案例生成方法、装置、服务器及存储介质
US20160307223A1 (en) Method for determining a user profile in relation to certain web content
WO2017050991A1 (en) Aggregating profile information
EP3341920A1 (en) A method for automatically presenting to a user online content based on the user's preferences as derived from the user's online activity and related system and computer readable medium
US20200349167A1 (en) Method for reducing the computing time of a data processing unit
CN112015910B (zh) 域名知识库的生成方法、装置、计算机设备及存储介质
CN105468688B (zh) 一种站点模板的处理方法及装置
CN114610973A (zh) 信息的搜索匹配方法、装置、计算机设备及存储介质
CN105701232B (zh) 一种基于app信息数据的超文本链接清单推送系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant