CN105512126A - 网页广告过滤隐藏及过滤隐藏规则下发方法和装置 - Google Patents

网页广告过滤隐藏及过滤隐藏规则下发方法和装置 Download PDF

Info

Publication number
CN105512126A
CN105512126A CN201410494363.5A CN201410494363A CN105512126A CN 105512126 A CN105512126 A CN 105512126A CN 201410494363 A CN201410494363 A CN 201410494363A CN 105512126 A CN105512126 A CN 105512126A
Authority
CN
China
Prior art keywords
advertisement
rule
webpage
opened
web page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410494363.5A
Other languages
English (en)
Inventor
吕鹏元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410494363.5A priority Critical patent/CN105512126A/zh
Publication of CN105512126A publication Critical patent/CN105512126A/zh
Pending legal-status Critical Current

Links

Abstract

一种网页广告过滤方法,包括:获取待打开网页的网页标识;向网页标识对应的网页服务器请求待打开网页的主资源,接收网页服务器返回的待打开网页的主资源;向浏览器的后台服务器请求网页标识对应的广告过滤规则,接收后台服务器返回的网页标识对应的广告过滤规则;解析主资源,获取待加载的子资源的URL;判断待加载的子资源的URL是否与所述广告过滤规则相匹配,若是,则不向网页服务器请求所述子资源,若否,则向网页服务器请求所述子资源。上述方法可减少浏览器所在终端过滤网页中的广告所花费的计算资源。此外,还提供一种网页广告过滤装置、网页广告隐藏方法和装置、网页广告过滤规则下发方法和装置、网页广告隐藏规则下发方法和装置。

Description

网页广告过滤隐藏及过滤隐藏规则下发方法和装置
技术领域
本发明涉及网页技术领域,特别是涉及一种网页广告过滤方法和装置,以及一种网页广告隐藏方法和装置,以及一种网页广告过滤规则下发方法和装置,以及一种网页广告隐藏规则下发方法和装置。
背景技术
随着互联网技术的发展,互联网上出现了提供各种服务的网页,网页的种类非常繁多,例如提供搜索功能的搜索类网页、提供新闻信息的新闻类网页、提供交友平台的社交类网页等等。一些网页除了提供实现网页主要功能服务的信息内容之外,还会附带一些广告信息,而广告信息通常是用户不希望看到的内容,过滤网页中的广告信息是用户期望浏览器能实现的。
然而,由于互联网上的广告信息的数量是巨大,而且一般情况下各种广告信息之间也没有特定的共同特征,识别一个网页中的广告信息需要花费庞大的计算资源;而浏览器所在的终端的计算资源一般有限,无法达到识别网页中的广告信息所需资源的要求。
发明内容
基于此,有必要提供一种可减少浏览器所在终端过滤网页中的广告所花费的计算资源的网页广告过滤方法。
一种网页广告过滤方法,包括以下步骤:
获取待打开网页的网页标识;
向所述网页标识对应的网页服务器请求所述待打开网页的主资源,接收所述网页服务器返回的所述待打开网页的主资源;
向浏览器的后台服务器请求所述网页标识对应的广告过滤规则,接收所述后台服务器返回的所述网页标识对应的广告过滤规则;
解析所述主资源,获取待加载的子资源的URL;
判断待加载的子资源的URL是否与所述广告过滤规则相匹配,若是,则不向所述网页服务器请求所述子资源,若否,则向所述网页服务器请求所述子资源。
此外,还有必要提供一种可减少浏览器所在终端过滤网页中的广告所花费的计算资源的网页广告隐藏方法。
一种网页广告隐藏方法,包括以下步骤:
获取待打开网页的网页标识;
向所述网页标识对应的网页服务器请求所述待打开网页的网页资源,接收所述网页服务器返回的所述待打开网页的网页资源;
向浏览器的后台服务器请求所述网页标识对应的广告隐藏规则,接收所述后台服务器返回的所述网页标识对应的广告隐藏规则;
在对所述待打开网页的网页资源进行排版时,将所述待打开网页中网页块标识与所述广告隐藏规则相匹配的网页块进行隐藏。
此外,还有必要提供一种可减少浏览器所在终端过滤网页中的广告所花费的计算资源的网页广告过滤规则下发方法。
一种网页广告过滤规则下发方法,包括以下步骤:
接收浏览器发送的广告过滤规则请求,所述广告过滤规则请求中包括待打开网页的网页标识;
在预先存储的网页标识与广告过滤规则的对应关系中查找所述待打开网页的网页标识对应的广告过滤规则,网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配;
若查找到对应的广告过滤规则,则将查找到的广告过滤规则下发给所述浏览器;
若未查找到对应的广告过滤规则,则根据所述待打开网页的网页标识加载所述待打开网页的网页资源,并在预先设置的广告过滤规则库中查找与所述网页资源匹配的广告过滤规则,存储所述待打开网页的网页标识与所述匹配的广告过滤规则的对应关系。
此外,还有必要提供一种可减少浏览器所在终端过滤网页中的广告所花费的计算资源的网页广告隐藏规则下发方法。
一种网页广告隐藏规则下发方法,包括以下步骤:
接收浏览器发送的广告隐藏规则请求,所述广告过滤规则请求中包括待打开网页的网页标识;
在预先存储的网页标识与广告隐藏规则的对应关系中查找所述待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配;
若查找到对应的广告隐藏规则,则将查找到的广告隐藏规则下发给所述浏览器;
若未查找到对应的广告隐藏规则,则在预先设置的广告隐藏规则库中查找与所述网页资源匹配的广告隐藏规则,存储所述待打开网页的网页标识与所述匹配的广告隐藏规则的对应关系。
此外,还有必要提供一种可减少浏览器所在终端过滤网页中的广告所花费的计算资源的网页广告过滤装置。
一种网页广告过滤装置,包括:
网页标识获取模块,用于获取待打开网页的网页标识;
主资源加载模块,用于向所述网页标识对应的网页服务器请求所述待打开网页的主资源,接收所述网页服务器返回的所述待打开网页的主资源;
过滤规则请求模块,用于向浏览器的后台服务器请求所述网页标识对应的广告过滤规则,接收所述后台服务器返回的所述网页标识对应的广告过滤规则;
主资源解析模块,用于解析所述主资源,获取待加载的子资源的URL;
子资源加载模块,用于判断待加载的子资源的URL是否与所述广告过滤规则相匹配,若是,则不向所述网页服务器请求所述子资源,若否,则向所述网页服务器请求所述子资源。
此外,还有必要提供一种可减少浏览器所在终端过滤网页中的广告所花费的计算资源的网页广告隐藏装置。
一种网页广告隐藏装置,包括:
网页标识获取模块,用于获取待打开网页的网页标识;
网页资源加载模块,用于向所述网页标识对应的网页服务器请求所述待打开网页的网页资源,接收所述网页服务器返回的所述待打开网页的网页资源;
隐藏规则请求模块,用于向浏览器的后台服务器请求所述网页标识对应的广告隐藏规则,接收所述后台服务器返回的所述网页标识对应的广告隐藏规则;
排版模块,用于在对所述待打开网页的网页资源进行排版时,将所述待打开网页中网页块标识与所述广告隐藏规则相匹配的网页块进行隐藏。
此外,还有必要提供一种可减少浏览器所在终端过滤网页中的广告所花费的计算资源的网页广告过滤规则下发装置。
一种网页广告过滤规则下发装置,包括:
过滤请求接收模块,用于接收浏览器发送的广告过滤规则请求,所述广告过滤规则请求中包括待打开网页的网页标识;
过滤规则查找模块,用于在预先存储的网页标识与广告过滤规则的对应关系中查找所述待打开网页的网页标识对应的广告过滤规则,网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配;
过滤规则下发模块,用于若查找到对应的广告过滤规则,则将查找到的广告过滤规则下发给所述浏览器;
过滤规则获取及存储模块,用于若未查找到对应的广告过滤规则,则根据所述待打开网页的网页标识加载所述待打开网页的网页资源,并在预先设置的广告过滤规则库中查找与所述网页资源匹配的广告过滤规则,存储所述待打开网页的网页标识与所述匹配的广告过滤规则的对应关系。
此外,还有必要提供一种可减少浏览器所在终端过滤网页中的广告所花费的计算资源的网页广告隐藏规则下发装置。
一种网页广告隐藏规则下发装置,包括:
隐藏请求接收模块,用于接收浏览器发送的广告隐藏规则请求,所述广告过滤规则请求中包括待打开网页的网页标识;
隐藏规则查找模块,用于在预先存储的网页标识与广告隐藏规则的对应关系中查找所述待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配;
隐藏规则下发模块,用于若查找到对应的广告隐藏规则,则将查找到的广告隐藏规则下发给所述浏览器;
隐藏规则获取及存储模块,用于若未查找到对应的广告隐藏规则,则在预先设置的广告隐藏规则库中查找与所述网页资源匹配的广告隐藏规则,存储所述待打开网页的网页标识与所述匹配的广告隐藏规则的对应关系。
上述网页广告过滤方法和装置,向浏览器的后台服务器请求待打开网页对应的广告过滤规则,并根据请求得到的广告过滤规则确定是否加载待打开网页的子资源,从而达到过滤广告的目的,上述方法和装置不需要根据互联网上已有的海量的广告信息来过滤待打开网页的广告,只需要根据待打开网页对应的广告过滤规则来过滤待打开网页的广告,而一个网页对应的广告过滤规则只有少数的几条,因此极大地节省了浏览器所在终端过滤网页中的广告所花费的计算资源并提高了其过滤网页中的广告的速度。而且,上述方法和装置,对于网页中与广告过滤规则相匹配的子资源,则不向网页服务器请求这些子资源,避免浪费时间以及计算资源在广告子资源的加载上,从而加快了网页资源的加载速度以及节省了网页资源加载所需的计算资源。
上述网页广告隐藏方法和装置,只需要根据待打开网页对应的少数的几条广告隐藏规则来过滤待打开网页的广告,而不是根据海量的广告隐藏规则来过滤待打开网页的广告,因此可极大地节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高其过滤网页中的广告的速度。
上述网页广告过滤规则下发方法和装置,首先在预先存储的网页标识与广告过滤规则的对应关系中查找待打开网页的网页标识对应的广告过滤规则,若查找到,则将查找到的广告过滤规则下发给浏览器,若未查找到,则在预先设置的广告过滤规则库中查找与待打开网页的网页资源匹配的广告过滤规则,存储待打开网页的网页标识与匹配的广告过滤规则的对应关系,以供下一次请求待打开网页对应的广告过滤规则时查询;上述方法和装置为浏览器承担了将网页资源与广告过滤规则库中海量的广告过滤规则相匹配的工作,使得浏览器只需将待打开网页的网页资源与待打开网页对应的广告过滤规则相匹配以过滤其中的广告即可,从而可节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高浏览器过滤网页中的广告的速度。
另外,由于网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配,因此,浏览器在解析加载待打开网页的子资源的过程中,可不加载与待打开网页的广告过滤规则相匹配的子资源,从而可加快浏览器加载待打开网页的网页资源的速度以及节省所需的计算资源。
上述网页广告隐藏规则下发方法和装置,可使得浏览器只需要根据待打开网页对应的少数的几条广告隐藏规则来过滤待打开网页的广告,而不是根据海量的广告隐藏规则来过滤待打开网页的广告,因此可极大地节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高其过滤网页中的广告的速度。
附图说明
图1为一个实施例中的网页广告过滤方法和网页广告过滤规则下发方法的运行环境示意图;
图2为一个实施例中的网页广告过滤方法的流程示意图;
图3为一个实施例中隐藏网页块的过程的流程示意图;
图4为一个实施例中的网页广告隐藏方法的流程示意图;
图5为一个实施例中的网页广告过滤规则下发方法的流程示意图;
图6为一个实施例中下发广告隐藏规则的过程的流程示意图;
图7为一个实施例中的网页广告隐藏规则下发方法的流程示意图;
图8为一个实施例中网页广告过滤方法和网页广告过滤规则下发方法并发运行的时序图;
图9为一个实施例中的网页广告过滤装置的结构示意图;
图10为另一实施例中的网页广告过滤装置的结构示意图;
图11为一个实施例中的网页广告隐藏装置的结构示意图;
图12为一个实施例中的网页广告过滤规则下发装置的结构示意图;
图13为另一实施例中的网页广告过滤规则下发装置的结构示意图;
图14为一个实施例中的网页广告隐藏规则下发装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中的网页广告过滤方法和网页广告过滤规则下发方法的运行环境示意图。如图1所示,该运行环境包括浏览器所在终端100、网页服务器120和浏览器的后台服务器140。其中,浏览器所在终端100可以是台式机、笔记本、个人数字助理、平板电脑等等所有可安装浏览器的设备。在一个实施例中,该运行环境实现网页广告过滤方法和网页广告过滤规则下发方法的过程如下:
浏览器所在终端100获取待打开网页的网页标识。浏览器所在终端100向所述网页标识对应的网页服务器120请求所述待打开网页的主资源,接收所述网页服务器120返回的所述待打开网页的主资源。浏览器所在终端100向浏览器的后台服务器140请求所述网页标识对应的广告过滤规则,后台服务器140接收浏览器发送的广告过滤规则请求,所述广告过滤规则请求中包括待打开网页的网页标识。后台服务器140在预先存储的网页标识与广告过滤规则的对应关系中查找待打开网页的网页标识对应的广告过滤规则,网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配。若未查找到对应的广告过滤规则,则根据待打开网页的网页标识加载待打开网页的网页资源,并在预先设置的广告过滤规则库中查找与该网页资源匹配的广告过滤规则,存储待打开网页的网页标识与匹配的广告过滤规则的对应关系。后台服务器140将待打开网页对应的广告过滤规则下发给浏览器所在终端100,浏览器所在终端100接收后台服务器140返回的广告过滤规则。浏览器所在终端100解析待打开网页的主资源,获取待加载的子资源的URL;判断待加载的子资源的URL是否与广告过滤规则相匹配,若是,则不向网页服务器120请求该子资源,若否,则向网页服务器120请求该子资源。
如图2所示,在一个实施例中,一种网页广告过滤方法,包括以下步骤:
步骤S202,获取待打开网页的网页标识。
网页标识可为网页的URL(UniformResourceLocator,统一资源定位符)。
步骤S204,向网页标识对应的网页服务器请求待打开网页的主资源,接收网页服务器返回的待打开网页的主资源。
网页的URL中包含网页的域名信息,而每一个域名都对应一个网页服务器。步骤S204可解析待打开网页的URL得到待打开网页的域名,并向域名对应的网页服务器请求待打开网页的主资源。
网页的主资源即为网页的html文件,网页的html文件中包含网页的源代码。网页的除主资源以外的其他资源称之为网页的子资源,例如例如,图片、流媒体、JavaScript脚本文件和层叠样式表(CascadingStyleSheets,CSS)资源等。一般的,浏览器下载网页时,先下载网页的主资源,进而解析网页的主资源,当解析到其中包含的子资源的URL时,开始下载该URL对应的子资源。
步骤S206,向浏览器的后台服务器请求网页标识对应的广告过滤规则,接收后台服务器返回的网页标识对应的广告过滤规则。
在一个实施例中,广告过滤规则为正则表达式;一个网页对应的广告过滤规则包括可与该网页中作为广告的子资源的URL相匹配的正则表达式。
后台服务器中可预先存储网页标识与广告过滤规则的对应关系。步骤S206可生成包含待打开网页的网页标识的广告过滤规则请求,将广告过滤规则请求发送到后台服务器。后台服务器接收到包含网页标识的广告过滤规则请求后,可查找该网页标识对应的广告过滤规则,并将广告过滤规则下发到浏览器。
步骤S208,解析待打开网页的主资源,获取待加载的子资源的URL。
步骤S210,判断待加载的子资源的URL是否与广告过滤规则相匹配,若是,则不向网页服务器请求该子资源,若否,则向网页服务器请求该子资源。
上述网页广告过滤方法,向浏览器的后台服务器请求待打开网页对应的广告过滤规则,并根据请求得到的广告过滤规则确定是否加载待打开网页的子资源,从而达到过滤广告的目的,上述方法不需要根据互联网上已有的海量的广告信息来过滤待打开网页的广告,只需要根据待打开网页对应的广告过滤规则来过滤待打开网页的广告,而一个网页对应的广告过滤规则只有少数的几条,因此极大地节省了浏览器所在终端过滤网页中的广告所花费的计算资源并提高了其过滤网页中的广告的速度。而且,上述方法,对于网页中与广告过滤规则相匹配的子资源,则不向网页服务器请求这些子资源,避免浪费时间以及计算资源在广告子资源的加载上,从而加快了网页资源的加载速度以及节省了网页资源加载所需的计算资源。
在一个实施例中,上述网页广告过滤方法还包括隐藏网页块的过程,如图3所示,该过程包括以下步骤:
步骤S302,接收后台服务器返回的待打开网页的网页标识对应的广告隐藏规则。
在一个实施例中,广告隐藏规则为正则表达式;一个网页对应的广告隐藏规则包括可与该网页中作为广告的子资源所在的网页块的网页块标识相匹配的正则表达式。
后台服务器中可预先存储网页标识与广告隐藏规则的对应关系。后台服务器接收到包含网页标识的广告过滤规则请求后,还可查找该网页标识对应的广告隐藏规则,并将广告隐藏规则下发到浏览器。
网页块通过网页标签来进行定义,其包含图像和/或文字等网页元素,且可在网页排版中占有一定区域。例如,div标签定义的一个分区或节即为一个网页块。一个网页块中可包含其它网页块。对网页块可起到标识作用的字符串可作为网页块的网页块标识,例如,div标签中id属性的属性值,等等。
步骤S304,在对待打开网页进行排版时,将待打开网页中网页块标识与广告隐藏规则相匹配的网页块进行隐藏。
在一个实施例中,可设置网页块的style为"display:none",即在定义网页块的网页标签中设置style="display:none"。
仅通过将子资源的URL与广告过滤规则来进行匹配以识别子资源是否为广告,可能还不能达到完全过滤网页中的广告的目的。因为,互联网上广告信息的数量是巨大的,不可能针对每一条广告制定一条广告过滤规则,通常通过抽取多个广告的URL的共性来制定一条广告过滤规则,从而一条广告过滤规则通常可匹配多个作为广告的子资源的URL。在一些情况下,多个广告子资源的URL所具有的共性,一些不是广告的子资源的URL也具有。
例如,图片1的URL为:http://images.sohu.com/bill/1.jpg;图片2的URL为:http://images.sohu.com/bill/2.jpg;图片3的URL为:http://images.sohu.com/bill/3.jpg;其中,图片1和图片2为广告,而图片3不是广告,从而不能制定以下广告过滤规则:||images.sohu.com/bill/,该规则与所有以“images.sohu.com/bill/”开头的URL相匹配。从而,无法通过将子资源的URL与广告过滤规则进行匹配来过滤图片1和图片2。
由于任意一个子资源都包含在一个网页块中,后台服务器可预先提取网页中作为广告的子资源在网页中所在的网页块的网页块标识,根据提取的网页块标识制定广告隐藏规则。本实施例中,浏览器在对待打开网页进行排版时,将待打开网页中网页块标识与广告隐藏规则相匹配的网页块进行隐藏,作为上述广告识别手段(将子资源的URL与广告过滤规则进行匹配以识别子资源是否为广告)的补充手段,可以达到完全过滤待打开网页中的广告的目的。
而且,本实施例中只需要根据待打开网页对应的少数的几条广告隐藏规则来过滤待打开网页的广告,而不是根据海量的广告隐藏规则来过滤待打开网页的广告,因此可极大地节省了浏览器所在终端过滤网页中的广告所花费的计算资源并可提高其过滤网页中的广告的速度。
在一个实施例中,待打开网页中网页块标识与上述广告隐藏规则相匹配的网页块包括待打开网页中与上述广告过滤规则相匹配的子资源所在的网页块。即,在待打开网页中,若某一个子资源的URL与待打开网页的广告过滤规则相匹配,则该子资源所在的网页块的网页块标识与待打开网页的广告隐藏规则相匹配。
步骤S210中,若一个子资源的URL与广告过滤规则相匹配,则不向网页服务器请求该子资源,但该子资源所在的网页块还是存在的。因为该子资源没有被下载,因此,该子资源所在的网页块在网页中对应的区域可能呈现白色。本实施例中,在对待打开网页进行排版时,将其中网页块标识与广告隐藏规则相匹配的网页块进行隐藏,从而可避免被确定为广告的子资源没有被下载时,其所在的网页块在网页中对应的区域留白的问题。
如图4所示,在一个实施例中,一种网页广告隐藏方法,包括以下步骤:
步骤S402,获取待打开网页的网页标识。
步骤S404,向网页标识对应的网页服务器请求待打开网页的网页资源,接收网页服务器返回的待打开网页的网页资源。
步骤S406,向浏览器的后台服务器请求网页标识对应的广告隐藏规则,接收后台服务器返回的网页标识对应的广告隐藏规则。
在一个实施例中,广告隐藏规则为正则表达式;一个网页对应的广告隐藏规则包括可与该网页中作为广告的子资源所在的网页块的网页块标识相匹配的正则表达式。
步骤S408,在对待打开网页的网页资源进行排版时,将待打开网页中网页块标识与广告隐藏规则相匹配的网页块进行隐藏。
本实施例中只需要根据待打开网页对应的少数的几条广告隐藏规则来过滤待打开网页的广告,而不是根据海量的广告隐藏规则来过滤待打开网页的广告,因此可极大地节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高其过滤网页中的广告的速度。
如图5所示,一种网页广告过滤规则下发方法,包括以下步骤:
步骤S502,接收浏览器发送的广告过滤规则请求,该广告过滤规则请求中包括待打开网页的网页标识。
在一个实施例中,网页标识可为网页域名或网页URL。
步骤S504,在预先存储的网页标识与广告过滤规则的对应关系中查找待打开网页的网页标识对应的广告过滤规则,网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配;若查找到对应的广告过滤规则(即查找成功),则执行步骤S506,若未查找到对应的广告过滤规则(即查找失败),则执行步骤S508。
在预先存储的网页标识与广告过滤规则的对应关系中,一个网页标识对应的广告过滤规则与该网页标识对应的网页中作为广告的子资源的URL相匹配。
步骤S506,将查找到的广告过滤规则下发给浏览器。
步骤S508,根据待打开网页的网页标识加载待打开网页的网页资源,并在预先设置的广告过滤规则库中查找与待打开网页的网页资源匹配的广告过滤规则,存储待打开网页的网页标识与匹配的广告过滤规则的对应关系。
在一个实施例中,预先设置的广告过滤规则库中包含了与互联网上的作为广告的子资源的URL相匹配的正则表达式。在一个实施例中,可提取标记为广告的多个子资源的URL的共同特征来得到广告过滤规则库中的广告过滤规则,从而使得一条广告过滤规则可匹配多条作为广告的子资源的URL。
在一个实施例中,步骤S508包括以下步骤:向网页标识对应的网页服务器请求待打开网页的主资源,接收网页服务器返回的待打开网页的主资源,解析待打开网页的主资源,获取待打开网页中子资源的URL,并将待打开网页的子资源的URL与预先设置的广告过滤规则库中的广告过滤规则进行匹配,收集匹配的广告过滤规则,存储待打开网页的网页标识与匹配的广告过滤规则的对应关系。
在一个实施例中,步骤S508可在步骤S504未查找到对应的广告过滤规则后即刻执行,在步骤S508在预先设置的广告过滤规则库中查找到与待打开网页的网页资源匹配的广告过滤规则后,可将匹配的广告过滤规则下发给发起广告过滤规则请求的浏览器。
在另一个实施例中,步骤S508也可与步骤S504异步执行,即步骤S508可在步骤S504执行后的一段时间之后执行或者/以及步骤S508与步骤S504可由不同的执行主体执行。本实施例中,步骤S508存储的待打开网页的网页标识与匹配的广告过滤规则的对应关系,可供下一次接收到浏览器发送的广告过滤规则请求之后查询使用。
上述网页广告过滤规则下发方法,首先在预先存储的网页标识与广告过滤规则的对应关系中查找待打开网页的网页标识对应的广告过滤规则,若查找到,则将查找到的广告过滤规则下发给浏览器,若未查找到,则在预先设置的广告过滤规则库中查找与待打开网页的网页资源匹配的广告过滤规则,存储待打开网页的网页标识与匹配的广告过滤规则的对应关系,以供下一次请求待打开网页对应的广告过滤规则时查询;上述方法为浏览器承担了将网页资源与广告过滤规则库中海量的广告过滤规则相匹配的工作,使得浏览器只需将待打开网页的网页资源与待打开网页对应的广告过滤规则相匹配以过滤其中的广告即可,从而可节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高浏览器过滤网页中的广告的速度。
另外,由于网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配,因此,浏览器在解析加载待打开网页的子资源的过程中,可不加载与待打开网页的广告过滤规则相匹配的子资源,从而可加快浏览器加载待打开网页的网页资源的速度以及节省所需的计算资源。
如图6所示,在一个实施例中,上述网页广告过滤规则下发方法还包括下发广告隐藏规则的过程,该过程包括以下步骤:
步骤S602,在预先存储的网页标识与广告隐藏规则的对应关系中查找待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配;若查找到对应的广告隐藏规则(即查找成功),则执行步骤S604,若未查找到对应的广告隐藏规则(即查找失败),则执行步骤S606。
在预先存储的网页标识与广告隐藏规则的对应关系中,一个网页标识对应的广告隐藏规则与该网页标识对应的网页中作为广告的子资源所在的网页块的网页块标识相匹配。
步骤S604,将查找到的广告隐藏规则下发给浏览器。
步骤S606,在预先设置的广告隐藏规则库中查找与网页资源匹配的广告隐藏规则,存储待打开网页的网页标识与匹配的广告隐藏规则的对应关系。
在一个实施例中,预先设置的广告隐藏规则库中包含了与互联网上的作为广告的子资源所在的网页块的网页块标识相匹配的正则表达式。在一个实施例中,可提取标记为广告的子资源所在的网页块的网页块标识,根据提取的网页块标识生成作为广告隐藏规则的正则表达式,将生成的正则表达式存入广告隐藏规则库中。
在一个实施例中,步骤S606包括以下步骤:将待打开网页的网页资源中各个网页块的网页块标识与预先设置的广告隐藏规则库中的广告隐藏规则进行匹配,收集匹配的广告隐藏规则,存储待打开网页的网页标识与匹配的广告隐藏规则的对应关系。
在一个实施例中,步骤S606可在步骤S602未查找到对应的广告隐藏规则后即刻执行,在步骤S606在预先设置的广告隐藏规则库中查找到与待打开网页的网页资源匹配的广告隐藏规则后,可将匹配的广告隐藏规则下发给发起广告过滤规则请求的浏览器。
在另一个实施例中,步骤S606也可与步骤S602异步执行,即步骤S606可在步骤S602执行后的一段时间之后执行或者/以及步骤S606与步骤S602可由不同的执行主体执行。本实施例中,步骤S606存储的待打开网页的网页标识与匹配的广告隐藏规则的对应关系,可供下一次接收到浏览器发送的广告过滤规则请求之后查询使用。
上述方法为浏览器承担了将网页资源与广告隐藏规则库中海量的广告隐藏规则相匹配的工作,使得浏览器只需将待打开网页的网页资源与待打开网页对应的广告隐藏规则相匹配以过滤其中的广告即可,从而可节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高浏览器过滤网页中的广告的速度。
在一个实施例中,同一网页中,网页块标识与该网页对应的广告隐藏规则相匹配的网页块包括与该网页对应的广告过滤规则相匹配的子资源所在的网页块。即,在上述预先存储的网页标识与广告过滤规则的对应关系以及上述预先存储的网页标识与广告隐藏规则的对应关系中,一网页标识对应的广告过滤规则所匹配的子资源所在的网页块的网页块标识,与该网页标识对应的广告隐藏规则相匹配。
本实施例中,可在提取标记为广告的多个子资源的URL的共同特征来得到广告过滤规则库中的广告过滤规则的同时,分别提取该多个子资源所在的网页块的网页块标识,根据提取的网页块标识生成作为广告隐藏规则的多个正则表达式,将生成的多个正则表达式存入广告隐藏规则库中。
本实施例可使得浏览器根据广告过滤规则对确定为广告的子资源不进行下载,并使得浏览器将没有下载的子资源所在的网页块进行隐藏,从而可避免被确定为广告的子资源没有被下载时,其所在的网页块在网页中对应的区域留白的问题。
如图7所示,在一个实施例中,一种网页广告隐藏规则下发方法,包括以下步骤:
步骤S702,接收浏览器发送的广告隐藏规则请求,广告过滤规则请求中包括待打开网页的网页标识。
步骤S704,在预先存储的网页标识与广告隐藏规则的对应关系中查找待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配;若查找到对应的广告隐藏规则(即查找成功),则步骤S706;若未查找到对应的广告隐藏规则(即查找失败),则执行步骤S708。
步骤S706,将查找到的广告隐藏规则下发给浏览器。
步骤S708,在预先设置的广告隐藏规则库中查找与待打开网页的网页资源匹配的广告隐藏规则,存储待打开网页的网页标识与匹配的广告隐藏规则的对应关系。
在一个实施例中,步骤S708包括以下步骤:将待打开网页的网页资源中各个网页块的网页块标识与预先设置的广告隐藏规则库中的广告隐藏规则进行匹配,收集匹配的广告隐藏规则,存储待打开网页的网页标识与匹配的广告隐藏规则的对应关系。
在一个实施例中,在预先设置的广告隐藏规则库中查找到与待打开网页的网页资源匹配的广告隐藏规则后,可将匹配的广告隐藏规则下发给发起广告隐藏规则请求的浏览器,在另一个实施例中,也可不进行此下发操作,步骤S708存储的待打开网页的网页标识与匹配的广告隐藏规则的对应关系,可供下一次接收到浏览器发送的广告隐藏规则请求之后查询使用。
本实施例中可使得浏览器只需要根据待打开网页对应的少数的几条广告隐藏规则来过滤待打开网页的广告,而不是根据海量的广告隐藏规则来过滤待打开网页的广告,因此可极大地节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高其过滤网页中的广告的速度。
图8为一个实施例中网页广告过滤方法和网页广告过滤规则下发方法并发运行的时序图。如图8所示,浏览器所在终端、浏览器的后台服务器以及网页服务器协作实现一个实施例中的网页广告过滤方法和网页广告过滤规则下发方法的过程如下:
(1)浏览器所在终端获取待打开网页的网页标识。
(2)浏览器所在终端向网页标识对应的网页服务器请求待打开网页的主资源。
(3)浏览器所在终端向浏览器的后台服务器请求网页标识对应的广告过滤规则,后台服务器接收浏览器发送的广告过滤规则请求,该广告过滤规则请求中包括待打开网页的网页标识。
(4.1)后台服务器在预先存储的网页标识与广告过滤规则的对应关系中查找待打开网页的网页标识对应的广告过滤规则,网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配;(4.2)若未查找到对应的广告过滤规则,则根据待打开网页的网页标识加载待打开网页的网页资源;(4.3)在预先设置的广告过滤规则库中查找与待打开网页的网页资源匹配的广告过滤规则,存储待打开网页的网页标识与匹配的广告过滤规则的对应关系。
(5)后台服务器将待打开网页的网页标识对应的广告过滤规则下发给浏览器;浏览器所在终端接收后台服务器返回的待打开网页的网页标识对应的广告过滤规则。
(6)浏览器所在终端接收网页服务器返回的待打开网页的主资源。
(7)浏览器所在终端解析待打开网页的主资源,获取待加载的子资源的URL;判断待加载的子资源的URL是否与广告过滤规则相匹配,若是,则不向网页服务器请求该子资源,若否,则向网页服务器请求该子资源。
(8)后台服务器在预先存储的网页标识与广告隐藏规则的对应关系中查找待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配;若未查找到对应的广告隐藏规则,则在预先设置的广告隐藏规则库中查找与网页资源匹配的广告隐藏规则,存储待打开网页的网页标识与匹配的广告隐藏规则的对应关系。
(9)后台服务器将待打开网页的网页标识对应的广告隐藏规则下发给浏览器;浏览器所在终端接收后台服务器返回的待打开网页的网页标识对应的广告隐藏规则。
(10)浏览器所在终端在对待打开网页进行排版时,将待打开网页中网页块标识与广告隐藏规则相匹配的网页块进行隐藏。
在一个实施例中,上述的步骤(5)和(9)可合并执行,即,后台服务器将待打开网页的网页标识对应的广告过滤规则和广告隐藏规则一起下发给浏览器;浏览器所在终端接收后台服务器返回的待打开网页的网页标识对应的广告过滤规则和广告隐藏规则。
如图9所示,在一个实施例中,一种网页广告过滤装置,包括网页标识获取模块902、主资源加载模块904、过滤规则请求模块906、主资源解析模块908和子资源加载模块910,其中:
网页标识获取模块902用于获取待打开网页的网页标识。
网页标识可为网页的URL(UniformResourceLocator,统一资源定位符)。
主资源加载模块904用于向网页标识对应的网页服务器请求待打开网页的主资源,接收网页服务器返回的待打开网页的主资源。
网页的URL中包含网页的域名信息,而每一个域名都对应一个网页服务器。主资源加载模块904可解析待打开网页的URL得到待打开网页的域名,并向域名对应的网页服务器请求待打开网页的主资源。
网页的主资源即为网页的html文件,网页的html文件中包含网页的源代码。网页的除主资源以外的其他资源称之为网页的子资源,例如例如,图片、流媒体、JavaScript脚本文件和层叠样式表(CascadingStyleSheets,CSS)资源等。一般的,浏览器下载网页时,先下载网页的主资源,进而解析网页的主资源,当解析到其中包含的子资源的URL时,开始下载该URL对应的子资源。
过滤规则请求模块906用于向浏览器的后台服务器请求网页标识对应的广告过滤规则,接收后台服务器返回的网页标识对应的广告过滤规则。
在一个实施例中,广告过滤规则为正则表达式;一个网页对应的广告过滤规则包括可与该网页中作为广告的子资源的URL相匹配的正则表达式。
后台服务器中可预先存储网页标识与广告过滤规则的对应关系。过滤规则请求模块906生成包含待打开网页的网页标识的广告过滤规则请求,将广告过滤规则请求发送到后台服务器。后台服务器接收到包含网页标识的广告过滤规则请求后,可查找该网页标识对应的广告过滤规则,并将广告过滤规则下发到浏览器。
主资源解析模块908用于解析待打开网页的主资源,获取待加载的子资源的URL。
子资源加载模块910用于判断待加载的子资源的URL是否与广告过滤规则相匹配,若是,则不向网页服务器请求该子资源,若否,则向网页服务器请求该子资源。
上述网页广告过滤装置,向浏览器的后台服务器请求待打开网页对应的广告过滤规则,并根据请求得到的广告过滤规则确定是否加载待打开网页的子资源,从而达到过滤广告的目的,上述装置不需要根据互联网上已有的海量的广告信息来过滤待打开网页的广告,只需要根据待打开网页对应的广告过滤规则来过滤待打开网页的广告,而一个网页对应的广告过滤规则只有少数的几条,因此极大地节省了浏览器所在终端过滤网页中的广告所花费的计算资源并提高了其过滤网页中的广告的速度。而且,上述装置,对于网页中与广告过滤规则相匹配的子资源,则不向网页服务器请求这些子资源,避免浪费时间以及计算资源在广告子资源的加载上,从而加快了网页资源的加载速度以及节省了网页资源加载所需的计算资源。
如图10所示,在一个实施例中,上述网页广告过滤装置还包括隐藏规则接收模块1002和排版模块1004,其中:
隐藏规则接收模块1002用于接收后台服务器返回的待打开网页的网页标识对应的广告隐藏规则。
在一个实施例中,广告隐藏规则为正则表达式;一个网页对应的广告隐藏规则包括可与该网页中作为广告的子资源所在的网页块的网页块标识相匹配的正则表达式。
后台服务器中可预先存储网页标识与广告隐藏规则的对应关系。后台服务器接收到包含网页标识的广告过滤规则请求后,还可查找该网页标识对应的广告隐藏规则,并将广告隐藏规则下发到浏览器。
网页块通过网页标签来进行定义,其包含图像和/或文字等网页元素,且可在网页排版中占有一定区域。例如,div标签定义的一个分区或节即为一个网页块。一个网页块中可包含其它网页块。对网页块可起到标识作用的字符串可作为网页块的网页块标识,例如,div标签中id属性的属性值,等等。
排版模块1004用于在对待打开网页进行排版时,将待打开网页中网页块标识与广告隐藏规则相匹配的网页块进行隐藏。
在一个实施例中,排版模块1004可设置网页块的style为"display:none",即在定义网页块的网页标签中设置style="display:none"。
仅通过将子资源的URL与广告过滤规则来进行匹配以识别子资源是否为广告,可能还不能达到完全过滤网页中的广告的目的。因为,互联网上广告信息的数量是巨大的,不可能针对每一条广告制定一条广告过滤规则,通常通过抽取多个广告的URL的共性来制定一条广告过滤规则,从而一条广告过滤规则通常可匹配多个作为广告的子资源的URL。在一些情况下,多个广告子资源的URL所具有的共性,一些不是广告的子资源的URL也具有。
由于任意一个子资源都包含在一个网页块中,后台服务器可预先提取网页中作为广告的子资源在网页中所在的网页块的网页块标识,根据提取的网页块标识制定广告隐藏规则。本实施例中,在对待打开网页进行排版时,将待打开网页中网页块标识与广告隐藏规则相匹配的网页块进行隐藏,作为上述广告识别手段(将子资源的URL与广告过滤规则进行匹配以识别子资源是否为广告)的补充手段,可以达到完全过滤待打开网页中的广告的目的。
而且,本实施例中只需要根据待打开网页对应的少数的几条广告隐藏规则来过滤待打开网页的广告,而不是根据海量的广告隐藏规则来过滤待打开网页的广告,因此可极大地节省了浏览器所在终端过滤网页中的广告所花费的计算资源并可提高其过滤网页中的广告的速度。
在一个实施例中,待打开网页中网页块标识与上述广告隐藏规则相匹配的网页块包括待打开网页中与上述广告过滤规则相匹配的子资源所在的网页块。即,在待打开网页中,若某一个子资源的URL与待打开网页的广告过滤规则相匹配,则该子资源所在的网页块的网页块标识与待打开网页的广告隐藏规则相匹配。
若一个子资源的URL与广告过滤规则相匹配,则子资源加载模块910不向网页服务器请求该子资源,但该子资源所在的网页块还是存在的。因为该子资源没有被下载,因此,该子资源所在的网页块在网页中对应的区域可能呈现白色。本实施例中,在对待打开网页进行排版时,将其中网页块标识与广告隐藏规则相匹配的网页块进行隐藏,从而可避免被确定为广告的子资源没有被下载时,其所在的网页块在网页中对应的区域留白的问题。
如图11所示,在一个实施例中,一种网页广告隐藏装置,包括网页标识获取模块1102、网页资源加载模块1104、隐藏规则请求模块1106和排版模块1108,其中:
网页标识获取模块1102用于获取待打开网页的网页标识。
网页资源加载模块1104用于向网页标识对应的网页服务器请求待打开网页的网页资源,接收网页服务器返回的待打开网页的网页资源。
隐藏规则请求模块1106用于向浏览器的后台服务器请求网页标识对应的广告隐藏规则,接收后台服务器返回的网页标识对应的广告隐藏规则。
在一个实施例中,广告隐藏规则为正则表达式;一个网页对应的广告隐藏规则包括可与该网页中作为广告的子资源所在的网页块的网页块标识相匹配的正则表达式。
排版模块1108用于在对待打开网页的网页资源进行排版时,将待打开网页中网页块标识与广告隐藏规则相匹配的网页块进行隐藏。
本实施例中只需要根据待打开网页对应的少数的几条广告隐藏规则来过滤待打开网页的广告,而不是根据海量的广告隐藏规则来过滤待打开网页的广告,因此可极大地节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高其过滤网页中的广告的速度。
如图12所示,一种网页广告过滤规则下发装置,包括过滤请求接收模块1202、过滤规则查找模块1204、过滤规则下发模块1206和过滤规则获取及存储模块1208,其中:
过滤请求接收模块1202用于接收浏览器发送的广告过滤规则请求,该广告过滤规则请求中包括待打开网页的网页标识。
在一个实施例中,网页标识可为网页域名或网页URL。
过滤规则查找模块1204用于在预先存储的网页标识与广告过滤规则的对应关系中查找待打开网页的网页标识对应的广告过滤规则,网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配。在预先存储的网页标识与广告过滤规则的对应关系中,一个网页标识对应的广告过滤规则与该网页标识对应的网页中作为广告的子资源的URL相匹配。
过滤规则下发模块1206用于若查找到对应的广告过滤规则,将查找到的广告过滤规则下发给浏览器。
过滤规则获取及存储模块1208用于若未查找到对应的广告过滤规则,则根据待打开网页的网页标识加载待打开网页的网页资源,并在预先设置的广告过滤规则库中查找与待打开网页的网页资源匹配的广告过滤规则,存储待打开网页的网页标识与匹配的广告过滤规则的对应关系。
在一个实施例中,过滤规则获取及存储模块1208可向网页标识对应的网页服务器请求待打开网页的主资源,接收网页服务器返回的待打开网页的主资源,解析待打开网页的主资源,获取待打开网页中子资源的URL,并将待打开网页的子资源的URL与预先设置的广告过滤规则库中的广告过滤规则进行匹配,收集匹配的广告过滤规则,存储待打开网页的网页标识与匹配的广告过滤规则的对应关系。
在一个实施例中,过滤规则下发模块1206还用于将过滤规则获取及存储模块1208查找到的匹配的广告过滤规则下发给发起广告过滤规则请求的浏览器。在另一个实施例中,过滤规则下发模块1206可不下发匹配的广告过滤规则,过滤规则获取及存储模块1208存储的待打开网页的网页标识与匹配的广告过滤规则的对应关系,可供下一次接收到浏览器发送的广告过滤规则请求之后查询使用。
在一个实施例中,预先设置的广告过滤规则库中包含了与互联网上的作为广告的子资源的URL相匹配的正则表达式。在一个实施例中,上述网页广告过滤规则下发装置还包括过滤规则库建立模块(图中未示出),用于提取标记为广告的多个子资源的URL的共同特征来得到广告过滤规则库中的广告过滤规则,从而使得一条广告过滤规则可匹配多条作为广告的子资源的URL。
上述网页广告过滤规则下发装置,首先在预先存储的网页标识与广告过滤规则的对应关系中查找待打开网页的网页标识对应的广告过滤规则,若查找到,则将查找到的广告过滤规则下发给浏览器,若未查找到,则在预先设置的广告过滤规则库中查找与待打开网页的网页资源匹配的广告过滤规则,存储待打开网页的网页标识与匹配的广告过滤规则的对应关系,以供下一次请求待打开网页对应的广告过滤规则时查询;上述装置为浏览器承担了将网页资源与广告过滤规则库中海量的广告过滤规则相匹配的工作,使得浏览器只需将待打开网页的网页资源与待打开网页对应的广告过滤规则相匹配以过滤其中的广告即可,从而可节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高浏览器过滤网页中的广告的速度。
另外,由于网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配,因此,浏览器在解析加载待打开网页的子资源的过程中,可不加载与待打开网页的广告过滤规则相匹配的子资源,从而可加快浏览器加载待打开网页的网页资源的速度以及节省所需的计算资源。
如图13所示,在一个实施例中,上述网页广告过滤规则下发装置还包括隐藏规则查找模块1302、隐藏规则下发模块1304和隐藏规则获取及存储模块1306,其中:
隐藏规则查找模块1302用于在预先存储的网页标识与广告隐藏规则的对应关系中查找待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配。在预先存储的网页标识与广告隐藏规则的对应关系中,一个网页标识对应的广告隐藏规则与该网页标识对应的网页中作为广告的子资源所在的网页块的网页块标识相匹配。
隐藏规则下发模块1304用于若查找到对应的广告隐藏规则,则将查找到的广告隐藏规则下发给浏览器。
隐藏规则获取及存储模块1306用于若未查找到对应的广告隐藏规则,则在预先设置的广告隐藏规则库中查找与网页资源匹配的广告隐藏规则,存储待打开网页的网页标识与匹配的广告隐藏规则的对应关系。
在一个实施例中,隐藏规则获取及存储模块1306可将待打开网页的网页资源中各个网页块的网页块标识与预先设置的广告隐藏规则库中的广告隐藏规则进行匹配,收集匹配的广告隐藏规则,存储待打开网页的网页标识与匹配的广告隐藏规则的对应关系。
在一个实施例中,隐藏规则下发模块1304还用于将隐藏规则获取及存储模块1306查找到的匹配的广告隐藏规则下发给发起过滤规则请求的浏览器。在另一个实施例中,隐藏规则下发模块1304可不下发匹配的广告隐藏规则,隐藏规则获取及存储模块1306存储的待打开网页的网页标识与匹配的广告隐藏规则的对应关系,可供下一次接收到浏览器发送的广告过滤规则请求之后查询使用。
在一个实施例中,预先设置的广告隐藏规则库中包含了与互联网上的作为广告的子资源所在的网页块的网页块标识相匹配的正则表达式。在一个实施例中,上述广告过滤规则下发装置还包括隐藏规则库建立模块(图中未示出),用于提取标记为广告的子资源所在的网页块的网页块标识,根据提取的网页块标识生成作为广告隐藏规则的正则表达式,将生成的正则表达式存入广告隐藏规则库中。
上述装置为浏览器承担了将网页资源与广告隐藏规则库中海量的广告隐藏规则相匹配的工作,使得浏览器只需将待打开网页的网页资源与待打开网页对应的广告隐藏规则相匹配以过滤其中的广告即可,从而可节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高浏览器过滤网页中的广告的速度。
在一个实施例中,同一网页中,网页块标识与该网页对应的广告隐藏规则相匹配的网页块包括与该网页对应的广告过滤规则相匹配的子资源所在的网页块。即,在上述预先存储的网页标识与广告过滤规则的对应关系以及上述预先存储的网页标识与广告隐藏规则的对应关系中,一网页标识对应的广告过滤规则所匹配的子资源所在的网页块的网页块标识,与该网页标识对应的广告隐藏规则相匹配。
本实施例中,在过滤规则库建立模块提取标记为广告的多个子资源的URL的共同特征来得到广告过滤规则库中的广告过滤规则的同时,隐藏规则库建立模块可分别提取该多个子资源所在的网页块的网页块标识,根据提取的网页块标识生成作为广告隐藏规则的多个正则表达式,将生成的多个正则表达式存入广告隐藏规则库中。
本实施例可使得浏览器根据广告过滤规则对确定为广告的子资源不进行下载,并使得浏览器将没有下载的子资源所在的网页块进行隐藏,从而可避免被确定为广告的子资源没有被下载时,其所在的网页块在网页中对应的区域留白的问题。
如图7所示,在一个实施例中,一种网页广告隐藏规则下发装置,包括隐藏请求接收模块1402、隐藏规则查找模块1404、隐藏规则下发模块1406和隐藏规则获取及存储模块1408,其中:
隐藏请求接收模块1402用于接收浏览器发送的广告隐藏规则请求,广告过滤规则请求中包括待打开网页的网页标识。
隐藏规则查找模块1404用于在预先存储的网页标识与广告隐藏规则的对应关系中查找待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配。
隐藏规则下发模块1406用于若查找到对应的广告隐藏规则,则将查找到的广告隐藏规则下发给浏览器。
隐藏规则获取及存储模块1408用于若未查找到对应的广告隐藏规则,则在预先设置的广告隐藏规则库中查找与待打开网页的网页资源匹配的广告隐藏规则,存储待打开网页的网页标识与匹配的广告隐藏规则的对应关系。
在一个实施例中,隐藏规则获取及存储模块1408可将待打开网页的网页资源中各个网页块的网页块标识与预先设置的广告隐藏规则库中的广告隐藏规则进行匹配,收集匹配的广告隐藏规则,存储待打开网页的网页标识与匹配的广告隐藏规则的对应关系。
隐藏规则下发模块1304还用于将隐藏规则获取及存储模块1306查找到的匹配的广告隐藏规则下发给发起过滤规则请求的浏览器。
在一个实施例中,隐藏规则下发模块1406还用于将隐藏规则获取及存储模块1408查找到手匹配的广告隐藏规则下发给发起隐藏规则请求的浏览器。在另一个实施例中,隐藏规则下发模块1406可不下发匹配的广告隐藏规则,隐藏规则获取及存储模块1408存储的待打开网页的网页标识与匹配的广告隐藏规则的对应关系,可供下一次接收到浏览器发送的广告隐藏规则请求之后查询使用。
本实施例中可使得浏览器只需要根据待打开网页对应的少数的几条广告隐藏规则来过滤待打开网页的广告,而不是根据海量的广告隐藏规则来过滤待打开网页的广告,因此可极大地节省浏览器所在终端过滤网页中的广告所花费的计算资源并可提高其过滤网页中的广告的速度。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (16)

1.一种网页广告过滤方法,包括以下步骤:
获取待打开网页的网页标识;
向所述网页标识对应的网页服务器请求所述待打开网页的主资源,接收所述网页服务器返回的所述待打开网页的主资源;
向浏览器的后台服务器请求所述网页标识对应的广告过滤规则,接收所述后台服务器返回的所述网页标识对应的广告过滤规则;
解析所述主资源,获取待加载的子资源的URL;
判断待加载的子资源的URL是否与所述广告过滤规则相匹配,若是,则不向所述网页服务器请求所述子资源,若否,则向所述网页服务器请求所述子资源。
2.根据权利要求1所述的网页广告过滤方法,其特征在于,所述方法还包括:
接收所述后台服务器返回的所述待打开网页的网页标识对应的广告隐藏规则;
在对所述待打开网页进行排版时,将所述待打开网页中网页块标识与所述广告隐藏规则相匹配的网页块进行隐藏。
3.根据权利要求2所述的网页广告过滤方法,其特征在于,所述待打开网页中网页块标识与所述广告隐藏规则相匹配的网页块包括所述待打开网页中与所述广告过滤规则相匹配的子资源所在的网页块。
4.一种网页广告隐藏方法,包括以下步骤:
获取待打开网页的网页标识;
向所述网页标识对应的网页服务器请求所述待打开网页的网页资源,接收所述网页服务器返回的所述待打开网页的网页资源;
向浏览器的后台服务器请求所述网页标识对应的广告隐藏规则,接收所述后台服务器返回的所述网页标识对应的广告隐藏规则;
在对所述待打开网页的网页资源进行排版时,将所述待打开网页中网页块标识与所述广告隐藏规则相匹配的网页块进行隐藏。
5.一种网页广告过滤规则下发方法,包括以下步骤:
接收浏览器发送的广告过滤规则请求,所述广告过滤规则请求中包括待打开网页的网页标识;
在预先存储的网页标识与广告过滤规则的对应关系中查找所述待打开网页的网页标识对应的广告过滤规则,网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配;
若查找到对应的广告过滤规则,则将查找到的广告过滤规则下发给所述浏览器;
若未查找到对应的广告过滤规则,则根据所述待打开网页的网页标识加载所述待打开网页的网页资源,并在预先设置的广告过滤规则库中查找与所述网页资源匹配的广告过滤规则,存储所述待打开网页的网页标识与所述匹配的广告过滤规则的对应关系。
6.根据权利要求5所述的网页广告过滤规则下发方法,其特征在于,所述方法还包括:
在预先存储的网页标识与广告隐藏规则的对应关系中查找所述待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配;
若查找到对应的广告隐藏规则,则将查找到的广告隐藏规则下发给所述浏览器;
若未查找到对应的广告隐藏规则,则在预先设置的广告隐藏规则库中查找与所述网页资源匹配的广告隐藏规则,存储所述待打开网页的网页标识与所述匹配的广告隐藏规则的对应关系。
7.根据权利要求6所述的网页面广告过滤规则下发方法,其特征在于,同一网页中,网页块标识与该网页对应的广告隐藏规则相匹配的网页块包括与该网页对应的广告过滤规则相匹配的子资源所在的网页块。
8.一种网页广告隐藏规则下发方法,包括以下步骤:
接收浏览器发送的广告隐藏规则请求,所述广告过滤规则请求中包括待打开网页的网页标识;
在预先存储的网页标识与广告隐藏规则的对应关系中查找所述待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配;
若查找到对应的广告隐藏规则,则将查找到的广告隐藏规则下发给所述浏览器;
若未查找到对应的广告隐藏规则,则在预先设置的广告隐藏规则库中查找与所述网页资源匹配的广告隐藏规则,存储所述待打开网页的网页标识与所述匹配的广告隐藏规则的对应关系。
9.一种网页广告过滤装置,其特征在于,包括:
网页标识获取模块,用于获取待打开网页的网页标识;
主资源加载模块,用于向所述网页标识对应的网页服务器请求所述待打开网页的主资源,接收所述网页服务器返回的所述待打开网页的主资源;
过滤规则请求模块,用于向浏览器的后台服务器请求所述网页标识对应的广告过滤规则,接收所述后台服务器返回的所述网页标识对应的广告过滤规则;
主资源解析模块,用于解析所述主资源,获取待加载的子资源的URL;
子资源加载模块,用于判断待加载的子资源的URL是否与所述广告过滤规则相匹配,若是,则不向所述网页服务器请求所述子资源,若否,则向所述网页服务器请求所述子资源。
10.根据权利要求9所述的网页广告过滤装置,其特征在于,所述装置还包括:
隐藏规则接收模块,用于接收所述后台服务器返回的所述待打开网页的网页标识对应的广告隐藏规则;
排版模块,用于在对所述待打开网页进行排版时,将所述待打开网页中网页块标识与所述广告隐藏规则相匹配的网页块进行隐藏。
11.根据权利要求10所述的网页广告过滤装置,其特征在于,所述待打开网页中网页块标识与所述广告隐藏规则相匹配的网页块包括所述待打开网页中与所述广告过滤规则相匹配的子资源所在的网页块。
12.一种网页广告隐藏装置,其特征在于,包括:
网页标识获取模块,用于获取待打开网页的网页标识;
网页资源加载模块,用于向所述网页标识对应的网页服务器请求所述待打开网页的网页资源,接收所述网页服务器返回的所述待打开网页的网页资源;
隐藏规则请求模块,用于向浏览器的后台服务器请求所述网页标识对应的广告隐藏规则,接收所述后台服务器返回的所述网页标识对应的广告隐藏规则;
排版模块,用于在对所述待打开网页的网页资源进行排版时,将所述待打开网页中网页块标识与所述广告隐藏规则相匹配的网页块进行隐藏。
13.一种网页广告过滤规则下发装置,其特征在于,包括:
过滤请求接收模块,用于接收浏览器发送的广告过滤规则请求,所述广告过滤规则请求中包括待打开网页的网页标识;
过滤规则查找模块,用于在预先存储的网页标识与广告过滤规则的对应关系中查找所述待打开网页的网页标识对应的广告过滤规则,网页中作为广告的子资源的URL与该网页的网页标识对应的广告过滤规则相匹配;
过滤规则下发模块,用于若查找到对应的广告过滤规则,则将查找到的广告过滤规则下发给所述浏览器;
过滤规则获取及存储模块,用于若未查找到对应的广告过滤规则,则根据所述待打开网页的网页标识加载所述待打开网页的网页资源,并在预先设置的广告过滤规则库中查找与所述网页资源匹配的广告过滤规则,存储所述待打开网页的网页标识与所述匹配的广告过滤规则的对应关系。
14.根据权利要求13所述的网页广告过滤规则下发装置,其特征在于,所述装置还包括:
隐藏规则查找模块,用于在预先存储的网页标识与广告隐藏规则的对应关系中查找所述待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配;
隐藏规则下发模块,用于若查找到对应的广告隐藏规则,则将查找到的广告隐藏规则下发给所述浏览器;
隐藏规则获取及存储模块,用于若未查找到对应的广告隐藏规则,则在预先设置的广告隐藏规则库中查找与所述网页资源匹配的广告隐藏规则,存储所述待打开网页的网页标识与所述匹配的广告隐藏规则的对应关系。
15.根据权利要求14所述的网页面广告过滤规则下发装置,其特征在于,同一网页中,网页块标识与该网页对应的广告隐藏规则相匹配的网页块包括与该网页对应的广告过滤规则相匹配的子资源所在的网页块。
16.一种网页广告隐藏规则下发装置,其特征在于,包括:
隐藏请求接收模块,用于接收浏览器发送的广告隐藏规则请求,所述广告过滤规则请求中包括待打开网页的网页标识;
隐藏规则查找模块,用于在预先存储的网页标识与广告隐藏规则的对应关系中查找所述待打开网页的网页标识对应的广告隐藏规则,网页中作为广告的子资源所在的网页块的网页块标识与该网页的网页标识对应的广告隐藏规则相匹配;
隐藏规则下发模块,用于若查找到对应的广告隐藏规则,则将查找到的广告隐藏规则下发给所述浏览器;
隐藏规则获取及存储模块,用于若未查找到对应的广告隐藏规则,则在预先设置的广告隐藏规则库中查找与所述网页资源匹配的广告隐藏规则,存储所述待打开网页的网页标识与所述匹配的广告隐藏规则的对应关系。
CN201410494363.5A 2014-09-24 2014-09-24 网页广告过滤隐藏及过滤隐藏规则下发方法和装置 Pending CN105512126A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410494363.5A CN105512126A (zh) 2014-09-24 2014-09-24 网页广告过滤隐藏及过滤隐藏规则下发方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410494363.5A CN105512126A (zh) 2014-09-24 2014-09-24 网页广告过滤隐藏及过滤隐藏规则下发方法和装置

Publications (1)

Publication Number Publication Date
CN105512126A true CN105512126A (zh) 2016-04-20

Family

ID=55720116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410494363.5A Pending CN105512126A (zh) 2014-09-24 2014-09-24 网页广告过滤隐藏及过滤隐藏规则下发方法和装置

Country Status (1)

Country Link
CN (1) CN105512126A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105897900A (zh) * 2016-04-22 2016-08-24 北京小米移动软件有限公司 资源获取方法及装置
CN105931032A (zh) * 2016-05-11 2016-09-07 百度在线网络技术(北京)有限公司 智能家居平台、应用于该平台的信息推送方法和装置
CN106649787A (zh) * 2016-12-28 2017-05-10 北京奇虎科技有限公司 移动终端客户端中广告过滤方法及装置
CN106790589A (zh) * 2016-12-28 2017-05-31 北京奇虎科技有限公司 移动终端客户端中广告过滤方法及装置
CN108023867A (zh) * 2016-10-28 2018-05-11 中国移动通信集团广东有限公司 移动端网页广告过滤的方法、网关服务器及过滤服务器
CN108280109A (zh) * 2017-04-17 2018-07-13 广州市动景计算机科技有限公司 页面数据过滤方法、装置及用户终端
CN109582900A (zh) * 2018-11-14 2019-04-05 百度在线网络技术(北京)有限公司 页面加载过滤方法及其装置
CN109902241A (zh) * 2019-02-01 2019-06-18 珠海天燕科技有限公司 一种资源的加载方法、装置及其设备
CN110020336A (zh) * 2017-08-01 2019-07-16 北京国双科技有限公司 遮罩层控制方法及装置
CN110046310A (zh) * 2019-04-03 2019-07-23 北京字节跳动网络技术有限公司 分析页面中的跳转链接的方法和装置
CN111399966A (zh) * 2020-06-03 2020-07-10 广东睿江云计算股份有限公司 一种隐藏网页页面的方法及系统
WO2022089016A1 (zh) * 2020-10-31 2022-05-05 华为技术有限公司 网页广告过滤方法、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622382A (zh) * 2011-03-14 2012-08-01 北京小米科技有限责任公司 一种网页重排版的方法
CN102768664A (zh) * 2011-05-06 2012-11-07 李超 分布式网页广告拦截的方法及系统
CN103593354A (zh) * 2012-08-15 2014-02-19 腾讯科技(深圳)有限公司 一种过滤网络页面广告的方法、装置、服务器及系统
CN103605688A (zh) * 2013-11-01 2014-02-26 北京奇虎科技有限公司 一种网页广告的拦截方法、装置和浏览器
CN104021172A (zh) * 2014-05-30 2014-09-03 北京搜狗科技发展有限公司 广告过滤方法及广告过滤装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622382A (zh) * 2011-03-14 2012-08-01 北京小米科技有限责任公司 一种网页重排版的方法
CN102768664A (zh) * 2011-05-06 2012-11-07 李超 分布式网页广告拦截的方法及系统
CN103593354A (zh) * 2012-08-15 2014-02-19 腾讯科技(深圳)有限公司 一种过滤网络页面广告的方法、装置、服务器及系统
CN103605688A (zh) * 2013-11-01 2014-02-26 北京奇虎科技有限公司 一种网页广告的拦截方法、装置和浏览器
CN104021172A (zh) * 2014-05-30 2014-09-03 北京搜狗科技发展有限公司 广告过滤方法及广告过滤装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105897900A (zh) * 2016-04-22 2016-08-24 北京小米移动软件有限公司 资源获取方法及装置
CN105931032A (zh) * 2016-05-11 2016-09-07 百度在线网络技术(北京)有限公司 智能家居平台、应用于该平台的信息推送方法和装置
CN108023867A (zh) * 2016-10-28 2018-05-11 中国移动通信集团广东有限公司 移动端网页广告过滤的方法、网关服务器及过滤服务器
CN106649787A (zh) * 2016-12-28 2017-05-10 北京奇虎科技有限公司 移动终端客户端中广告过滤方法及装置
CN106790589A (zh) * 2016-12-28 2017-05-31 北京奇虎科技有限公司 移动终端客户端中广告过滤方法及装置
CN108280109A (zh) * 2017-04-17 2018-07-13 广州市动景计算机科技有限公司 页面数据过滤方法、装置及用户终端
CN110020336A (zh) * 2017-08-01 2019-07-16 北京国双科技有限公司 遮罩层控制方法及装置
CN109582900A (zh) * 2018-11-14 2019-04-05 百度在线网络技术(北京)有限公司 页面加载过滤方法及其装置
CN109902241A (zh) * 2019-02-01 2019-06-18 珠海天燕科技有限公司 一种资源的加载方法、装置及其设备
CN109902241B (zh) * 2019-02-01 2020-12-25 珠海天燕科技有限公司 一种资源的加载方法、装置及其设备
CN110046310A (zh) * 2019-04-03 2019-07-23 北京字节跳动网络技术有限公司 分析页面中的跳转链接的方法和装置
CN110046310B (zh) * 2019-04-03 2020-12-08 北京字节跳动网络技术有限公司 分析页面中的跳转链接的方法和装置
CN111399966A (zh) * 2020-06-03 2020-07-10 广东睿江云计算股份有限公司 一种隐藏网页页面的方法及系统
CN111399966B (zh) * 2020-06-03 2020-09-18 广东睿江云计算股份有限公司 一种隐藏网页页面的方法及系统
WO2022089016A1 (zh) * 2020-10-31 2022-05-05 华为技术有限公司 网页广告过滤方法、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN105512126A (zh) 网页广告过滤隐藏及过滤隐藏规则下发方法和装置
US20190370305A1 (en) Method and apparatus for providing search results
US8612416B2 (en) Domain-aware snippets for search results
US9304979B2 (en) Authorized syndicated descriptions of linked web content displayed with links in user-generated content
US11055373B2 (en) Method and apparatus for generating information
CN106911693B (zh) 用于检测网页内容劫持的方法、装置和终端设备
CN105027121A (zh) 对本机应用的应用页面建索引
CN102098234A (zh) 基于即时通信消息中超链接提供目标内容的方法与设备
WO2015007228A1 (en) Keyword based automatic reply generation in messaging application
CN102184185A (zh) 一种用于多媒体资源搜索的方法与设备
JP2014029701A (ja) モバイル装置のための文書処理
CN103618774A (zh) 一种基于网络行为的资源推荐方法及装置、系统
CN104731870A (zh) 一种用于提供推荐信息的方法与设备
CN104462590A (zh) 信息搜索方法及装置
CN102929971A (zh) 一种多媒体信息播放方法和系统
CN103577544A (zh) 一种用于提供待发送信息的方法及装置
CN104657474A (zh) 一种广告展示方法、广告查询服务器及客户端
CN101924791B (zh) 一种用于显示多媒体信息的方法、设备和系统
EP2557515A1 (en) Method and apparatus for providing search services interactively displaying a type of search target
CN104699836A (zh) 一种多关键字的搜索提示方法和装置
CN105260459A (zh) 搜索方法和装置
CN102289479A (zh) 一种确定图像展现方式并展现图像的方法、装置和设备
US10747827B2 (en) Method and apparatus for pushing information
CN107291904A (zh) 一种视频搜索方法和装置
CN101777067A (zh) 一种用于移动通讯设备终端的网页内容识别管理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160420

RJ01 Rejection of invention patent application after publication