CN104809119A - 一种网页广告过滤方法及装置 - Google Patents

一种网页广告过滤方法及装置 Download PDF

Info

Publication number
CN104809119A
CN104809119A CN201410036481.1A CN201410036481A CN104809119A CN 104809119 A CN104809119 A CN 104809119A CN 201410036481 A CN201410036481 A CN 201410036481A CN 104809119 A CN104809119 A CN 104809119A
Authority
CN
China
Prior art keywords
resource
url information
target web
advertising
described target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410036481.1A
Other languages
English (en)
Inventor
刘阳
关翔
焦文超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shell Internet Beijing Security Technology Co Ltd
Original Assignee
Shell Internet Beijing Security Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shell Internet Beijing Security Technology Co Ltd filed Critical Shell Internet Beijing Security Technology Co Ltd
Priority to CN201410036481.1A priority Critical patent/CN104809119A/zh
Priority to PCT/CN2014/084782 priority patent/WO2015109831A1/zh
Publication of CN104809119A publication Critical patent/CN104809119A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/34Network arrangements or protocols for supporting network services or applications involving the movement of software or configuration parameters 

Abstract

本发明实施例公开了一种网页广告过滤方法及装置,所述方法包括:接收用户输入的针对目标网页访问请求,其中,所述目标网页访问请求中,携带目标网页的统一资源定位符URL信息;判断所述目标网页的URL信息是否符合第一预设广告特征;如果是,判定所述目标网页为广告资源,不向网络侧发送所述目标网页的下载请求;如果否,向网络侧发送所述目标网页的下载请求,获得所述目标网页的源代码。应用本发明实施例提供的网页广告过滤方法及装置进行网页广告过滤时,在过滤网页广告的同时可以节省用户流量。

Description

一种网页广告过滤方法及装置
技术领域
本发明涉及网络通信技术领域,特别涉及一种网页广告过滤方法及装置。
背景技术
随着网络用户数量的逐年上升,广告商开始在网页上大量投放广告,广告给用户提供信息的同时也给大多数用户带来干扰,因此,从用户的角度看,有必要对网页中的广告进行过滤。
现有技术中,过滤网页广告时,通常先将网页数据下载到用户的客户端,再通过JavaScript访问已下载的网页数据,并判断已下载的网页数据中的数据标识等元素信息是否符合预设的规则,若符合,则判定为网页广告,通过修改CSS(Cascading Style Sheets,层叠样式表单)的方式,使得网页广告不在客户端屏幕上显示,从而达到过滤网页广告的目的。然而,通过上述方式过滤网页广告时,虽然网页广告没有在客户端屏幕上显示,但是客户端依然下载了网页广告数据,造成了用户网络流量浪费。
发明内容
本发明实施例公开了一种网页广告过滤方法及装置,在过滤网页广告的同时节省用户网络流量。
为达到上述目的,本发明实施例公开了一种网页广告过滤方法,所述方法包括:
接收用户输入的针对目标网页访问请求,其中,所述目标网页访问请求中,携带目标网页的统一资源定位符URL信息;
判断所述目标网页的URL信息是否符合第一预设广告特征;
如果是,判定所述目标网页为广告资源,不向网络侧发送所述目标网页的下载请求;
如果否,向网络侧发送所述目标网页的下载请求,获得所述目标网页的源代码。
较佳的,在所述判定所述目标网页为广告资源之后,还包括:
根据所述目标网页的URL信息确定所述目标网页对应的广告资源的类型;
加载预设的与所述目标网页对应的广告资源的资源类型一致的资源。
较佳的,获得所述目标网页的源代码之后,还包括:
按照预设规则,加载所述目标网页的源代码中包含的URL信息对应的资源;
加载所述目标网页的源代码中的非URL信息。
较佳的,所述按照预设规则,加载所述目标网页的源代码中包含的URL信息对应的资源,包括:
在加载所述目标网页的源代码中包含的第n个URL信息对应的资源之前,判断所述第n个URL信息是否符合第二预设广告特征;
如果是,判定所述第n个URL信息对应的资源为广告资源,不发送所述第n个URL信息对应的资源的下载请求;其中,1≤n≤所述目标网页的源代码中包含的URL信息的数量。
较佳的,在判定所述第n个URL信息对应的资源为广告资源之后,还包括:
将所述目标网页的源代码中包含的第n个URL信息替换为预设的与所述第n个URL信息对应的资源类型一致的资源;
加载替换后的资源。
较佳的,所述按照预设规则,加载所述目标网页的源代码中包含的URL信息对应的资源,包括:
确定所述目标网页的源代码中所有符合第二预设广告特征的URL信息;
判定所述符合第二预设广告特征的URL信息对应的资源为广告资源,不发送所述广告资源的下载请求;
加载所述目标网页的源代码中不符合第二预设广告特征的URL信息对应的资源。
较佳的,在判定所述符合第二预设广告特征的URL信息对应的资源为广告资源之后,还包括:
将所述符合第二预设广告特征的URL信息对应的广告资源替换为预设的与所述广告资源类型一致的资源;
加载替换后的资源。
为达到上述目的,本发明实施例公开了一种网页广告过滤装置,所述装置包括:
访问请求接收模块,用于接收用户输入的针对目标网页访问请求,其中,所述目标网页访问请求中,携带目标网页的统一资源定位符URL信息;
URL信息判断模块,用于判断所述目标网页的URL信息是否符合第一预设广告特征;
广告资源判定模块,用于在所述URL信息判断模块的判断结果为是时,判定所述目标网页为广告资源,不向网络侧发送所述目标网页的下载请求;
源代码获得模块,用于在所述URL信息判断模块的判断结果为否时,向网络侧发送所述目标网页的下载请求,获得所述目标网页的源代码。
较佳的,所述网页广告过滤装置还包括:
资源类型确定模块,用于在所述广告资源判定模块判定所述目标网页为广告资源后,根据所述目标网页的URL信息确定所述目标网页对应的广告资源的类型;
预设资源加载模块,用于加载预设的与所述目标网页对应的广告资源的资源类型一致的资源。
较佳的,所述网页广告过滤装置还包括:
URL信息对应资源加载模块,用于在所述源代码获得模块获得所述目标网页的源代码之后,按照预设规则,加载所述目标网页的源代码中包含的URL信息对应的资源;
非URL信息加载模块,用于加载所述目标网页的源代码中的非URL信息。
较佳的,所述URL信息对应资源加载模块,包括:URL信息判断子模块和第一广告资源判定子模块;
所述URL信息判断子模块,用于在加载所述目标网页的源代码中包含的第n个URL信息对应的资源之前,判断所述第n个URL信息是否符合第二预设广告特征;
所述第一广告资源判定子模块,用于在所述URL信息判断子模块的判断结果为是时,判定所述第n个URL信息对应的资源为广告资源,不发送所述第n个URL信息对应的资源的下载请求;其中,1≤n≤所述目标网页的源代码中包含的URL信息的数量。
较佳的,所述URL信息对应资源加载模块,还包括:第一广告资源替换子模块和第一资源加载子模块;
所述第一广告资源替换子模块,用于在所述第一广告资源判定子模块判定所述第n个URL信息对应的资源为广告资源之后,将所述目标网页的源代码中包含的第n个URL信息替换为预设的与所述第n个URL信息对应的资源类型一致的资源;
所述第一资源加载子模块,用于加载替换后的资源。
较佳的,所述URL信息对应资源加载模块,包括:广告资源确定子模块、第二广告资源判定子模块和第二资源加载子模块;
所述广告资源确定子模块,用于确定所述目标网页的源代码中所有符合第二预设广告特征的URL信息;
所述第二广告资源判定子模块,用于判定所述符合第二预设广告特征的URL信息对应的资源为广告资源,不发送所述广告资源的下载请求;
所述第二资源加载子模块,用于加载所述目标网页的源代码中不符合第二预设广告特征的URL信息对应的资源。
较佳的,所述URL信息对应资源加载模块,还包括:第二广告资源替换子模块和第三资源加载子模块;
所述第二广告资源替换子模块,用于在所述广告资源确定子模块判定所述符合第二预设广告特征的URL信息对应的资源为广告资源之后,将所述符合第二预设广告特征的URL信息对应的广告资源替换为预设的与所述广告资源类型一致的资源;
所述第三资源加载子模块,用于加载替换后的资源。
由以上可见,本方案中在下载网页源代码之前,通过判断目标网页的URL信息是否符合第一预设广告特征的方式,判定目标网页是否为广告资源。当判断得目标网页为广告资源时,不向网络侧发送目标网页的下载请求信息,因此,与现有技术相比,在过滤网页广告的同时可以节省用户流量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的网页广告过滤方法的第一种流程示意图;
图2为本发明实施例提供的网页广告过滤方法的第二种流程示意图;
图3为本发明实施例提供的网页广告过滤方法的第三种流程示意图;
图4为本发明实施例提供的网页广告过滤方法的第四种流程示意图;
图5为本发明实施例提供的网页广告过滤方法的第五种流程示意图;
图6为本发明实施例提供的网页广告过滤装置的第一种结构示意图;
图7为本发明实施例提供的网页广告过滤装置的第二种结构示意图;
图8为本发明实施例提供的网页广告过滤装置的第三种结构示意图;
图9为本发明实施例提供的网页广告过滤装置的第四种结构示意图;
图10为本发明实施例提供的网页广告过滤装置的第五种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的网页广告过滤方法的第一种流程示意图,该方法包括:
S101:接收用户输入的针对目标网页访问请求。
实际应用中,用户通过浏览器或者具有浏览器功能的应用访问网页时,首先要接收用户访问目标网页的访问请求,其中,目标网页访问请求中,需携带目标网页的统一资源定位符URL信息。URL信息可以是用户在浏览器或者具有浏览器功能的应用的地址栏直接输入的,也可以是用户点击已打开网页中的某一链接信息后,浏览器或者具有浏览器功能的应用从该已打开网页对应的源代码中获得的,当然本申请只是以上述为例进行说明,实际应用中,并不对URL信息的获得方式进行限定。
S102:判断所述目标网页的URL信息是否符合第一预设广告特征,如果是,进行S103,如果否,进行S104。
其中,第一预设广告特征的具体表现形式可以是关键字、通配符匹配表达式、字符串匹配表达式或正则表达式等等,本申请不对第一预设广告特征的具体表现形式进行限定。
具体的,通配符匹配表达式,是指主要有星号(*)和问号(?)的一种特殊语句,用来进行模糊搜索,可以使用星号代替0个或多个字符,用问号代替一个字符。例如:2100book.com/themes/v2/images/top_*.jpg、acookie.*.gif?、baidu.com/*/egg*.swf等等。
正则表达式,是指对字符串操作的一种逻辑公式,即用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,该“规则字符串”用来表达对字符串的一种过滤逻辑。例如:
/:\/\/([^\/]+\.)?amazon\.com[^-\.%a-zA-Z0-9].*\/getaanad\?、
/:\/\/([^\/]+\.)?bergen\.com[^-\.%a-zA-Z0-9].*\/sponsoredby-/、
/:\/\/([^\/]+\.)?boago\.com[^-\.%a-zA-Z0-9].*_Takeover_/等等。
第一预设广告特征可以包括上述的一个或多个关键字或表达式,当浏览器或者具有浏览器功能的应用获得目标网页的URL信息后,将目标网页的URL信息与第一预设广告特征中的关键字或者表达式逐个匹配,若匹配命中,则判定目标网页的URL信息符合第一预设广告特征,若均未匹配命中,则判定目标网页的URL信息不符合第一预设广告特征。
S103:判定所述目标网页为广告资源,不向网络侧发送所述目标网页的下载请求。
本实施例中,在S102判断得目标网页的URL信息不符合第一预设广告特征后,则判定该目标网页为广告资源,从过滤网页广告的角度来看,该目标网页不需向用户展示,因此,浏览器或者具有浏览器功能的应用不需向网络侧发送目标网页的下载请求,以达到过滤网页广告且节省用户流量的目的。实际应用中,考虑到为用户提供更佳的体验效果,浏览器或者具有浏览器功能的应用还可以为用户提供提示信息,提醒用户该目标网页为广告资源,并且可以由用户来手动选择是否进一步向网络侧发送目标网页下载请求。
S104:向网络侧发送所述目标网页的下载请求,获得所述目标网页的源代码。
浏览器或者具有浏览器功能的应用向网络侧发送目标网页的下载请求后,网络侧的服务器端解析接收到的目标网页的下载请求,获得目标网页的URL信息,服务器根据目标网页的URL信息确定相应的源代码,并将该源代码提供给浏览器或者具有浏览器功能的应用。
由以上可见,本方案中在下载目标网页源代码之前,通过判断目标网页的URL信息是否符合第一预设广告特征的方式,判定目标网页是否为广告资源。当判断得目标网页为广告资源时,不向网络侧发送目标网页的下载请求信息,因此,与现有技术相比,在过滤网页广告的同时可以节省用户流量。
应用本发明实施例提供的网页广告过滤方法进行网页广告过滤时,还可以用预设的资源代替网页中的广告资源,以便为用户提供较佳的体验效果,为此,本发明实施例提供了另一种具体实现方式,图2为本发明实施例提供的网页广告过滤方法的第二种流程示意图,在图1所示实施例的基础之上,本实施例在S103之后,还包括:
S105:根据所述目标网页的URL信息确定所述目标网页对应的广告资源的类型。
实际应用中,目标网页的URL信息对应的资源类型可以是HTML类型、CSS(Cascading Style Sheets)类型、JS(JavaScript)类型、IMAGE类型、XML类型等等。
具体的,例如:
http://m.sina.com.cn/m/finance.html对应的资源类型为HTML类型;
http://img.adbox.sina.com.cn/static/css/base.css对应的资源类型为CSS类型;
http://d1.sina.com.cn/js/index/14/sync.js对应的资源类型为JS类型;
http://i3.sinaimg.cn/home/2013/0331/U586P30DT20130331093840.png对应的资源类型为IMAGE类型;
http://www.china61.org/jobs.xml对应的资源类型为XML类型。
S106:加载预设的与所述目标网页对应的广告资源的资源类型一致的资源。
应用本实施例提供的方法进行网页广告过滤时,可以将目标网页对应的广告资源替换为预设的同类型的非广告资源。例如:
HTML类型的广告资源替换为:<html><body></body></html>;
JS类型的广告资源替换为:(function(){});
CSS类型的广告资源替换为:一个空的字符串;
IMAGE类型的广告资源替换为:一个1x1的透明图片;
XML类型的广告资源替换为:<?xml version=”1.0”?><root></root>等等。
当然,针对具体的应用环境用于替换目标网页对应的广告资源的资源也可以是与目标网页对应的广告资源的类型不一致的资源,例如,目标网页对应的广告资源类型为VIDEO类型的资源,在替换时可以用一个IMAGE类型的非广告资源替换等等。
由以上可见,本方案中用预设的与目标网页对应的广告资源类型一致的资源替换目标网页对应的广告资源,保持了替换前后目标网页中资源类型的一致性,不易引起展示网页时的格式错误,能够为用户提供较佳的体验效果。
图3为本发明实施例提供的网页广告过滤方法的第三种流程示意图,在图1所示实施例的基础之上,本实施例在S104之后,还包括:
S107:按照预设规则,加载所述目标网页的源代码中包含的URL信息对应的资源。
目标网页的源代码中包含URL信息和非URL信息。其中,在加载URL信息对应的资源时,需先向网络侧发送相应资源下载请求信息,在接收到网络侧反馈的资源数据之后才能够加载相应资源。
可选的,如图4提供的网页广告过滤方法的第四种流程示意图所示,在本发明的另一种具体实现中,加载所述目标网页的源代码中包含的URL信息对应的资源(S107),可以包括:
S107A:在加载所述目标网页的源代码中包含的第n个URL信息对应的资源之前,判断所述第n个URL信息是否符合第二预设广告特征,如果是,判定所述第n个URL信息对应的资源为广告资源,不发送所述第n个URL信息对应的资源的下载请求,其中,1≤n≤所述目标网页的源代码中包含的URL信息的数量。
本实施例中,第二预设广告特征可以与图1所示实施例中的第一预设广告特征完全相同,这里不再重复。
依据图2所示实施例提供的方法,本领域内的技术人员可以理解的是,在S107A中判定所述第n个URL信息对应的资源为广告资源之后,还可以将所述目标网页的源代码中包含的第n个URL信息替换为预设的与所述第n个URL信息对应的资源类型一致的资源,并加载替换后的资源。
S107B:在加载所述目标网页的源代码中包含的第n个URL信息对应的资源之前,判断所述第n个URL信息是否符合第二预设广告特征,如果否,判定所述第n个URL信息对应的资源为非广告资源,发送所述第n个URL信息对应的资源下载请求,并加载所述第n个URL信息对应的资源,其中,1≤n≤所述目标网页的源代码中包含的URL信息的数量。
可选的,如图5提供的网页广告过滤方法的第五种流程示意图所示,在本发明的另一种具体实现中,加载所述目标网页的源代码中包含的URL信息对应的资源(S107),可以包括:
S107C:确定所述目标网页的源代码中所有符合第二预设广告特征的URL信息。
S107D:判定所述符合第二预设广告特征的URL信息对应的资源为广告资源,不发送所述广告资源的下载请求。
依据图2所示实施例提供的方法,本领域内的技术人员可以理解的是,在判定所述符合第二预设广告特征的URL信息对应的资源为广告资源之后,还可以将将所述广告资源替换为预设的与所述广告资源类型一致的资源,并加载替换后的资源。
S107E:加载所述目标网页的源代码中不符合第二预设广告特征的URL信息对应的资源。
S108:加载所述目标网页的源代码中的非URL信息。
需要说明的是,实际应用中S107和S108没有严格的执行时间限制,S107可以在S108之前执行,也可以在S108之后执行,还可以两者同时执行。
由以上可见,本方案中在下载目标网页源代码之前,通过判断目标网页的URL信息是否符合第一预设广告特征的方式,判定目标网页是否为广告资源。当判断得目标网页为广告资源时,不向网络侧发送目标网页的下载请求信息,因此,与现有技术相比,在过滤网页广告的同时可以节省用户流量。
图6为本发明实施例提供的网页广告过滤装置的第一种结构示意图,该装置包括:访问请求接收模块601、URL信息判断模块602、广告资源判定模块603和源代码获得模块604。
其中,访问请求接收模块601,用于接收用户输入的针对目标网页访问请求,其中,所述目标网页访问请求中,携带目标网页的统一资源定位符URL信息;
URL信息判断模块602,用于判断所述目标网页的URL信息是否符合第一预设广告特征;
广告资源判定模块603,用于在所述URL信息判断模块的判断结果为是时,判定所述目标网页为广告资源,不向网络侧发送所述目标网页的下载请求;
源代码获得模块604,用于在所述URL信息判断模块的判断结果为否时,向网络侧发送所述目标网页的下载请求,获得所述目标网页的源代码。
由以上可见,本方案中在下载目标网页源代码之前,通过判断目标网页的URL信息是否符合第一预设广告特征的方式,判定目标网页是否为广告资源。当判断得目标网页为广告资源时,不向网络侧发送目标网页的下载请求信息,因此,与现有技术相比,在过滤网页广告的同时可以节省用户流量。
应用本发明实施例提供的网页广告过滤装置进行网页广告过滤时,还可以用预设的资源代替网页中的广告资源,以便为用户提供较佳的体验效果,为此,本发明实施例提供了另一种具体实现方式,图7为本发明实施例提供的网页广告过滤装置的第二种结构示意图,在图6所示实施例的基础之上,本实施例在广告资源判定模块603之后,还包括:资源类型确定模块605和预设资源加载模块606。
其中,资源类型确定模块605,用于在所述广告资源判定模块603判定所述目标网页为广告资源后,根据所述目标网页的URL信息确定所述目标网页对应的广告资源的类型;
预设资源加载模块606,用于加载预设的与所述目标网页对应的广告资源的资源类型一致的资源。
由以上可见,本方案中用预设的与目标网页对应的广告资源类型一致的资源替换目标网页对应的广告资源,保持了替换前后目标网页中资源类型的一致性,不易引起展示网页时的格式错误,能够为用户提供较佳的体验效果。
图8为本发明实施例提供的网页广告过滤装置的第三种结构示意图,在图6所示实施例的基础之上,在源代码获得模块604之后,还包括:URL信息对应资源加载模块607和非URL信息加载模块608。
其中,URL信息对应资源加载模块607,用于在所述源代码获得模块604获得所述目标网页的源代码之后,按照预设规则,加载所述目标网页的源代码中包含的URL信息对应的资源;
非URL信息加载模块608,用于加载所述目标网页的源代码中的非URL信息。
可选的,如图9提供的网页广告过滤装置的第四种结构示意图所示,在本发明的另一种具体实现中,URL信息对应资源加载模块607,可以包括:URL信息判断子模块6071和第一广告资源判定子模块6072。
其中,URL信息判断子模块6071,用于在加载所述目标网页的源代码中包含的第n个URL信息对应的资源之前,判断所述第n个URL信息是否符合第二预设广告特征;
第一广告资源判定子模块6072,用于在所述URL信息判断子模块6071的判断结果为是时,判定所述第n个URL信息对应的资源为广告资源,不发送所述第n个URL信息对应的资源的下载请求;其中,1≤n≤所述目标网页的源代码中包含的URL信息的数量。
在本发明的另一具体实现方式中,URL信息对应资源加载模块607,还可以包括:第一广告资源替换子模块和第一资源加载子模块(图中未示出)。
所述第一广告资源替换子模块,用于在所述广告资源判定子模块6072判定所述第n个URL信息对应的资源为广告资源之后,将所述目标网页的源代码中包含的第n个URL信息替换为预设的与所述第n个URL信息对应的资源类型一致的资源;所述第一资源加载子模块,用于加载替换后的资源。
可选的,如图10提供的网页广告过滤装置的第五种结构示意图所示,在本发明的另一种具体实现中,URL信息对应资源加载模块607,可以包括:广告资源确定子模块6073、第二广告资源判定子模块6074和第二资源加载子模块6075。
其中,所述广告资源确定子模块6073,用于确定所述目标网页的源代码中所有符合第二预设广告特征的URL信息;
所述第二广告资源判定子模块6074,用于判定所述符合第二预设广告特征的URL信息对应的资源为广告资源,不发送所述广告资源的下载请求;
所述第二资源加载子模块6075,用于加载所述目标网页的源代码中不符合第二预设广告特征的URL信息对应的资源。
在本发明的另一种具体实现方式中,URL信息对应资源加载模块607,还可以包括:第二广告资源替换子模块和第三资源加载子模块(图中未示出)。
所述第二广告资源替换子模块,用于在所述广告资源确定子模块6073判定所述符合第二预设广告特征的URL信息对应的资源为广告资源之后,将所述符合第二预设广告特征的URL信息对应的广告资源替换为预设的与所述广告资源类型一致的资源;所述第三资源加载子模块,用于加载替换后的资源。
由以上可见,本方案中在下载目标网页源代码之前,通过判断目标网页的URL信息是否符合第一预设广告特征的方式,判定目标网页是否为广告资源。当判断得目标网页为广告资源时,不向网络侧发送目标网页的下载请求信息,因此,与现有技术相比,在过滤网页广告的同时可以节省用户流量。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (14)

1.一种网页广告过滤方法,其特征在于,所述方法包括:
接收用户输入的针对目标网页访问请求,其中,所述目标网页访问请求中,携带目标网页的统一资源定位符URL信息;
判断所述目标网页的URL信息是否符合第一预设广告特征;
如果是,判定所述目标网页为广告资源,不向网络侧发送所述目标网页的下载请求;
如果否,向网络侧发送所述目标网页的下载请求,获得所述目标网页的源代码。
2.根据权利要求1所述的方法,其特征在于,在所述判定所述目标网页为广告资源之后,还包括:
根据所述目标网页的URL信息确定所述目标网页对应的广告资源的类型;
加载预设的与所述目标网页对应的广告资源的资源类型一致的资源。
3.根据权利要求1或2所述的方法,其特征在于,获得所述目标网页的源代码之后,还包括:
按照预设规则,加载所述目标网页的源代码中包含的URL信息对应的资源;
加载所述目标网页的源代码中的非URL信息。
4.根据权利要求3所述的方法,其特征在于,所述按照预设规则,加载所述目标网页的源代码中包含的URL信息对应的资源,包括:
在加载所述目标网页的源代码中包含的第n个URL信息对应的资源之前,判断所述第n个URL信息是否符合第二预设广告特征;
如果是,判定所述第n个URL信息对应的资源为广告资源,不发送所述第n个URL信息对应的资源的下载请求;其中,1≤n≤所述目标网页的源代码中包含的URL信息的数量。
5.根据权利要求4所述的方法,其特征在于,在判定所述第n个URL信息对应的资源为广告资源之后,还包括:
将所述目标网页的源代码中包含的第n个URL信息替换为预设的与所述第n个URL信息对应的资源类型一致的资源;
加载替换后的资源。
6.根据权利要求3所述的方法,其特征在于,所述按照预设规则,加载所述目标网页的源代码中包含的URL信息对应的资源,包括:
确定所述目标网页的源代码中所有符合第二预设广告特征的URL信息;
判定所述符合第二预设广告特征的URL信息对应的资源为广告资源,不发送所述广告资源的下载请求;
加载所述目标网页的源代码中不符合第二预设广告特征的URL信息对应的资源。
7.根据权利要求6所述的方法,其特征在于,在判定所述符合第二预设广告特征的URL信息对应的资源为广告资源之后,还包括:
将所述符合第二预设广告特征的URL信息对应的广告资源替换为预设的与所述广告资源类型一致的资源;
加载替换后的资源。
8.一种网页广告过滤装置,其特征在于,所述装置包括:
访问请求接收模块,用于接收用户输入的针对目标网页访问请求,其中,所述目标网页访问请求中,携带目标网页的统一资源定位符URL信息;
URL信息判断模块,用于判断所述目标网页的URL信息是否符合第一预设广告特征;
广告资源判定模块,用于在所述URL信息判断模块的判断结果为是时,判定所述目标网页为广告资源,不向网络侧发送所述目标网页的下载请求;
源代码获得模块,用于在所述URL信息判断模块的判断结果为否时,向网络侧发送所述目标网页的下载请求,获得所述目标网页的源代码。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
资源类型确定模块,用于在所述广告资源判定模块判定所述目标网页为广告资源后,根据所述目标网页的URL信息确定所述目标网页对应的广告资源的类型;
预设资源加载模块,用于加载预设的与所述目标网页对应的广告资源的资源类型一致的资源。
10.根据权利要求8或9所述的装置,其特征在于,所述装置还包括:
URL信息对应资源加载模块,用于在所述源代码获得模块获得所述目标网页的源代码之后,按照预设规则,加载所述目标网页的源代码中包含的URL信息对应的资源;
非URL信息加载模块,用于加载所述目标网页的源代码中的非URL信息。
11.根据权利要求10所述的装置,其特征在于,所述URL信息对应资源加载模块,包括:URL信息判断子模块和第一广告资源判定子模块;
所述URL信息判断子模块,用于在加载所述目标网页的源代码中包含的第n个URL信息对应的资源之前,判断所述第n个URL信息是否符合第二预设广告特征;
所述第一广告资源判定子模块,用于在所述URL信息判断子模块的判断结果为是时,判定所述第n个URL信息对应的资源为广告资源,不发送所述第n个URL信息对应的资源的下载请求;其中,1≤n≤所述目标网页的源代码中包含的URL信息的数量。
12.根据权利要求11所述的装置,其特征在于,所述URL信息对应资源加载模块,还包括:第一广告资源替换子模块和第一资源加载子模块;
所述第一广告资源替换子模块,用于在所述第一广告资源判定子模块判定所述第n个URL信息对应的资源为广告资源之后,将所述目标网页的源代码中包含的第n个URL信息替换为预设的与所述第n个URL信息对应的资源类型一致的资源;
所述第一资源加载子模块,用于加载替换后的资源。
13.根据权利要求10所述的装置,其特征在于,所述URL信息对应资源加载模块,包括:广告资源确定子模块、第二广告资源判定子模块和第二资源加载子模块;
所述广告资源确定子模块,用于确定所述目标网页的源代码中所有符合第二预设广告特征的URL信息;
所述第二广告资源判定子模块,用于判定所述符合第二预设广告特征的URL信息对应的资源为广告资源,不发送所述广告资源的下载请求;
所述第二资源加载子模块,用于加载所述目标网页的源代码中不符合第二预设广告特征的URL信息对应的资源。
14.根据权利要求13所述的装置,其特征在于,所述URL信息对应资源加载模块,还包括:第二广告资源替换子模块和第三资源加载子模块;
所述第二广告资源替换子模块,用于在所述广告资源确定子模块判定所述符合第二预设广告特征的URL信息对应的资源为广告资源之后,将所述符合第二预设广告特征的URL信息对应的广告资源替换为预设的与所述广告资源类型一致的资源;
所述第三资源加载子模块,用于加载替换后的资源。
CN201410036481.1A 2014-01-24 2014-01-24 一种网页广告过滤方法及装置 Pending CN104809119A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410036481.1A CN104809119A (zh) 2014-01-24 2014-01-24 一种网页广告过滤方法及装置
PCT/CN2014/084782 WO2015109831A1 (zh) 2014-01-24 2014-08-20 一种网页广告过滤方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410036481.1A CN104809119A (zh) 2014-01-24 2014-01-24 一种网页广告过滤方法及装置

Publications (1)

Publication Number Publication Date
CN104809119A true CN104809119A (zh) 2015-07-29

Family

ID=53680761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410036481.1A Pending CN104809119A (zh) 2014-01-24 2014-01-24 一种网页广告过滤方法及装置

Country Status (2)

Country Link
CN (1) CN104809119A (zh)
WO (1) WO2015109831A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893428A (zh) * 2015-12-07 2016-08-24 乐视移动智能信息技术(北京)有限公司 广告过滤方法、装置及移动终端
CN105897900A (zh) * 2016-04-22 2016-08-24 北京小米移动软件有限公司 资源获取方法及装置
CN106126678A (zh) * 2016-06-28 2016-11-16 乐视控股(北京)有限公司 一种数据处理方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009232A (zh) * 2017-11-29 2018-05-08 北京小米移动软件有限公司 广告屏蔽方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6701350B1 (en) * 1999-09-08 2004-03-02 Nortel Networks Limited System and method for web page filtering
CN103530560A (zh) * 2013-09-29 2014-01-22 北京金山网络科技有限公司 广告拦截的方法、装置和客户端

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8050970B2 (en) * 2002-07-25 2011-11-01 Google Inc. Method and system for providing filtered and/or masked advertisements over the internet
CN100543741C (zh) * 2006-02-10 2009-09-23 鸿富锦精密工业(深圳)有限公司 自动下载和过滤网页的系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6701350B1 (en) * 1999-09-08 2004-03-02 Nortel Networks Limited System and method for web page filtering
CN103530560A (zh) * 2013-09-29 2014-01-22 北京金山网络科技有限公司 广告拦截的方法、装置和客户端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DELECTATE: "AdBlock Plus插件的原理是什么?", 《HTTP://FORUM.UBUNTU.ORG.CN/VIEWTOPIC.PHP?T=293143》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893428A (zh) * 2015-12-07 2016-08-24 乐视移动智能信息技术(北京)有限公司 广告过滤方法、装置及移动终端
CN105897900A (zh) * 2016-04-22 2016-08-24 北京小米移动软件有限公司 资源获取方法及装置
CN106126678A (zh) * 2016-06-28 2016-11-16 乐视控股(北京)有限公司 一种数据处理方法及装置

Also Published As

Publication number Publication date
WO2015109831A1 (zh) 2015-07-30

Similar Documents

Publication Publication Date Title
CN102722563B (zh) 页面显示方法及装置
CN102200980B (zh) 一种提供网络资源的方法及系统
CA2729272C (en) Embedding macros in web pages with advertisements
US7302431B1 (en) Configurable architecture for managing corporate and industry knowledgebases
US20090249188A1 (en) Method for adaptive transcription of web pages
CN105528408A (zh) 页面展示方法和装置
CN103699665A (zh) 一种网页广告过滤方法及装置
CN104036011A (zh) 网页元素的显示方法以及浏览器装置
CN101782913A (zh) 一种更新提醒的方法及浏览器
CN104580093A (zh) 网站通知消息的处理方法、装置及系统
CN104462583A (zh) 一种进行广告拦截处理浏览器装置和移动终端
CN105718533A (zh) 信息推送方法和装置
CN104809119A (zh) 一种网页广告过滤方法及装置
CN102023998B (zh) 用于处理网页以便在手持设备上显示的方法和装置
CN103092917A (zh) 一种自定义标签实现浏览器页面业务字典的查询方法
US20130097192A1 (en) Identifier assigning method, identifier parsing method, and multimedia reading
CN105808642A (zh) 推荐方法及装置
CN101499077A (zh) 一种根据载体内容分类信息发布信息的控制装置及方法
CN104267921A (zh) 一种页面显示控制方法及服务器
CN105450718A (zh) 界面更新方法及客户端
CN101203853B (zh) 用于支持播客的技术和系统
CN105183453A (zh) 基于网页的信息获取方法及装置
CN108920642A (zh) 校园信息发布系统
CN101782915A (zh) 一种聚合内容rss订阅方法和装置
CN105635821A (zh) 一种视频过滤方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150729

RJ01 Rejection of invention patent application after publication