CN106033450A - 一种广告拦截的方法、装置和浏览器 - Google Patents

一种广告拦截的方法、装置和浏览器 Download PDF

Info

Publication number
CN106033450A
CN106033450A CN201510116203.1A CN201510116203A CN106033450A CN 106033450 A CN106033450 A CN 106033450A CN 201510116203 A CN201510116203 A CN 201510116203A CN 106033450 A CN106033450 A CN 106033450A
Authority
CN
China
Prior art keywords
style attributes
detected
style
attribute
attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510116203.1A
Other languages
English (en)
Other versions
CN106033450B (zh
Inventor
曹刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201510116203.1A priority Critical patent/CN106033450B/zh
Publication of CN106033450A publication Critical patent/CN106033450A/zh
Application granted granted Critical
Publication of CN106033450B publication Critical patent/CN106033450B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种广告拦截的方法、装置和浏览器,该方法可以包括:获取待检测页面所对应的文档对象模型DOM树中的待检测区域节点;根据待检测区域节点的样式属性确定待检测区域节点在待检测页面中所对应的区域为候选广告区域;将候选广告区域对应的待检测区域节点的内部文本与预设的字符集进行匹配,当内部文本中包含预设的字符集中所包括的关键字时,确定候选广告区域为需拦截的广告区域,并对候选广告区域进行拦截。

Description

一种广告拦截的方法、装置和浏览器
技术领域
本发明涉及浏览器技术,尤其涉及一种广告拦截的方法、装置和浏览器。
背景技术
当前,在移动终端上使用浏览器上网的用户越来越多,而浏览器所浏览的网页上会通常出现各种各样商家的广告,非常影响用户的阅读体验。目前浏览器对于网页广告的常规拦截技术主要包括两种方法:一是建立与广告对应的图片、JS脚本文件等子资源的统一资源定位器(URL,Uniform Resoure Locator)地址黑名单,当浏览器检测到该黑名单中的URL地址时,对这些URL地址停止进行网络加载。这种方法适用于点击进入的网页广告进行拦截;二是对网页广告区域在网页超文本标记语言(HTML,HyperText Markup Language)中的文档对象模型(DOM,Document Object Model)树的对应节点进行标识黑名单,这些标识包括节点ID或者节点类名;当浏览器在构造DOM树时,如果发现某个节点的ID或者节点类名属于标识黑名单中则将该节点进行删除或隐藏。
而当前最影响用户浏览网页的主要是弹出框广告,并且这类广告对应的DOM节点标识都是通过JS动态随机产生,因此,第一种方法只能在弹出框广告已弹出且弹出框广告的子资源进行加载时才能够进行拦截,无法消除掉弹出框;而第二种方法由于标识黑名单中的是有限的,无法识别出随机产生的节点标识。因此,上述两种方法均无法有效地拦截DOM节点标识是动态随机产生的这类弹出框广告。
发明内容
为解决上述技术问题,本发明实施例期望提供一种广告拦截的方法、装置和浏览器,能够有效地拦截DOM节点标识是动态随机产生的弹出框广告,提升了用户体验。
本发明的技术方案是这样实现的:
第一方面,本发明实施例提供了一种广告拦截的方法,所述方法应用于浏览器侧,所述方法包括:
获取待检测页面所对应的文档对象模型DOM树中的待检测区域节点;
根据所述待检测区域节点的样式属性确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;
将所述候选广告区域对应的待检测区域节点的内部文本与预设的字符集进行匹配,当所述内部文本中包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为需拦截的广告区域,并对所述候选广告区域进行拦截。
进一步地,所述根据所述待检测区域节点的样式属性确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域,包括:
依次对所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性与对应的预设判定条件进行比对;
当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性均满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;
当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性中的任一项不满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域不为候选广告区域。
进一步地,与所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性对应的预设的判定条件,包括:
与所述位置样式属性对应的预设的判定条件为:所述位置样式属性为固定属性;
与所述图层样式属性对应的预设的判定条件为:所述图层样式属性的属性值大于零;
与所述底部坐标样式属性对应的预设的判定条件为:所述底部坐标样式属性的属性值在第一数值范围内;
与所述宽度样式属性对应的预设的判定条件为:所述宽度样式属性的属性值在第二数值范围内;
与所述高度样式属性对应的预设的判定条件为:所述高度样式属性的属性值在第三数值范围内。
进一步地,所述对所述候选广告区域进行拦截,包括:将所述候选广告区域对应的待检测区域节点在所述待检测页面所对应的DOM树中进行隐藏或删除。
进一步地,所述方法还包括:当所述内部文本中没有包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为非广告区域,不对所述候选广告区域进行拦截。
第二方面,本发明实施例提供了一种广告拦截的装置,所述装置包括:获取单元、确定单元、匹配单元和拦截控制单元,其中,
所述获取单元,用于获取待检测页面所对应的文档对象模型DOM树中的待检测区域节点;
所述确定单元,用于根据所述待检测区域节点的样式属性确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;
所述匹配单元,将所述候选广告区域对应的待检测区域节点的内部文本与预设的字符集进行匹配,并根据匹配结果触发拦截控制单元;
所述拦截控制单元,用于当所述内部文本中包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为需拦截的广告区域,并对所述候选广告区域进行拦截。
进一步地,所述确定单元,包括比对模块和确定模块,其中,
所述比对模块,用于依次对所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性与对应的预设判定条件进行比对;并根据比对结果触发所述确定模块;
所述确定模块,用于当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性均满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;以及,
当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性中的任一项不满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域不为候选广告区域。
进一步地,与所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性对应的预设的判定条件,包括:
与所述位置样式属性对应的预设的判定条件为:所述位置样式属性为固定属性;
与所述图层样式属性对应的预设的判定条件为:所述图层样式属性的属性值大于零;
与所述底部坐标样式属性对应的预设的判定条件为:所述底部坐标样式属性的属性值在第一数值范围内;
与所述宽度样式属性对应的预设的判定条件为:所述宽度样式属性的属性值在第二数值范围内;
与所述高度样式属性对应的预设的判定条件为:所述高度样式属性的属性值在第三数值范围内。
进一步地,所述拦截控制单元,用于将所述候选广告区域对应的待检测区域节点在所述待检测页面所对应的DOM树中进行隐藏或删除。
进一步地,所述拦截控制单元,还用于当所述内部文本中没有包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为非广告区域,不对所述候选广告区域进行拦截。
第三方面,本发明实施例提供了一种浏览器,所述浏览器包括:获取单元、确定单元、匹配单元和拦截控制单元,其中,
所述获取单元,用于获取待检测页面所对应的文档对象模型DOM树中的待检测区域节点;
所述确定单元,用于根据所述待检测区域节点的样式属性确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;
所述匹配单元,将所述候选广告区域对应的待检测区域节点的内部文本与预设的字符集进行匹配,并根据匹配结果触发拦截控制单元;
所述拦截控制单元,用于当所述内部文本中包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为需拦截的广告区域,并对所述候选广告区域进行拦截。
进一步地,所述确定单元,包括比对模块和确定模块,其中,
所述比对模块,用于依次对所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性与对应的预设判定条件进行比对;并根据比对结果触发所述确定模块;
所述确定模块,用于当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性均满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;以及,
当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性中的任一项不满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域不为候选广告区域。
进一步地,与所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性对应的预设的判定条件,包括:
与所述位置样式属性对应的预设的判定条件为:所述位置样式属性为固定属性;
与所述图层样式属性对应的预设的判定条件为:所述图层样式属性的属性值大于零;
与所述底部坐标样式属性对应的预设的判定条件为:所述底部坐标样式属性的属性值在第一数值范围内;
与所述宽度样式属性对应的预设的判定条件为:所述宽度样式属性的属性值在第二数值范围内;
与所述高度样式属性对应的预设的判定条件为:所述高度样式属性的属性值在第三数值范围内。
进一步地,所述拦截控制单元,用于将所述候选广告区域对应的待检测区域节点在所述待检测页面所对应的DOM树中进行隐藏或删除。
进一步地,所述拦截控制单元,还用于当所述内部文本中没有包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为非广告区域,不对所述候选广告区域进行拦截。
本发明实施例提供了一种广告拦截的方法、装置和浏览器,通过弹出框广告在网络页面HTML中的DOM树节点的样式属性来对弹出框广告进行判定和拦截,从而在网络页面加载过程中就能够拦截到弹出框广告,而且还避免了根据DOM树的节点标识无法拦截动态随机产生的弹出框广告的情况,能够有效地拦截DOM节点标识是动态随机产生的弹出框广告,提升了用户体验。
附图说明
图1为本发明实施例提供的一种广告拦截的方法流程示意图;
图2为本发明实施例提供的一种候选广告区域的确定方法流程示意图;
图3为本发明实施例提供的一种广告拦截的装置结构示意图;
图4为本发明实施例提供的另一种广告拦截的装置结构示意图;
图5为本发明实施例提供的一种浏览器的结构示意图;
图6为本发明实施例提供的另一种浏览器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明实施例的基本思想是:通过弹出框广告在网络页面HTML中的DOM树节点的样式属性来对弹出框广告进行判定和拦截,从而在网络页面加载过程中就能够拦截到弹出框广告,而且还避免了根据DOM树的节点标识无法拦截动态随机产生的弹出框广告的情况,能够有效地拦截DOM节点标识是动态随机产生的弹出框广告,提升了用户体验。
对于上述的基本思想,参见图1,其示出了本发明实施例提供的一种广告拦截的方法流程,该方法可以应用于浏览器侧,该方法可以包括:
S101:获取待检测页面所对应的DOM树中的待检测区域节点;
需要说明的是,并不是所有的当前浏览器网页均为待检测页面,当用户期望通过浏览器进行广告浏览时,就无需对用户期望进行广告浏览的页面进行广告拦截。具体地,可以根据URL地址来确定当前浏览器网页是否为待检测页面。比如,当用户需要通过浏览器进行广告浏览时,此时可以将当前浏览器网页的URL与用户期望进行广告浏览的广告页面URL进行比较,若确定当前浏览器网页为用户期望进行广告浏览的广告页面时,当前浏览器网页就无需进行广告拦截,因此当前浏览器网页就不是待检测页面。
当确定了当前浏览器网页为待检测页面后,浏览器可以从待检测页面HTML的DOM树中获取待检测区域节点,通常来说,弹出框广告一般存在于DOM树中的DIV节点和SECTION节点,因此,浏览器可以将DOM树中的DIV节点和SECTION节点作为进行弹出框广告拦截的待检测区域节点。可以理解的,DOM树中的DIV节点和SECTION节点的数量不止一个,因此,待检测区域节点的数量也不止一个,因此,在得到了待检测区域节点之后,可以依次对待检测节点通过步骤S102和S103的弹出框广告检测过程来确定待检测区域节点在待检测页面中所对应的区域是否为需拦截的广告区域,并对需拦截的广告区域进行拦截。
为了简要而清楚地说明本发明实施例的技术方案,在本实施例中,以DOM树中的单个待检测区域节点对后续步骤S102和步骤S103的弹出框广告检测过程进行说明,可以理解地,步骤S102和步骤S103的弹出框广告检测过程可以应用于DOM树中的所有待检测区域节点,本发明实施例对此不作赘述。
S102:根据待检测区域节点的样式属性确定待检测区域节点在待检测页面中所对应的区域为候选广告区域;
示例性地,参见图2,步骤S102具体可以包括:
S1021:依次对待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性与对应的预设判定条件进行比对;
S1022:当待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性均满足对应的预设判定条件时,确定待检测区域节点在待检测页面中所对应的区域为候选广告区域;
S1023:当待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性中的任一项不满足对应的预设判定条件时,确定待检测区域节点在待检测页面中所对应的区域不为候选广告区域。
进一步地,与待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性对应的预设的判定条件,包括:
与位置样式属性对应的预设的判定条件为:位置样式属性position为固定属性fixed;需要说明的是,因为几乎所有的弹出框广告一旦在网页上弹出则该弹出框广告相对窗体位置都是固定不变,即不随网页垂直或水平滚动发生改变,这也是弹出框广告最影响用户浏览体验的重要原因,所以固定属性是判断弹出框广告第一重要样式属性;
与图层样式属性对应的预设的判定条件为:图层样式属性z-index的属性值大于零;需要说明的是,因为弹出框广告通常不是嵌入在网页内部,而是覆盖在网页上面,即与普通的网页内容不在同一个图层,因此几乎所有的弹出框广告区域节点的图层样式属性值都是大于零的,所以图层样式属性的属性值大于零也是判断弹出框广告非常重要的样式属性;
与底部坐标样式属性对应的预设的判定条件为:底部坐标样式属性bottom的属性值在第一数值范围内;需要说明的是,最常见的广告弹出框都是底部弹出框,因此底部坐标样式属性的属性值一般为零,但考虑到有些弹出框广告也会超出底部显示。因此,第一数值范围可以为零和某个阈值之间,该阈值和窗体高度成正比;
与宽度样式属性对应的预设的判定条件为:宽度样式属性width的属性值在第二数值范围内;需要说明的是,宽度样式属性的属性值和高度样式属性的属性值都是广告弹出框判断一种辅助性属性,这主要是考虑到这类广告一般都会占据一定面积的区域,从而避免一些小的有用提示窗体被误滤掉。因此,第二数值范围可以为某个阈值和手机窗体宽度值之间,该阈值和窗体宽度成正比;
与高度样式属性对应的预设的判定条件为:高度样式属性height的属性值在第三数值范围内。需要说明的是,高度样式属性的属性值和宽度样式属性的属性值类似,都是广告弹出框判断一种辅助性属性,与宽度样式属性的属性值类似的说明,第三数值范围可以为某个阈值和手机窗体高度值之间,该阈值和窗体高度成正比;
可以理解地,步骤S102是在考虑了弹出框广告在DOM树中的样式属性之后对弹出框广告进行判定,但是由于还有一些网页中,会出现弹出框的应用,例如,某些音乐网站中会通过弹出框来进行音乐播放,某些购物网站会通过弹出框来进行支付或购买物品的选择。因此,如果仅通过步骤S102就确定候选广告区域为弹出框广告区域就会出现大量的误判,因此,本发明实施例还通过步骤S103对候选广告区域进行进一步地判断,以确定候选广告区域是否为需拦截的广告区域。
S103:将候选广告区域对应的待检测区域节点的内部文本与预设的字符集进行匹配,当内部文本中包含预设的字符集中所包括的关键字时,确定候选广告区域为需拦截的广告区域,并对候选广告区域进行拦截。
示例性地,步骤S103中所述的对候选广告区域进行拦截,具体可以包括:将候选广告区域对应的待检测区域节点在待检测页面所对应的DOM树中进行隐藏或删除。
示例性地,本方法流程还包括:当内部文本中没有包含预设的字符集中所包括的关键字时,确定候选广告区域为非广告区域,不对候选广告区域进行拦截。
需要说明的是,候选广告区域包括了弹出框广告区域,也包括了非弹出框广告区域,如果将所有的候选广告区域都进行拦截,那么会造成大量的误拦截。因此,本发明实施例通过对候选广告区域所对应的待检测区域节点的内部文本进行进一步地判定,来消除误拦截的情况,可以理解地,常见弹出框广告中都会有些关键字,如“APP”、“DOWNLOAD”、“APK”、“下载”、“开启”、“AD”、“广告”等等,这些关键字可以组成一个字符集,并且该字符集可由第三方提供,并随时能够进行更新。当候选广告区域所对应的待检测区域节点的内部文本中包含了该字符集中的关键字时,就可以确定该候选广告区域为需拦截的广告区域,并对需拦截的广告区域进行拦截;当候选广告区域所对应的待检测区域节点的内部文本中没有包含该字符集中的关键字时,就可以确定该候选广告区域为非广告区域,不对非广告区域进行拦截。通过步骤S103可以极大地降低弹出框广告的误拦截情况发生。
本实施例提供了一种广告拦截的方法,通过弹出框广告在网络页面HTML中的DOM树节点的样式属性来对弹出框广告进行判定和拦截,能够有效地拦截DOM节点标识是动态随机产生的弹出框广告,提升了用户体验。
基于前述实施例相同的技术构思,参见图3,其示出了本发明实施例提供的一种广告拦截的装置30,该装置30可以包括:获取单元301、确定单元302、匹配单元303和拦截控制单元304,其中,
获取单元301,用于获取待检测页面所对应的文档对象模型DOM树中的待检测区域节点;
确定单元302,用于根据待检测区域节点的样式属性确定待检测区域节点在待检测页面中所对应的区域为候选广告区域;
匹配单元303,将候选广告区域对应的待检测区域节点的内部文本与预设的字符集进行匹配,并根据匹配结果触发拦截控制单元304;
拦截控制单元304,用于当内部文本中包含预设的字符集中所包括的关键字时,确定候选广告区域为需拦截的广告区域,并对候选广告区域进行拦截。
示例性地,确定单元302,包括比对模块3021和确定模块3022,其中,
比对模块3021,用于依次对待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性与对应的预设判定条件进行比对;并根据比对结果触发确定模块3022;
确定模块3022,用于当待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性均满足对应的预设判定条件时,确定待检测区域节点在待检测页面中所对应的区域为候选广告区域;以及,
当待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性中的任一项不满足对应的预设判定条件时,确定待检测区域节点在待检测页面中所对应的区域不为候选广告区域。
进一步地,与待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性对应的预设的判定条件,包括:
与位置样式属性对应的预设的判定条件为:位置样式属性为固定属性;
与图层样式属性对应的预设的判定条件为:图层样式属性的属性值大于零;
与底部坐标样式属性对应的预设的判定条件为:底部坐标样式属性的属性值在第一数值范围内;
与宽度样式属性对应的预设的判定条件为:宽度样式属性的属性值在第二数值范围内;
与高度样式属性对应的预设的判定条件为:高度样式属性的属性值在第三数值范围内。
示例性地,拦截控制单元304,用于将候选广告区域对应的待检测区域节点在待检测页面所对应的DOM树中进行隐藏或删除。
示例性地,拦截控制单元304,还用于当内部文本中没有包含预设的字符集中所包括的关键字时,确定候选广告区域为非广告区域,不对候选广告区域进行拦截。
本实施例提供了一种广告拦截的装置30,通过弹出框广告在网络页面HTML中的DOM树节点的样式属性来对弹出框广告进行判定和拦截,能够有效地拦截DOM节点标识是动态随机产生的弹出框广告,提升了用户体验。
基于前述实施例相同的技术构思,参见图5,其示出了本发明实施例提供的一种浏览器50,该浏览器50可以包括:获取单元501、确定单元502、匹配单元503和拦截控制单元504,其中,
获取单元501,用于获取待检测页面所对应的文档对象模型DOM树中的待检测区域节点;
确定单元502,用于根据待检测区域节点的样式属性确定待检测区域节点在待检测页面中所对应的区域为候选广告区域;
匹配单元503,将候选广告区域对应的待检测区域节点的内部文本与预设的字符集进行匹配,并根据匹配结果触发拦截控制单元504;
拦截控制单元504,用于当内部文本中包含预设的字符集中所包括的关键字时,确定候选广告区域为需拦截的广告区域,并对候选广告区域进行拦截。
示例性地,参见图6,确定单元502,可以包括:比对模块5021和确定模块5022,其中,
比对模块5021,用于依次对待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性与对应的预设判定条件进行比对;并根据比对结果触发确定模块5022;
确定模块5022,用于当待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性均满足对应的预设判定条件时,确定待检测区域节点在待检测页面中所对应的区域为候选广告区域;以及,
当待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性中的任一项不满足对应的预设判定条件时,确定待检测区域节点在待检测页面中所对应的区域不为候选广告区域。
进一步地,与待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性对应的预设的判定条件,包括:
与位置样式属性对应的预设的判定条件为:位置样式属性为固定属性;
与图层样式属性对应的预设的判定条件为:图层样式属性的属性值大于零;
与底部坐标样式属性对应的预设的判定条件为:底部坐标样式属性的属性值在第一数值范围内;
与宽度样式属性对应的预设的判定条件为:宽度样式属性的属性值在第二数值范围内;
与高度样式属性对应的预设的判定条件为:高度样式属性的属性值在第三数值范围内。
示例性地,拦截控制单元504,用于将候选广告区域对应的待检测区域节点在待检测页面所对应的DOM树中进行隐藏或删除。
示例性地,拦截控制单元504,还用于当内部文本中没有包含预设的字符集中所包括的关键字时,确定候选广告区域为非广告区域,不对候选广告区域进行拦截。
本实施例提供了一种浏览器50,通过弹出框广告在网络页面HTML中的DOM树节点的样式属性来对弹出框广告进行判定和拦截,能够有效地拦截DOM节点标识是动态随机产生的弹出框广告,提升了用户体验。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (15)

1.一种广告拦截的方法,其特征在于,所述方法应用于浏览器侧,所述方法包括:
获取待检测页面所对应的文档对象模型DOM树中的待检测区域节点;
根据所述待检测区域节点的样式属性确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;
将所述候选广告区域对应的待检测区域节点的内部文本与预设的字符集进行匹配,当所述内部文本中包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为需拦截的广告区域,并对所述候选广告区域进行拦截。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待检测区域节点的样式属性确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域,包括:
依次对所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性与对应的预设判定条件进行比对;
当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性均满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;
当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性中的任一项不满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域不为候选广告区域。
3.根据权利要求2所述的方法,其特征在于,与所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性对应的预设的判定条件,包括:
与所述位置样式属性对应的预设的判定条件为:所述位置样式属性为固定属性;
与所述图层样式属性对应的预设的判定条件为:所述图层样式属性的属性值大于零;
与所述底部坐标样式属性对应的预设的判定条件为:所述底部坐标样式属性的属性值在第一数值范围内;
与所述宽度样式属性对应的预设的判定条件为:所述宽度样式属性的属性值在第二数值范围内;
与所述高度样式属性对应的预设的判定条件为:所述高度样式属性的属性值在第三数值范围内。
4.根据权利要求1所述的方法,其特征在于,所述对所述候选广告区域进行拦截,包括:将所述候选广告区域对应的待检测区域节点在所述待检测页面所对应的DOM树中进行隐藏或删除。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述内部文本中没有包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为非广告区域,不对所述候选广告区域进行拦截。
6.一种广告拦截的装置,其特征在于,所述装置包括:获取单元、确定单元、匹配单元和拦截控制单元,其中,
所述获取单元,用于获取待检测页面所对应的文档对象模型DOM树中的待检测区域节点;
所述确定单元,用于根据所述待检测区域节点的样式属性确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;
所述匹配单元,将所述候选广告区域对应的待检测区域节点的内部文本与预设的字符集进行匹配,并根据匹配结果触发拦截控制单元;
所述拦截控制单元,用于当所述内部文本中包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为需拦截的广告区域,并对所述候选广告区域进行拦截。
7.根据权利要求6所述的装置,其特征在于,所述确定单元,包括比对模块和确定模块,其中,
所述比对模块,用于依次对所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性与对应的预设判定条件进行比对;并根据比对结果触发所述确定模块;
所述确定模块,用于当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性均满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;以及,
当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性中的任一项不满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域不为候选广告区域。
8.根据权利要求7所述的装置,其特征在于,与所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性对应的预设的判定条件,包括:
与所述位置样式属性对应的预设的判定条件为:所述位置样式属性为固定属性;
与所述图层样式属性对应的预设的判定条件为:所述图层样式属性的属性值大于零;
与所述底部坐标样式属性对应的预设的判定条件为:所述底部坐标样式属性的属性值在第一数值范围内;
与所述宽度样式属性对应的预设的判定条件为:所述宽度样式属性的属性值在第二数值范围内;
与所述高度样式属性对应的预设的判定条件为:所述高度样式属性的属性值在第三数值范围内。
9.根据权利要求6所述的装置,其特征在于,所述拦截控制单元,用于将所述候选广告区域对应的待检测区域节点在所述待检测页面所对应的DOM树中进行隐藏或删除。
10.根据权利要求6所述的装置,其特征在于,所述拦截控制单元,还用于当所述内部文本中没有包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为非广告区域,不对所述候选广告区域进行拦截。
11.一种浏览器,其特征在于,所述浏览器包括:获取单元、确定单元、匹配单元和拦截控制单元,其中,
所述获取单元,用于获取待检测页面所对应的文档对象模型DOM树中的待检测区域节点;
所述确定单元,用于根据所述待检测区域节点的样式属性确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;
所述匹配单元,将所述候选广告区域对应的待检测区域节点的内部文本与预设的字符集进行匹配,并根据匹配结果触发拦截控制单元;
所述拦截控制单元,用于当所述内部文本中包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为需拦截的广告区域,并对所述候选广告区域进行拦截。
12.根据权利要求11所述的浏览器,其特征在于,所述确定单元,包括比对模块和确定模块,其中,
所述比对模块,用于依次对所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性与对应的预设判定条件进行比对;并根据比对结果触发所述确定模块;
所述确定模块,用于当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性均满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域为候选广告区域;以及,
当所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性中的任一项不满足对应的预设判定条件时,确定所述待检测区域节点在所述待检测页面中所对应的区域不为候选广告区域。
13.根据权利要求12所述的浏览器,其特征在于,与所述待检测区域节点的样式属性中的位置样式属性、图层样式属性、底部坐标样式属性、宽度样式属性和高度样式属性对应的预设的判定条件,包括:
与所述位置样式属性对应的预设的判定条件为:所述位置样式属性为固定属性;
与所述图层样式属性对应的预设的判定条件为:所述图层样式属性的属性值大于零;
与所述底部坐标样式属性对应的预设的判定条件为:所述底部坐标样式属性的属性值在第一数值范围内;
与所述宽度样式属性对应的预设的判定条件为:所述宽度样式属性的属性值在第二数值范围内;
与所述高度样式属性对应的预设的判定条件为:所述高度样式属性的属性值在第三数值范围内。
14.根据权利要求11所述的浏览器,其特征在于,所述拦截控制单元,用于将所述候选广告区域对应的待检测区域节点在所述待检测页面所对应的DOM树中进行隐藏或删除。
15.根据权利要求11所述的浏览器,其特征在于,所述拦截控制单元,还用于当所述内部文本中没有包含所述预设的字符集中所包括的关键字时,确定所述候选广告区域为非广告区域,不对所述候选广告区域进行拦截。
CN201510116203.1A 2015-03-17 2015-03-17 一种广告拦截的方法、装置和浏览器 Active CN106033450B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510116203.1A CN106033450B (zh) 2015-03-17 2015-03-17 一种广告拦截的方法、装置和浏览器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510116203.1A CN106033450B (zh) 2015-03-17 2015-03-17 一种广告拦截的方法、装置和浏览器

Publications (2)

Publication Number Publication Date
CN106033450A true CN106033450A (zh) 2016-10-19
CN106033450B CN106033450B (zh) 2020-02-14

Family

ID=57150795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510116203.1A Active CN106033450B (zh) 2015-03-17 2015-03-17 一种广告拦截的方法、装置和浏览器

Country Status (1)

Country Link
CN (1) CN106033450B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193870A (zh) * 2017-04-12 2017-09-22 广东万丈金数信息技术股份有限公司 网页内容的提取方法和系统
WO2018058330A1 (zh) * 2016-09-27 2018-04-05 中兴通讯股份有限公司 广告拦截的方法、装置和浏览器、计算机存储介质
CN108062324A (zh) * 2016-11-08 2018-05-22 广州市动景计算机科技有限公司 广告过滤方法、装置及用户终端
CN108280179A (zh) * 2018-01-22 2018-07-13 百度在线网络技术(北京)有限公司 音频广告检测的方法及系统、终端以及计算机可读存储介质
WO2018161613A1 (en) * 2017-03-10 2018-09-13 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Mobile terminal and method and device for controlling to display in the same
WO2018171189A1 (zh) * 2017-03-21 2018-09-27 中兴通讯股份有限公司 一种浏览器广告拦截方法、装置及终端
CN109948088A (zh) * 2019-02-15 2019-06-28 广东小天才科技有限公司 一种广告拦截方法及系统
CN110955855A (zh) * 2018-09-27 2020-04-03 华为终端有限公司 一种信息拦截的方法、装置及终端

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070206221A1 (en) * 2006-03-01 2007-09-06 Wyler Eran S Methods and apparatus for enabling use of web content on various types of devices
CN103473338A (zh) * 2013-09-22 2013-12-25 北京奇虎科技有限公司 网页内容抽取方法和网页内容抽取系统
CN103838880A (zh) * 2014-03-28 2014-06-04 北京金山网络科技有限公司 一种网页广告过滤方法及装置
CN103886088A (zh) * 2014-03-28 2014-06-25 北京金山网络科技有限公司 一种拦截网页中的广告的方法及装置
CN104133865A (zh) * 2014-07-17 2014-11-05 可牛网络技术(北京)有限公司 一种广告过滤方法以及装置
CN104239422A (zh) * 2014-08-21 2014-12-24 小米科技有限责任公司 广告识别方法及装置、电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070206221A1 (en) * 2006-03-01 2007-09-06 Wyler Eran S Methods and apparatus for enabling use of web content on various types of devices
CN103473338A (zh) * 2013-09-22 2013-12-25 北京奇虎科技有限公司 网页内容抽取方法和网页内容抽取系统
CN103838880A (zh) * 2014-03-28 2014-06-04 北京金山网络科技有限公司 一种网页广告过滤方法及装置
CN103886088A (zh) * 2014-03-28 2014-06-25 北京金山网络科技有限公司 一种拦截网页中的广告的方法及装置
CN104133865A (zh) * 2014-07-17 2014-11-05 可牛网络技术(北京)有限公司 一种广告过滤方法以及装置
CN104239422A (zh) * 2014-08-21 2014-12-24 小米科技有限责任公司 广告识别方法及装置、电子设备

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018058330A1 (zh) * 2016-09-27 2018-04-05 中兴通讯股份有限公司 广告拦截的方法、装置和浏览器、计算机存储介质
CN108062324A (zh) * 2016-11-08 2018-05-22 广州市动景计算机科技有限公司 广告过滤方法、装置及用户终端
WO2018161613A1 (en) * 2017-03-10 2018-09-13 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Mobile terminal and method and device for controlling to display in the same
US10564837B2 (en) 2017-03-10 2020-02-18 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Mobile terminal and method and device for controlling to display in the same
WO2018171189A1 (zh) * 2017-03-21 2018-09-27 中兴通讯股份有限公司 一种浏览器广告拦截方法、装置及终端
CN108628888A (zh) * 2017-03-21 2018-10-09 中兴通讯股份有限公司 一种浏览器广告拦截方法、装置及终端
CN107193870A (zh) * 2017-04-12 2017-09-22 广东万丈金数信息技术股份有限公司 网页内容的提取方法和系统
CN108280179A (zh) * 2018-01-22 2018-07-13 百度在线网络技术(北京)有限公司 音频广告检测的方法及系统、终端以及计算机可读存储介质
CN110955855A (zh) * 2018-09-27 2020-04-03 华为终端有限公司 一种信息拦截的方法、装置及终端
CN110955855B (zh) * 2018-09-27 2023-06-02 花瓣云科技有限公司 一种信息拦截的方法、装置及终端
CN109948088A (zh) * 2019-02-15 2019-06-28 广东小天才科技有限公司 一种广告拦截方法及系统

Also Published As

Publication number Publication date
CN106033450B (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN106033450A (zh) 一种广告拦截的方法、装置和浏览器
US10007933B2 (en) Systems and methods for integrating dynamic content into electronic media
JP7528166B2 (ja) インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法
US9529780B2 (en) Displaying content on a mobile device
CN110069683B (zh) 一种基于浏览器爬取数据的方法及装置
EP3345114B1 (en) Disabling malicious browser extensions
US8090703B1 (en) Overlapping experiments
US20090299862A1 (en) Online ad serving
WO2015143956A1 (zh) 一种拦截网页中的广告的方法及装置
US9830304B1 (en) Systems and methods for integrating dynamic content into electronic media
US20090327869A1 (en) Online ad serving
CN105677654B (zh) 广告过滤方法及装置
CN104035753A (zh) 一种双WebView展示定制页面的方法及系统
WO2020118485A1 (en) Method of Detecting User Interface Layout Issues for Web Applications
CN104572798A (zh) 一种用于处理网页的方法、设备与系统
CN102724187A (zh) 一种针对网址的安全检测方法及装置
WO2021098242A1 (zh) 页面处理方法、装置、电子设备和计算机可读介质
Zhou et al. Understanding and monitoring embedded web scripts
CN105631340B (zh) 一种xss漏洞检测的方法及装置
CN107506649A (zh) 一种html网页的漏洞检测方法、装置及电子设备
Ghasemisharif et al. Speedreader: Reader mode made fast and private
US20150205767A1 (en) Link appearance formatting based on target content
CN104899217B (zh) 一种自定义功能的实现方法及装置
CN103336693B (zh) refer链的创建方法、装置及安全检测设备
CN103581321B (zh) 一种refer链的创建方法、装置及安全检测方法和客户端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant