CN108628888A - 一种浏览器广告拦截方法、装置及终端 - Google Patents
一种浏览器广告拦截方法、装置及终端 Download PDFInfo
- Publication number
- CN108628888A CN108628888A CN201710168060.8A CN201710168060A CN108628888A CN 108628888 A CN108628888 A CN 108628888A CN 201710168060 A CN201710168060 A CN 201710168060A CN 108628888 A CN108628888 A CN 108628888A
- Authority
- CN
- China
- Prior art keywords
- pop
- box
- characteristic value
- advertisement
- webpage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000000903 blocking effect Effects 0.000 title claims abstract description 41
- 230000006870 function Effects 0.000 claims description 80
- 238000012549 training Methods 0.000 claims description 53
- 238000013528 artificial neural network Methods 0.000 claims description 16
- 230000004913 activation Effects 0.000 claims description 7
- 238000011084 recovery Methods 0.000 claims 3
- 238000001914 filtration Methods 0.000 claims 1
- 238000012423 maintenance Methods 0.000 abstract description 3
- 239000010410 layer Substances 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 7
- 239000002356 single layer Substances 0.000 description 7
- 210000005036 nerve Anatomy 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
Landscapes
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种浏览器广告拦截方法、装置及终端,该方法包括:对弹出框的可观察特征值进行训练得到识别函数;针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。本发明无需维护黑名单和特征表,降低了成本,且能够适应弹出框的外部信息和内部特征千变万化的情况进行广告弹出框的准确拦截。
Description
技术领域
本发明涉及终端浏览器应用技术领域,尤其涉及一种浏览器广告拦截方法、装置及终端。
背景技术
随着无线通讯技术和互联网技术的飞速发展,在移动终端上使用浏览器上网的用户越来越多。作为移动互联网入口,浏览器的重要性不言而喻。如何在移动终端上提高浏览器的用户体验,从而在白热化的市场竞争中取得亮点和份额,是自研浏览器技术目前研究的重点。
通常网页上会出现各种各样商家的广告,特别是那些弹出框广告悬浮在网页上面,非常影响用户(尤其是手机用户)的阅读体验。因此针对这种弹出式广告框,各种浏览器竞相推出自己的广告拦截功能,其常规技术主要包括两种方法:一是建立相关弹出框广告对应的图片、JS(JavaScript)脚本文件等子资源的URL(Uniform Resource Locator,统一资源定位器)地址、弹出框的ID或CLASS等拦截黑名单,当浏览器检测到这些URL地址时就停止网络加载或根据ID及CLASS隐藏弹出框;二是根据弹出框特征自身,如CSS(CascadingStyle Sheets,层叠样式表)特征,由用户在服务器上定义好特征和规则,在服务器侧来确定弹出框是否滤除并通知终端进行拦截。以上两种方法的共同特点是:预先选取好的特征和规则来进行弹出框广告的拦截,其主要的缺陷是:
1、黑名单和特征表维护工作巨大,成本极高;
2、弹出框的外部信息和内部特征千变万化,如ID和CLASS信息本身经常不断动态变化,自身的CSS特征和规则选取不足或不当都会造成新广告弹出框的漏拦截或误拦截。
发明内容
本发明要解决的技术问题是,提供一种浏览器广告拦截方法、装置及终端,克服现有技术对广告弹出框拦截的技术方案的上述缺陷。
本发明采用的技术方案是,所述浏览器广告拦截方法,包括:
对弹出框的可观察特征值进行训练得到识别函数;
针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
进一步的,所述弹出框的获取方式,包括:
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素作为弹出框进行收集;或者,
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素、以及:网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框作为弹出框进行收集。
进一步的,作为一种可选的技术方案,所述对所述弹出框的可观察特征值进行训练,得到识别函数,包括:
设置所述弹出框是否为广告弹出框的标识;
基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
基于所述弹出框的各可观察特征值的权值确定出识别函数。
进一步的,作为另一种可选的技术方案,所述对所述弹出框的可观察特征值进行训练,得到识别函数,包括:
设置所述弹出框是否为广告弹出框的标识;
基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值;
基于所述弹出框的各有效可观察特征值的权值确定出识别函数。
进一步的,所述基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值,包括:
将所述弹出框的各可观察特征值的权值与设定的权值阈值进行比较,筛选出权值大于设定的权值阈值的可观察特征值作为有效可观察特征值。
进一步的,所述设置所述弹出框是否为广告弹出框的标识,包括:
通过标记的方式和/或聚类算法设置所述弹出框是否为广告弹出框的标识。
进一步的,所述训练是采用人工神经网络方法进行训练的;
所述识别函数为阶跃激活函数。
进一步的,所述弹出框的可观察特征值,包括以下至少之一:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
进一步的,针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值判断所述任一弹出框是否为广告弹出框,包括:
若所述任一弹出框对应的所述识别函数的数值大于设定的识别阈值,则判定所述任一弹出框为广告弹出框,否则判定所述任一弹出框不是广告弹出框。
本发明还提供一种浏览器广告拦截装置,包括:
训练模块,用于对弹出框的可观察特征值进行训练得到识别函数;
拦截模块,用于针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
进一步的,所述装置还包括:
收集模块,用于将网页的树形结构中层叠样式表位置属性为固定属性的节点元素作为弹出框进行收集;或者,
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素、以及:网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框作为弹出框进行收集。
进一步的,所述训练模块,包括:
设置模块,用于设置所述弹出框是否为广告弹出框的标识;
权值确定模块,用于基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
函数确定模块,用于基于所述弹出框的各可观察特征值的权值确定出识别函数。
本发明还提供一种终端,包括处理器以及存储有所述处理器可执行指令的存储器,当所述指令被处理器执行时,执行如下操作:
对弹出框的可观察特征值进行训练得到识别函数;
针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
进一步的,所述处理器执行的操作具体还包括:将网页的树形结构中层叠样式表位置属性为固定属性的节点元素作为弹出框进行收集;或者,
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素、以及:网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框作为弹出框进行收集。
进一步的,作为一种可选的技术方案,所述处理器在执行所述对所述弹出框的可观察特征值进行训练得到识别函数的步骤时,具体包括如下操作:
设置所述弹出框是否为广告弹出框的标识;
基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
基于所述弹出框的各可观察特征值的权值确定出识别函数。
进一步的,作为另一种可选的技术方案,所述处理器在执行所述对所述弹出框的可观察特征值进行训练得到识别函数的步骤时,具体包括如下操作:
设置所述弹出框是否为广告弹出框的标识;
基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值;
基于所述弹出框的各有效可观察特征值的权值确定出识别函数。
进一步的,所述处理器在执行所述基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值的步骤时,具体包括如下操作:
将所述弹出框的各可观察特征值的权值与设定的权值阈值进行比较,筛选出权值大于设定的权值阈值的可观察特征值作为有效可观察特征值。
进一步的,所述处理器在执行所述设置所述弹出框是否为广告弹出框的标识的步骤时,具体包括如下操作:
通过标记的方式和/或聚类算法设置所述弹出框是否为广告弹出框的标识。
进一步的,所述训练是采用人工神经网络方法进行训练的;
所述识别函数为阶跃激活函数。
进一步的,所述弹出框的可观察特征值,包括以下至少之一:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
进一步的,所述处理器在执行根据任一弹出框对应的所述识别函数的数值判断所述任一弹出框是否为广告弹出框的步骤时,具体包括如下操作:
若所述任一弹出框对应的所述识别函数的数值大于设定的识别阈值,则判定所述任一弹出框为广告弹出框,否则判定所述任一弹出框不是广告弹出框。
采用上述技术方案,本发明至少具有下列优点:
本发明所述浏览器广告拦截方法、装置及终端,主要秉承“让广告弹出框数据自己说话”的宗旨,基于人工智能和大数据技术进行机器学习的浏览器广告弹出框广告拦截办法,用机器学习的方法自动选择特征和规则,因此让拦截系统更加具有智能化和泛化性,有效地弥补常规方法的缺陷,从而取得极佳的用户体验。
附图说明
图1为本发明第一、二、三实施例的浏览器广告拦截方法的主流程图;
图2为本发明第二实施例的浏览器广告拦截方法中的步骤S102的流程图;
图3为本发明第三实施例的浏览器广告拦截方法中的步骤S102的流程图;
图4为本发明第四、五、六实施例的浏览器广告拦截装置的主要组成结构示意图;
图5为本发明第五实施例的建模模块的组成示意图;
图6为本发明第六实施例的建模模块的组成示意图;
图7为本发明第八实施例的基于机器学习的浏览器广告弹出框拦截装置的工作流程示意图;
图8为本发明第八实施例的弹出框样本训练的主要处理流程图;
图9为本发明第八实施例的实时检测阶段进行广告弹出框拦截的主要处理流程图。
具体实施方式
为更进一步阐述本发明为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明进行详细说明如后。
本发明实施例提出的广告弹出框的拦截方法、装置及终端,主要秉承“让广告弹出框数据自己说话”的宗旨,用机器学习的方法自动选择广告弹出框拦截需要的特征和规则,其主要包含以下几个关键技术步骤处理:
(一)首先进行预处理检测,根据网页DOM中各标签元素的CSS属性值,将样式位置为固定属性(position值等于fixed值)的标签元素作为训练的样本和待下一步检测的候选广告弹出框;
(二)在训练阶段,根据(一)中的方法提取大量主流网站中的弹出式广告框标签元素样本,并将这些标签元素的所有相关的可观察特征值作为多维输入以及每个样本人工标记作为期望输出,从而构成机器学习训练中需要的可监督学习样本(不限于其他半监督或非监督学习方法)。训练的时候可采用机器学习常用的基于人工神经网络模型结构和学习算法(不限于其他机器学习模型结构和学习方法)。等训练收敛后,各个可观察特征值对应的权值就会自动计算出来(这里实现了检测规则的自动确定),为了在实时检测中提高检测效率,可将权值极低对应的特征项去掉,从而同时实现特征的自动选取;
(三)在实时检测阶段,根据(一)中得到候选的弹出广告框的各观察特征值输入到(二)中训练好的模型中得到实际输出值(该值可以是布尔值,也不限于其他概率实数值等)来判断是否是广告弹出框来进行拦截操作(如在网页DOM中隐藏或删除该标签元素);
经过上述几个关键技术步骤的处理,可实现广告弹出框的特征和规则自动获取,从而使得浏览器在任何复杂网页中能非常准确地拦截住各种形式的广告弹出框广告框。
本发明第一实施例,一种浏览器广告拦截方法,如图1所示,包括以下具体步骤:
步骤S101,收集网页中的弹出框。
在本步骤中,弹出框是通过对网页中所有的节点元素进行初筛,具体是利用弹出框必然具备的属性进行初筛,但并不是说具备该属性的一定就是广告弹出框,后续还需要经过训练才能用于确定出用于识别广告弹出框的识别函数。因此,初筛得到的弹出框可以认为是疑似广告弹出框。广告弹出框必然包含于收集到的弹出框中。
可选的,所述收集网页中的弹出框,包括:
将网页的树形结构中层叠样式表位置属性CSS-position为固定属性的节点元素判定为弹出框,对所述弹出框进行收集。
网页的树形结构通常为DOM(Document Object Model,文档对象模型)树结构,固定属性可以是position值、fixed值等。
步骤S102,对所述弹出框的可观察特征值进行训练得到识别函数。
可选的,采用人工神经网络方法对所述弹出框的可观察特征值进行训练。
可选的,所述弹出框的可观察特征值,包括以下至少之一:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
步骤S103,针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
本发明实施例将网页的树形结构中CSS-position属性为固定属性的节点元素判定为弹出框,虽然可能会将一些不是广告弹出框的节点元素纳入其中,但是能够保证是广告弹出框的节点元素不会漏掉,这一步可以认为是基于广告弹出框的必要特征进行的初筛,后续选择尽可能多的与广告弹出框相关的可观察特征值,采用人工神经网络方法对这些可观察特征值进行训练以得到用于判断所述弹出框是否为广告弹出框的人工神经网络模型。由于本发明实施例对于可观察特征值选择的全面准确,可以得到较为准确的该人工神经网络模型即识别函数,因此,对广告弹出框的判断也比较准确。本发明实施例无需像现有技术那样维护黑名单和特征表,降低了广告弹出框的拦截成本,且能够适应弹出框的外部信息和内部特征千变万化的情况而进行广告弹出框的准确拦截。
本发明第二实施例,一种浏览器广告拦截方法,如图1所示,包括以下具体步骤:
步骤S101,收集网页中的弹出框。
可选的,所述收集网页中的弹出框,包括:
将网页的树形结构中层叠样式表位置属性CSS-position为固定属性的节点元素判定为弹出框,对所述弹出框进行收集。
网页的树形结构通常为DOM(Document Object Model,文档对象模型)树结构,固定属性可以是position值、fixed值等。
可选的,所述收集网页中的弹出框,还包括:将网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框也作为弹出框进行收集。
本发明实施例与第一实施例相比,还可以将网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框也作为弹出框,增加了弹出框的样本种类,用户删除的广告弹出框说明经过拦截还有一些漏掉的广告弹出框没有识别出来,被用户看到后由用户手动删除了,对于这种样本非常有记录的意义,经过训练后可以对用于判断所述弹出框是否为广告弹出框的人工神经网络模型即识别函数进行完善;由用户恢复显示的已拦截广告弹出框说明拦截了一些用户不认为是广告弹出框的或者用户愿意看到的弹出框,对于这种样本也非常有记录的意义,经过训练后可以对用于判断所述弹出框是否为广告弹出框的人工神经网络模型进行完善。与第一实施例的拦截效果相比更加贴近用户的真实需求,提升了用户体验。
步骤S102,对弹出框的可观察特征值进行训练得到识别函数;
如图2所示,可选的,步骤S102包括:
A1:设置所述弹出框是否为广告弹出框的标识;
可选的,步骤A1包括:
通过标记的方式设置所述弹出框是否为广告弹出框的标识。所述标记可以是人工标记也可以是自动标记。所述弹出框是否为广告弹出框的标识实际上就是期望判定结果。
在步骤S101中,根据层叠样式表位置属性CSS-position判断出的弹出框是否为广告弹出框的标识是被人工标记为是或者否。
由用户删除的广告弹出框作为弹出框时,该弹出框是否为广告弹出框的标识被人工或者自动标记为是,属于漏拦截,在用户实际使用浏览器的过程中,通过该弹出框的加入训练对特征值的选取和权值予以修正;由用户恢复显示的已拦截广告弹作为弹出框时,该弹出框是否为广告弹出框的标识被人工或者自动标记为否,属于误拦截,通过该弹出框的加入训练对特征值的选取和权值予以修正。
A2:基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
可选的,所述弹出框的可观察特征值,包括:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
A3:基于所述弹出框的各可观察特征值的权值确定出识别函数。该识别函数可以是基于单层人工神经网络模型或者多层人工神经网络模型的阶跃激活函数。
步骤S103,针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
可选的,在步骤S103中,包括:
若所述任一弹出框对应的所述识别函数的数值大于设定的识别阈值,则判定所述任一弹出框为广告弹出框,否则判定所述任一弹出框不是广告弹出框。
本发明第三实施例,一种浏览器广告拦截方法,如图1所示,包括以下具体步骤:
步骤S101,收集网页中的弹出框。
可选的,所述收集网页中的弹出框,包括:
将网页的树形结构中层叠样式表位置属性CSS-position为固定属性的节点元素判定为弹出框,对所述弹出框进行收集。
网页的树形结构通常为DOM(Document Object Model,文档对象模型)树结构,固定属性可以是position值、fixed值等。
可选的,所述收集网页中的弹出框,还包括:将网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框也作为弹出框进行收集。
步骤S102,对弹出框的可观察特征值进行训练得到识别函数;
如图3所示,可选的,步骤S102包括:
B1:设置所述弹出框是否为广告弹出框的标识;
可选的,步骤B1包括:
通过聚类算法设置所述弹出框是否为广告弹出框的标识;
或者,通过标记的方式设置一部分所述弹出框是否为广告弹出框的标识、且通过聚类算法设置其余的所述弹出框是否为广告弹出框的标识。所述标记可以是人工标记也可以是自动标记。
在步骤S101中,在采用标记方式的情况下,根据层叠样式表位置属性CSS-position判断出的弹出框是否为广告弹出框的标识被人工标记为是或者否。
由用户删除的广告弹出框作为弹出框时,该弹出框是否为广告弹出框的标识被人工或者自动标记为是,属于漏拦截,在用户实际使用浏览器的过程中,通过该弹出框的加入训练对特征值的选取和权值予以修正;由用户恢复显示的已拦截广告弹作为弹出框时,该弹出框是否为广告弹出框的标识被人工或者自动标记为否,属于误拦截,通过该弹出框的加入训练对特征值的选取和权值予以修正。
本发明实施例与第二实施例的区别在于,可以全部或者部分的通过聚类算法,比如:K均值方法,设置所述弹出框是否为广告弹出框的标识,减少人工成本。
B2:基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
可选的,所述弹出框的可观察特征值,包括:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
B3:基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值;
可选的,步骤B3包括:
将所述弹出框的各可观察特征值的权值与设定的权值阈值进行比较,筛选出权值大于设定的权值阈值的可观察特征值作为有效可观察特征值。
B4:基于所述弹出框的各有效可观察特征值的权值确定出识别函数。
步骤S103,针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
可选的,在步骤S103中,包括:
若所述任一弹出框对应的所述识别函数的数值大于设定的识别阈值,则判定所述任一弹出框为广告弹出框,否则判定所述任一弹出框不是广告弹出框。
本发明第四实施例,与第一实施例对应,本实施例介绍一种浏览器广告拦截装置,如图4所示,包括以下组成部分:
1)收集模块401,用于收集网页中的弹出框。
可选的,收集模块401,用于:
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素作为弹出框进行收集。
网页的树形结构通常为DOM树结构,固定属性可以是position值、fixed值等。
2)训练模块402,用于对弹出框的可观察特征值进行训练得到识别函数;
可选的,所述弹出框的可观察特征值,包括以下至少之一:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
3)拦截模块403,用于针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
本发明第五实施例,与第二实施例对应,本实施例介绍一种浏览器广告拦截装置,如图4所示,包括以下组成部分:
1)收集模块401,用于收集网页中的弹出框。
可选的,收集模块401,用于:
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素作为弹出框进行收集。
网页的树形结构通常为DOM树结构,固定属性可以是position值、fixed值等。
可选的,收集模块401,还用于:将网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框也作为弹出框进行收集。
2)训练模块402,用于对弹出框的可观察特征值进行训练得到识别函数;
如图5所示,可选的,训练模块402,包括:
设置模块10,用于设置所述弹出框是否为广告弹出框的标识;
可选的,设置模块10,用于:通过标记的方式设置所述弹出框是否为广告弹出框的标识;
可选的,根据层叠样式表位置属性CSS-position判断出的弹出框是否为广告弹出框的标识被人工标记为是或者否。
由用户删除的广告弹出框作为弹出框时,该弹出框是否为广告弹出框的标识被人工或者自动标记为是,属于漏拦截,在用户实际使用浏览器的过程中,通过该弹出框的加入训练对特征值的选取和权值予以修正;由用户恢复显示的已拦截广告弹作为弹出框时,该弹出框是否为广告弹出框的标识被人工或者自动标记为否,属于误拦截,通过该弹出框的加入训练对特征值的选取和权值予以修正。
权值确定模块20,用于基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
进一步的,所述弹出框的可观察特征值,包括:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
函数确定模块30,用于基于所述弹出框的各可观察特征值的权值确定出识别函数。
3)拦截模块403,用于针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
可选的,拦截模块403,用于:
若所述任一弹出框对应的所述识别函数的数值大于设定的识别阈值,则判定所述任一弹出框为广告弹出框,否则判定所述任一弹出框不是广告弹出框。
本发明第六实施例,与第三实施例对应,本实施例介绍一种浏览器广告拦截装置,如图4所示,包括以下组成部分:
1)收集模块401,用于收集网页中的弹出框。
可选的,收集模块401,用于:
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素作为弹出框进行收集。
网页的树形结构通常为DOM树结构,固定属性可以是position值、fixed值等。
可选的,收集模块401,还用于:将网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框也作为弹出框进行收集。
2)训练模块402,用于对弹出框的可观察特征值进行训练得到识别函数;
如图6所示,可选的,建模模块402,包括:
设置模块10,用于设置所述弹出框是否为广告弹出框的标识;
可选的,设置模块10,用于:通过聚类算法设置所述弹出框是否为广告弹出框的标识;或者,通过标记的方式设置一部分所述弹出框是否为广告弹出框的标识、且通过聚类算法设置其余的所述弹出框是否为广告弹出框的标识。所述标记的方式包括人工标记或自动标记。
在采用标记方式的情况下,可选的,根据层叠样式表位置属性CSS-position判断出的弹出框是否为广告弹出框的标识被人工标记为是或者否。
由用户删除的广告弹出框作为弹出框时,该弹出框是否为广告弹出框的标识被人工或者自动标记为是,属于漏拦截,在用户实际使用浏览器的过程中,通过该弹出框的加入训练对特征值的选取和权值予以修正;由用户恢复显示的已拦截广告弹作为弹出框时,该弹出框是否为广告弹出框的标识被人工或者自动标记为否,属于误拦截,通过该弹出框的加入训练对特征值的选取和权值予以修正。
权值确定模块20,用于基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
进一步的,所述弹出框的可观察特征值,包括:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
筛选模块40,用于将所述弹出框的各可观察特征值的权值与设定的权值阈值进行比较,筛选出权值大于设定的权值阈值的可观察特征值作为有效可观察特征值。
函数确定模块30,用于基于所述弹出框的各有效可观察特征值的权值确定出识别函数。
3)拦截模块403,用于针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
可选的,拦截模块403,用于:
若所述任一弹出框对应的所述识别函数的数值大于设定的识别阈值,则判定所述任一弹出框为广告弹出框,否则判定所述任一弹出框不是广告弹出框。
本发明第七实施例,一种终端,可以作为实体装置手机或者服务器来理解,包括处理器以及存储有所述处理器可执行指令的存储器,当所述指令被处理器执行时,执行如下操作:
收集网页中的弹出框;
对弹出框的可观察特征值进行训练得到识别函数;
针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
可选的,所述处理器执行的操作具体还包括:
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素作为弹出框进行收集;或者,
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素、以及:网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框作为弹出框进行收集。
网页的树形结构通常为DOM树结构,固定属性可以是position值、fixed值等。
可选的,作为一种可选的技术方案,所述处理器在执行所述对所述弹出框的可观察特征值进行训练得到识别函数的步骤时,具体包括如下操作:
设置所述弹出框是否为广告弹出框的标识;
基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
基于所述弹出框的各可观察特征值的权值确定出识别函数。
可选的,作为另一种可选的技术方案,所述处理器在执行所述对所述弹出框的可观察特征值进行训练得到识别函数的步骤时,具体包括如下操作:
设置所述弹出框是否为广告弹出框的标识;
基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值;
基于所述弹出框的各有效可观察特征值的权值确定出识别函数。
可选的,所述处理器在执行所述基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值的步骤时,具体包括如下操作:
将所述弹出框的各可观察特征值的权值与设定的权值阈值进行比较,筛选出权值大于设定的权值阈值的可观察特征值作为有效可观察特征值。
可选的,所述处理器在执行所述设置所述弹出框是否为广告弹出框的标识的步骤时,具体包括如下操作:
通过标记的方式和/或聚类算法设置所述弹出框是否为广告弹出框的标识。
可选的,所述训练是采用人工神经网络方法进行训练的;
所述识别函数为阶跃激活函数。
可选的,所述弹出框的可观察特征值,包括以下至少之一:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
可选的,所述处理器在执行根据任一弹出框对应的所述识别函数的数值判断所述任一弹出框是否为广告弹出框的步骤时,具体包括如下操作:
若所述任一弹出框对应的所述识别函数的数值大于设定的识别阈值,则判定所述任一弹出框为广告弹出框,否则判定所述任一弹出框不是广告弹出框。
本发明第八实施例,本实施例是在上述实施例的基础上,结合附图7~9介绍一个本发明的应用实例。
本发明实施例提供了一种基于机器学习的浏览器广告弹出框拦截方法,实现该拦截方法的装置如图7所示,在该装置中包括:广告弹出框候选检测子模块、特征和决策学习子模块、广告弹出框判断子模块和广告框滤除处理子模块。其中,广告弹出框候选检测子模块是一个预处理模块,该预处理模块主要用于通过遍历当前网页DOM树结构中的每一个节点,检查其CSS-POSITION属性是否为FIXED(即位置固定不变,因为在网页上下滚动过程中,这些弹出框的位置都是固定不变的,即它并不随网页滚动而消失)来预先判断该节点对应区域是否为弹出框广告候选区域,并一方面作为学习样本输入给特征和决策学习子模块,以及另一方面作为检测样本输入给广告弹出框判断子模块进行处理。广告弹出框滤除处理子模块只是根据判断结果对须拦截的广告弹出框对应的DOM节点进行CSS隐藏或直接删除的处理。本发明实施例的核心处理过程是使用机器学习的方法对广告拦截框的样本进行训练从而自动获取特征选项和规则参数,以及使用训练结果进行实时的广告弹出框判别的处理,将在本实施例中予以详细介绍。
如图8是本发明实施例中广告弹出框样本训练的主要处理流程图,其详细步骤主要处理如下:
步骤100:首先需要通过广告弹出框候选检测子模块对当前主流网站的各个网页的弹出框样本进行获取。比如:这些弹出框样本对应的标签有<DIV>、<SECTION>、<A>等,这些不同标签的弹出框来自不同的网页。
步骤110:提取出与弹出框样本对应的所有可观察特征值构成训练需要的输入向量。这里与弹出框样本对应的所有可观察特征值是指尽量所有和广告弹出框相关的特征值,举个例子比如有:弹出框Z-INDEX高度相对值即弹出框在网页层方向上相对于弹出框所在的网页的高度(记为x1)、弹出框相对于弹出框所在的网页的起始坐标位置相对值(记为x2)、弹出框与终端窗口的面积比(记为x3)、弹出框对应的网址与弹出框所在的网页的域名的相关性值(记为x4)、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值(记为x5)等等。于是一个弹出框样本对应的输入向量值则为:
Xi={x1,x2,x3,x4,x5..xm},
其中i=1,2,…N(N表示样本的个数),m为输入向量的维度,即训练时所取的最大特征数值,本实施例中取m为5;
步骤120:通过人工标记的方式确定各弹出框样本是否是广告弹出框,从而构成期望输出,比如可记为:
Yi=1(如果样本为广告弹出框),Yi=0(如果样本为非广告弹出框),其中,i=1,2,…N(N表示样本的个数)。
这是采用监督式机器学习训练所需要的期望输出。
步骤130:在所有弹出框样本输入特征向量和期望输出的基础上采用人工神经网络方法训练出各个输入特征项对应的权值,这里就实现了决策参数的自动选取。具体以最简单的单层神经网络模型为例说明这个训练过程,该模型的实际输出output定义如下:output=f(w1*x1+w2*x2+…+wm*xm)
这里W=(w1,w2,..wm)中每个值为输入的特征值对应的权值,初始化可以设置为任意值(一般设为0),f为阶跃激活函数,其权值的训练过程具体如下:
步骤140:训练结束后将较小权值对应的特征值去掉,这里就实现了广告弹出框特征值的自动选取,这里仍然以步骤130中的例子继续具体说明:
训练结束是指步骤130中第二层中的一个循环结束后Change的值等于0即本次迭代没有权值需要更新,或者第一层循环全部结束即k=K(如200),这时可以得到训练更新后的权值W=(w1,w2,..wm),比如m=5时经过训练得到一个权值向量W=(0.0086,0.0078,0.0183,0.062,0.072),则通过下面一个判断来自动选取特征值:
如果一个特征值的权值w>0.01,则该特征值为选取的特征项,否则去掉该特征值。
于是特征值x1和x2被去掉,x3和x4、x5(各自对应的特征意义见步骤110中的举例)被自动选取出来,构成以后模型实际检测需要的特征向量;
步骤150:将剩余特征值(如x3,x4,x5)和对应权值(如W=(0.0183,0.062,0.072))预装或在线更新到实时检测的单层神经网络模型f(w3*x3+w4*x4+w5*x5)中。
如图9是本发明实施例中实时检测阶段进行广告弹出框拦截的主要处理流程图,其详细步骤如下:
步骤200:通过广告弹出框候选检测子模块的预处理得到一个候选弹出框,比如得到网页中的一个标签为<DIV>的节点,判断该节点的CSS-POSITION属性为FIXED,若是则判定该节点为候选弹出框;
步骤210:按照训练得到的特征项提取该节点各观察特征值构成输入向量。仍以上面的例子为例,比如这里构成的输入向量则为:
X={x3,x4,x5},其中,x3,x4,x5各自对应的特征值意义见步骤110中的举例,该值是在这个节点提取的对应实际特征值。
步骤220:将输入的特征向量和训练得到各个权值代入单层神经网络模型f(w3*x3+w4*x4+w5*x5)中,以得到确定的单层神经网络模型。比如:这里使用上面训练中得到并选择后的各个权值则为:W=(0.0183,0.062,0.072),则判断结果值Output=f(0.0183*x3+0.062*x4+0.072*x5)。
步骤230:根据结果值判断对应该节点是否为广告弹出框,比如:如果Output>0.5,则判定该候选弹出框为广告弹出框,执行步骤240,否则流程结束;
步骤240:隐藏或删除该广告弹出框。
训练步骤120-130中用到可监督学习训练算法和单层人工神经网络模型都可以找到其他机器学习的技术方法替换。比如可监督学习训练算法可以用非监督或半监督训练方法,非监督训练是指不需要人工标注每个样本的期望输出,而是通过一些聚类算法(如K均值方法)来自动实现样本的标注,半监督则是处于监督和非监督之间,即部分样本用监督,部分样本用非监督的方法标注。而单层人工神经网络模型可以用多层人工神经网络模型来替代。
另外需要说明的是实施例中的整个训练(步骤100至150)过程不一定局限在浏览器厂商离线训练后将参数预置到产品上,也可以扩展到使用该浏览器用户在实际使用中遇到新的没有滤除的广告弹出框或遇到误拦截情况时,可以选择在线滤除和恢复功能即启动在线的训练来实时更新参数,以后再打开该网页就不会出现该弹出广告框了或误拦截了。即用户可以根据自己判断干预训练的效果,从而更能突出相对于现有技术所能获得的有益效果。
浏览网页时经常出现弹出式广告框,对用户(特别是手机用户)的网页浏览体验非常差。常规弹出式广告拦截方法使用黑名单和特征表维护工作巨大,成本极高。另外广告弹出框的外部信息和内部特征千变万化,如ID和CLASS信息本身经常不断动态变化,自身的CSS特征选取不足或不当都会造成广告弹出框的漏拦截或误拦截。本发明根据目前人工智能和大数据技术发展,通过机器学习的方法自动进行特征和规则的选取(训练可在线或离线),能很有效地弥补常规方法的缺陷,从而能干净准确地拦截各种形式的广告框,因此能带来极佳的用户体验。
本发明第九实施例,本实施例的浏览器广告弹出框拦截方法的流程与第一、二或三实施例相同,区别在于,在工程实现上,本实施例可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明实施例的所述方法可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台设备(可以是手机、服务器等设备)执行本发明实施例所述的方法。
通过具体实施方式的说明,应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图示仅是提供参考与说明之用,并非用来对本发明加以限制。
Claims (21)
1.一种浏览器广告拦截方法,其特征在于,包括:
对弹出框的可观察特征值进行训练得到识别函数;
针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
2.根据权利要求1所述的浏览器广告拦截方法,其特征在于,所述弹出框的获取方式,包括:
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素作为弹出框进行收集;或者,
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素、以及:网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框作为弹出框进行收集。
3.根据权利要求1所述的浏览器广告拦截方法,其特征在于,所述对所述弹出框的可观察特征值进行训练,得到识别函数,包括:
设置所述弹出框是否为广告弹出框的标识;
基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
基于所述弹出框的各可观察特征值的权值确定出识别函数。
4.根据权利要求1所述的浏览器广告拦截方法,其特征在于,所述对所述弹出框的可观察特征值进行训练,得到识别函数,包括:
设置所述弹出框是否为广告弹出框的标识;
基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值;
基于所述弹出框的各有效可观察特征值的权值确定出识别函数。
5.根据权利要求4所述的浏览器广告拦截方法,其特征在于,所述基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值,包括:
将所述弹出框的各可观察特征值的权值与设定的权值阈值进行比较,筛选出权值大于设定的权值阈值的可观察特征值作为有效可观察特征值。
6.根据权利要求3或4所述的浏览器广告拦截方法,其特征在于,所述设置所述弹出框是否为广告弹出框的标识,包括:
通过标记的方式和/或聚类算法设置所述弹出框是否为广告弹出框的标识。
7.根据权利要求3或4所述的浏览器广告拦截方法,其特征在于,所述训练是采用人工神经网络方法进行训练的;
所述识别函数为阶跃激活函数。
8.根据权利要求3或4所述的浏览器广告拦截方法,其特征在于,所述弹出框的可观察特征值,包括以下至少之一:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
9.根据权利要求1所述的浏览器广告拦截方法,其特征在于,针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值判断所述任一弹出框是否为广告弹出框,包括:
若所述任一弹出框对应的所述识别函数的数值大于设定的识别阈值,则判定所述任一弹出框为广告弹出框,否则判定所述任一弹出框不是广告弹出框。
10.一种浏览器广告拦截装置,其特征在于,包括:
训练模块,用于对弹出框的可观察特征值进行训练得到识别函数;
拦截模块,用于针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
11.根据权利要求10所述的浏览器广告拦截装置,其特征在于,所述装置还包括:
收集模块,用于将网页的树形结构中层叠样式表位置属性为固定属性的节点元素作为弹出框进行收集;或者,
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素、以及:网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框作为弹出框进行收集。
12.根据权利要求10所述的浏览器广告拦截装置,其特征在于,所述训练模块,包括:
设置模块,用于设置所述弹出框是否为广告弹出框的标识;
权值确定模块,用于基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
函数确定模块,用于基于所述弹出框的各可观察特征值的权值确定出识别函数。
13.一种终端,其特征在于,包括处理器以及存储有所述处理器可执行指令的存储器,当所述指令被处理器执行时,执行如下操作:
对弹出框的可观察特征值进行训练得到识别函数;
针对任一弹出框,根据所述任一弹出框对应的所述识别函数的数值,判断所述任一弹出框是否为广告弹出框,若是,则进行拦截。
14.根据权利要求13所述的终端,其特征在于,所述处理器执行的操作具体还包括:将网页的树形结构中层叠样式表位置属性为固定属性的节点元素作为弹出框进行收集;或者,
将网页的树形结构中层叠样式表位置属性为固定属性的节点元素、以及:网页中由用户删除的广告弹出框和/或由用户恢复显示的已拦截广告弹出框作为弹出框进行收集。
15.根据权利要求13所述的终端,其特征在于,所述处理器在执行所述对所述弹出框的可观察特征值进行训练得到识别函数的步骤时,具体包括如下操作:
设置所述弹出框是否为广告弹出框的标识;
基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
基于所述弹出框的各可观察特征值的权值确定出识别函数。
16.根据权利要求13所述的终端,其特征在于,所述处理器在执行所述对所述弹出框的可观察特征值进行训练得到识别函数的步骤时,具体包括如下操作:
设置所述弹出框是否为广告弹出框的标识;
基于所述标识对所述弹出框的可观察特征值进行训练,得到所述弹出框的各可观察特征值的权值;
基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值;
基于所述弹出框的各有效可观察特征值的权值确定出识别函数。
17.根据权利要求16所述的终端,其特征在于,所述处理器在执行所述基于所述弹出框的各可观察特征值的权值筛选出所述弹出框的有效可观察特征值的步骤时,具体包括如下操作:
将所述弹出框的各可观察特征值的权值与设定的权值阈值进行比较,筛选出权值大于设定的权值阈值的可观察特征值作为有效可观察特征值。
18.根据权利要求15或16所述的终端,其特征在于,所述处理器在执行所述设置所述弹出框是否为广告弹出框的标识的步骤时,具体包括如下操作:
通过标记的方式和/或聚类算法设置所述弹出框是否为广告弹出框的标识。
19.根据权利要求15或16所述的终端,其特征在于,所述训练是采用人工神经网络方法进行训练的;
所述识别函数为阶跃激活函数。
20.根据权利要求15或16所述的终端,其特征在于,所述弹出框的可观察特征值,包括以下至少之一:
弹出框在网页层方向上相对于弹出框所在的网页的高度、弹出框相对于弹出框所在的网页的起始坐标位置相对值、弹出框与终端窗口的面积比、弹出框对应的网址与弹出框所在的网页的域名的相关性值、弹出框所呈现的文本与弹出框所在的网页的标题内容的相关性值。
21.根据权利要求13所述的终端,其特征在于,所述处理器在执行根据任一弹出框对应的所述识别函数的数值判断所述任一弹出框是否为广告弹出框的步骤时,具体包括如下操作:
若所述任一弹出框对应的所述识别函数的数值大于设定的识别阈值,则判定所述任一弹出框为广告弹出框,否则判定所述任一弹出框不是广告弹出框。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710168060.8A CN108628888A (zh) | 2017-03-21 | 2017-03-21 | 一种浏览器广告拦截方法、装置及终端 |
PCT/CN2017/107605 WO2018171189A1 (zh) | 2017-03-21 | 2017-10-25 | 一种浏览器广告拦截方法、装置及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710168060.8A CN108628888A (zh) | 2017-03-21 | 2017-03-21 | 一种浏览器广告拦截方法、装置及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108628888A true CN108628888A (zh) | 2018-10-09 |
Family
ID=63584041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710168060.8A Pending CN108628888A (zh) | 2017-03-21 | 2017-03-21 | 一种浏览器广告拦截方法、装置及终端 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108628888A (zh) |
WO (1) | WO2018171189A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111897606A (zh) * | 2019-05-06 | 2020-11-06 | 北京奇虎科技有限公司 | 一种弹框的处理方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104346457A (zh) * | 2014-10-31 | 2015-02-11 | 北京奇虎科技有限公司 | 拦截业务对象的方法及浏览器客户端 |
US20150128023A1 (en) * | 2013-11-06 | 2015-05-07 | Hipmunk, Inc. | Graphical user interface machine to present a window |
CN105516941A (zh) * | 2014-10-13 | 2016-04-20 | 中兴通讯股份有限公司 | 一种垃圾短信的拦截方法及装置 |
CN106033450A (zh) * | 2015-03-17 | 2016-10-19 | 中兴通讯股份有限公司 | 一种广告拦截的方法、装置和浏览器 |
CN106354836A (zh) * | 2016-08-31 | 2017-01-25 | 南威软件股份有限公司 | 一种广告页面的预测方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102591983A (zh) * | 2012-01-10 | 2012-07-18 | 凤凰在线(北京)信息技术有限公司 | 一种广告过滤系统及其过滤方法 |
CN105653550B (zh) * | 2014-11-14 | 2019-11-05 | 腾讯科技(深圳)有限公司 | 网页过滤方法和装置 |
CN104778405B (zh) * | 2015-03-11 | 2018-04-27 | 小米科技有限责任公司 | 广告拦截方法及装置 |
KR20160142075A (ko) * | 2015-06-02 | 2016-12-12 | 엘지전자 주식회사 | 디스플레이 장치 및 그의 방송 컨텐트 차단 방법 |
-
2017
- 2017-03-21 CN CN201710168060.8A patent/CN108628888A/zh active Pending
- 2017-10-25 WO PCT/CN2017/107605 patent/WO2018171189A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150128023A1 (en) * | 2013-11-06 | 2015-05-07 | Hipmunk, Inc. | Graphical user interface machine to present a window |
CN105516941A (zh) * | 2014-10-13 | 2016-04-20 | 中兴通讯股份有限公司 | 一种垃圾短信的拦截方法及装置 |
CN104346457A (zh) * | 2014-10-31 | 2015-02-11 | 北京奇虎科技有限公司 | 拦截业务对象的方法及浏览器客户端 |
CN106033450A (zh) * | 2015-03-17 | 2016-10-19 | 中兴通讯股份有限公司 | 一种广告拦截的方法、装置和浏览器 |
CN106354836A (zh) * | 2016-08-31 | 2017-01-25 | 南威软件股份有限公司 | 一种广告页面的预测方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111897606A (zh) * | 2019-05-06 | 2020-11-06 | 北京奇虎科技有限公司 | 一种弹框的处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2018171189A1 (zh) | 2018-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104679825B (zh) | 基于网络文本的地震宏观异常信息获取与筛选方法 | |
CN108256104A (zh) | 基于多维特征的互联网网站综合分类方法 | |
CN106599022A (zh) | 基于用户访问数据的用户画像形成方法 | |
CN107608874A (zh) | 测试方法和装置 | |
CN101820366A (zh) | 一种基于预取的钓鱼网页检测方法 | |
CN109242553A (zh) | 一种用户行为数据推荐方法、服务器及计算机可读介质 | |
CN102004764A (zh) | 互联网不良信息检测方法以及系统 | |
CN108229170B (zh) | 利用大数据和神经网络的软件分析方法和装置 | |
CN109918648B (zh) | 一种基于动态滑动窗口特征评分的谣言深度检测方法 | |
CN106682677A (zh) | 广告识别规则归纳方法、装置及设备 | |
CN112989824A (zh) | 信息推送方法及装置、电子设备及存储介质 | |
CN108121741B (zh) | 网站质量评估方法及装置 | |
CN107800670A (zh) | 用于预警网站安全的方法和装置 | |
CN102902794A (zh) | 网页分类系统及方法 | |
CN102902790A (zh) | 网页分类系统及方法 | |
CN110795930A (zh) | 一种文章标题优化方法、系统、介质及设备 | |
CN105989093B (zh) | 敏感词的自动发现方法及其装置和应用 | |
CN105183843A (zh) | 列表页识别系统及方法 | |
CN108628888A (zh) | 一种浏览器广告拦截方法、装置及终端 | |
Zaman et al. | Phishing website detection using effective classifiers and feature selection techniques | |
CN102929948B (zh) | 列表页识别系统及方法 | |
CN107291685B (zh) | 语义识别方法和语义识别系统 | |
CN110489665B (zh) | 一种基于情景建模和卷积神经网络的微博个性化推荐方法 | |
CN112084390A (zh) | 一种电商平台中利用自动结构化爬虫搜索的方法 | |
CN104111997B (zh) | 基于浏览器客户端的信息显示方法、装置和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181009 |
|
RJ01 | Rejection of invention patent application after publication |