CN106708502A - 网页处理方法和装置 - Google Patents

网页处理方法和装置 Download PDF

Info

Publication number
CN106708502A
CN106708502A CN201610989440.3A CN201610989440A CN106708502A CN 106708502 A CN106708502 A CN 106708502A CN 201610989440 A CN201610989440 A CN 201610989440A CN 106708502 A CN106708502 A CN 106708502A
Authority
CN
China
Prior art keywords
webpage
web page
unconventional
visited
page element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610989440.3A
Other languages
English (en)
Other versions
CN106708502B (zh
Inventor
王健
杜国阳
程虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610989440.3A priority Critical patent/CN106708502B/zh
Publication of CN106708502A publication Critical patent/CN106708502A/zh
Priority to PCT/CN2017/109037 priority patent/WO2018086476A1/zh
Priority to US16/299,883 priority patent/US10726135B2/en
Application granted granted Critical
Publication of CN106708502B publication Critical patent/CN106708502B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/20Software design
    • G06F8/22Procedural
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/57Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
    • G06F21/577Assessing vulnerabilities and evaluating computer system security
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/12Protecting executable software
    • G06F21/121Restricting unauthorised execution of programs
    • G06F21/125Restricting unauthorised execution of programs by manipulating the program code, e.g. source code, compiled code, interpreted code, machine code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/03Indexing scheme relating to G06F21/50, monitoring users, programs or devices to maintain the integrity of platforms
    • G06F2221/032Protect output to user by software means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/03Indexing scheme relating to G06F21/50, monitoring users, programs or devices to maintain the integrity of platforms
    • G06F2221/034Test or assess a computer or a system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Virology (AREA)
  • Technology Law (AREA)
  • Computing Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供了一种网页处理方法,所述方法包括:获取待访问网页进行网页渲染后的网页元素;检测所述网页元素中是否存在非常规元素;如果所述网页元素中存在非常规元素,则在网页中生成交互入口并显示;获取对所述交互入口的触发操作,响应所述触发操作将所述非常规元素进行过滤。采用该网页处理方法,可以实现对网页中显示的非常规元素进行过滤操作,从而使得网页中的非常规元素的过滤更为精确。此外,还提供了一种网页处理装置。

Description

网页处理方法和装置
技术领域
本发明涉及互联网技术领域,特别是涉及一种网页处理方法和装置。
背景技术
使用浏览器打开网页时,很多网页往往会显示很多非常规的网页元素,例如,广告、欺诈、虚假、低俗内容等与网页主题无关且具有一定骚扰性的网页元素,这些网页元素在网页中的存在给用户浏览网页带来很大不便。例如,在下载网站下载软件时往往会被误导去下载一个恶意的软件。又如,通过网站提供的链接跳转到某个网站时,往往会被诱导到一个不相关的网站或者欺诈网站。
传统技术中,通常在网页渲染前会对网页中的非常规元素进行过滤。然而,由于是在网页渲染前对非常规元素进行过滤,用户无法感知,且如果过滤的效果不佳时,渲染后的网页中仍然会存在大量的非常规元素。因此,传统技术中,网页中显示的非常规元素无法进行过滤,如果网页中的正常内容和非常规元素随机变化时,传统的这种网页处理方式将导致过滤不精确,从而导致过滤非常规元素的效果不佳。
发明内容
基于此,有必要针对上述技术问题,提供一种能使得网页中非常规元素过滤得更精确的网页处理方法和装置。
一种网页处理方法,所述方法包括:
获取待访问网页进行网页渲染后的网页元素;
检测所述网页元素中是否存在非常规元素;
如果所述网页元素中存在非常规元素,则在网页中生成交互入口并显示;
获取对所述交互入口的触发操作,响应所述触发操作将所述非常规元素进行过滤。
一种网页处理装置,所述装置包括:
网页元素获取模块,用于获取待访问网页进行网页渲染后的网页元素;
非常规元素检测模块,用于检测所述网页元素中是否存在非常规元素;
图标生成模块,用于如果所述网页元素中存在非常规元素,则在网页中生成交互入口并显示;
过滤模块,用于获取对所述交互入口的触发操作,响应所述触发操作将所述非常规元素进行过滤。
上述网页处理方法和装置,通过检测网页渲染后的网页元素中是否存在非常规元素,如果网页元素中存在非常规元素,则在网页中生成交互入口并显示,在获取到对交互入口的触发操作时将非常规元素进行过滤。由于在网页渲染后还能对网页中存在的非常规元素进行过滤,并且是在获取到用户操作后进行过滤,因此可以实现对网页中显示的非常规元素进行过滤操作,即使网页中的正常内容和非常规元素经常随机变化,只要网页渲染后非常规元素存在网页中,就可以通过用户操作过滤非常规元素,从而使得网页中的非常规元素的过滤更为精确。
附图说明
图1为一个实施例中网页处理方法的应用环境图;
图2为一个实施例中终端的结构示意图;
图3为一个实施例中网页处理方法的流程示意图;
图4为一个实施例中检测网页元素中是否存在非常规元素的流程示意图;
图5为另一个实施例中网页处理方法的流程示意图;
图6为一个实施例中网页渲染后的界面示意图;
图7为一个实施例中过滤非常规元素的效果图;
图8为一个实施例中网页处理装置的结构框图;
图9为一个实施例中非常规元素检测模块的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供的网页处理方法可应用于如图1所示的环境中。请参考图1所示,终端110通过网络与服务器120进行通信。终端110显示一个网页时需要进行网页加载、网页解析和网页渲染过程。通常,在网页渲染之前,可对一些非常规元素进行拦截。终端110在进行网页渲染之后可再进一步检测得到的网页元素中是否存在非常规元素,如果存在,则在网页中生成一个交互入口,当终端110接收到该交互入口的触发操作时,对网页中存在的非常规元素进行过滤。其中,终端110可以是但不限于是各种可请求并显示网页的个人计算机、笔记本电脑、台式电脑、智能手机、平板电脑、便携式可穿戴设备等。由于终端110在显示网页后还可对网页中存在的非常规元素进行过滤,使得网页中的非常规元素过滤更为精确。
图2为一个实施例中终端的内部结构示意图。该终端包括通过系统总线连接的处理器、非易失性存储介质、网络接口、内存储器、输入装置。其中该终端的非易失性存储介质存储有操作系统,还包括一种网页处理装置,该网页处理装置用于实现一种网页处理方法。该处理器用于提供计算和控制能力,支撑整个终端的运行。终端中的内存储器为非易失性存储介质中的网页处理装置的运行提供环境,网络接口用于与服务器进行通信,如发送URL请求至服务器,接收服务器发送的资源等。输入装置可以是显示屏上覆盖的触摸层,也可以是键盘鼠标或者是终端外壳上设置的轨迹球或触控板等。
本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用与其上的终端的限定,具体的终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
如图3所示,在一个实施例中,提供了一种网页处理方法,该方法以应用于如图1和图2所示的终端中进行举例说明,包括:
步骤302,获取待访问网页进行网页渲染后的网页元素。
本实施例中,终端发起URL请求后进行网页加载、网页解析和网页渲染过程。具体的,终端根据请求的URL进行域名解析,向服务器发起请求,接收服务器发送的资源(包括HTML、JS、CSS和图像等)。对加载到的资源进行语法解析,建立相应的内部数据结构(比如HTML的DOM树、JS的对象属性表和CSS的样式规则等),然后构造渲染树,对各个元素进行位置计算、样式计算等,根据渲染树对页面进行渲染,获取网页渲染后的网页元素。网页渲染后的网页元素包括应正常显示的网页内容,且可能包括一些非常规元素。
步骤304,检测网页元素中是否存在非常规元素。
本实施例中,终端可根据待访问网页所属的域名以及预设的网页元素关键属性来检测网页元素中是否存在非常规元素。具体的,可预设域名和网页元素关键属性的对应关系,设置的域名对应的网页元素关键属性可为非常规元素所具有的关键属性。其中,域名和对应的网页元素关键属性可预先存储在服务器中或者终端本地中。终端可预先根据本地存储的域名和对应的网页元素关键属性来检测网页渲染后的网页元素中是否存在非常规元素,当匹配不到与域名对应的网页元素关键属性时,可进一步在服务器中进行匹配,以提高匹配的准确性。
步骤306,如果网页元素中存在非常规元素,则在网页中生成交互入口并显示。
本实施例中,如果检测到网页渲染后的网页元素中存在非常规元素,例如,广告、欺诈、虚假、低俗内容等与网页主题无关且有一定骚扰性的网页元素。则在网页中生成一个交互入口,该交互入口可响应用户操作实现页面功能交互。进一步的,交互入口可以为一键过滤入口,例如可以是一个一键过滤按键。当用户点击该一键过滤按键,则终端相应用户的点击操作将网页中显示的非常规元素进行过滤。
步骤308,获取对交互入口的触发操作,响应该触发操作将非常规元素进行过滤。
本实施例中,当用户需要对网页中显示的非常规元素进行过滤时,可触发交互入口,例如点击一键过滤按键,终端响应对一键过滤按键的触发操作,从而将在网页中显示的非常规元素进行过滤。
本实施例中,通过检测网页渲染后的网页元素中是否存在非常规元素,如果网页元素中存在非常规元素,则在网页中生成交互入口并显示,在获取到对交互入口的触发操作时将非常规元素进行过滤。由于在网页渲染后还能对网页中存在的非常规元素进行过滤,并且是在获取到用户操作后进行过滤,因此可以实现对网页中显示的非常规元素进行过滤操作,即使网页中的正常内容和非常规元素经常随机变化,只要网页渲染后非常规元素存在网页中,就可以通过用户操作过滤掉非常规元素,从而使得网页中的非常规元素的过滤更为精确。
在一个实施例中,检测网页元素中是否存在非常规元素,包括:查找待访问网页所属的域名是否存在对应的预设的网页元素关键属性,若是,则检测查找到的网页元素关键属性是否有至少一条存在于待访问网页中;如果查找到的网页元素关键属性有至少一条存在于待访问网页中,则网页元素中存在非常规元素,否则网页元素中不存在非常规元素。
进一步的,在一个实施例中,查找待访问网页所属的域名是否存在对应的预设的网页元素关键属性,包括:查找待访问网页的网址的域名是否存在对应的预设的网页元素关键属性,若是,则进入检测查找到的网页元素关键属性是否有至少一条存在于所述待访问网页中的步骤,否则,进一步查找待访问网页的网址的顶级域名是否存在对应的预设的网页元素关键属性,若是,则进入检测查找到的网页元素关键属性是否有至少一条存在于待访问网页的步骤,否则网页元素中不存在非常规元素。
具体的,在一个实施例中,如图4所示,检测网页元素中是否存在非常规元素的步骤,包括:
步骤402,查找待访问网页的网址的域名是否存在对应的预设的网页元素关键属性,若是,则进入步骤406,否则进入步骤404。
本实施例中,预先设置了网页元素关键属性,所设置的网页元素关键属性是非常规元素的属性特征。具体的,所设置的网页元素关键属性包括Class属性和id属性。在其他实施例中,还可包括style属性或其它属性。本实施例中,还预先设置了域名与网页元素关键属性的对应关系,该对应关系表明了该域名下的网址会存在非常规元素。进一步的,该对应关系可存储在服务器(云端)或者终端本地,当服务器有更新时可同步更新至终端。终端可先根据在本地存储的域名与网页元素关键属性的对应关系,查找待访问网页的网址的域名是否存在对应的预设的网页元素关键属性,若查找到则进入步骤404,若查找不到,则可进一步在服务器上进行查找,如果在服务器中查找到则进入步骤404,如果在服务器中查找不到则进入步骤406。
步骤404,查找待访问网页的网址的顶级域名是否存在对应的预设的网页元素关键属性,若是,则进入步骤406,否则进入步骤408。
本实施例中,如果待访问网页的网址的域名不存在对应的预设的网页元素关键属性,则可进一步查找待访问网页的网址的顶级域名是否存在对应的预设的网页元素关键属性。如上所述,预先设置了域名与网页元素关键属性的对应关系,如果待访问网页的网址的顶级域名存在对应的预设的网页元素关键属性,则表明该待访问网页也可能存在非常规元素。具体的,终端也可先在本地查找待访问网页的网址的顶级域名是否存在对应的预设的网页元素关键属性,若查找到则进入步骤406,若查找不到则可进一步在服务器上进行查找,如果在服务器中查找到则进入步骤406,否则进入步骤408。
步骤406,检测查找到的网页元素关键属性是否有至少一条存在于待访问网页中,若是,则进入步骤410,否则进入步骤408。
步骤408,网页渲染后得到的网页元素中不存在非常规元素。
步骤410,网页渲染后得到的网页元素中存在非常规元素。
本实施例中,当待访问网页的网址的域名或顶级域名存在对应的预设的网页元素关键属性,则检测查找到的网页元素关键属性是否有至少一条存在于待访问网页中,即:将查找到的预设的网页元素关键属性与待访问网页进行网页渲染后得到的网页元素中的关键属性进行匹配,如果匹配到至少一条关键属性,则表明根据域名匹配到的非常规元素包含待访问网页中存在的非常规元素,待访问网页存在非常规元素。如果匹配不到至少一条关键属性,则待访问网页不存在非常规元素。
具体的,预设的网页元素关键属性包括Class属性、id属性、style属性和其它属性等,在匹配待访问网页中的网页元素时,则可逐一匹配这些属性。例如,某个网页中的非常规元素代码为:<div id=“wAdFlyBlttom”class=“onlyPc”>…</div>,预先设置与域名对应的网页元素关键属性为:div[id=“wAdFlyBlttom”]或者div[class=“onlyPc”],则可以匹配到待访问网页中存在非常规元素。
本实施例中,通过将待访问网页所属的域名与预设的域名匹配,匹配得到非常规元素的网页元素关键属性,然后检测匹配到的网页元素关键属性是否存在于待访问网页中,如果存在,则表明待访问网页中存在非常规元素,否则不存在非常规元素。由于服务器中或终端本地存储的用来匹配的网页元素关键属性有可能过期,通过两次匹配过程可以确保待访问元素中匹配到的关键属性正是预设的确定为非常规元素的关键属性,因此可以确保检测待访问网页中的非常规元素的准确性。
在一个实施例中,如果渲染后得到的网页元素中存在非常规元素,则在网页中生成交互入口并显示,包括:如果网页元素中存在非常规元素,则在待访问网页的页面中注入预设的JS代码,通过JS代码在网页中生成交互入口并显示,该JS代码还用于响应交互入口的触发操作将非常规元素进行过滤。
在一个实施例中,响应触发操作将非常规元素进行过滤,包括:获取非常规元素在网页中的位置大小信息,以及获取交互入口在网页中的位置大小信息;根据非常规元素在网页中的位置大小信息和交互入口在网页中的位置大小信息,将非常规元素按照预设动画效果移动至交互入口对应的位置处直至消失。
如图5所示,在一个实施例中,提供了一种网页处理方法,该方法以应用于如图1或图2中的终端中进行举例说明,包括:
步骤502,获取待访问网页进行网页渲染后的网页元素。
本实施例中,终端发起URL请求后进行网页加载、网页解析和网页渲染过程,当网页内的所有预执行的JS脚本执行过程完成,则整个页面完成加载,用户可以看到完整的网页页面。在进行网页渲染前可对网页中存在的一些非常规元素进行拦截操作,拦截掉一些非常规元素后再进行网页渲染。网页渲染后就即可显示整个网页页面,网页页面中显示了网页元素,这些网页元素除了包含正常显示的网页内容外,还可能包含了一些非常规元素。
步骤504,检测该网页元素中是否存在非常规元素,若是,则进入步骤506,否则结束。
具体的,可通过将待访问网页所属的域名与终端本地存储的域名进行匹配,匹配到域名后,获取预设的与该域名对应的网页元素关键属性。如果匹配不到,则去服务器匹配域名,从而获取到与待访问网页所属的域名对应的预设的网页元素关键属性。其中,待访问网页所属的域名包括待访问网页的网址的域名和顶级域名。在匹配时,首先对待访问网页的网址的域名进行匹配,匹配不到时再进一步对待访问网页的网址的顶级域名进行匹配。
进一步的,匹配到对应的预设的网页元素关键属性后,检测该网页元素关键属性是否有至少一条存在与待访问网页中,若是则表明匹配到的网页元素关键属性包含了待访问网页中的网页元素关键属性,待访问网页存在非常规元素,否则待访问网页不存在非常规元素。
步骤506,在待访问网页的页面中注入预设的JS代码,通过JS代码在网页中生成交互入口并显示。
本实施例中,可在网页浏览器中注入浏览器插件,该浏览器插件可用于当网页渲染后检测渲染后得到的网页元素中是否存在非常规元素,如果存在,则向页面注入预设的JS代码,该JS代码可实现在网页中生成一个交互入口并实现该交互入口的功能交互实现。
具体的,交互入口可以是一个用来过滤网页中的非常规元素的入口,例如,可以是在页面中显示的一个控件,比如是一个一键过滤按钮。如图6所示,网页渲染后显示整个网页页面,该页面中存在一些非常规元素602,非常规元素602可以是广告内容、虚假内容或者其他与网页主题无关的内容。当检测到这些非常规元素602时在页面中生成一个一键过滤按钮604,该一键过滤按钮604可为如图6所示的一个图标。
步骤508,获取对交互入口的触发操作,响应触发操作将网页中的非常规元素移动至交互入口对应的位置处直至消失。
本实施例中,可通过注入到页面中的预设的JS代码实现交互入口的功能交互实现。具体的,当用户触发交互入口时,例如,点击一键过滤按钮604,通过预设的JS代码响应该操作,进而获取到非常规元素在网页中的位置大小信息,以及获取交互入口在网页中的位置大小信息,根据非常规元素在网页中的位置大小信息和交互入口在网页中的位置大小信息,将非常规元素按照预设动画效果移动至交互入口对应的位置处直至消失。
具体的,在检测到待访问网页中存在非常规元素时,可根据匹配的网页元素关键属性获取到这些非常规元素,进而获取到非常规元素的位置大小信息。而交互入口的位置大小信息可根据预设的JS代码获取得到。进一步的,可根据非常规元素的位置大小信息和交互入口的位置大小信息获取到每个非常规元素与交互入口之间的距离,根据该距离将每个非常规元素移动到交互入口的位置处,然后隐藏消失。
进一步的,在移动每个非常规元素到交互入口位置处的过程中,可逐渐缩小非常规元素的大小,直至达到交互入口位置处消失,以实现非常规元素动态移动并且逐渐缩小直至消失的动画效果。具体的,可采用如下方式实现这一动画效果:假设非常规元素为A,大小为Sa,交互入口为B,根据A和B的位置计算得到A与B之间的距离为L,预先设置该动画效果总时间为T,设置定时器的时间间隔为t秒(即每t秒定时器执行1次)。则非常规元素A向交互入口B移动的总次数为n=T/t。定时器每执行一次,则A向B移动距离L△=L/n,同时将非常规元素A缩放m倍数:m=Sa/n,且最后一次执行将A的大小Sa置为0,并将其设置为隐藏。这样,每个非常规元素A平移到交互入口B的位置处则会消失。如图7所示,可通过一定的动画效果实现非常规元素的过滤,非常规元素平移到交互入口位置处并逐渐缩小直至消失在交互入口位置处,在回收非常规元素的过程中,交互入口可以呈现出一种回收的动画效果,从而实现了一种将非常规元素进行回收的显示效果。
本实施例中,通过设置浏览器插件,在检测到网页渲染后得到的网页元素中存在非常规元素,则显示交互入口。由于网页渲染后整个页面加载完毕,用户也可以看到网页中存在的非常规元素,因此可以选择是否将页面中的非常规元素进行过滤。当用户选择过滤时,可通过交互入口一键触发过滤网页中显示的非常规元素。且可通过一定的动画效果来实现将非常规元素平移到交互入口位置处直至消失,实现将网页中显示的非常规元素进行回收的效果。
如图8所示,在一个实施例中,还提供了一种网页处理装置,该装置包括:
网页元素获取模块802,用于获取待访问网页进行网页渲染后的网页元素。
非常规元素检测模块804,用于检测网页元素中是否存在非常规元素。
图标生成模块806,用于如果网页元素中存在非常规元素,则在网页中生成交互入口并显示。
过滤模块808,用于获取对交互入口的触发操作,响应触发操作将非常规元素进行过滤。
在一个实施例中,如图9所示,非常规元素检测模块804包括:
查找模块814,用于查找待访问网页所属的域名是否存在对应的预设的网页元素关键属性。
检测模块824,用于如果待访问网页所属的域名存在对应的预设的网页元素关键属性,则检测查找到的网页元素关键属性是否有至少一条存在于待访问网页中;如果查找到的网页元素关键属性有至少一条存在于待访问网页中,则网页元素中存在非常规元素,否则,网页元素中不存在非常规元素。
在一个实施例中,查找模块814用于查找待访问网页的网址的域名是否存在对应的预设的网页元素关键属性;检测模块824还用于如果查找模块814检测到待访问网页的网址的域名存在对应的预设的网页元素关键属性,则检测网页元素关键属性是否有至少一条存在于待访问网页。本实施例中,查找模块814还用于如果查找不到待访问网页的网址的域名存在对应的网页元素关键属性,则进一步查找待访问网页的网址的顶级域名是否存在对应的预设的网页元素关键属性。本实施例中,检测模块824还用于如果查找到待访问网页的网址的顶级域名存在对应的预设的网页元素关键属性,则检测查找到的网页元素关键属性是否有至少一条存在于待访问网页中,否则网页元素中不存在非常规元素。
在一个实施例中,图标生成模块806用于如果网页元素中存在非常规元素,则在待访问网页的页面中注入预设的JS代码,通过JS代码在网页中生成交互入口并显示,该JS代码还用于响应交互入口的触发操作将非常规元素进行过滤。
在一个实施例中,过滤模块808用于获取非常规元素在网页中的位置大小信息,以及获取交互入口在网页中的位置大小信息,根据非常规元素在网页中的位置大小信息和交互入口在网页中的位置大小信息,将非常规元素按照预设动画效果移动至交互入口对应的位置处直至消失。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种网页处理方法,所述方法包括:
获取待访问网页进行网页渲染后的网页元素;
检测所述网页元素中是否存在非常规元素;
如果所述网页元素中存在非常规元素,则在网页中生成交互入口并显示;
获取对所述交互入口的触发操作,响应所述触发操作将所述非常规元素进行过滤。
2.根据权利要求1所述的网页处理方法,其特征在于,所述检测所述网页元素中是否存在非常规元素,包括:
查找所述待访问网页所属的域名是否存在对应的预设的网页元素关键属性,若是,则检测查找到的所述网页元素关键属性是否有至少一条存在于所述待访问网页中;
如果所述查找到的网页元素关键属性有至少一条存在于所述待访问网页中,则所述网页元素中存在非常规元素,否则,所述网页元素中不存在非常规元素。
3.根据权利要求2所述的网页处理方法,其特征在于,所述查找待访问网页所属的域名是否存在对应的预设的网页元素关键属性,包括:
查找待访问网页的网址的域名是否存在对应的预设的网页元素关键属性,若是,则进入检测查找到的所述网页元素关键属性是否有至少一条存在于所述待访问网页中的步骤,否则,进一步查找待访问网页的网址的顶级域名是否存在对应的预设的网页元素关键属性,若是,则进入检测查找到的所述网页元素关键属性是否有至少一条存在于所述待访问网页的步骤,否则所述网页元素中不存在非常规元素。
4.根据权利要求1所述的网页处理方法,其特征在于,所述如果所述网页元素中存在非常规元素,则在网页中生成交互入口并显示,包括:
如果所述网页元素中存在非常规元素,则在待访问网页的页面中注入预设的JS代码,通过所述JS代码在网页中生成交互入口并显示,所述JS代码还用于响应所述交互入口的触发操作将所述非常规元素进行过滤。
5.根据权利要求1所述的网页处理方法,其特征在于,所述响应触发操作将非常规元素进行过滤,包括:
获取所述非常规元素在网页中的位置大小信息,以及获取所述交互入口在网页中的位置大小信息;
根据所述非常规元素在网页中的位置大小信息和所述交互入口在网页中的位置大小信息,将所述非常规元素按照预设动画效果移动至所述交互入口对应的位置处直至消失。
6.一种网页处理装置,其特征在于,所述装置包括:
网页元素获取模块,用于获取待访问网页进行网页渲染后的网页元素;
非常规元素检测模块,用于检测所述网页元素中是否存在非常规元素;
图标生成模块,用于如果所述网页元素中存在非常规元素,则在网页中生成交互入口并显示;
过滤模块,用于获取对所述交互入口的触发操作,响应所述触发操作将所述非常规元素进行过滤。
7.根据权利要求6所述的网页处理装置,其特征在于,所述非常规元素检测模块包括:
查找模块,用于查找所述待访问网页所属的域名是否存在对应的预设的网页元素关键属性;
检测模块,用于如果所述待访问网页所属的域名存在对应的预设的网页元素关键属性,则检测查找到的所述网页元素关键属性是否有至少一条存在于所述待访问网页中;如果查找到的所述网页元素关键属性有至少一条存在于所述待访问网页中,则所述网页元素中存在非常规元素,否则,所述网页元素中不存在非常规元素。
8.根据权利要求7所述的网页处理装置,其特征在于,所述查找模块用于查找待访问网页的网址的域名是否存在对应的预设的网页元素关键属性;
所述检测模块还用于如果查找模块查找到所述待访问网页的网址的域名存在对应的预设的网页元素关键属性,则检测所述网页元素关键属性是否有至少一条存在于所述待访问网页;
所述查找模块还用于如果查找不到所述待访问网页的网址的域名存在对应的网页元素关键属性,则进一步查找待访问网页的网址的顶级域名是否存在对应的预设的网页元素关键属性;
所述检测模块还用于如果查找到所述待访问网页的网址的顶级域名存在对应的预设的网页元素关键属性,则检测查找到的所述网页元素关键属性是否有至少一条存在于所述待访问网页中,否则所述网页元素中不存在非常规元素。
9.根据权利要求6所述的网页处理装置,其特征在于,所述图标生成模块用于如果所述网页元素中存在非常规元素,则在待访问网页的页面中注入预设的JS代码,通过所述JS代码在网页中生成交互入口并显示,所述JS代码还用于响应交互入口的触发操作将所述非常规元素进行过滤。
10.根据权利要求6所述的网页处理装置,其特征在于,所述过滤模块用于获取所述非常规元素在网页中的位置大小信息,以及获取所述交互入口在网页中的位置大小信息,根据所述非常规元素在网页中的位置大小信息和所述交互入口在网页中的位置大小信息,将所述非常规元素按照预设动画效果移动至所述交互入口对应的位置处直至消失。
CN201610989440.3A 2016-11-10 2016-11-10 网页处理方法和装置 Active CN106708502B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201610989440.3A CN106708502B (zh) 2016-11-10 2016-11-10 网页处理方法和装置
PCT/CN2017/109037 WO2018086476A1 (zh) 2016-11-10 2017-11-02 网页处理方法、装置和存储介质
US16/299,883 US10726135B2 (en) 2016-11-10 2019-03-12 Web page processing method and apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610989440.3A CN106708502B (zh) 2016-11-10 2016-11-10 网页处理方法和装置

Publications (2)

Publication Number Publication Date
CN106708502A true CN106708502A (zh) 2017-05-24
CN106708502B CN106708502B (zh) 2022-04-29

Family

ID=58940889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610989440.3A Active CN106708502B (zh) 2016-11-10 2016-11-10 网页处理方法和装置

Country Status (3)

Country Link
US (1) US10726135B2 (zh)
CN (1) CN106708502B (zh)
WO (1) WO2018086476A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018086476A1 (zh) * 2016-11-10 2018-05-17 腾讯科技(深圳)有限公司 网页处理方法、装置和存储介质
CN109814782A (zh) * 2018-11-22 2019-05-28 北京金山云网络技术有限公司 图片切换方法、装置和终端设备
CN110297751A (zh) * 2018-03-22 2019-10-01 博彦科技(上海)有限公司 页面元素的检测方法、装置、存储介质及处理器
CN110427935A (zh) * 2019-06-28 2019-11-08 华为技术有限公司 一种网页元素识别的方法及服务器
CN111125603A (zh) * 2019-12-27 2020-05-08 百度时代网络技术(北京)有限公司 网页场景识别方法、装置、电子设备及存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401416B (zh) * 2020-03-05 2022-10-21 支付宝(杭州)信息技术有限公司 异常网站的识别方法、装置和异常对抗行为的识别方法
CN113495836A (zh) * 2020-04-03 2021-10-12 北京搜狗科技发展有限公司 一种页面检测方法、装置和用于页面检测的装置
CN114880612A (zh) * 2022-05-11 2022-08-09 网易有道信息技术(北京)有限公司 用于公式排版异常管理的方法及其相关产品
CN116049551B (zh) * 2023-01-13 2023-08-25 北京景安云信科技有限公司 网页操作的识别管控系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110078558A1 (en) * 2009-09-30 2011-03-31 International Business Machines Corporation Method and system for identifying advertisement in web page
CN103729784A (zh) * 2014-01-26 2014-04-16 合一信息技术(北京)有限公司 交互式的广告管理的方法及系统
CN104216929A (zh) * 2013-07-11 2014-12-17 腾讯科技(深圳)有限公司 一种页面元素的拦截方法和装置
CN104572798A (zh) * 2014-07-25 2015-04-29 上海二三四五网络科技有限公司 一种用于处理网页的方法、设备与系统
CN105701154A (zh) * 2015-12-29 2016-06-22 腾讯科技(深圳)有限公司 广告清除方法和装置
CN106095869A (zh) * 2016-06-03 2016-11-09 腾讯科技(深圳)有限公司 广告信息处理方法、用户设备、后台服务器及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9147210B2 (en) * 2009-07-29 2015-09-29 Paypal, Inc. System and a machine-readable medium for processing an on-line payment without authenticating the user
US10354004B2 (en) * 2012-06-07 2019-07-16 Apple Inc. Intelligent presentation of documents
US9053493B2 (en) * 2012-08-13 2015-06-09 Google Inc. Affecting display of content based on negative reactions
CN103970395A (zh) * 2013-01-30 2014-08-06 腾讯科技(深圳)有限公司 关闭后台程序的方法和装置
CN103327104A (zh) * 2013-06-25 2013-09-25 天津汉柏汉安信息技术有限公司 一种网页广告过滤后对客户端呈现的方法
US20160350798A1 (en) * 2015-05-26 2016-12-01 adResponse UG Method and system for managing access to advertisements on web pages
US20170060986A1 (en) * 2015-08-31 2017-03-02 Shine Security Ltd. Systems and methods for detection of content of a predefined content category in a network document
CN106708502B (zh) * 2016-11-10 2022-04-29 腾讯科技(深圳)有限公司 网页处理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110078558A1 (en) * 2009-09-30 2011-03-31 International Business Machines Corporation Method and system for identifying advertisement in web page
CN104216929A (zh) * 2013-07-11 2014-12-17 腾讯科技(深圳)有限公司 一种页面元素的拦截方法和装置
CN103729784A (zh) * 2014-01-26 2014-04-16 合一信息技术(北京)有限公司 交互式的广告管理的方法及系统
CN104572798A (zh) * 2014-07-25 2015-04-29 上海二三四五网络科技有限公司 一种用于处理网页的方法、设备与系统
CN105701154A (zh) * 2015-12-29 2016-06-22 腾讯科技(深圳)有限公司 广告清除方法和装置
CN106095869A (zh) * 2016-06-03 2016-11-09 腾讯科技(深圳)有限公司 广告信息处理方法、用户设备、后台服务器及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018086476A1 (zh) * 2016-11-10 2018-05-17 腾讯科技(深圳)有限公司 网页处理方法、装置和存储介质
US10726135B2 (en) 2016-11-10 2020-07-28 Tencent Technology (Shenzhen) Company Limited Web page processing method and apparatus, and storage medium
CN110297751A (zh) * 2018-03-22 2019-10-01 博彦科技(上海)有限公司 页面元素的检测方法、装置、存储介质及处理器
CN109814782A (zh) * 2018-11-22 2019-05-28 北京金山云网络技术有限公司 图片切换方法、装置和终端设备
CN110427935A (zh) * 2019-06-28 2019-11-08 华为技术有限公司 一种网页元素识别的方法及服务器
CN110427935B (zh) * 2019-06-28 2023-06-20 华为技术有限公司 一种网页元素识别的方法及服务器
CN111125603A (zh) * 2019-12-27 2020-05-08 百度时代网络技术(北京)有限公司 网页场景识别方法、装置、电子设备及存储介质
CN111125603B (zh) * 2019-12-27 2023-06-27 百度时代网络技术(北京)有限公司 网页场景识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
US20190205546A1 (en) 2019-07-04
WO2018086476A1 (zh) 2018-05-17
US10726135B2 (en) 2020-07-28
CN106708502B (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
CN106708502A (zh) 网页处理方法和装置
US11880864B2 (en) System and method of automated delivery of relevance-checked benefit-conveying codes during online transaction
CN102629273B (zh) 基于浏览器的广告信息推送方法、装置及浏览器系统
US9424424B2 (en) Client based local malware detection method
US8856100B2 (en) Displaying browse sequence with search results
US20150220492A1 (en) Systems and methods for integrating dynamic content into electronic media
CN106033450B (zh) 一种广告拦截的方法、装置和浏览器
CN102831218B (zh) 热力图中的数据确定方法及装置
US10110966B2 (en) Method, device, server and client device for video processing
CN104991896A (zh) 一种解析二维码的方法与装置
CN106844635A (zh) 网页中的元素的编辑方法及装置
JP2016514880A (ja) アプリケーションに適合したオブジェクトの再使用およびリサイクル
CN105868290A (zh) 一种展现搜索结果的方法及装置
CN104504058A (zh) 一种页面展示方法和浏览器装置
CN106250761A (zh) 一种识别web自动化工具的设备、装置及方法
CN109240664A (zh) 一种采集用户行为信息的方法及终端
CN111309578A (zh) 标识对象的方法和装置
CN107220371A (zh) 页面显示方法、装置及存储介质
CN107798558A (zh) 用户行为数据分析方法及服务器
CN108959296A (zh) 网页访问错误的处理方法和装置
CN103581321B (zh) 一种refer链的创建方法、装置及安全检测方法和客户端
CN107220364A (zh) 一种信息处理的方法及装置
CN108062324A (zh) 广告过滤方法、装置及用户终端
CN110213211A (zh) 识别安全下载链接的方法、装置、终端及存储介质
WO2018058330A1 (zh) 广告拦截的方法、装置和浏览器、计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant