CN107204958A - 网页资源元素的检测方法及装置、终端设备 - Google Patents

网页资源元素的检测方法及装置、终端设备 Download PDF

Info

Publication number
CN107204958A
CN107204958A CN201610151262.7A CN201610151262A CN107204958A CN 107204958 A CN107204958 A CN 107204958A CN 201610151262 A CN201610151262 A CN 201610151262A CN 107204958 A CN107204958 A CN 107204958A
Authority
CN
China
Prior art keywords
resource
whole
path
webpage
paths
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610151262.7A
Other languages
English (en)
Other versions
CN107204958B (zh
Inventor
张佳辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610151262.7A priority Critical patent/CN107204958B/zh
Publication of CN107204958A publication Critical patent/CN107204958A/zh
Application granted granted Critical
Publication of CN107204958B publication Critical patent/CN107204958B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1466Active attacks involving interception, injection, modification, spoofing of data unit addresses, e.g. hijacking, packet injection or TCP sequence number attacks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/51Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems at application loading time, e.g. accepting, rejecting, starting or inhibiting executable software based on integrity or source reliability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请提供一种网页资源元素的检测方法及装置、终端设备,该方法包括:确定网页当前加载的全部资源元素对应的全部资源路径;从所述全部资源路径中提取所述全部资源路径对应的全部主机名;确定所述全部主机名中不在白名单中的主机名,所述白名单用于记录所述网页的合法主机名;确定所述不在所述白名单中的主机名对应的资源元素为第三方的资源元素。在本申请的技术方案可以实现只有在网页加载资源元素时触发对网页当前加载的全部资源元素的检测,避免对网页的定期扫描;由于网页在加载元素仅对当前加载的全部资源元素进行检测,因此无需扫描整个网页上的全部资源元素,大大提高了检测效率。

Description

网页资源元素的检测方法及装置、终端设备
技术领域
本申请涉及网络技术领域,尤其涉及一种网页资源元素的检测方法及装置、终端设备。
背景技术
目前网络运营商、浏览器插件以及大量黑色产业都在争夺用户的流量,通过在网页中植入广告或恶意代码成为最为常见的劫持方式,该种劫持方式可导致网站原有广告的流失,同时也给用户带来极大的安全隐患。现有技术中,通过扫描页面中的元素节点,分析元素节点的来源路径,判断是否位于合法的网站还是第三方的网站。由于该种方式只能扫描某一时刻的元素集合,而网页里的内容会动态变化,因此需要定期扫描,效率较低。
发明内容
有鉴于此,本申请提供一种新的技术方案,可以尽快检测到网页加载的第三方资源,提高网页的监控效率。
为实现上述目的,本申请提供技术方案如下:
根据本申请的第一方面,提出了一种网页资源元素的检测方法,包括:
确定网页当前加载的全部资源元素对应的全部资源路径;
从所述全部资源路径中提取所述全部资源路径对应的全部主机名;
确定所述全部主机名中不在白名单中的主机名,所述白名单用于记录所述网页的合法主机名;
确定所述不在所述白名单中的主机名对应的资源元素为第三方的资源元素。
根据本申请的第二方面,提出了一种网页资源元素的检测装置,包括:
第一确定模块,用于确定网页当前加载的全部资源元素对应的全部资源路径;
第一提取模块,用于从所述第一确定模块确定的所述全部资源路径中提取所述全部资源路径对应的全部主机名;
第二确定模块,用于确定所述第一提取模块提取到的所述全部主机名中不在白名单中的主机名,所述白名单用于记录所述网页的合法主机名;
第三确定模块,用于确定所述第二确定模块确定的所述不在所述白名单中的主机名对应的资源元素为第三方的资源元素。
根据本申请的第三方面,提出了一种终端设备,所述终端设备包括:
处理器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器,用于确定网页当前加载的全部资源元素对应的全部资源路径;
从所述全部资源路径中提取所述全部资源路径对应的全部主机名;
确定所述全部主机名中不在白名单中的主机名,所述白名单用于记录所述网页的合法主机名;
确定所述不在所述白名单中的主机名对应的资源元素为第三方的资源元素。
由以上技术方案可见,本申请实现了只有在网页加载资源元素时触发对网页当前加载的全部资源元素的检测,避免了对网页的定期扫描;由于网页在加载元素仅对当前加载的全部资源元素进行检测,因此无需扫描整个网页上的全部资源元素,大大提高了检测效率。
附图说明
图1示出了根据本发明的示例性实施例一的网页资源元素的检测方法的流程示意图;
图2示出了根据本发明的示例性实施例二的网页资源元素的检测方法的流程示意图;
图3示出了根据本发明的示例性实施例三的网页资源元素的检测方法的流程示意图;
图4示出了根据本发明的示例性实施例四的网页资源元素的检测方法的流程示意图;
图5示出了根据本发明的示例性实施例五的网页资源元素的检测方法的流程示意图;
图6示出了根据本发明的一示例性实施例的终端设备的结构示意图;
图7示出了根据本发明的示例性实施例一的网页资源元素的检测装置的结构示意图;
图8示出了根据本发明的示例性实施例二的网页资源元素的检测装置的结构示意图;
图9示出了根据本发明的示例性实施例三的网页资源元素的检测装置的结构示意图;
图10示出了根据本发明的示例性实施例四的网页资源元素的检测装置的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
现有技术中的浏览器都遵循DOM-Level-3-Events事件模型,该DOM-Level-3-Events事件模型包括三个阶段:捕获阶段、目标阶段、冒泡阶段。当网页中添加一个资源元素时,例如图片<img src="1.png">,如果资源元素加载成功,则该资源元素会触发加载成功事件(onload),如果该资源元素加载失败,则该资源元素会触发加载失败事件(onerror),例如,<imgsrc="1.png"onload="alert('success')"onerror="alert('fail')">。其中,onload事件和onerror事件属于目标阶段。由于window.onload表示“页面加载完成”,window.onerror表示“有脚本错误发生”,因此不能用于跟踪资源元素的加载事件。
本申请通过捕获加载事件来检测网页加载的第三方的资源元素,可以提高监控效率。为对本申请进行进一步说明,提供下列实施例:
图1示出了根据本发明的示例性实施例一的网页资源元素的检测方法的流程示意图;如图1所示,包括如下步骤:
步骤101,确定网页当前加载的全部资源元素对应的全部资源路径。
步骤102,从全部资源路径中提取全部资源路径对应的全部主机名。
步骤103,确定全部主机名中不在白名单中的主机名,白名单用于记录网页的合法主机名。
步骤104,确定不在白名单中的主机名对应的资源元素为第三方的资源元素。
在上述步骤101中,在一实施例中,网页当前加载的资源元素可以包括图片元素、脚本元素、框架元素、样式元素等。在一实施例中,可以通过监控网页上的全部资源元素触发的加载成功事件和加载失败事件,进而通过的加载成功事件和加载失败事件对应的事件回调函数确定相应的资源元素,在确定资源元素之后,通过分析资源元素的路径属性,即可得到全部资源元素对应的全部资源路径。
在上述步骤102中,例如,资源元素加载的资源路径为:URL=Element.getAttribute(AttrName),从该URL中即可提取出主机名,HostName=get_hostname_from_url(URL)。在一实施例中,主机名可以以域名或者IP地址的方式来表示。
在上述步骤103中,在一实施例中,白名单可以根据网页对应的网站来设置,网站不同,对应的白名单也不同,例如,对于网站www.aaa.com,对应的白名单为List_aaa,对于网站www.bbb.com,对应的白名单为List_bbb,其中,List_aaa与List_bbb可以根据各自对应的网站来设置。在一实施例中,可以将白名单记录在脚本文件中,网页在加载资源元素时调用该脚本文件,从而获取到网页所在网站对应的白名单。
在上述步骤104中,例如,通过上述步骤101-103得到全部主机名包括“www.aaa.com”和“www.bbb.com”,而当前加载的网页对应的域名为“www.aaa.com”,由于“www.aaa.com”位于List_aaa中,而“www.bbb.com”不在List_aaa中,因此确定“www.bbb.com”对应的资源元素为第三方的资源元素。
由上述描述可知,本发明实施例通过上述步骤101-步骤104,实现了只有在网页加载资源元素时触发对网页当前加载的全部资源元素的检测,避免了对网页的定期扫描;由于网页在加载元素仅对当前加载的全部资源元素进行检测,因此无需扫描整个网页上的全部资源元素,大大提高了检测效率。
图2示出了根据本发明的示例性实施例二的网页资源元素的检测方法的流程示意图;本实施例以如何确定网页当前加载的全部资源元素对应的全部资源路径为例进行示例性说明,如图2所示,包括如下步骤:
步骤201,获取网页当前加载的全部资源元素触发的全部加载事件。
步骤202,通过全部加载事件各自对应的回调函数确定全部加载事件各自对应的资源元素,得到全部加载事件对应的全部资源元素。
步骤203,确定全部资源元素各自对应的路径属性名。
步骤204,根据全部资源元素各自对应的路径属性名读取全部资源元素各自对应的属性值,该全部资源元素各自对应的属性值对应全部资源元素加载的全部资源路径。
在上述步骤201中,在一实施例中,可通过监控网页(Document)当前加载的全部资源元素触发的加载成功事件和加载失败事件来获取网页中的全部资源元素触发的全部加载事件,例如,网页中有10个资源元素,其中8个资源元素加载成功,2个资源元素加载失败,则需要获取该10个资源元素对应的10件加载事件,可通过如下函数即可监控网页中的全部资源元素触发的加载成功事件和加载失败事件:
document.addEventListener('load',function(e){…},true)
document.addEventListener('error',function(e){…},true)
上述步骤202中,根据DOM-3-Level-Events模型,加载事件的回调函数的第一个参数(即步骤201中示出的代码中的变量e)包含资源元素的事件在触发时的相关信息,其中的目标(target)属性,即表示产生事件的资源元素,即:Element=e.target。
上述步骤203中,不同的元素类型有不同的属性名,例如,图片元素、脚本元素、框架元素对应的路径属性名为“src”,样式元素对应的路径属性名为“href”。例如,通过如下代码得到全部资源元素各自对应的路径属性名:
上述步骤204中,根据全部资源元素各自对应的路径属性名读取全部资源元素各自对应的属性值,即得到全部资源元素加载的全部资源路径,例如:
URL=Element.getAttribute(AttrName)。
本实施例通过使用前端技术,可直接通过脚本程序的方式获取到网页当前加载的全部资源元素对应的全部资源路径,从而可以在第一时间检测到网页当前加载的资源路径,进而提高了检测网页上的资源元素的效率。
图3示出了根据本发明的示例性实施例三的网页资源元素的检测方法的流程示意图;本实施例以如何剔除网页当前加载的全部资源元素对应的全部资源路径中的无效资源路径为例进行示例性说明,如图3所示,包括如下步骤:
步骤301,确定全部资源路径中属性值为空的资源路径。
步骤302,将属性值为空的资源路径从全部资源路径中删除。
步骤303,确定全部资源路径中是否存在以设定字符串开头的资源路径。
步骤304,如果全部资源路径中存在以设定字符串开头的资源路径,将以设定字符串开头的资源路径从全部资源路径中删除。
上述步骤301和步骤302中,通过URL=Element.getAttribute(AttrName),读取属性值,如果URL为空,则终止检测该URL对应的资源元素。
上述步骤303和步骤304中,在一实施例中,设定字符串可以由提供网页的网络服务商来确定,例如,根据web标准的协议,“data:”为该网页内部提供的资源元素,不需要通过网络加载。
本实施例中,通过将属性值为空的资源路径以及以设定字符串开头的资源路径从全部资源路径中删除,可以减少后续不必要的检测。
图4示出了根据本发明的示例性实施例四的网页资源元素的检测方法的流程示意图;本实施例以如何剔除主机名为空的资源路径为例进行示例性说明,如图4所示,包括如下步骤:
步骤401,确定全部资源路径中是否存在主机名为空的资源路径。
步骤402,当存在主机名为空的资源路径时,确定主机名为空的资源路径的路径类型。
步骤403,当路径类型表示主机名为空的资源路径为相对路径或者无效路径时,停止对主机名为空的资源路径对应的资源元素的检测。
在一实施例中,资源路径的路径类型可以包括绝对路径、相对路径以及无效路径。其中,绝对路径表示网页对应的当前网站的资源路径,相对路径表示相对网页对应的当前网站的资源路径,通常情形下无路径名,无效路径表示格式存在问题的资源路径。
例如,通过HostName=get_hostname_from_url(URL)提取到主机名,如果HostName非空,例如,该资源路径为绝对路径的情形为:http://www.aaa.com/1.gif;如果HostName为空,例如,该资源路径为相对路径的情形为:<img src="/xxx/xxx.GIF">;该资源路径为无效路径的情形为:<img src="http://.GIF">。
本实施例中,当路径类型表示主机名为空的资源路径为相对路径或者无效路径时,停止对主机名为空的资源路径对应的资源元素的检测,可以减少后续不必要的检测。
图5示出了根据本发明的示例性实施例五的网页资源元素的检测方法的流程示意图;本实施例以如何将第三方的资源元素通知给日志分析平台为例进行示例性说明,如图5所示,包括如下步骤:
步骤501,确定第三方的资源元素在网页上的DOM路径。
步骤502,根据DOM路径定位第三方的资源元素在网页的页面结构中的位置。
步骤503,根据第三方的资源元素的资源路径和第三方的资源元素的DOM路径生成报警日志。
步骤504,将报警日志发送到日志分析平台。
在上述步骤501和步骤502中,例如,通过收集资源元素的DOM路径,以CSS选择器的方式表示为:Dom_Path=get_dom_path(Element),
DOM路径例如为:HTML>BODY>DIV.class-name>DIV#id>IMG。
在上述步骤503中,生成的报警日志例如为:Log(URL,DOM_PATH)。
本实施例中,通过第三方的资源元素在网页上的DOM路径可以定位异常的资源元素在网页的DOM结构中的位置,从而方便后期对第三方的资源元素进行分析、排查和统计;通过将报警日志发送给日志分析平台,可以使日志分析平台对第三方的资源元素的URL、异常元素路径、以及时间、用户IP、浏览器版本等信息进行统计和分析。
对应于上述的网页资源元素的检测方法,本申请还提出了图6所示的根据本申请的一示例性实施例的终端设备的示意结构图。请参考图6,在硬件层面,该终端设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成网页资源元素的检测装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
其中,处理器,用于确定网页当前加载的全部资源元素对应的全部资源路径;
从全部资源路径中提取全部资源路径对应的全部主机名;
确定全部主机名中不在白名单中的主机名,白名单用于记录网页的合法主机名;
确定不在白名单中的主机名对应的资源元素为第三方的资源元素。
图7为根据本发明的示例性实施例一的网页资源元素的检测装置的结构示意图;如图7所示,该网页资源元素的检测装置可以包括:第一确定模块71、第一提取模块72、第二确定模块73、第三确定模块74。其中:
第一确定模块71,用于确定网页当前加载的全部资源元素对应的全部资源路径;
第一提取模块72,用于从第一确定模块71确定的全部资源路径中提取全部资源路径对应的全部主机名;
第二确定模块73,用于确定第一提取模块72提取到的全部主机名中不在白名单中的主机名,白名单用于记录网页的合法主机名;
第三确定模块74,用于确定第二确定模块73确定的不在白名单中的主机名对应的资源元素为第三方的资源元素
图8示出了根据本发明的示例性实施例二的网页资源元素的检测装置的结构示意图;如图8所示,在上述图7所示实施例的基础上,在一实施例中,第一确定模块71可包括:
获取单元711,用于获取网页当前加载的全部资源元素触发的全部加载事件;
第一确定单元712,用于通过获取单元711获取到的全部加载事件各自对应的回调函数确定全部加载事件各自对应的资源元素,得到全部加载事件对应的全部资源元素;
第二确定单元713,用于确定第一确定单元712确定的全部资源元素各自对应的路径属性名;
读取单元714,用于根据第二确定单元713确定的全部资源元素各自对应的路径属性名读取全部资源元素各自对应的属性值,该全部资源元素各自对应的属性值对应全部资源元素加载的全部资源路径。
在一实施例中,装置还可包括:
第四确定模块75,用于确定第一确定模块71确定的全部资源路径中属性值为空的资源路径;
第一删除模块76,用于将第四确定模块75确定的属性值为空的资源路径从全部资源路径中删除。
在一实施例中,装置还可包括:
第五确定模块77,用于确定第一确定模块71确定的全部资源路径中是否存在以设定字符串开头的资源路径;
第二删除模块78,用于如果第五确定模块77确定的全部资源路径中存在以设定字符串开头的资源路径,将以设定字符串开头的资源路径从全部资源路径中删除。
图9示出了根据本发明的示例性实施例三的网页资源元素的检测装置的结构示意图;如图9所示,在上述图7或图8所示实施例的基础上,在一实施例中,装置还可包括:
第六确定模块79,用于确定第一确定模块71确定的全部资源路径中是否存在主机名为空的资源路径;
第七确定模块80,用于当第六确定模块79确定存在主机名为空的资源路径时,确定主机名为空的资源路径的路径类型;
控制模块81,用于当第七确定模块80确定路径类型表示主机名为空的资源路径为相对路径或者无效路径时,停止对主机名为空的资源路径对应的资源元素的检测。
图10示出了根据本发明的示例性实施例四的网页资源元素的检测装置的结构示意图;如图10所示,在上述图7-图9任一所示实施例的基础上,在一实施例中,装置还可包括:
第八确定模块82,用于确定第三确定模块74确定的第三方的资源元素在网页上的DOM路径;
定位模块83,用于根据第八确定模块82确定的DOM路径定位第三方的资源元素在网页的页面结构中的位置。
在一实施例中,装置还可包括:
日志生成模块84,用于根据第三确定模块74确定的第三方的资源元素的资源路径和第三方的资源元素的DOM路径生成报警日志;
发送模块85,用于将日志生成模块84生成的报警日志发送到日志分析平台。
上述实施例可见,本申请通过捕获加载事件来检测网页加载的第三方的资源元素,从而可以提高监控效率。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (15)

1.一种网页资源元素的检测方法,其特征在于,所述方法包括:
确定网页当前加载的全部资源元素对应的全部资源路径;
从所述全部资源路径中提取所述全部资源路径对应的全部主机名;
确定所述全部主机名中不在白名单中的主机名,所述白名单用于记录合法主机名;
确定所述不在所述白名单中的主机名对应的资源元素为第三方的资源元素。
2.根据权利要求1所述的方法,其特征在于,所述确定所述网页当前加载的全部资源元素对应的全部资源路径,包括:
获取所述网页当前加载的全部资源元素触发的全部加载事件;
通过所述全部加载事件各自对应的回调函数确定所述全部加载事件各自对应的资源元素,得到所述全部加载事件对应的全部资源元素;
确定所述全部资源元素各自对应的路径属性名;
根据所述全部资源元素各自对应的路径属性名读取所述全部资源元素各自对应的属性值,该全部资源元素各自对应的属性值对应所述全部资源元素加载的全部资源路径。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
确定所述全部资源路径中属性值为空的资源路径;
将所述属性值为空的资源路径从所述全部资源路径中删除。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
确定所述全部资源路径中是否存在以设定字符串开头的资源路径;
如果所述全部资源路径中存在以设定字符串开头的资源路径,将所述以设定字符串开头的资源路径从所述全部资源路径中删除。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述全部资源路径中是否存在主机名为空的资源路径;
当存在主机名为空的资源路径时,确定所述主机名为空的资源路径的路径类型;
当所述路径类型表示所述主机名为空的资源路径为相对路径或者无效路径时,停止对所述主机名为空的资源路径对应的资源元素的检测。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述第三方的资源元素在所述网页上的DOM路径;
根据所述DOM路径定位所述第三方的资源元素在所述网页的页面结构中的位置。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述第三方的资源元素的资源路径和所述第三方的资源元素的DOM路径生成报警日志;
将所述报警日志发送到日志分析平台。
8.一种网页资源元素的检测装置,其特征在于,所述装置包括:
第一确定模块,用于确定网页当前加载的全部资源元素对应的全部资源路径;
第一提取模块,用于从所述第一确定模块确定的所述全部资源路径中提取所述全部资源路径对应的全部主机名;
第二确定模块,用于确定所述第一提取模块提取到的所述全部主机名中不在白名单中的主机名,所述白名单用于记录所述网页的合法主机名;
第三确定模块,用于确定所述第二确定模块确定的所述不在所述白名单中的主机名对应的资源元素为第三方的资源元素。
9.根据权利要求8所述的装置,其特征在于,所述第一确定模块包括:
获取单元,用于获取所述网页当前加载的全部资源元素触发的全部加载事件;
第一确定单元,用于通过所述获取单元获取到的所述全部加载事件各自对应的回调函数确定所述全部加载事件各自对应的资源元素,得到所述全部加载事件对应的全部资源元素;
第二确定单元,用于确定所述第一确定单元确定的所述全部资源元素各自对应的路径属性名;
读取单元,用于根据所述第二确定单元确定的所述全部资源元素各自对应的路径属性名读取所述全部资源元素各自对应的属性值,该全部资源元素各自对应的属性值对应所述全部资源元素加载的全部资源路径。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第四确定模块,用于确定所述第一确定模块确定的所述全部资源路径中属性值为空的资源路径;
第一删除模块,用于将所述第四确定模块确定的所述属性值为空的资源路径从所述全部资源路径中删除。
11.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第五确定模块,用于确定所述第一确定模块确定的所述全部资源路径中是否存在以设定字符串开头的资源路径;
第二删除模块,用于如果所述第五确定模块确定的所述全部资源路径中存在以设定字符串开头的资源路径,将所述以设定字符串开头的资源路径从所述全部资源路径中删除。
12.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第六确定模块,用于确定所述第一确定模块确定的所述全部资源路径中是否存在主机名为空的资源路径;
第七确定模块,用于当所述第六确定模块确定存在主机名为空的资源路径时,确定所述主机名为空的资源路径的路径类型;
控制模块,用于当所述第七确定模块确定所述路径类型表示所述主机名为空的资源路径为相对路径或者无效路径时,停止对所述主机名为空的资源路径对应的资源元素的检测。
13.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第八确定模块,用于确定所述第三确定模块确定的所述第三方的资源元素在所述网页上的DOM路径;
定位模块,用于根据所述第八确定模块确定的所述DOM路径定位所述第三方的资源元素在所述网页的页面结构中的位置。
14.根据权利要求8所述的装置,其特征在于,所述装置还包括:
日志生成模块,用于根据所述第三确定模块确定的所述第三方的资源元素的资源路径和所述第三方的资源元素的DOM路径生成报警日志;
发送模块,用于将所述日志生成模块生成的所述报警日志发送到日志分析平台。
15.一种终端设备,其特征在于,所述终端设备包括:
处理器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器,用于确定网页当前加载的全部资源元素对应的全部资源路径;
从所述全部资源路径中提取所述全部资源路径对应的全部主机名;
确定所述全部主机名中不在白名单中的主机名,所述白名单用于记录所述网页的合法主机名;
确定所述不在所述白名单中的主机名对应的资源元素为第三方的资源元素。
CN201610151262.7A 2016-03-16 2016-03-16 网页资源元素的检测方法及装置、终端设备 Active CN107204958B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610151262.7A CN107204958B (zh) 2016-03-16 2016-03-16 网页资源元素的检测方法及装置、终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610151262.7A CN107204958B (zh) 2016-03-16 2016-03-16 网页资源元素的检测方法及装置、终端设备

Publications (2)

Publication Number Publication Date
CN107204958A true CN107204958A (zh) 2017-09-26
CN107204958B CN107204958B (zh) 2021-03-23

Family

ID=59903505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610151262.7A Active CN107204958B (zh) 2016-03-16 2016-03-16 网页资源元素的检测方法及装置、终端设备

Country Status (1)

Country Link
CN (1) CN107204958B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109617915A (zh) * 2019-01-15 2019-04-12 成都知道创宇信息技术有限公司 一种基于页面访问拓扑的异常用户挖掘方法
CN112527748A (zh) * 2020-12-24 2021-03-19 北京百度网讯科技有限公司 用于分析用户操作行为的方法、装置、设备以及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120246558A1 (en) * 2006-12-26 2012-09-27 International Business Machines Corporation Social bookmarking of resources exposed in web pages
CN103001817A (zh) * 2011-09-16 2013-03-27 厦门市美亚柏科信息股份有限公司 一种实时检测网页跨域请求的方法和装置
CN103377059A (zh) * 2012-04-23 2013-10-30 阿里巴巴集团控股有限公司 基于jQuery框架的功能模块动态加载方法和装置
CN103914302A (zh) * 2014-04-02 2014-07-09 北京京东尚科信息技术有限公司 一种网页加载进度监控方法和装置
CN104462583A (zh) * 2014-12-30 2015-03-25 北京奇虎科技有限公司 一种进行广告拦截处理浏览器装置和移动终端
CN104536974A (zh) * 2014-12-03 2015-04-22 北京奇虎科技有限公司 在浏览器中搜索信息的方法和浏览器客户端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120246558A1 (en) * 2006-12-26 2012-09-27 International Business Machines Corporation Social bookmarking of resources exposed in web pages
CN103001817A (zh) * 2011-09-16 2013-03-27 厦门市美亚柏科信息股份有限公司 一种实时检测网页跨域请求的方法和装置
CN103377059A (zh) * 2012-04-23 2013-10-30 阿里巴巴集团控股有限公司 基于jQuery框架的功能模块动态加载方法和装置
CN103914302A (zh) * 2014-04-02 2014-07-09 北京京东尚科信息技术有限公司 一种网页加载进度监控方法和装置
CN104536974A (zh) * 2014-12-03 2015-04-22 北京奇虎科技有限公司 在浏览器中搜索信息的方法和浏览器客户端
CN104462583A (zh) * 2014-12-30 2015-03-25 北京奇虎科技有限公司 一种进行广告拦截处理浏览器装置和移动终端

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109617915A (zh) * 2019-01-15 2019-04-12 成都知道创宇信息技术有限公司 一种基于页面访问拓扑的异常用户挖掘方法
CN109617915B (zh) * 2019-01-15 2020-12-15 成都知道创宇信息技术有限公司 一种基于页面访问拓扑的异常用户挖掘方法
CN112527748A (zh) * 2020-12-24 2021-03-19 北京百度网讯科技有限公司 用于分析用户操作行为的方法、装置、设备以及存储介质
CN112527748B (zh) * 2020-12-24 2024-04-09 北京百度网讯科技有限公司 用于分析用户操作行为的方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN107204958B (zh) 2021-03-23

Similar Documents

Publication Publication Date Title
US9509714B2 (en) Web page and web browser protection against malicious injections
US9712560B2 (en) Web page and web browser protection against malicious injections
CN104486140B (zh) 一种检测网页被劫持的装置及其检测方法
EP3726410B1 (en) Interpretation device, interpretation method and interpretation program
CN108304410B (zh) 一种异常访问页面的检测方法、装置及数据分析方法
CN104601573B (zh) 一种Android平台URL访问结果验证方法及装置
CN103279710B (zh) Internet信息系统恶意代码的检测方法和系统
CN107085549B (zh) 故障信息生成的方法和装置
CN104683328A (zh) 一种跨站漏洞扫描方法及系统
CN105812196A (zh) 一种WebShell检测方法及电子设备
CN111008405A (zh) 一种基于文件Hash的网站指纹识别方法
CN109347882A (zh) 网页木马监测方法、装置、设备及存储介质
CN106250761B (zh) 一种识别web自动化工具的设备、装置及方法
CN114465741B (zh) 一种异常检测方法、装置、计算机设备及存储介质
CN109657459A (zh) 网页后门检测方法、设备、存储介质及装置
CN111130845A (zh) 基于视觉信息的网站页面IPv6支持度测试方法及装置
CN107566401A (zh) 虚拟化环境的防护方法及装置
CN108156121A (zh) 流量劫持的监控方法及装置、流量劫持的报警方法及装置
CN107135199B (zh) 网页后门的检测方法和装置
Choudhary et al. A cross-browser web application testing tool
CN105100065B (zh) 基于云的webshell攻击检测方法、装置及网关
CN114157568B (zh) 一种浏览器安全访问方法、装置、设备及存储介质
CN111131236A (zh) 一种web指纹检测装置、方法、设备及介质
CN107566371B (zh) 一种面向海量日志的WebShell挖掘方法
CN111125704B (zh) 一种网页挂马识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant