WO2015188431A1

WO2015188431A1 - 资源的下载方法及装置

Info

Publication number: WO2015188431A1
Application number: PCT/CN2014/083594
Authority: WO
Inventors: 曹刚
Original assignee: 中兴通讯股份有限公司
Priority date: 2014-06-10
Filing date: 2014-08-01
Publication date: 2015-12-17
Also published as: CN105320661A; CN105279215A; EP3142020A4; EP3142020A1; US10262341B2; US20170132669A1

Abstract

本发明公开了一种资源的下载方法及装置，在上述方法中，对待下载资源所在网页的DOM树进行动态检测，获取多个URL资源；从多个URL资源中滤除与广告数据对应的部分URL资源；提示用户对滤除广告数据后剩余的URL资源进行下载。根据本发明提供的技术方案，进而使得用户在仅提供在线播放的网页中可以随意获取自身感兴趣的媒体文件，从而极大地提升了用户体验。

Description

资源的下载方法及装置技术领域本发明涉及通信领域，具体而言，涉及一种资源的下载方法及装置。背景技术随着无线通讯技术和互联网技术的飞速发展，在移动终端上使用浏览器进行上网的用户越来越多。作为移动互联网入口，浏览器的重要性不言而喻。如何在移动终端上提高浏览器的用户体验，从而在白热化的市场竞争中取得亮点并占有市场份额已经成为目前浏览器技术研究的重点。在通常情况下，用户在使用移动终端浏览器浏览一些视频、音乐网站时，发现在网页上自己喜欢的视频或音乐只能在线播放，而没有任何可以对该多媒体文件进行下载的操作按钮，从而无法将这些文件下载到本地来随时进行流畅的播放。而多次在线播放不仅消耗网络流量，而且受到网络带宽的影响经常在播放过程中会出现卡顿现象，继而降低了用户体验。基于上述问题的存在，一种被称为 "嗅探" 的浏览器技术应运而生，其主要原理是在网页资源加载完成后，对网页内各个标签进行检测，若检测到视频或音频等标签则获取它们对应的统一资源定位符（URL)，经过 URL验证再提示给用户是否需要下载。通过用户选择提示下载选项对应的 URL即可将多媒体文件下载到本地进行播放。然而，上述常规嗅探方法仍然存在以下缺陷：

( 1 )这是一种静态的检测方法，然而在网页加载完成后，其媒体内容经常会发生动态变化，因而常规嗅探往往会出现漏检测或误检测的情况。 (2) 很多网页在打开过程中会事先播放一段广告视频等与用户需求不相关的内容，而常规的嗅探经常将这些广告嗅探出来交给用户下载，但是对于用户原本需求的媒体文件却无法嗅探。

(3 ) 在嗅探阶段往往无法获知下载的文件名，常规办法只能采用对应 URL结尾字符串来命名，用户下载后往往不确定哪个是自己下载的文件。发明内容本发明提供了一种资源的下载方法及装置，以至少解决相关技术中在视频或音乐等网站的媒体文件仅提供在线播放而不支持本地下载的情况下，如何使用浏览器对媒体文件进行嗅探以便向用户提供本地下载的问题。根据本发明的一个方面，提供了一种资源的下载方法。根据本发明实施例的资源的下载方法包括：对待下载资源所在网页的文档对象模型（DOM) 树进行动态检测，获取多个统一资源定位符（URL) 资源；从多个 URL 资源中滤除与广告数据对应的部分 URL资源;提示用户对滤除广告数据后剩余的 URL 资源进行下载。优选地，对 DOM树进行实时检测，获取多个 URL资源包括：判断 DOM树中是否存在预设标签集合中的标签，其中，预设标签集合包括以下至少之一：视频（video) 标签、音频（audio) 标签、对象（object) 标签；如果存在，则获取标签对应的超文本引用（href) 属性，并从 href属性中提取多个 URL资源。优选地，从多个 URL资源中滤除部分 URL资源包括：接收来自于服务器的最近更新的广告拦截数据信息，其中，广告拦截数据信息包括：部分 URL资源的标识信息以及确定部分 URL资源为待拦截的广告数据的特征信息；采用广告拦截数据信息从多个 URL资源中滤除部分 URL资源。优选地，提示用户对剩余的 URL资源进行下载包括：对剩余的 URL资源进行命名；按照预设显示方式对剩余的 URL资源的文件名进行显示。优选地，对剩余的 URL资源进行命名包括：将剩余的 URL资源中的每个 URL资源所在网页的标题设置为第一文件名；将每个 URL资源的最后 N位字符设置为第二文件名，其中， N为正整数；将第一文件名和第二文件名进行组合，对每个 URL资源进行命名。优选地，对 D0M树进行动态检测包括以下之一: 按照预设周期对 D0M树进行检测；由网页后台脚本自动触发对 D0M树进行检测; 通过用户点击预设按钮引发的网页子资源加载事件被捕获后触发对 D0M树进行检领优选地，在提示用户对剩余的 URL资源进行下载之前，还包括：采用预设的 URL 规范对剩余的 URL资源进行 URL验证。根据本发明的另一方面，提供了一种资源的下载装置。根据本发明实施例的资源的下载装置包括：检测模块，设置为对待下载资源所在网页的 DOM树进行动态检测，获取多个 URL资源；过滤模块，设置为从多个 URL 资源中滤除与广告数据对应的部分 URL资源；处理模块，设置为提示用户对滤除广告数据后剩余的 URL资源进行下载。优选地，检测模块包括：判断单元，设置为判断 DOM树中是否存在预设标签集合中的标签，其中，预设标签集合包括以下至少之一： video标签、 audio标签、 object 标签；提取单元，设置为在判断单元输出为是时，获取标签对应的 href属性，并从 href 属性中提取多个 URL资源。优选地，过滤模块包括：接收单元，设置为接收来自于服务器的最近更新的广告拦截数据信息，其中，广告拦截数据信息包括：部分 URL资源的标识信息以及确定部分 URL资源为待拦截的广告数据的特征信息；过滤单元，设置为采用广告拦截数据信息从多个 URL资源中滤除部分 URL资源。优选地，处理模块包括：命名单元，设置为对剩余的 URL资源进行命名；显示单元，设置为按照预设显示方式对剩余的 URL资源的文件名进行显示。优选地，命名单元包括：第一设置子单元，设置为将剩余的 URL 资源中的每个 URL 资源所在网页的标题设置为第一文件名；第二设置子单元，设置为将每个 URL 资源的最后 N位字符设置为第二文件名，其中， N为正整数；组合子单元，设置为将第一文件名和第二文件名进行组合，对每个 URL资源进行命名。优选地，检测模块，设置为按照以下方式之一对 D0M树进行动态检测：按照预设周期对 D0M树进行检测；由网页后台脚本自动触发对 D0M树进行检测；通过用户点击预设按钮引发的网页子资源加载事件被捕获后触发对 D0M树进行检测。优选地，上述装置还包括：验证模块，设置为采用预设的 URL规范对剩余的 URL 资源进行 URL验证。通过本发明实施例，采用对待下载资源所在网页的 D0M树进行动态检测，获取多个 URL资源；从多个 URL资源中滤除与广告数据对应的部分 URL资源；提示用户对滤除广告数据后剩余的 URL资源进行下载，解决了相关技术中在视频或音乐等网站的媒体文件仅提供在线播放而不支持本地下载的情况下，如何使用浏览器对媒体文件进行嗅探以便向用户提供本地下载的问题，进而使得用户在仅提供在线播放的网页中可以随意获取自身感兴趣的媒体文件，从而极大地提升了用户体验。附图说明此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：图 1是根据本发明实施例的资源的下载方法的流程图；图 2是根据本发明优选实施例的对网页的媒体资源进行动态检测方法的流程图；图 3是根据本发明优选实施例的对网页嗅探的资源进行广告滤除和验证方法的流程图；图 4是根据本发明优选实施例的对网页嗅探下载文件进行命名和提示方法的流程图；图 5是根据本发明实施例的资源的下载装置的结构框图；图 6是根据本发明优选实施例的资源的下载装置的结构框图；图 7 是根据本发明优选实施例的可滤除广告的浏览器动态嗅探的总体架构示意图。具体实施方式下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。图 1是根据本发明实施例的资源的下载方法的流程图。如图 1所示，该方法可以包括以下处理步骤：步骤 S102: 对待下载资源所在网页的 DOM树进行动态检测，获取多个 URL资源；步骤 S104: 从多个 URL资源中滤除与广告数据对应的部分 URL资源；步骤 S106: 提示用户对滤除广告数据后剩余的 URL资源进行下载。相关技术中，在视频或音乐等网站的媒体文件仅提供在线播放而不支持本地下载的情况下，使用现有的浏览器对媒体文件进行嗅探的方式向用户提供本地下载缺乏准确性和灵活性。采用如图 1所示的方法，通过对待下载资源所在网页的 DOM树进行动态检测，获取多个 URL资源可以避免现有的浏览器嗅探技术中存在的漏检测或误检测，通过从多个 URL资源中滤除与广告数据对应的部分 URL资源可以避免广告媒体文件的严重干扰，然后提示用户对滤除广告数据后剩余的 URL资源进行下载，由此解决了相关技术中在视频或音乐等网站的媒体文件仅提供在线播放而不支持本地下载的情况下，如何使用浏览器对媒体文件进行嗅探以便向用户提供本地下载的问题，进而使得用户在仅提供在线播放的网页中可以随意获取自身感兴趣的媒体文件，从而极大地提升了用户体验。优选地，在步骤 S102中，对 DOM树进行实时检测，获取多个 URL资源可以包括以下操作：步骤 S1 : 判断 DOM树中是否存在预设标签集合中的标签，其中，预设标签集合包括以下至少之一：视频（video) 标签、音频（audio) 标签、对象（object) 标签；步骤 S2: 如果存在，则获取标签对应的超文本引用（href) 属性，并从 href属性中提取多个 URL资源。在优选实施过程中，对 DOM树进行动态检测可以包括以下方式之一：方式一、按照预设周期对 D0M树进行检测；方式二、由网页后台脚本自动触发对 D0M树进行检测；方式三、通过用户点击预设按钮引发的网页子资源加载事件被捕获后触发对 D0M 树进行检测。作为本发明的一个优选实施例，图 2是根据本发明优选实施例的对网页的媒体资源进行动态检测方法的流程图。如图 2 所示，该流程可以包括以下处理步骤：步骤 S202:在接收到浏览器内核网页加载结束信号之后，开始启动对网页的 DOM 树的检测操作；步骤 S204: 如果检测到当前网页的 D0M 树中包含<^(^₀>禾口 /或<audio>禾口 /或 <₀ 6 >标签时，获取该标签对应节点的超文本引用（Hypertext Reference,简称为 href) 属性，即该音频或视频文件的下载 URL资源，继续执行步骤 S206; 否则，转到步骤 S208; 步骤 S206: 判断当前网页获取的下载资源 URL是否重复，若不重复，则可以继续进行广告滤除操作，本阶段结束；若重复，则转到步骤 S208; 步骤 S208: 启动网页子资源加载监听流程，当网页后台 Java脚本（JavaScript) 自动发起或者通过用户点击播放按钮引起的网页子资源加载事件被捕获后，会再次通知执行步骤 S202进行检测；通过上述动态监听检测，可以实时监控 DOM树内部节点所发生的变化，从而避免出现嗅探的漏检。优选地，在步骤 S104中，从多个 URL资源中滤除部分 URL资源可以包括以下步骤：步骤 S3 : 接收来自于服务器的最近更新的广告拦截数据信息，其中，广告拦截数据信息可以包括但不限于：部分 URL资源的标识信息（例如：网站宿主名（HostName) 信息）以及确定部分 URL资源为待拦截的广告数据的特征信息（例如：与 HostName 信息对应的广告数据的关键字信息）；步骤 S4: 采用广告拦截数据信息从多个 URL资源中滤除部分 URL资源。作为本发明的又一个优选实施例，图 3是根据本发明优选实施例的对网页嗅探的资源进行广告滤除和验证方法的流程图。如图 3 所示，该流程可以包括以下处理步骤: 步骤 S302: 通过向服务器发送更新请求消息，从服务器获取最新的广告拦截数据表，该广告拦截数据表可以包括两个字段：其一是当前一些热门视频和 /或音频网站的网站宿主名（即 HostName),其二是与该网站播放的广告对应的 URL所包含的关键字 key, 其中， HostName在广告拦截数据表中是唯一的，而一个 HostName可以对应多个 key; 步骤 S304: 将获取到的备选下载资源 URL与广告拦截数据进行匹配。在该优选实施例中，首先可以从当前网页自身的 URL得到 HostName; 然后在广告拦截数据表中查找该 HostName是否存在对应的 key;最后检查这些 key是否包含在备选下载资源 URL中，如果包含则说明该下载资源 URL属于广告资源直接滤除；否则继续执行步骤 S306; 步骤 S306: 判断经过广告滤除的下载资源 URL是否符合 URL规范，若不符合，则直接滤除，若符合，则继续执行后续对下载文件进行命名的流程。优选地，在步骤 S106中，提示用户对剩余的 URL资源进行下载可以包括以下操作：步骤 S5: 对剩余的 URL资源进行命名；步骤 S6: 按照预设显示方式对剩余的 URL资源的文件名进行显示。优选地，在步骤 S5中，对剩余的 URL资源进行命名可以包括以下步骤：步骤 S51 : 将剩余的 URL资源中的每个 URL资源所在网页的标题设置为第一文件名；步骤 S52: 将每个 URL资源的最后 N位字符设置为第二文件名，其中， N为正整数；步骤 S53 : 将第一文件名和第二文件名进行组合，对每个 URL资源进行命名。作为本发明的另一个优选实施例，图 4是根据本发明优选实施例的对网页嗅探下载文件进行命名和提示方法的流程图。如图 4 所示，该流程可以包括以下处理步骤：步骤 S402: 将网页标题作为下载文件名的主文件名，在通常情况下，网页标题可以包含该下载文件中较为准确的信息；步骤 S404: 提取下载资源 URL地址后 N位（N为正整数）字符作为下载文件名的副文件名，例如：一般提取后 8位，主要考虑尽可能地将文件类型后缀保留下来；步骤 S406: 将主文件名和副文件名组合在一起作为该下载资源的文件名；步骤 S408: 提示用户在该网页上嗅探到可下载的媒体文件，并采用列表的方式对下载资源的文件名加以显示。优选地，在步骤 S106, 提示用户对剩余的 URL资源进行下载之前，还可以包括以下操作：步骤 S9: 采用预设的 URL规范对剩余的 URL资源进行 URL验证。即需要对滤除广告后的 URL下载资源进行验证，判断其是否符合 URL规范。而通常情况下只有在滤除广告后的 URL下载资源符合 URL规范时，才会提示用户在该网页上嗅探到可下载的媒体文件，并采用列表的方式对下载资源的文件名加以显示，以便用户进行下载。图 5是根据本发明实施例的资源的下载装置的结构框图。如图 5所示，该资源的下载装置可以包括：检测模块 10，设置为对待下载资源所在网页的 DOM树进行动态检测，获取多个 URL资源；过滤模块 20，设置为从多个 URL资源中滤除与广告数据对应的部分 URL资源；处理模块 30，设置为提示用户对滤除广告数据后剩余的 URL 资源进行下载。采用如图 5所示的装置，解决了相关技术中在视频或音乐等网站的媒体文件仅提供在线播放而不支持本地下载的情况下，如何使用浏览器对媒体文件进行嗅探以便向用户提供本地下载的问题，进而使得用户在仅提供在线播放的网页中可以随意获取自身感兴趣的媒体文件，从而极大地提升了用户体验。优选地，如图 6所示，检测模块 10可以包括：判断单元 100，设置为判断 DOM 树中是否存在预设标签集合中的标签，其中，预设标签集合包括以下至少之一： video 标签、 audio标签、 object标签；提取单元 102，设置为在判断单元输出为是时，获取标签对应的 href属性，并从 href属性中提取多个 URL资源。优选地，如图 6所示，过滤模块 20可以包括：接收单元 200，设置为接收来自于服务器的最近更新的广告拦截数据信息，其中，广告拦截数据信息包括：部分 URL资源的标识信息以及确定部分 URL资源为待拦截的广告数据的特征信息;过滤单元 202，设置为采用广告拦截数据信息从多个 URL资源中滤除部分 URL资源。优选地，如图 6所示，处理模块 30可以包括：命名单元 300，设置为对剩余的

URL资源进行命名；显示单元 302，设置为按照预设显示方式对剩余的 URL资源的文件名进行显示。优选地，命名单元 300可以包括：第一设置子单元（图中未示出），设置为将剩余的 URL资源中的每个 URL资源所在网页的标题设置为第一文件名；第二设置子单元 (图中未示出），设置为将每个 URL资源的最后 N位字符设置为第二文件名，其中， N为正整数；组合子单元（图中未示出），设置为将第一文件名和第二文件名进行组合，对每个 URL资源进行命名。优选地，检测模块 10，设置为按照以下方式之一对 DOM树进行动态检测：按照预设周期对 DOM树进行检测；由网页后台脚本自动触发对 DOM树进行检测；通过用户点击预设按钮引发的网页子资源加载事件被捕获后触发对 DOM树进行检测。优选地，如图 6 所示，上述装置还可以包括：验证模块 40，设置为采用预设的 URL规范对剩余的 URL资源进行 URL验证。下面将结合图 7所示的优选实施方式对上述优选实施过程做进一步的描述。图 7 是根据本发明优选实施例的可滤除广告的浏览器动态嗅探的总体架构示意图。如图 7所示，在上述总体架构中，可以包括：媒体检测模块（相当于上述检测模块）、子资源加载监听模块、广告拦截数据更新模块、广告拦截执行模块（相当于上述过滤模块）、 URL验证模块（相当于上述验证模块）、文件命名模块（相当于上述命名单元）、提示和下载模块（相当于上述处理模块的部分功能）。各个模块实现的功能如下： ( 1 )媒体检测模块主要负责在网页当前的文档对象模型（ Obj ect Document Model，简称为 DOM) 树中检索出相关媒体标签的节点，并从该节点中获取对应的可下载的

(2)子资源加载监听模块主要负责监测在网页文件的整个生命周期中是否存在待加载的子资源，以此便于通知媒体检测模块发起再次检测，从而可以对下载资源进行动态嗅探。

(3 )广告拦截数据更新模块主要负责定期向服务器发送数据更新请求，以获取最新的广告拦截信息，其中，最新的广告拦截信息可以包括：当前一些主流的音频和 / 或视频网站上的广告 URL资源的关键字。

(4)广告拦截执行模块主要负责通过服务器更新的广告拦截信息，对媒体检测模块获取到的 URL进行检测，判断其是否包含在黑名单中（即与广告拦截信息中的关键字相匹配）从而对包含在黑名单中的 URL进行删除拦截。

( 5 ) URL验证模块主要负责对滤除广告后的 URL下载资源进行验证，判断其是否符合 URL规范。

(6)文件命名模块主要负责获取当前网页的标题信息和 URL地址以便构造该下载文件的名称。

(7)提示和下载模块主要负责将嗅探到的下载资源信息展示给用户，并在用户选择下载后进行下载管理。从以上的描述中，可以看出，上述实施例实现了如下技术效果（需要说明的是这些效果是某些优选实施例可以达到的效果）：采用本发明实施例所提供的技术方案，可以有效地解决现有的浏览器嗅探技术中存在的漏检测或误检测，尤其是广告媒体文件的严重干扰以及目前采用的下载文件命名方式使得用户无法分辨哪个下载文件才是用户自身需求的文件等问题，进而使得用户在仅提供在线播放的网页中可以随意获取自身感兴趣的媒体文件，从而极大地提升了用户体验。显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。工业实用性如上所述，本发明实施例提供的一种资源的下载方法及装置具有以下有益效果：可以有效地解决现有的浏览器嗅探技术中存在的漏检测或误检测，尤其是广告媒体文件的严重干扰以及目前采用的下载文件命名方式使得用户无法分辨哪个下载文件才是用户自身需求的文件等问题，进而使得用户在仅提供在线播放的网页中可以随意获取自身感兴趣的媒体文件，从而极大地提升了用户体验。

Claims

权利要求书

1. 一种资源的下载方法，包括：

对待下载资源所在网页的文档对象模型 DOM树进行动态检测，获取多个统一资源定位符 URL资源；

从所述多个 URL资源中滤除与广告数据对应的部分 URL资源；提示用户对滤除广告数据后剩余的 URL资源进行下载。

2. 根据权利要求 1所述的方法，其中，对所述 DOM树进行实时检测，获取所述多个 URL资源包括：判断所述 DOM树中是否存在预设标签集合中的标签，其中，所述预设标签集合包括以下至少之一：视频 video标签、音频 audio标签、对象 object标签；如果存在，则获取所述标签对应的超文本引用 href属性，并从所述 href属性中提取所述多个 URL资源。

3. 根据权利要求 1所述的方法，其中，从所述多个 URL资源中滤除所述部分 URL 资源包括：

接收来自于服务器的最近更新的广告拦截数据信息，其中，广告拦截数据信息包括：所述部分 URL资源的标识信息以及确定所述部分 URL资源为待拦截的广告数据的特征信息；

采用所述广告拦截数据信息从所述多个 URL资源中滤除所述部分 URL资源。

4. 根据权利要求 1所述的方法，其中，提示所述用户对所述剩余的 URL资源进行下载包括：

对所述剩余的 URL资源进行命名；

按照预设显示方式对所述剩余的 URL资源的文件名进行显示。

5. 根据权利要求 4所述的方法，其中，对所述剩余的 URL资源进行命名包括：将所述剩余的 URL资源中的每个 URL资源所在网页的标题设置为第一文件名；将所述每个 URL资源的最后 N位字符设置为第二文件名，其中， N为正整数；将所述第一文件名和所述第二文件名进行组合，对所述每个 URL资源进行命名。

6. 根据权利要求 1所述的方法，其中，对所述 DOM树进行动态检测包括以下之按照预设周期对所述 DOM树进行检测；由网页后台脚本自动触发对所述 DOM树进行检测；通过用户点击预设按钮引发的网页子资源加载事件被捕获后触发对所述 DOM树进行检测。

7. 根据权利要求 1至 6中任一项所述的方法，其中，在提示所述用户对所述剩余的 URL资源进行下载之前，还包括：采用预设的 URL规范对所述剩余的 URL资源进行 URL验证。

8. 一种资源的下载装置，包括：

检测模块，设置为对待下载资源所在网页的文档对象模型 DOM树进行动态检测，获取多个统一资源定位符 URL资源；

过滤模块，设置为从所述多个 URL资源中滤除与广告数据对应的部分 URL 资源；

处理模块，设置为提示用户对滤除广告数据后剩余的 URL资源进行下载。

9. 根据权利要求 8所述的装置，其中，所述检测模块包括：判断单元，设置为判断所述 DOM树中是否存在预设标签集合中的标签，其中，所述预设标签集合包括以下至少之一：视频 video标签、音频 audio标签、对象 object标签；提取单元，设置为在所述判断单元输出为是时，获取所述标签对应的超文本引用 href属性，并从所述 href属性中提取所述多个 URL资源。

10. 根据权利要求 8所述的装置，其中，所述过滤模块包括: 接收单元，设置为接收来自于服务器的最近更新的广告拦截数据信息，其中，广告拦截数据信息包括：所述部分 URL资源的标识信息以及确定所述部分 URL资源为待拦截的广告数据的特征信息；

过滤单元，设置为采用所述广告拦截数据信息从所述多个 URL资源中滤除所述部分 URL资源。

11. 根据权利要求 8所述的装置，其中，所述处理模块包括：

命名单元，设置为对所述剩余的 URL资源进行命名；显示单元，设置为按照预设显示方式对所述剩余的 URL资源的文件名进行显示。

12. 根据权利要求 11所述的装置，其中，所述命名单元包括：

第一设置子单元，设置为将所述剩余的 URL资源中的每个 URL资源所在网页的标题设置为第一文件名；

第二设置子单元，设置为将所述每个 URL资源的最后 N位字符设置为第二文件名，其中， N为正整数；组合子单元，设置为将所述第一文件名和所述第二文件名进行组合，对所述每个 URL资源进行命名。

13. 根据权利要求 8所述的装置，其中，所述检测模块，设置为按照以下方式之一对所述 DOM树进行动态检测：按照预设周期对所述 DOM树进行检测；由网页后台脚本自动触发对所述 DOM树进行检测；通过用户点击预设按钮引发的网页子资源加载事件被捕获后触发对所述 DOM树进行检测。

14. 根据权利要求 8至 13中任一项所述的装置，其中，所述装置还包括：

验证模块，设置为采用预设的 URL规范对所述剩余的 URL资源进行 URL 验证。