CN102955852A - 一种网页资源处理方法、装置及设备 - Google Patents
一种网页资源处理方法、装置及设备 Download PDFInfo
- Publication number
- CN102955852A CN102955852A CN2012104318565A CN201210431856A CN102955852A CN 102955852 A CN102955852 A CN 102955852A CN 2012104318565 A CN2012104318565 A CN 2012104318565A CN 201210431856 A CN201210431856 A CN 201210431856A CN 102955852 A CN102955852 A CN 102955852A
- Authority
- CN
- China
- Prior art keywords
- resource link
- subdocument
- output content
- default output
- main document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明实施例公开了一种用于网页资源处理方法、装置及设备,其中,方法包括以下步骤:根据网页的访问请求获取所述网页对应的页面主文档;根据预设输出内容确定所述页面主文档中的第一资源链接;下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。本发明实施例通过分析源文件中的资源链接,仅下载用于显示网页的预设输出内容的资源链接对应的子文档,可以使浏览器过滤掉广告等无用的部分,节省流量。
Description
技术领域
本发明涉及信息处理技术领域,更具体地,涉及一种网页资源处理方法、装置及设备。
背景技术
随着互联网的发展,以及个人电脑、手持设备(如手机、平板电脑)等终端的智能化程度越来越高,人们越来越多地使用这些终端访问网页。目前,网页可内嵌的元素种类也越来越多,例如图片、视频、动画等。
目前,由于网络推广的范围广,网页中除了正文外,广告也越来越多,因此,用户在查看网页时,会下载大量的广告和无用信息,这就带来了以下技术问题:
(1)当用户通过WiFi(无线保真,Wireless-Fidelity)网络访问网页时,虽然WiFi网速较快,但是由于网页中包含的大量的广告和无用信息,仍会占用大部分带宽、增加CPU处理时间、占用很多内存、消耗很多电量、显示网页的速度慢等问题;
(2)当用户通过移动通信网络,例如通过2G(2rd-generation,第二代手机通信技术规格)(如:CDMA (Code Division Multiple Access,码分多址)、GSM(global system for mobile communications,全球移动通信系统))、3G(3rd-generation,第三代移动通信技术)(如:WCDMA(Wideband CodeDivision Multiple Access,宽带码分多址)、TD-SCDMA(TimeDivision-Synchronous Code Division Multiple Access,时分同步码分多址)、CDMA 2000(Code Division Multiple Access 2000,码分多址2000))或4G(4th-generation,第四代移动通信技术)等付费网络访问网页时,由于需要下载大量的广告和无用信息,因此会耗费流量,导致资费上升,同时也存在需要更多的CPU处理时间、占用很多内存、消耗很多电量、显示网页的速度慢等问题。
综上所述,目前的网页由于包含大量的无用信息,导致用户在浏览网页时,要加载很多对于用户无用的资源,导致网页显示速度慢,增大终端的信息处理量,占用多余的带宽,且用户体验差。
发明内容
本发明实施例的提出一种网页资源处理方法、装置及设备,能够对网页资源进行分析,避免下载无用的子文档。
本发明实施例提出一种网页资源处理方法,包括以下步骤:
根据网页的访问请求获取所述网页对应的页面主文档;
根据预设输出内容确定所述页面主文档中的第一资源链接;
下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
本发明实施例通过分析源文件中的资源链接,仅下载用于显示网页的预设输出内容的资源链接对应的子文档,可以使浏览器过滤掉广告等无用的部分,提升访问速度,节省流量。
作为上述技术方案的优选,所述下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容之前,所述方法还包括:
确定所述页面主文档中的第二资源链接,所述第二资源链接包括:指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。
本方案针对有可能需要下载用于规定所述网页的运行逻辑的子文档和/或指向用于规定所述网页的布局的子文档,增加了确定第二资源链接的步骤。
作为上述技术方案的优选,下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容,采用如下方式:
下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页的预设输出内容。
作为上述技术方案的优选,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如下方式:
确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所述页面主文档中的资源链接候选队列;
确定所述资源链接候选队列中指向的子文档类型不符合所述预设输出内容中的子文档类型的资源链接;
删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。
作为上述技术方案的优选,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如下方式:
根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选队列;
确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接候选队列中的资源链接是否存在于所述节点中;
删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源链接。
作为上述技术方案的优选,所述确定在所述页面主文档中与所述预设输出内容对应的节点,采用如下方式:
根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为在所述页面主文档中与所述预设输出内容对应的节点。
本发明实施例还提出一种网页资源处理装置,包括:
获取模块,用于根据网页的访问请求获取所述网页对应的页面主文档;
第一确定模块,用于根据预设输出内容确定所述页面主文档中的第一资源链接;
下载子文档模块,用于下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
作为上述技术方案的优选,所述装置还包括:
第二确定模块,用于确定所述页面主文档中的第二资源链接,所述第二资源链接包括:指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。
作为上述技术方案的优选,所述下载子文档模块用于:
下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页的预设输出内容。
作为上述技术方案的优选,所述第一确定模块用于:
确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所述页面主文档中的资源链接候选队列;
确定所述资源链接候选队列中指向的子文档类型不符合所述预设输出内容中的子文档类型的资源链接;
删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。
作为上述技术方案的优选,所述第一确定模块用于:
根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选队列;
确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接候选队列中的资源链接是否存在于所述节点中;
删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源链接。
作为上述技术方案的优选,所述第一确定模块用于:
根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为在所述页面主文档中与所述预设输出内容对应的节点。
本发明实施例还提出一种设备,所述设备包括:
一个或多个处理器;
存储器;和
一个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,其中,所述一个或多个模块具有如下功能:
根据网页的访问请求获取所述网页对应的页面主文档;
根据预设输出内容确定所述页面主文档中的第一资源链接;
下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
本发明实施例的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例而了解。本发明实施例的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明实施例的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明实施例,并不构成对本发明实施例的限制。在附图中:
图1是本发明优选实施例提出的网页资源处理方法的流程图;
图2是本发明一具体实施例提出的网页资源处理方法的流程图;
图3是本发明优选实施例提出的网页资源处理装置的结构示意图;
图4是本发明优选实施例提出的网页资源处理装置的第二种结构示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明实施例,并不用于限定本发明实施例。
如图1所示为本发明优选实施例提出的网页资源处理方法的流程图,该方包括以下步骤:
步骤S101:根据网页的访问请求获取所述网页对应的页面主文档;
步骤S102:根据预设输出内容确定所述页面主文档中的第一资源链接;
步骤S103:下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
本发明实施例通过分析源文件中的资源链接,仅下载用于显示网页的预设输出内容的资源链接对应的子文档,可以使浏览器过滤掉广告等无用的部分,提升访问速度,节省流量。
下面通过具体实施例来对本发明实施例提出的用于显示网页的方法进行详细说明。
具体实施例一如图2所示,是以在手机浏览器中实现本方法实施例提出的网页资源处理方法为例,具体地,该方法包括以下步骤:
步骤S201:用户在手机浏览器中输入请求访问的网址,并发出访问请求。
在本实施例中,以以下网址为例进行说明:
http://news.sina.com.cn/c/2012-09-04/093225096490.shtml。
步骤S202:服务器在接收到访问请求后,将该网页的页面主文档发送至浏览器。
在相关技术中,页面主文档包括但不限于:超文本标记语言(HypertextMarkup Languagehtml,HTML)文件、超文本预处理(Hypertext Preprocessor,PHP)文件和使用服务器端嵌入(Server Side Include,SSI)的html,即SHTML文件等;
步骤S203:浏览器对页面主文档进行解析,获取全部资源链接。
较佳地,本步骤S203可以为:
浏览器将页面主文档中的资源进行排列,依次放入资源列表中,在资源列表中,记录有每一个资源链接以及这个资源链接所指向的子文档的类型。
其中,资源链接通常以统一资源定位符(Uniform/Universal ResourceLocator,URL)的形式出现。
在本实施例中,子文档指的是页面主文档中的每个资源链接对应的资源,或网页中的元素,例如:欲显示的网页中的视频、图片等。
浏览器建立资源列表时确定每个资源链接所指向的子文档的类型的方法可以如下,以下以HTML文档为例进行说明,在大多数HTML网页中:
(1)一部分URL会在HTML文档中指明其所指向的子文档的类型:
例如:
从<link rel="alternate"type="application/rss+xml"title="新浪体育_焦点新闻"href="http://rss.sina.com.cn/news/allnews/sports.xml"/>可知,资源链接"http://rss.sina.com.cn/news/allnews/sports.xml"的类型为:
type="application/rss+xml";
从<script type="text/javascript"src="http://i1.sinaimg.cn/home/sinaflash.js"></script>可知,资源链接"http://i1.sinaimg.cn/home/sinaflash.js"指向的子文档的类型为:
type="text/javascript";
从<img src="http://i2.sinaimg.cn/c.gif″width="1"height="1"alt="跳转到路径导航栏"/>可知,资源链接"http://i2.sinaimg.cn/c.gif″所指向的文档类型为图片。
(2)另外一部分,可通过URL的后缀名得到其类型:
例如:
资源链接“http://i3.sinaimg.cn/ty/main/logo/logo_home_sports_nonike.gif”的后缀名为“gif”,通过该后缀名可知其指向的子文档的类型为图像互换格式(Graphics Interchange Format,GIF);
资源链接“http://news.sina.com.cn/js/694/2012/0713/build.1.0.js”的后缀名为“js”,该资源链接对应的子文档为JAVA脚本(Java Script)文件;
资源链接“http://news.sina.com.cn/css/87/20120625/247/style.css”的后缀为“css”,该资源链接对应的子文档为级联样式表(Cascading Style Sheet,CSS)文件。
(3)作为另一种优选的实施方式,获取资源链接对应的子文档的类型的方式也可以为:
通过浏览器为该页面主文档建立的文档对象模型(Document ObjectModel,简称DOM)树,获取每个资源链接的对应的子文档的类型。在DOM树中,指明有每个子文档的多功能网际邮件扩充协议(Multipurpose InternetMail Extensions,简称MIME)类型。
步骤S204:建立队列A和队列B。
较佳地,队列A用于保存全部资源链接中指向必须要下载的子文档的第二资源链接。队列B用于保存全部资源链接中除了第二资源链接外的暂时不需要下载的子文档对应的其他资源链接。
在该实施例中,必须要下载的子文档是显示网页所必需的子文档,例如包括但不限于:用于规定网页的运行逻辑的文档,例如JS文件;用于规定网页风格、外观等的文档,例如CSS文件。
应当注意的是,该第二资源链接不一定是必然存在的,在有的html文字中,网页逻辑较简单的情况下,会直写在页面主文档中,而无需下载资源链接。
较佳地,队列A中的资源链接对应的子文档因为是必需的,故可实时进行下载,因此,在本步骤之后,还可以包括:
实时下载队列A中的资源链接对应的子文档并存入缓存。
较佳地,建立队列B的方式为:
确定全部资源链接中除了第二资源链接之外的其他资源链接中对应的子文档类型符合预设输出内容中的子文档类型的资源链接,将确定的资源链接一资源链接放入队列B中。
其中,预设输出内容为预先设置的浏览当前网页所需的信息部分,通常包括标题和正文。其中,正文中可能会包括文字、图片、视频、音频等,因此,预设输出内容中还可以设置要输出的子文档的类型。当预设输出内容中限定了子文档类型时,只有指向的子文档类型符合预设输出内容的子文档类型的资源链接才被放入队列B中。
步骤S205:确定在所述页面主文档中与预设输出内容对应的节点。
较佳地,所述预设输出内容为用户浏览当前网页所需的信息部分,通常,关键部分包括标题和正文,其中,正文中可能会包括文字与新闻内容附带的图片、视频、音频等。
确定在所述页面主文档中与预设输出内容对应的节点的方法可选用多种方式,例如可采用以下方法:
根据预先设置的关键词对页面主文档中的节点的标识进行匹配,匹配成功的节点即为在所述页面主文档中与所述预设输出内容对应的节点。
例如,当前网页为新闻时,预设输出内容设置为包括标题和正文,设置的关键词为“hl”和“div”。
在通常情况下,开发人员在对页面主文档进行编辑时,习惯上使用标识为h1的节点标识题目,使用标识为div的节点标识正文内容。
例如,对于该网址对应的页面主文档中的以下代码:
<h1 id="artibodyTitle"pid="1"tid="1″did="25096490"fid="1666">火箭胜活塞</h1>
当解析到上述节点时,得到该节点的标识为“h1”,与预先设置的关键词匹配,则该节点的内容“火箭胜活塞”为预设输出内容的标题;
当解析到节点的标识为“div”,并且节点内的文本内容满足一定模式(比如文字长度符合一定条件,或者符合某个模板等)时,则该元素的内容为预设输出内容的正文;
其中,模板指的是网站提供的网页所使用的HTML模板、SHTML模板等。
较佳地,对于实际实施时,关键词并不限定于上述关键词,而是取决于开发人员对于关键词的词库的设定,关键词的词库应适用于大多数网址的网页的关键部分的提取。
步骤S206:确定队列B中中不存在于与预设输出内容对应的节点中的资源链接。
步骤S207:删除队列B中不存在于与预设输出内容对应的节点中的资源链接。
经过上述步骤处理后的队列B中的资源链接即为根据预设输出内容确定的页面主文档中的第一资源链接。
优选地,在本发明的另一实施例中,得到第一资源链接的方式还可以为:
确定在页面主文档中与预设输出内容对应的节点,根据所述节点确定所述页面主文档中的资源链接候选队列;
确定所述资源链接候选队列中指向的子文档类型不符合所述预设输出内容中的子文档类型的资源链接;
删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。
步骤S208:根据队列B中的资源链接下载相应的子文档并存入缓存。
步骤S209:从缓存中读取根据队列A和队列B中的资源链接下载的子文档,显示当前网页。
以浏览器访问网址:
http://news.sina.com.cn/c/2012-09-04/093225096490.shtml为例:
该文档的主页面文档为343K,根据该网页的预设输出内容,发现预设输出内容中不包括图片、视频等文件,则显示该网页时不需要再下载子文档。而在完全下载该网页的情况下,则需要耗费流量1.15M,通过本实施例所提供的方法,节省了至少814K的流量和大量的内存与CPU处理时间,加快了网页显示速度。
相应地,本发明实施例还提出一种网页资源处理装置,如图3所示,包括:
获取模块301,用于根据网页的访问请求获取所述网页对应的页面主文档;
第一确定模块302,用于根据预设输出内容确定所述页面主文档中的第一资源链接;
下载子文档模块303,用于下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
优选地,如图4所示,本装置还可以包括:
第二确定模块304,用于确定所述页面主文档中的第二资源链接,所述第二资源链接包括:指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。
下载子文档模块303用于:
下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页的预设输出内容。
优选地,所述第一确定模块302用于:
确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所述页面主文档中的资源链接候选队列;
确定所述资源链接候选队列中指向的子文档类型不符合所述预设输出内容中的子文档类型的资源链接;
删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。
优选地,所述第一确定模块302用于:
根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选队列;
确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接候选队列中的资源链接是否存在于所述节点中;
删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源链接。
优选地,所述第一确定模块302用于:
根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为在所述页面主文档中与所述预设输出内容对应的节点。
本发明实施例还提出一种设备,包括:
一个或多个处理器;
存储器;和
一个或多个模块(programs),所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,其中,所述一个或多个模块具有如下功能:
根据网页的访问请求获取所述网页对应的页面主文档;
根据预设输出内容确定所述页面主文档中的第一资源链接;
下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
较佳地,所述一个或多个模块还具有如下功能:
在所述下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容之前,确定所述页面主文档中的第二资源链接,所述第二资源链接包括:指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。
较佳地,下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容,采用如下方式:
下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页的预设输出内容。
较佳地,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如下方式:
确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所述页面主文档中的资源链接候选队列;
确定所述资源链接候选队列中指向的子文档的类型不符合所述预设输出内容中的子文档的类型的资源链接;
删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。
较佳地,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如下方式:
根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选队列;
确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接候选队列中的资源链接是否存在于所述节点中;
删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源链接。
较佳地,所述确定在所述页面主文档中与所述预设输出内容对应的节点,采用如下方式:
根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为在所述页面主文档中与所述预设输出内容对应的节点。
另外,本发明实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在具有一个或多个处理器的设备时,可以使得该设备执行如下步骤的指令(instructions):
根据网页的访问请求获取所述网页对应的页面主文档;
根据预设输出内容确定所述页面主文档中的第一资源链接;
下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
较佳地,所述一个或多个模块还使得该设备执行如下步骤的指令:
在所述下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容之前,确定所述页面主文档中的第二资源链接,所述第二资源链接包括:指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。
较佳地,下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容,采用如下方式:
下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页的预设输出内容。
较佳地,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如下方式:
确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所述页面主文档中的资源链接候选队列;
确定所述资源链接候选队列中指向的子文档的类型不符合所述预设输出内容中的子文档的类型的资源链接;
删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。
较佳地,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如下方式:
根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选队列;
确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接候选队列中的资源链接是否存在于所述节点中;
删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源链接。
较佳地,所述确定在所述页面主文档中与所述预设输出内容对应的节点,采用如下方式:
根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为在所述页面主文档中与所述预设输出内容对应的节点。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (13)
1.一种网页资源处理方法,其特征在于,包括以下步骤:
根据网页的访问请求获取所述网页对应的页面主文档;
根据预设输出内容确定所述页面主文档中的第一资源链接;
下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
2.根据权利要求1所述的方法,其特征在于,所述下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容之前,所述方法还包括:
确定所述页面主文档中的第二资源链接,所述第二资源链接包括:指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。
3.根据权利要求2所述的方法,其特征在于,下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容,采用如下方式:
下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页的预设输出内容。
4.根据权利要求1所述的方法,其特征在于,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如下方式:
确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所述页面主文档中的资源链接候选队列;
确定所述资源链接候选队列中指向的子文档的类型不符合所述预设输出内容中的子文档的类型的资源链接;
删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。
5.根据权利要求1所述的方法,其特征在于,所述根据预设输出内容确定所述页面主文档中的第一资源链接,采用如下方式:
根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选队列;
确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接候选队列中的资源链接是否存在于所述节点中;
删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源链接。
6.根据权利要求4或5所述的方法,其特征在于,所述确定在所述页面主文档中与所述预设输出内容对应的节点,采用如下方式:
根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为在所述页面主文档中与所述预设输出内容对应的节点。
7.一种网页资源处理装置,其特征在于,包括:
获取模块,用于根据网页的访问请求获取所述网页对应的页面主文档;
第一确定模块,用于根据预设输出内容确定所述页面主文档中的第一资源链接;
下载子文档模块,用于下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二确定模块,用于确定所述页面主文档中的第二资源链接,所述第二资源链接包括:指向用于规定所述网页的运行逻辑的子文档的链接和/或指向用于规定所述网页的布局的子文档的链接。
9.根据权利要求8所述的装置,其特征在于,所述下载子文档模块用于:
下载所述第一资源链接和所述第二资源链接对应的子文档以用于输出所述网页的预设输出内容。
10.根据权利要求7所述的装置,其特征在于,所述第一确定模块用于:
确定在所述页面主文档中与所述预设输出内容对应的节点,根据所述节点确定所述页面主文档中的资源链接候选队列;
确定所述资源链接候选队列中指向的子文档的类型不符合所述预设输出内容中的子文档的类型的资源链接;
删除所述资源链接候选队列中的所述资源链接,得到第一资源链接。
11.根据权利要求7所述的装置,其特征在于,所述第一确定模块用于:
根据所述预设输出内容中的子文档类型确定所述页面主文档中的资源链接候选队列;
确定在所述页面主文档中与所述预设输出内容对应的节点,并确定所述资源链接候选队列中的资源链接是否存在于所述节点中;
删除所述资源链接候选队列中的不存在于所述节点中的资源链接,得到第一资源链接。
12.根据权利要求10或11所述的装置,其特征在于,所述第一确定模块用于:
根据预先设置的关键词匹配所述页面主文档中的节点的标识,匹配成功的节点为在所述页面主文档中与所述预设输出内容对应的节点。
13.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器;和
一个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,其中,所述一个或多个模块具有如下功能:
根据网页的访问请求获取所述网页对应的页面主文档;
根据预设输出内容确定所述页面主文档中的第一资源链接;
下载所述第一资源链接对应的子文档以用于输出所述网页的预设输出内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104318565A CN102955852A (zh) | 2012-11-01 | 2012-11-01 | 一种网页资源处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012104318565A CN102955852A (zh) | 2012-11-01 | 2012-11-01 | 一种网页资源处理方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102955852A true CN102955852A (zh) | 2013-03-06 |
Family
ID=47764658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012104318565A Pending CN102955852A (zh) | 2012-11-01 | 2012-11-01 | 一种网页资源处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102955852A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103353842A (zh) * | 2013-06-20 | 2013-10-16 | 北京小米科技有限责任公司 | 一种网页的加载方法和装置 |
CN104035977A (zh) * | 2014-05-23 | 2014-09-10 | 小米科技有限责任公司 | 网页加载方法及装置 |
WO2014206050A1 (zh) * | 2013-06-29 | 2014-12-31 | 广州市动景计算机科技有限公司 | 基于中转服务器的网页加载方法、装置及系统 |
WO2015062527A1 (zh) * | 2013-11-01 | 2015-05-07 | 北京奇虎科技有限公司 | 一种网页广告的拦截方法、装置和浏览器 |
CN104731808A (zh) * | 2013-12-20 | 2015-06-24 | 腾讯科技(深圳)有限公司 | 一种浏览器加载网页的方法及装置 |
CN106649525A (zh) * | 2016-10-19 | 2017-05-10 | 北京小米移动软件有限公司 | 显示网页信息的方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6278448B1 (en) * | 1998-02-17 | 2001-08-21 | Microsoft Corporation | Composite Web page built from any web content |
WO2003040955A1 (en) * | 2001-11-06 | 2003-05-15 | Farooq Khan | Method and apparatus for capturing and displaying web page information |
CN101246494A (zh) * | 2008-03-19 | 2008-08-20 | 腾讯科技(深圳)有限公司 | 一种互联网网页转换方法、系统及设备 |
CN102156737A (zh) * | 2011-04-12 | 2011-08-17 | 华中师范大学 | 一种中文网页主题内容的提取方法 |
CN102270206A (zh) * | 2010-06-03 | 2011-12-07 | 北京迅捷英翔网络科技有限公司 | 一种有效网页内容的抓取方法及装置 |
CN102375829A (zh) * | 2010-08-13 | 2012-03-14 | 富士通株式会社 | 识别网页节点类型的方法和装置 |
CN102436455A (zh) * | 2010-09-29 | 2012-05-02 | 腾讯科技(深圳)有限公司 | 实现文字浏览的方法、系统和客户端浏览器 |
CN102622382A (zh) * | 2011-03-14 | 2012-08-01 | 北京小米科技有限责任公司 | 一种网页重排版的方法 |
CN102819561A (zh) * | 2012-06-29 | 2012-12-12 | 北京奇虎科技有限公司 | 一种基于网页的图片显示方法和装置 |
-
2012
- 2012-11-01 CN CN2012104318565A patent/CN102955852A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6278448B1 (en) * | 1998-02-17 | 2001-08-21 | Microsoft Corporation | Composite Web page built from any web content |
WO2003040955A1 (en) * | 2001-11-06 | 2003-05-15 | Farooq Khan | Method and apparatus for capturing and displaying web page information |
CN101246494A (zh) * | 2008-03-19 | 2008-08-20 | 腾讯科技(深圳)有限公司 | 一种互联网网页转换方法、系统及设备 |
CN102270206A (zh) * | 2010-06-03 | 2011-12-07 | 北京迅捷英翔网络科技有限公司 | 一种有效网页内容的抓取方法及装置 |
CN102375829A (zh) * | 2010-08-13 | 2012-03-14 | 富士通株式会社 | 识别网页节点类型的方法和装置 |
CN102436455A (zh) * | 2010-09-29 | 2012-05-02 | 腾讯科技(深圳)有限公司 | 实现文字浏览的方法、系统和客户端浏览器 |
CN102622382A (zh) * | 2011-03-14 | 2012-08-01 | 北京小米科技有限责任公司 | 一种网页重排版的方法 |
CN102156737A (zh) * | 2011-04-12 | 2011-08-17 | 华中师范大学 | 一种中文网页主题内容的提取方法 |
CN102819561A (zh) * | 2012-06-29 | 2012-12-12 | 北京奇虎科技有限公司 | 一种基于网页的图片显示方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103353842A (zh) * | 2013-06-20 | 2013-10-16 | 北京小米科技有限责任公司 | 一种网页的加载方法和装置 |
WO2014206050A1 (zh) * | 2013-06-29 | 2014-12-31 | 广州市动景计算机科技有限公司 | 基于中转服务器的网页加载方法、装置及系统 |
US10158691B2 (en) | 2013-06-29 | 2018-12-18 | Guangzhou Ucweb Computer Technology Co., Ltd. | Method and apparatus for providing network resources at intermediary server |
WO2015062527A1 (zh) * | 2013-11-01 | 2015-05-07 | 北京奇虎科技有限公司 | 一种网页广告的拦截方法、装置和浏览器 |
CN104731808A (zh) * | 2013-12-20 | 2015-06-24 | 腾讯科技(深圳)有限公司 | 一种浏览器加载网页的方法及装置 |
CN104035977A (zh) * | 2014-05-23 | 2014-09-10 | 小米科技有限责任公司 | 网页加载方法及装置 |
CN104035977B (zh) * | 2014-05-23 | 2018-06-19 | 小米科技有限责任公司 | 网页加载方法及装置 |
CN106649525A (zh) * | 2016-10-19 | 2017-05-10 | 北京小米移动软件有限公司 | 显示网页信息的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102819555B (zh) | 一种在网页的阅读模式中进行推荐信息加载的方法和装置 | |
CN102200971B (zh) | 一种实现网页内容预览的方法和设备 | |
CN102567516B (zh) | 脚本加载方法及装置 | |
CN102646135B (zh) | 一种网页收藏方法、装置及系统 | |
CN104572843B (zh) | 一种页面的加载方法及装置 | |
CN103618774B (zh) | 一种基于网络行为的资源推荐方法及装置、系统 | |
CN102955852A (zh) | 一种网页资源处理方法、装置及设备 | |
CN110020329B (zh) | 用于生成网页的方法、装置和系统 | |
CN105095280A (zh) | 一种浏览器缓存方法和装置 | |
CN102402518A (zh) | 一种访问网页的方法及装置 | |
CN103412890A (zh) | 一种网页加载方法和装置 | |
CN107766532A (zh) | 一种前端Node.js自动化正静态方法 | |
CN104049991A (zh) | 用于将网络应用转换为移动应用的方法和系统 | |
CN104750851A (zh) | 网页内容的延迟加载方法及系统 | |
CN102298599A (zh) | 离线浏览网页方法及其系统 | |
CN106293675A (zh) | 系统静态资源加载方法及装置 | |
CN103164446A (zh) | 一种网页请求信息的响应方法及装置 | |
CN103365877B (zh) | 对网页进行转码后建立目录的方法以及服务器 | |
KR101287371B1 (ko) | 웹 컨텐츠 수집방법 및 수집장치, 그 기록매체 | |
WO2008132706A1 (en) | A web browsing method and system | |
CN101876998B (zh) | 一种实现数据编辑的方法和系统 | |
CN103034655A (zh) | 一种用户行为信息的收集方法、系统及相关设备 | |
CN101458693A (zh) | 网页下载解析系统及方法 | |
CN102541863A (zh) | 一种应用于移动终端的网页压缩方法 | |
CN117390326A (zh) | 页面管理方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent of invention or patent application | ||
CB02 | Change of applicant information |
Address after: 100085 Beijing city Haidian District Qinghe Street No. 68 Huarun colorful city shopping center two floor 13 Applicant after: Xiaomi Technology Co., Ltd. Address before: 100102, No. 50, block B, building No. 12, winding stone world building, Wangjing West Road, Beijing, Chaoyang District Applicant before: Beijing Xiaomi Technology Co., Ltd. |
|
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130306 |
|
RJ01 | Rejection of invention patent application after publication |