CN103150355A - 一种网页内容预览的方法、装置及设备 - Google Patents
一种网页内容预览的方法、装置及设备 Download PDFInfo
- Publication number
- CN103150355A CN103150355A CN2013100554614A CN201310055461A CN103150355A CN 103150355 A CN103150355 A CN 103150355A CN 2013100554614 A CN2013100554614 A CN 2013100554614A CN 201310055461 A CN201310055461 A CN 201310055461A CN 103150355 A CN103150355 A CN 103150355A
- Authority
- CN
- China
- Prior art keywords
- page
- web page
- continued
- current web
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例提供了一种网页内容预览的方法、装置及设备,其中,所述的方法,包括:判断当前网页是否存在后续页;若所述当前网页存在后续页,则获取所述后续页的网页内容至本地;当获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。本发明实施例能够加快当前网页的后续页的网页内容的显示速度,节省用户时间,增强用户体验,提高用户粘度。
Description
技术领域
本发明实施例涉及互联网信息处理技术领域,特别是涉及一种网页内容预览的方法,一种网页内容预览的装置,以及,一种设备。
背景技术
随着互联网科技的不断前进与发展,越来越多的信息可以通过网页的形式在互联网上传播,因而越来越多的用户通过浏览网页来获取信息。
目前的网页,尤其是各大门户网站提供的网页,以及新闻类的网页,当网页内容比较多时,经常会对网页分页,即一条新闻可以以连续型网页的形式,分为多页呈现给用户,这样不仅可以提高访问流量,还能携带更多的广告。例如:一条新闻,可能包括多页,可以在网页下方显示1、2、3、4等网页序列,用户可以通过点击网页序列来访问相应的网页内容。
用户在浏览具有对应网页序列的网页时,当看完当前网页,点击下一网页时,浏览器才开始获取下一页的网页内容,然后进行显示。由于受网速等影响,在用户点击下一网页后,需要下载相应的网页内容,导致网页内容显示会有延迟,影响用户体验。
发明内容
本发明实施例提供了一种网页内容预览的方法,能够加快当前网页的后续页的网页内容的显示速度,节省用户时间,增强用户体验,提高用户粘度。
相应的,本发明实施例还提供了一种网页内容预览的装置,以及,一种设备,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种网页内容预览的方法,包括:
判断当前网页是否存在后续页;
若所述当前网页存在后续页,则获取所述后续页的网页内容至本地;
当获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。
较佳地,所述判断当前网页是否存在后续页的步骤,采用如下方式:
获取当前网页对应的网页文档;
判断所述网页文档的节点数据中是否存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系;
若所述网页文档的节点数据中存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系,则判定当前网页存在对应的网页序列;
确定所述当前网页在所述网页序列中的位置;
根据所述当前网页在所述网页序列中的位置判断所述当前网页是否存在后续页。
较佳地,所述预设特征字符串包括连续型字符串,和/或,中间缺失单个字符的非连续型字符。
较佳地,所述同级关系包括预设特征字符串中具有相同父节点的字符之间的关系,和/或,形成预设特征字符串的字符为并列关系。
较佳地,所述获取后续页的网页内容至本地的步骤,采用如下方式:
从形成所述预设特征字符串的字符对应的节点数据中提取所述后续页的地址;
根据所述后续页的地址读取后续页的网页内容至本地。
较佳地,所述确定当前网页在网页序列中的位置的步骤,采用如下方式:
确定所述当前网页的位置为网页序列对应的地址中与当前网页地址相同的地址对应的位置;
或,
确定所述当前网页的位置为网页序列中所缺失的单个字符对应的位置;
或,
根据所述节点数据中的节点属性确定当前网页的位置。
较佳地,所述判断当前网页是否存在后续页的步骤,采用如下方式:
获取当前网页对应的网页文档;判断所述网页文档的节点数据中是否存在预设图片标识,并且,所述预设图片标识是否具有页面跳转的属性;
若所述网页文档的节点数据中存在预设图片标识,并且,所述预设图片标识具有页面跳转的属性,则判定所述当前网页存在后续页。
较佳地,所述获取后续页的网页内容至本地的步骤,采用如下方式:
根据所述页面跳转的属性确定后续页的地址;
根据所述后续页的地址读取后续页的网页内容至本地。
本发明实施例还公开了一种网页内容预览的装置,包括:
判断模块,用于判断当前网页是否存在后续页;若是,则调用获取模块;
获取模块,用于获取所述后续页的网页内容至本地;
展现模块,用于在获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。
较佳地,所述判断模块包括:
第一获取子模块,用于获取当前网页对应的网页文档;
第一判断子模块,用于判断所述网页文档的节点数据中是否存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系;若是,则调用判定子模块;
判定子模块,用于判定当前网页存在对应的网页序列;
第一确定子模块,用于确定所述当前网页在所述网页序列中的位置;
第二判断子模块,用于根据所述当前网页在所述网页序列中的位置判断所述当前网页是否存在后续页。
较佳地,所述预设特征字符串包括连续型字符串,和/或,中间缺失单个字符的非连续型字符。
较佳地,所述同级关系包括预设特征字符串中具有相同父节点的字符之间的关系,和/或,形成预设特征字符串的字符为并列关系。
较佳地,所述获取模块包括:
提取子模块,用于从形成所述预设特征字符串的字符对应的节点数据中提取所述后续页的地址;
第一读取子模块,用于根据所述后续页的地址读取后续页的网页内容至本地。
较佳地,所述第一确定子模块包括:
第一确定单元,用于确定所述当前网页的位置为网页序列对应的地址中与当前网页地址相同的地址对应的位置;
或,
第二确定单元,用于确定所述当前网页的位置为网页序列中所缺失的单个字符对应的位置;
或,
第三确定单元,用于根据所述节点数据中的节点属性确定当前网页的位置。
较佳地,所述判断模块包括:
第二获取子模块,用于获取当前网页对应的网页文档;
第三判断子模块,用于判断所述网页文档的节点数据中是否存在预设图片标识,并且,所述预设图片标识是否具有页面跳转的属性;若是,则调用判定子模块;
判定子模块,用于判定所述当前网页存在后续页。
较佳地,所述获取模块包括:
第二确定子模块,用于根据所述页面跳转的属性确定后续页的地址;
第二读取子模块,用于根据所述后续页的地址读取后续页的网页内容至本地。
本发明实施例还公开了一种设备,所述设备包括:
判断当前网页是否存在后续页;
若所述当前网页存在后续页,则获取所述后续页的网页内容至本地;
当获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。
与背景技术相比,本发明实施例具有以下优点:
本发明实施例通过获取后续页的网页内容至本地,在获得后续页的访问请求时,从本地提取所述后续页的网页内容进行展现,能够加快当前网页的后续页的网页内容的显示速度,节省用户时间,增强用户体验,提高用户粘度。
附图说明
图1示出了本发明实施例提供的一种网页内容预览的方法实施例1的步骤流程图;
图2示出了本发明实施例提供的一种网页内容预览的方法实施例2的步骤流程图;
图3示出了本发明实施例提供的一种网页内容预览的装置实施例的结构框图。
具体实施方式
为使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明实施例作进一步详细的说明。
本发明实施例提供的方法,通过获取后续页的网页内容至本地,在获得后续页的访问请求时,从本地提取所述后续页的网页内容进行展现,能够加快当前网页的后续页的网页内容的显示速度,节省用户时间,增强用户体验,提高用户粘度。
参照图1,示出了本发明实施例提供的一种网页内容预览方法实施例1的步骤流程图,具体可以包括以下步骤:
步骤101,判断当前网页是否存在后续页;若是,执行步骤102;
步骤102,获取所述后续页的网页内容至本地;
作为本发明实施例具体应用的一种示例,所述后续页可以为当前网页的下一个网页,也可以为当前网页的后面多个网页,本发明对此不作限制。
在本发明实施例的一种优选实施例中,所述步骤101可以包括如下子步骤:
子步骤S1011,获取当前网页对应的网页文档;
作为本发明实施例具体应用的一种示例,所述网页文档可以为浏览器的操作对象,例如,浏览器任意打开一个网址,通过点击右键查看源代码即可看到相应的网页文档。一般情况下,根据网页的不同,可以将网页文档分为html文档、shtml文档以及htm文档。具体而言,网页文档是由多个具有层次关系节点数据组成的,并且每个节点数据有着各自的格式,一般节点数据包括三部分,即标识、属性以及属性值,例如:
<tag A=“yyyy”>xxxxx</tag>
其中,tag为节点标识,一般节点以<tag>开头,</tag>结尾,A表示节点的属性,yyyy为该属性的属性值,xxxx为节点内容。
在实际中,用户通过浏览器看到的网页内容是浏览器对相应网页文档的解析结果,例如,网页文档中的某个节点限定了网页内容中的某张图片,并且标记了图片在网页内容中的位置以及图片的URI(UniformResource Identifier,通用资源标识符),则由所述URI获取图片,并且将图片显示到指定位置。
在具体实现中,获取当前网页对应的网页文档后,可以对所述网页文档中的节点数据进行扫描。
子步骤S1012,判断所述网页文档的节点数据中是否存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系;若是,则执行子步骤S1013;若否,则执行子步骤S1014;
子步骤S1013,判定当前网页存在对应的网页序列;
子步骤S1014,判定当前网页不存在对应的网页序列;
作为本发明实施例具体应用的一种示例,所述预设特征字符串可以包括连续型字符串,和/或,中间缺失单个字符的非连续型字符。具体而言,所述连续型字符串可以为1、2、3、4、5……,或者,a、b、c、d、e……,或者,[1]、[2]、[3]、[4]、[5]……等,这种情况下,每个字符都对应一个地址,每个字符的下一个字符对应的地址为相应的后续页的地址;所述中间缺失单个字符的非连续型字符可以为1、2、4.....,这种情况下,每个字符都对应一个地址,并且,字符4对应的地址为后续页的地址。
其中,所述预设特征字符串可以包括连续型字符串,和/或,中间缺失单个字符的非连续型字符,可以包括如下情况:
(1)连续型字符串;
(2)中间缺失单个字符的非连续型字符;
(3)连续型字符串和中间缺失单个字符的非连续型字符。
作为本发明实施例具体应用的又一种示例,所述同级关系可以包括预设特征字符串中具有相同父节点的字符之间的关系,和/或,形成预设特征字符串的字符为并列关系。具体而言,如果两个或多个节点的父节点相同,那么所述两个或多个节点为同级关系;或者,可以通过DOM树直接查看两个或多个节点的关系是否为并列关系,所述同级关系的确定方式可以由本领域技术人员依据实际情况任意选定,本发明对此不作限制。
其中,所述同级关系可以包括预设特征字符串中具有相同父节点的字符之间的关系,和/或,形成预设特征字符串的字符为并列关系,可以包括如下情况:
(1)预设特征字符串中具有相同父节点的字符之间的关系;
(2)形成预设特征字符串的字符为并列关系;
(3)预设特征字符串中具有相同父节点的字符之间的关系,以及,形成预设特征字符串的字符为并列关系
在具体实现中,如果所述节点数据中存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系,那么,即可判定当前网页存在对应的网页序列;如果所述节点数据中不存在形成预设特征字符串的字符,或者,如果所述节点数据中存在形成预设特征字符串的字符,但是,所述形成预设特征字符串的字符所对应的节点数据不为同级关系,那么,即可判定当前网页不存在对应的网页序列,这种情况下,展现当前网页的网页内容即可。
子步骤S1015,确定所述当前网页在网页序列中的位置;
在本发明实施例的另一种优选实施例中,所述子步骤S1025可以包括如下子步骤:
子步骤S25a,确定当前网页的位置为网页序列对应的地址中与当前网页地址相同的地址对应的位置;
子步骤S25b,确定当前网页的位置为网页序列中所缺失的单个字符对应的位置;
子步骤S25c,根据节点数据中的节点属性确定当前网页的位置。
子步骤S1016,根据所述当前网页在网页序列中的位置判断当前网页是否存在后续页。
在本发明实施例的又一种优选实施例中,所述步骤102可以包括如下子步骤:
子步骤S1021,从形成所述预设特征字符串的字符对应的节点数据中提取所述后续页的地址;
子步骤S1022,根据所述后续页的地址读取后续页的网页内容至本地。
为使本领域技术人员更好地理解步骤101和步骤102,以下通过一个具体应用的实例说明该步骤。
本实例中,所述网页序列对应的地址为形成预设特征字符串的字符对应的节点数据中的属性值,在具体实现中,所述预设特征字符串为1、2、3、4、5、6,所述形成预设特征字符串的字符对应的节点数据为
<div class="pg″>
<a href="www.xx.com/q?cin=&site=&sf=0&sd=0&nf=0&pg=1″>1</a>
<a href="www.xx.com/q?cin=&site=&sf=0&sd=0&nf=0&pg=2">2</a>
<a href="www.xx.com/q?cin=&site=&sf=0&sd=0&nf=0&pg=3">3</a>
<a href="www.xx.com/q?cin=&site=&sf=0&sd=0&nf=0&pg=4">4</a>
<a href="www.xx.com/q?cin=&site=&sf=0&sd=0&nf=0&pg=5">5</a>
<a href="www.xx.com/q?cin=&site=&sf=0&sd=0&nf=0&pg=6">6</a>
</div>,
这种情况下,可以从上述形成预设特征字符串的字符对应的节点数据中分别提取网页序列1对应的地址为/q?cin=&site=&sf=0&sd=0&nf=0&pg=1,网页序列2对应的地址为/q?cin=&site=&sf=0&sd=0&nf=0&pg=2,网页序列3对应的地址为/q?cin=&site=&sf=0&sd=0&nf=0&pg=3,网页序列4对应的地址为/q?cin=&site=&sf=0&sd=0&nf=0&pg=4,网页序列5对应的地址为/q?cin=&site=&sf=0&sd=0&nf=0&pg=5,网页序列6对应的地址为/q?cin=&site=&sf=0&sd=0&nf=0&pg=6。
本实例中,当前网页地址为/q?cin=&site=&sf=0&sd=0&nf=0&pg=3,与网页序列3对应的地址相同,即可确定当前网页的位置为第三页,然后可以依据所述当前网页的位置确定其余5个网页对应的地址分别为
/q?cin=&site=&sf=0&sd=0&nf=0&pg=1,
/q?cin=&site=&sf=0&sd=0&nf=0&pg=2,
/q?cin=&site=&sf=0&sd=0&nf=0&pg=4,
/q?cin=&site=&sf=0&sd=0&nf=0&pg=5,
/q?cin=&site=&sf=0&sd=0&nf=0&pg=6,
在第三页的网页内容展现过程中,可以根据上述5个网页对应的地址将这五个网页的网页内容读取至本地。
在具体实现中,如果网页序列为中间缺失单个字符的非连续型字符,例如为1,2,4,5,6时,那么当前网页的位置为所缺失的字符3对应的位置。
在实际中,还可以根据节点数据中的节点属性确定当前网页的位置,例如,所述预设特征字符串的字符对应的节点数据为
<div class="pg">
<span class="current">1</span>
<a href="/q?cin=&site=&sf=0&sd=0&nf=0&pg=2">2</a>
<a href="/q?cin=&site=&sf=0&sd=0&nf=0&pg=3">3</a>
<a href="/q?cin=&site=&sf=0&sd=0&nf=0&pg=4">4</a>
<a href="/q?cin=&site=&sf=0&sd=0&nf=0&pg=5">5</a>
<a href="/q?cin=&site=&sf=0&sd=0&nf=0&pg=6">6</a>
</div>
所述节点数据中网页序列1对应的属性值为current,并且所述属性值中不包括地址,这种情况下,可以根据节点数据中的节点属性确定当前网页的位置。
步骤103,当获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。
例如,在上述步骤101和步骤102的实例中,当获得第四页的网页读取请求时,并且,本地存在第四页的网页内容,则可以从本地直接提取第四页的网页内容进行展现;如果获得第四页的网页读取请求时,还在预读第四页的网页内容,本地并不存在第四页的网页内容,这种情况下,不能从本地直接提取该网页内容进行展现,需要重新开始获取第四页的网页内容,获取完毕后再展现其内容。
本发明实施例提供了一种网页内容预览的方法,若根据当前网页所对应的网页序列判定当前网页存在后续页,则可以读取所述后续页的网页内容至本地,在获得所述后续页的访问请求时,可以从本地提取所述后续页的网页内容进行展现,能够加快当前网页的后续页的网页内容的显示速度,节省用户时间,增强用户体验。
参照图2,示出了本发明实施例提供的一种网页内容预览方法实施例2的步骤流程图,具体可以包括以下步骤:
步骤201,判断当前网页是否存在后续页;若是,则执行步骤202;
步骤202,获取所述后续页的网页内容至本地;
在本发明实施例的一种优选实施例中,所述步骤201可以包括如下子步骤:
子步骤S2011,获取当前网页对应的网页文档;
本发明实施例2中子步骤S2011与上述方法实施例1中的子步骤S1011类似,在此不再详述。本方法实施例2中,所述步骤201还可以包括如下子步骤:
子步骤S2012,判断所述网页文档的节点数据中是否存在预设图片标识,并且,所述图片标识是否具有页面跳转的属性;若是,则执行子步骤S2013;若否,则执行子步骤S2014;
子步骤S2013,判定所述当前网页存在后续页;
子步骤S2014,判定所述当前网页不存在后续页;
在实际中,给予选择下一页的页码可以不为字符,而为图片标识,这种情况下,可以先判断所述节点数据中是否存在预设图片标识,若所述节点数据中有预设图片标识,并且,所述预设图片标识具有页面跳转的属性,那么,即可判定当前网页存在对应的网页序列;如果所述节点数据中不存在预设图片标识,或者,所述节点数据中存在预设图片标识,但是所述预设图片标识不具有页面跳转的属性,那么,即可判定当前网页存在对应的网页序列,这种情况下,展现当前网页的网页内容即可。
例如,若判定所述节点数据中存在预设图片标识,并且所述节点数据为
<img src=”/static/images/blank.png”alt="next"></img>,
其中,所述页面跳转的属性为alt属性,所述页面跳转属性的属性值为next,这种情况下,即可判定当前网页存在对应的网页序列。
在本发明实施例的一种优选实施例中,所述步骤202可以包括如下子步骤:
子步骤S2021,根据所述页面跳转的属性确定后续页的地址;
子步骤S2022,根据所述后续页的地址读取后续页的网页内容至本地。
在实际中,可以根据所述页面跳转的属性确定后续页的地址,然后在当前网页展现过程中根据所述后续页的地址将其网页内容读取至本地。
步骤203,当获得所述后续页的访问请求时,从本地提取所述后续页网页内容进行展现。
本发明实施例2中步骤203与上述方法实施例1中的步骤103原理相同,在此不再详述。
本发明实施例提供了一种网页内容预览的方法,若根据当前网页所对应网页文档的节点数据中的预设图片标识判定当前网页存在后续页,则可以读取所述后续页的网页内容至本地,在获得所述后续页的访问请求时,可以从本地提取所述后续页的网页内容进行展现,能够加快当前网页的后续页的网页内容的显示速度,节省用户时间,增强用户体验,提高用户粘度。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了本发明实施例提供的一种网页内容预览装置实施例的结构框图,具体可以包括:
判断模块301,用于判断当前网页是否存在后续页;若是,则调用获取模块;
获取模块302,用于获取所述后续页的网页内容至本地;
展现模块303,用于在获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。
在本发明实施例的一种优选实施例中,所述判断模块可以包括:
第一获取子模块,用于获取当前网页对应的网页文档;
第一判断子模块,用于判断所述网页文档的节点数据中是否存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系;若是,则调用判定子模块;
判定子模块,用于判定当前网页存在对应的网页序列;
第一确定子模块,用于确定所述当前网页在所述网页序列中的位置;
第二判断子模块,用于根据所述当前网页在所述网页序列中的位置判断所述当前网页是否存在后续页。
作为本发明实施例具体应用的一种示例,所述预设特征字符串可以包括连续型字符串,和/或,中间缺失单个字符的非连续型字符。
作为本发明实施例具体应用的又一种示例,所述同级关系可以包括预设特征字符串中具有相同父节点的字符之间的关系,和/或,形成预设特征字符串的字符为并列关系。
在本发明实施例的一种优选实施例中,所述获取模块可以包括:
提取子模块,用于从形成所述预设特征字符串的字符对应的节点数据中提取所述后续页的地址;
第一读取子模块,用于根据所述后续页的地址读取后续页的网页内容至本地。
在本发明实施例的另一种优选实施例中,所述第一确定子模块可以包括:
第一确定单元,用于确定所述当前网页的位置为网页序列对应的地址中与当前网页地址相同的地址对应的位置;
第二确定单元,用于确定所述当前网页的位置为网页序列中所缺失的单个字符对应的位置;
第三确定单元,用于根据所述节点数据中的节点属性确定当前网页的位置。
在本发明实施例的又一种优选实施例中,所述判断模块可以包括:
第二获取子模块,用于获取当前网页对应的网页文档;
第三判断子模块,用于判断所述网页文档的节点数据中是否存在预设图片标识,并且,所述预设图片标识是否具有页面跳转的属性;若是,则调用判定子模块;
判定子模块,用于判定所述当前网页存在后续页。
在本发明实施例的又一种优选实施例中,所述获取模块可以包括:
第二确定子模块,用于根据所述页面跳转的属性确定后续页的地址;
第二读取子模块,用于根据所述后续页的地址读取后续页的网页内容至本地。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储器;和
一个或多个模块(programs),所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,其中,所述一个或多个模块具有如下功能:
判断当前网页是否存在后续页;
若所述当前网页存在后续页,则获取所述后续页的网页内容至本地;
当获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。
较佳地,所述判断当前网页是否存在后续页的步骤,采用如下方式:
获取当前网页对应的网页文档;
判断所述网页文档的节点数据中是否存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系;
若所述网页文档的节点数据中存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系,则判定当前网页存在对应的网页序列;
确定所述当前网页在所述网页序列中的位置;
根据所述当前网页在所述网页序列中的位置判断所述当前网页是否存在后续页。
较佳地,所述预设特征字符串包括连续型字符串,和/或,中间缺失单个字符的非连续型字符。
较佳地,所述同级关系包括预设特征字符串中具有相同父节点的字符之间的关系,和/或,形成预设特征字符串的字符为并列关系。
较佳地,所述获取后续页的网页内容至本地的步骤,采用如下方式:
从形成所述预设特征字符串的字符对应的节点数据中提取所述后续页的地址;
根据所述后续页的地址读取后续页的网页内容至本地。
较佳地,所述确定当前网页在网页序列中的位置的步骤,采用如下方式:
确定所述当前网页的位置为网页序列对应的地址中与当前网页地址相同的地址对应的位置;
或,
确定所述当前网页的位置为网页序列中所缺失的单个字符对应的位置;
或,
根据所述节点数据中的节点属性确定当前网页的位置。
较佳地,所述判断当前网页是否存在后续页的步骤,采用如下方式:
获取当前网页对应的网页文档;判断所述网页文档的节点数据中是否存在预设图片标识,并且,所述预设图片标识是否具有页面跳转的属性;
若所述网页文档的节点数据中存在预设图片标识,并且,所述预设图片标识具有页面跳转的属性,则判定所述当前网页存在后续页。
较佳地,所述获取后续页的网页内容至本地的步骤,采用如下方式:
根据所述页面跳转的属性确定后续页的地址;
根据所述后续页的地址读取后续页的网页内容至本地。
本发明实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在具有触摸屏幕的设备时,可以使得该设备执行如下步骤的指令(instructions):
判断当前网页是否存在后续页;
若所述当前网页存在后续页,则获取所述后续页的网页内容至本地;
当获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。
较佳地,所述判断当前网页是否存在后续页的步骤,采用如下方式:
获取当前网页对应的网页文档;
判断所述网页文档的节点数据中是否存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系;
若所述网页文档的节点数据中存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系,则判定当前网页存在对应的网页序列;
确定所述当前网页在所述网页序列中的位置;
根据所述当前网页在所述网页序列中的位置判断所述当前网页是否存在后续页。
较佳地,所述预设特征字符串包括连续型字符串,和/或,中间缺失单个字符的非连续型字符。
较佳地,所述同级关系包括预设特征字符串中具有相同父节点的字符之间的关系,和/或,形成预设特征字符串的字符为并列关系。
较佳地,所述获取后续页的网页内容至本地的步骤,采用如下方式:
从形成所述预设特征字符串的字符对应的节点数据中提取所述后续页的地址;
根据所述后续页的地址读取后续页的网页内容至本地。
较佳地,所述确定当前网页在网页序列中的位置的步骤,采用如下方式:
确定所述当前网页的位置为网页序列对应的地址中与当前网页地址相同的地址对应的位置;
或,
确定所述当前网页的位置为网页序列中所缺失的单个字符对应的位置;
或,
根据所述节点数据中的节点属性确定当前网页的位置。
较佳地,所述判断当前网页是否存在后续页的步骤,采用如下方式:
获取当前网页对应的网页文档;判断所述网页文档的节点数据中是否存在预设图片标识,并且,所述预设图片标识是否具有页面跳转的属性;
若所述网页文档的节点数据中存在预设图片标识,并且,所述预设图片标识具有页面跳转的属性,则判定所述当前网页存在后续页。
较佳地,所述获取后续页的网页内容至本地的步骤,采用如下方式:
根据所述页面跳转的属性确定后续页的地址;
根据所述后续页的地址读取后续页的网页内容至本地。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、系统、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端上,使得在计算机或其他可编程终端上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端中还存在另外的相同要素。
以上对本发明实施例所提供的一种网页内容预览的方法,一种网页内容预览的装置,以及一种设备,进行了详细介绍,本文中应用了具体个例对本发明实施例的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (17)
1.一种网页内容预览的方法,其特征在于,包括:
判断当前网页是否存在后续页;
若所述当前网页存在后续页,则获取所述后续页的网页内容至本地;
当获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。
2.根据权利要求1所述的方法,其特征在于,所述判断当前网页是否存在后续页的步骤,采用如下方式:
获取当前网页对应的网页文档;
判断所述网页文档的节点数据中是否存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系;
若所述网页文档的节点数据中存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系,则判定当前网页存在对应的网页序列;
确定所述当前网页在所述网页序列中的位置;
根据所述当前网页在所述网页序列中的位置判断所述当前网页是否存在后续页。
3.根据权利要求1或2所述的方法,其特征在于,所述预设特征字符串包括连续型字符串,和/或,中间缺失单个字符的非连续型字符。
4.根据权利要求1或2所述的方法,其特征在于,所述同级关系包括预设特征字符串中具有相同父节点的字符之间的关系,和/或,形成预设特征字符串的字符为并列关系。
5.根据权利要求2所述的方法,其特征在于,所述获取后续页的网页内容至本地的步骤,采用如下方式:
从形成所述预设特征字符串的字符对应的节点数据中提取所述后续页的地址;
根据所述后续页的地址读取后续页的网页内容至本地。
6.根据权利要求2所述的方法,其特征在于,所述确定当前网页在网页序列中的位置的步骤,采用如下方式:
确定所述当前网页的位置为网页序列对应的地址中与当前网页地址相同的地址对应的位置;
或,
确定所述当前网页的位置为网页序列中所缺失的单个字符对应的位置;
或,
根据所述节点数据中的节点属性确定当前网页的位置。
7.根据权利要求1所述的方法,其特征在于,所述判断当前网页是否存在后续页的步骤,采用如下方式:
获取当前网页对应的网页文档;判断所述网页文档的节点数据中是否存在预设图片标识,并且,所述预设图片标识是否具有页面跳转的属性;
若所述网页文档的节点数据中存在预设图片标识,并且,所述预设图片标识具有页面跳转的属性,则判定所述当前网页存在后续页。
8.根据权利要求7所述的方法,其特征在于,所述获取后续页的网页内容至本地的步骤,采用如下方式:
根据所述页面跳转的属性确定后续页的地址;
根据所述后续页的地址读取后续页的网页内容至本地。
9.一种网页内容预览的装置,其特征在于,包括:
判断模块,用于判断当前网页是否存在后续页;若是,则调用获取模块;
获取模块,用于获取所述后续页的网页内容至本地;
展现模块,用于在获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。
10.根据权利要求9所述的装置,其特征在于,所述判断模块包括:
第一获取子模块,用于获取当前网页对应的网页文档;
第一判断子模块,用于判断所述网页文档的节点数据中是否存在形成预设特征字符串的字符,并且,所述形成预设特征字符串的字符所对应的节点数据为同级关系;若是,则调用判定子模块;
判定子模块,用于判定当前网页存在对应的网页序列;
第一确定子模块,用于确定所述当前网页在所述网页序列中的位置;
第二判断子模块,用于根据所述当前网页在所述网页序列中的位置判断所述当前网页是否存在后续页。
11.根据权利要求9或10所述的装置,其特征在于,所述预设特征字符串包括连续型字符串,和/或,中间缺失单个字符的非连续型字符。
12.根据权利要求9或10所述的装置,其特征在于,所述同级关系包括预设特征字符串中具有相同父节点的字符之间的关系,和/或,形成预设特征字符串的字符为并列关系。
13.根据权利要求10所述的装置,其特征在于,所述获取模块包括:
提取子模块,用于从形成所述预设特征字符串的字符对应的节点数据中提取所述后续页的地址;
第一读取子模块,用于根据所述后续页的地址读取后续页的网页内容至本地。
14.根据权利要求10所述的装置,其特征在于,所述第一确定子模块包括:
第一确定单元,用于确定所述当前网页的位置为网页序列对应的地址中与当前网页地址相同的地址对应的位置;
或,
第二确定单元,用于确定所述当前网页的位置为网页序列中所缺失的单个字符对应的位置;
或,
第三确定单元,用于根据所述节点数据中的节点属性确定当前网页的位置。
15.根据权利要求9所述的装置,其特征在于,所述判断模块包括:
第二获取子模块,用于获取当前网页对应的网页文档;
第三判断子模块,用于判断所述网页文档的节点数据中是否存在预设图片标识,并且,所述预设图片标识是否具有页面跳转的属性;若是,则调用判定子模块;
判定子模块,用于判定所述当前网页存在后续页。
16.根据权利要求15所述的方法,其特征在于,所述获取模块包括:
第二确定子模块,用于根据所述页面跳转的属性确定后续页的地址;
第二读取子模块,用于根据所述后续页的地址读取后续页的网页内容至本地。
17.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器;和
一个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,其中,所述一个或多个模块具有如下功能:
判断当前网页是否存在后续页;
若所述当前网页存在后续页,则获取所述后续页的网页内容至本地;
当获得所述后续页的访问请求时,从本地提取所述后续页的网页内容进行展现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013100554614A CN103150355A (zh) | 2013-02-21 | 2013-02-21 | 一种网页内容预览的方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013100554614A CN103150355A (zh) | 2013-02-21 | 2013-02-21 | 一种网页内容预览的方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103150355A true CN103150355A (zh) | 2013-06-12 |
Family
ID=48548432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013100554614A Pending CN103150355A (zh) | 2013-02-21 | 2013-02-21 | 一种网页内容预览的方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103150355A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103390050A (zh) * | 2013-07-24 | 2013-11-13 | 北京小米科技有限责任公司 | 网页预取的方法、装置及终端设备 |
CN104462142A (zh) * | 2013-09-24 | 2015-03-25 | 联想(北京)有限公司 | 一种搜索网页页面中内容的方法及装置 |
CN104793859A (zh) * | 2015-03-27 | 2015-07-22 | 小米科技有限责任公司 | 一种应用界面的布局方法及装置 |
CN108446285A (zh) * | 2017-02-16 | 2018-08-24 | 北京国双科技有限公司 | 网站正文提取的方法和装置 |
CN109725820A (zh) * | 2018-12-29 | 2019-05-07 | 武汉心络科技有限公司 | 获取列表条目的方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101075940A (zh) * | 2006-05-19 | 2007-11-21 | 佳能株式会社 | 网络信息处理设备和网络信息处理方法 |
CN101325602A (zh) * | 2008-07-30 | 2008-12-17 | 广州市动景计算机科技有限公司 | 一种微浏览器智能预读网页的方法及系统 |
CN102122283A (zh) * | 2010-01-07 | 2011-07-13 | 宏碁股份有限公司 | 网页翻页方法与电子装置 |
CN102135958A (zh) * | 2010-01-21 | 2011-07-27 | 宏碁股份有限公司 | 网页撷取方法及网页撷取系统 |
CN102163203A (zh) * | 2010-02-24 | 2011-08-24 | 富士通株式会社 | 网页下载的方法和装置 |
CN102799687A (zh) * | 2012-07-30 | 2012-11-28 | 北界创想(北京)软件有限公司 | 显示网页的方法及装置 |
-
2013
- 2013-02-21 CN CN2013100554614A patent/CN103150355A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101075940A (zh) * | 2006-05-19 | 2007-11-21 | 佳能株式会社 | 网络信息处理设备和网络信息处理方法 |
CN101325602A (zh) * | 2008-07-30 | 2008-12-17 | 广州市动景计算机科技有限公司 | 一种微浏览器智能预读网页的方法及系统 |
CN102122283A (zh) * | 2010-01-07 | 2011-07-13 | 宏碁股份有限公司 | 网页翻页方法与电子装置 |
CN102135958A (zh) * | 2010-01-21 | 2011-07-27 | 宏碁股份有限公司 | 网页撷取方法及网页撷取系统 |
CN102163203A (zh) * | 2010-02-24 | 2011-08-24 | 富士通株式会社 | 网页下载的方法和装置 |
CN102799687A (zh) * | 2012-07-30 | 2012-11-28 | 北界创想(北京)软件有限公司 | 显示网页的方法及装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103390050A (zh) * | 2013-07-24 | 2013-11-13 | 北京小米科技有限责任公司 | 网页预取的方法、装置及终端设备 |
CN103390050B (zh) * | 2013-07-24 | 2016-08-17 | 小米科技有限责任公司 | 网页预取的方法、装置及终端设备 |
CN104462142A (zh) * | 2013-09-24 | 2015-03-25 | 联想(北京)有限公司 | 一种搜索网页页面中内容的方法及装置 |
CN104462142B (zh) * | 2013-09-24 | 2019-01-15 | 联想(北京)有限公司 | 一种搜索网页页面中内容的方法及装置 |
CN104793859A (zh) * | 2015-03-27 | 2015-07-22 | 小米科技有限责任公司 | 一种应用界面的布局方法及装置 |
CN108446285A (zh) * | 2017-02-16 | 2018-08-24 | 北京国双科技有限公司 | 网站正文提取的方法和装置 |
CN108446285B (zh) * | 2017-02-16 | 2020-10-27 | 北京国双科技有限公司 | 网站正文提取的方法和装置 |
CN109725820A (zh) * | 2018-12-29 | 2019-05-07 | 武汉心络科技有限公司 | 获取列表条目的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101997927B (zh) | 一种web平台数据缓存的方法和系统 | |
US8554800B2 (en) | System, methods and applications for structured document indexing | |
CN102306174B (zh) | 一种基于网页元素与用户进行互动的方法与设备 | |
CN108334585A (zh) | 一种网页爬虫方法、装置以及电子设备 | |
CN110851757A (zh) | 页面资源加载方法及终端 | |
CN104035753A (zh) | 一种双WebView展示定制页面的方法及系统 | |
CN103443786A (zh) | 识别网络浏览器中的并行布局的独立任务的机器学习方法 | |
KR20140012664A (ko) | 웹페이지 재배치 방법 | |
CN110110198B (zh) | 一种网页信息抽取方法及装置 | |
CN110309386B (zh) | 一种网页爬取的方法和装置 | |
CN102929971A (zh) | 一种多媒体信息播放方法和系统 | |
CN103150355A (zh) | 一种网页内容预览的方法、装置及设备 | |
CN104750851A (zh) | 网页内容的延迟加载方法及系统 | |
CN103383687A (zh) | 一种页面处理方法和装置 | |
CN103678325A (zh) | 一种用于提供与初始页面相对应的浏览页面的方法和设备 | |
US7174513B1 (en) | System and method for advanced network viewing | |
CN110020273B (zh) | 用于生成热力图的方法、装置以及系统 | |
CN103744845A (zh) | 一种web平台数据缓存的方法和系统 | |
CN103761257B (zh) | 基于移动浏览器的网页处理方法及系统 | |
WO2015062292A1 (zh) | 页面排版方法及系统 | |
CN114021042A (zh) | 网页内容的提取方法、装置、计算机设备和存储介质 | |
CN103020179A (zh) | 一种网页内容的提取方法、装置和设备 | |
CN102955852A (zh) | 一种网页资源处理方法、装置及设备 | |
CN107688650B (zh) | 一种web页面生成方法和装置 | |
CN101233494B (zh) | 插件模块、浏览器、邮箱运行方法及终端装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent of invention or patent application | ||
CB02 | Change of applicant information |
Address after: 100085 Beijing city Haidian District Qinghe Street No. 68 Huarun colorful city shopping center two floor 13 Applicant after: Xiaomi Technology Co., Ltd. Address before: 100102 Beijing Wangjing West Road, a volume of stone world building, A, block, floor 12 Applicant before: Beijing Xiaomi Technology Co., Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130612 |