CN103870479B - 网页显示方法和装置 - Google Patents
网页显示方法和装置 Download PDFInfo
- Publication number
- CN103870479B CN103870479B CN201210536066.3A CN201210536066A CN103870479B CN 103870479 B CN103870479 B CN 103870479B CN 201210536066 A CN201210536066 A CN 201210536066A CN 103870479 B CN103870479 B CN 103870479B
- Authority
- CN
- China
- Prior art keywords
- webpage
- page
- body matter
- homepage
- continuous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9574—Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
Abstract
一种网页显示方法,包括以下步骤:获取打开网页的指令;判断所述网页是否为连续网页的首页,若是,获取所述首页的正文内容并显示,并获取所述连续网页中所述首页后续的网页的正文内容,根据显示操控指令显示所述后续的网页的正文内容。上述方法在显示连续网页包含的网页的网页内容时,不多次重复显示相同的附属内容,而只显示网页的正文内容,正文内容是读者阅读网页的主要阅读对象,不多次重复显示相同的附属内容,不但可减少网页内容的冗余信息,增大网页的正文内容占用屏幕的空间,还能更加方便操控正文内容的显示,从而可提高连续网页阅读效率。此外,还提供一种网页显示装置。
Description
【技术领域】
本发明涉及互联网技术领域,特别涉及一种网页显示方法和装置。
【背景技术】
连续网页包含用下一页文本超链接串连起来的多个网页。若有N个网页,其中的网页记为第一网页、第二网页、…、第N网页,若第一网页中的下一页文本超链接指向第二网页、第二网页中的下一页文本超链接指向第三网页、…、第(N-1)网页中的下一页文本超链接指向第N网页,则该N个网页组成连续网页。其中的第一网页可称之为上述连续网页的首页。当然第二网页也可称为由第二网页、第三网页、…、第N网页组成的连续网页的首页,依次类推。下一页文本超链接指的是用于链接的文本(可称为链接文本)的含义表示下一页的文本超链接。含义表示下一页的文本包含多个,例如,“下一页”、“下页”、“next”等等。
网页内容中包含正文内容和附属内容,正文内容为网页内容的主体,用于表示网页的主题内容。正文内容可以包含图片、文章等。正文内容一般为读取阅读网页的主要阅读对象。附属内容则网页的主题内容之外的一些内容,例如广告、友情链接和相似主题链接等等。
连续网页中包含的网页的正文内容一般关于同一主题但内容不同,而附属内容则一般相同。
传统的方法在显示网页时,一般显示网页的所有内容,包括正文内容和附属内容,若网页中有下一页文本超链接,当获取到用户点击下一页文本超链接的操作时,则显示下一页网页的所有内容。因此,传统的方法在显示连续网页时,每显示一页网页,都会显示网页相同的附属内容,从而多次重复显示连续网页的附属内容。内容相同的附属内容会占据屏幕的相当一部分空间,尤其是在移动终端的屏幕较小的情况下,附属内容的显示使得用户界面中内容的分布相对拥挤,将正文内容放大并移动到屏幕中央则需要额外的操作,从而使得阅读连续网页的效率较低。
【发明内容】
基于此,有必要提供一种能提高连续网页阅读效率的网页显示方法。
一种网页显示方法,包括以下步骤:
获取打开网页的指令;
判断所述网页是否为连续网页的首页,若是,获取所述首页的正文内容并显示,并获取所述连续网页中所述首页后续的网页的正文内容,根据显示操控指令显示所述后续的网页的正文内容。
此外,还有必要提供一种能提高连续网页阅读效率的网页显示装置。
一种网页显示装置,包括:
指令获取模块,用于获取打开网页的指令;
连续网页判断模块,用于判断所述网页是否为连续网页的首页;
正文内容获取模块,用于若所述网页为连续网页的首页,则获取所述首页的正文内容;
显示模块,用于显示所述首页的正文内容;
所述正文内容获取模块还用于在显示所述首页的正文内容之后,获取所述连续网页中所述首页后续的网页的正文内容;
所述显示模块还用于根据显示操控指令显示所述后续的网页的正文内容。
上述网页显示方法和装置,在显示连续网页包含的网页的网页内容时,不多次重复显示相同的附属内容,而只显示网页的正文内容,正文内容是读者阅读网页的主要阅读对象,不多次重复显示相同的附属内容,不但可减少网页内容的冗余信息,增大网页的正文内容占用屏幕的空间,还能更加方便操控正文内容的显示,从而提高连续网页阅读效率。
而且,上述方法和装置在显示首页的正文内容后,就获取连续网页中首页后续的网页的正文内容,用户阅读首页一般需要一段时间,因此,获取后续的网页的正文内容这一过程在用户阅读首页期间就已经完成了,当获取到进入下一页的指令后,可直接显示已经获取的下一页的正文内容,减少了等待进入下一页的时间,提高了连续网页中页面的显示速度。
【附图说明】
图1为一个实施例中的网页显示方法的流程示意图;
图2为一个实施例中图1的步骤S103的流程示意图;
图3为一个实施例中两个网页的源代码比较示意图;
图4为一个实施例中图1的步骤S105的流程示意图
图5为一个实施例中页面显示示意图;
图6为一个实施例中的网页显示装置的结构示意图;
图7为一个实施例中正文内容获取模块的结构示意图。
【具体实施方式】
如图1所示,在一个实施例中,一种网页显示方法,包括以下步骤:
步骤S101,获取打开网页的指令。
步骤S102,判断上述网页是否为连续网页的首页,若是,则执行步骤S103。在一个实施例中,若上述网页不是连续网页的首页,则显示该网页的所有网页内容,包括正文内容和附属内容。
在一个实施例中,指令中包含待打开网页的链接地址,可根据指令包含的链接地址拉取网页的源文件,判断网页的源文件中是否存在下一页文本超链接,若是,则说明该网页有下一页,可判定该网页为连续网页的首页。在一个实施例中,可预先维护一个下一页文本清单,清单中可包含“下页”、“下一页”和“next”等表示下一页含义的文本。步骤S102可判断网页中是否存在所链接的文本包含于下一页文本清单的文本超链接,若是,则说明网页中包含下一页文本超链接。
步骤S103,获取首页的正文内容并显示。
如图2所示,在一个实施例中,步骤S103包括以下步骤:
步骤S201,根据首页的源文件中的下一页文本超链接拉取首页的下一页的源文件。
步骤S202,查找首页的源文件与首页的下一页的源文件中相同的源代码块。
在一个实施例中,可查找出首页的源文件与首页的下一页的源文件中路径和属性相同的标签,得到由相同的标签组成的源代码块。如图3所示,301和302分别为两个网页的源文件所包含的源代码。比较两个源文件可知,书签“<ahref=”xxxx”></a>”的路径(都为:html/body)和属性(链接文字都为“书城”、链接地址都为“xxxx”都相同。依次类推,可得出相同的源代码块303和304。
步骤S203,获取首页的源文件中上述相同的源代码块之外的源代码。
步骤S204,解析获取的源代码,得到首页的正文内容。
步骤S104,获取连续网页中首页后续的网页的正文内容。
在一个实施例中,可拉取首页后续的网页的源文件,获取后续的网页的源文件中上述相同的源代码块之外的源代码;解析获取的源代码,得到后续的网页的正文内容。
在一个实施例中,可在每次显示新网页的正文内容后,若该新网页不是连续网页的最后一页,根据该新网页的下一页文本超链接拉取新网页的下一页的源代码。首页后续的网页的源代码分次获取。在另一个实施例中,可在显示首页的正文内容后,即拉取首页后续所有网页的源代码。
步骤S105,根据显示操控指令显示首页后续的网页的正文内容。
在一个实施例中,一个网页的正文内容显示于同一个页面;如图4所示,步骤S105包括以下步骤:
步骤S401,根据显示操控指令移动屏幕当前显示的页面。
在一个实施例中,屏幕为触敏显示器。可检测与屏幕的接触,并按照接触的移动的方向和速度形成具有相应方向和速度的显示操控指令,并根据该显示操作指令的方向和速度来移动当前显示的页面,以显示页面中包含的正文内容不同部分。
步骤S402,若屏幕当前显示的页面被移动到页面底部到屏幕底部的距离大于等于预设值的位置,且该页面对应的网页不是连续网页的最后一页,则显示对应的网页的下一页网页的正文内容。
如图5所示,当页面501被移动到其底部到屏幕502底部的距离大于等于预设值的位置时,可判断该页面的源文件中是否有下一页文本超链接,若是,则显示下一页的正文内容。
本实施例中,当页面被移动到页面底部到屏幕底部的距离大于等于预设值的位置时,进入到下一页面,根据页面底部与屏幕底部的距离来判断是否触发进入下一页的指令,准确性和可操作性高,不会对用户的操作进行误判,从而可简化并方便用户的操作。
在一个实施例中,上述网页显示方法还包括步骤:若屏幕当前显示的正文内容为连续网页的最后一页网页的正文内容,则获取连续网页的附属内容并显示。
若屏幕当前显示的是连续网页的最后一页的正文内容,即当前显示的正文内容所属的网页的源文件中不存在下一页文本超连接,则可解析步骤S202查找得到的相同的源代码块,得到连续网页的附属内容。
本实施例中,只有当显示到连续网页的最后一页时,才显示连续网页的附属内容,不但可减少网页内容的冗余信息,增大网页的正文内容占用屏幕的空间,还能更加方便操控正文内容的显示,从而可提高连续网页阅读效率,而且,还可以方便在阅读完连续网页的正文内容后,对附属内容进行操作。
如图6所示,在一个实施例中,一种网页显示装置,包括指令获取模块10、连续网页判断模块20、正文内容获取模块30和显示模块40,其中:
指令获取模块10用于获取打开网页的指令。
连续网页判断模块20用于判断上述网页是否为连续网页的首页。
在一个实施例中,指令中包含待打开网页的链接地址,连续网页判断模块20可根据指令包含的链接地址拉取网页的源文件,判断网页的源文件中是否存在下一页文本超链接,若是,则说明该网页有下一页,可判定该网页为连续网页的首页。在一个实施例中,可预先维护一个下一页文本清单,清单中可包含“下页”、“下一页”和“next”等表示下一页含义的文本。连续网页判断模块20可判断网页中是否存在所链接的文本包含于下一页文本清单的文本超链接,若是,则说明网页中包含下一页文本超链接。
正文内容获取模块30用于若上述网页为连续网页的首页,则获取首页的正文内容。
如图7所示,在一个实施例中,正文内容获取模块30包括源文件拉取模块310、附属内容源代码查找模块320、正文内容源代码获取模块330和代码解析模块340,其中:
源文件拉取模块310用于根据首页的源文件中的下一页文本超链接拉取首页的下一页的源文件。
附属内容源代码查找模块320用于查找首页的源文件与首页的下一页的源文件中相同的源代码块。在一个实施例中,附属内容源代码查找模块320可查找出首页的源文件与首页的下一页的源文件中路径和属性相同的标签,得到由相同的标签组成的源代码块。
正文内容源代码获取模块330用于获取首页的源文件中上述相同的源代码块之外的源代码。
代码解析模块340用于解析获取的源代码,得到首页的正文内容。
显示模块40用于显示首页的正文内容。
在一个实施例中,显示模块40用于若上述网页不是连续网页的首页,则显示该网页的所有网页内容,包括正文内容和附属内容。
正文内容获取模块30还用于在显示首页的正文内容之后,获取连续网页中首页后续的网页的正文内容。
其中,源文件拉取模块310可拉取首页后续的网页的源文件,正文内容源代码获取模块330可获取后续的网页的源文件中上述相同的源代码块之外的源代码;代码解析模块340可解析获取的源代码,得到后续的网页的正文内容。
在一个实施例中,源文件拉取模块310可在每次显示新网页的正文内容后,若该新网页不是连续网页的最后一页,根据该新网页的下一页文本超链接拉取新网页的下一页的源代码。源文件拉取模块310分次拉取首页后续的网页的源代码。在另一个实施例中,源文件拉取模块310可在显示首页的正文内容后,即拉取首页后续所有网页的源代码。
显示模块40还用于根据显示操控指令显示后续的网页的正文内容。
在一个实施例中,显示模块40将一个网页的正文内容显示于同一个页面。显示模块40还用于根据显示操控指令移动屏幕当前显示的页面。在一个实施例中,屏幕为触敏显示器,上述网页显示装置还包括指令生成模块(图中未示出),用于检测与屏幕的接触,并按照接触的移动的方向和速度形成具有相应方向和速度的显示操控指令。本实施例中,显示模块40可根据该显示操作指令的方向和速度来移动当前显示的页面,以显示页面中包含的正文内容不同部分。
进一步的,若屏幕当前显示的页面被移动到页面底部到屏幕底部的距离大于等于预设值的位置,且该页面对应的网页不是连续网页的最后一页,则显示模块40可显示对应的网页的下一页网页的正文内容。
本实施例中,当页面被移动到页面底部到屏幕底部的距离大于等于预设值的位置时,进入到下一页面,根据页面底部与屏幕底部的距离来判断是否触发进入下一页的指令,准确性和可操作性高,不会对用户的操作进行误判,从而可简化并方便用户的操作。
在一个实施例中,上述网页显示装置还包括附属内容获取模块(图中未示出),用于若屏幕当前显示的正文内容为连续网页的最后一页网页的正文内容,则获取连续网页的附属内容。
连续网页判断模块20可判断屏幕当前显示的正文内容是否为连续网页的最后一页的正文内容,若是,则附属内容获取模块可获取附属内容源代码查找模块查找得到的相同的源代码块,并解析该源代码块,得到连续网页的附属内容。
本实施例中,只有当显示到连续网页的最后一页时,才显示连续网页的附属内容,不但可减少网页内容的冗余信息,增大网页的正文内容占用屏幕的空间,还能更加方便操控正文内容的显示,从而可提高连续网页阅读效率,而且,还可以方便在阅读完连续网页的正文内容后,对附属内容进行操作。
上述网页显示方法和装置,在显示连续网页包含的网页的网页内容时,不多次重复显示相同的附属内容,而只显示网页的正文内容,正文内容是读者阅读网页的主要阅读对象,不多次重复显示相同的附属内容,不但可减少网页内容的冗余信息,增大网页的正文内容占用屏幕的空间,还能更加方便操控正文内容的显示,从而可提高连续网页阅读效率。
而且,上述方法和装置在显示首页的正文内容后,就获取连续网页中首页后续的网页的正文内容,用户阅读首页一般需要一段时间,因此,获取后续的网页的正文内容这一过程在用户阅读首页期间就已经完成了,当获取到进入下一页的指令后,可直接显示已经获取的下一页的正文内容,减少了等待进入下一页的时间,提高了连续网页中页面的显示速度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序控制相关的硬件来完成的,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种网页显示方法,包括以下步骤:
获取打开网页的指令;
判断所述网页是否为连续网页的首页,若是,获取所述首页的正文内容并显示,并获取所述连续网页中所述首页后续的网页的正文内容,根据显示操控指令显示所述后续的网页的正文内容;
若屏幕当前显示的正文内容为所述连续网页的最后一页网页的正文内容,则显示所述连续网页的附属内容;
一个网页的正文内容显示于同一个页面,所述根据显示操控指令显示所述后续的网页的正文内容的步骤包括:
根据显示操控指令移动屏幕当前显示的页面;
若屏幕当前显示的页面被移动到页面底部到屏幕底部的距离大于等于预设值的位置,且该页面对应的网页不是所述连续网页的最后一页,则显示所述对应的网页的下一页网页的正文内容。
2.根据权利要求1所述的网页显示方法,其特征在于,所述判断所述网页是否为连续网页的首页的步骤包括:
根据所述指令包含的链接地址拉取所述网页的源文件,查找所述源文件中是否存在下一页文本超链接,若是,则判定所述网页为连续网页的首页。
3.根据权利要求2所述的网页显示方法,其特征在于,所述获取所述首页的正文内容的步骤包括:
根据所述首页的源文件中的下一页文本超链接拉取所述首页的下一页的源文件;
查找所述首页的源文件与所述下一页的源文件中相同的源代码块;
获取所述首页的源文件中所述相同的源代码块之外的源代码;
解析获取的所述源代码,得到所述首页的正文内容。
4.根据权利要求3所述的网页显示方法,其特征在于,所述获取所述连续网页中所述首页后续的网页的正文内容的步骤包括:
拉取所述首页后续的网页的源文件;
获取所述后续的网页的源文件中所述相同的源代码块之外的源代码;
解析获取的所述源代码,得到所述后续的网页的正文内容。
5.一种网页显示装置,其特征在于,包括:
指令获取模块,用于获取打开网页的指令;
连续网页判断模块,用于判断所述网页是否为连续网页的首页;
正文内容获取模块,用于若所述网页为连续网页的首页,则获取所述首页的正文内容;
显示模块,用于显示所述首页的正文内容;
所述正文内容获取模块还用于在显示所述首页的正文内容之后,获取所述连续网页中所述首页后续的网页的正文内容;
所述显示模块还用于根据显示操控指令显示所述后续的网页的正文内容;
附属内容获取模块,用于若屏幕当前显示的正文内容为所述连续网页的最后一页网页的正文内容,则获取所述连续网页的附属内容;
所述显示模块,还用于显示所述连续网页的附属内容;
所述显示模块将一个网页的正文内容显示于同一个页面;所述显示模块还用于根据显示操控指令移动屏幕当前显示的页面,若屏幕当前显示的页面被移动到页面底部到屏幕底部的距离大于等于预设值的位置,且该页面对应的网页不是所述连续网页的最后一页,则显示所述对应的网页的下一页网页的正文内容。
6.根据权利要求5所述的网页显示装置,其特征在于,所述连续网页判断模块用于根据所述指令包含的链接地址拉取所述网页的源文件,查找所述源文件中是否存在下一页文本超链接,若是,则判定所述网页为连续网页的首页。
7.根据权利要求6所述的网页显示装置,其特征在于,所述正文内容获取模块包括:
源文件拉取模块,用于根据所述首页的源文件中的下一页文本超链接拉取所述首页的下一页的源文件;
附属内容源代码查找模块,用于查找所述首页的源文件与所述下一页的源文件中相同的源代码块;
正文内容源代码获取模块,用于获取所述首页的源文件中所述相同的源代码块之外的源代码;
代码解析模块,用于解析获取的所述源代码,得到所述首页的正文内容。
8.根据权利要求7所述的网页显示装置,其特征在于,所述源文件拉取模块还用于拉取所述首页后续的网页的源文件;
所述正文内容源代码获取模块还用于获取所述后续的网页的源文件中所述相同的源代码块之外的源代码;
所述代码解析模块还用于解析获取的所述源代码,得到所述后续的网页的正文内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210536066.3A CN103870479B (zh) | 2012-12-11 | 2012-12-11 | 网页显示方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210536066.3A CN103870479B (zh) | 2012-12-11 | 2012-12-11 | 网页显示方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103870479A CN103870479A (zh) | 2014-06-18 |
CN103870479B true CN103870479B (zh) | 2018-01-05 |
Family
ID=50909023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210536066.3A Active CN103870479B (zh) | 2012-12-11 | 2012-12-11 | 网页显示方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103870479B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102123168A (zh) * | 2011-01-14 | 2011-07-13 | 广州市动景计算机科技有限公司 | 基于中转服务器的网页页面预读及整合方法和系统 |
CN102799654A (zh) * | 2012-06-29 | 2012-11-28 | 新浪网技术(中国)有限公司 | 一种针对智能终端的文档在线预览方法、系统及智能终端 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1836229A (zh) * | 2003-03-05 | 2006-09-20 | 夏普株式会社 | 信息阅览方法及信息阅览装置 |
-
2012
- 2012-12-11 CN CN201210536066.3A patent/CN103870479B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102123168A (zh) * | 2011-01-14 | 2011-07-13 | 广州市动景计算机科技有限公司 | 基于中转服务器的网页页面预读及整合方法和系统 |
CN102799654A (zh) * | 2012-06-29 | 2012-11-28 | 新浪网技术(中国)有限公司 | 一种针对智能终端的文档在线预览方法、系统及智能终端 |
Also Published As
Publication number | Publication date |
---|---|
CN103870479A (zh) | 2014-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102436987B1 (ko) | 웹페이지 콘텐츠를 추출하기 위한 방법 및 단말 장치 | |
US10650185B2 (en) | Accessible processing method of webpage contents and accessible webpage device | |
CN103166981B (zh) | 一种无线网页转码方法及装置 | |
CN103472983B (zh) | 定位页面内容的方法及装置 | |
US20130339840A1 (en) | System and method for logical chunking and restructuring websites | |
CN101197849A (zh) | 将互联网页面转换为无线应用协议页面的转换方法和装置 | |
US20140089772A1 (en) | Automatically Creating Tables of Content for Web Pages | |
US20170075528A1 (en) | Method and electronic device for tab navigation and control | |
CN102591954A (zh) | 一种浏览器用数据加载方法、装置及终端 | |
CN102141868B (zh) | 快捷操作信息交互页面的方法、输入法系统和浏览器插件 | |
CN102945130A (zh) | 信息搜索方法及系统 | |
CN105094786A (zh) | 基于JavaScript定制页面的方法及系统 | |
CN102779169A (zh) | 一种基于html标签的网页正文提取方法及装置 | |
CN105095441A (zh) | 一种信息获取方法及装置 | |
CN104750851A (zh) | 网页内容的延迟加载方法及系统 | |
CN103365877B (zh) | 对网页进行转码后建立目录的方法以及服务器 | |
CN103136281A (zh) | 网页搜寻结果显示系统及其方法 | |
CN102955788A (zh) | 网页浏览跳转系统及其方法 | |
CN105224175A (zh) | 一种标记网页上内容的方法及电子设备 | |
CN103577477A (zh) | 浏览器的浏览历史的展示方法及展示系统 | |
CN103729178A (zh) | 一种浏览器多标签页的处理方法及系统 | |
US20130227391A1 (en) | Method and apparatus for displaying webpage | |
CN103870191A (zh) | 网页保存的方法及电子设备 | |
CN104238867A (zh) | 标签数据的显示方法及装置 | |
CN104462232A (zh) | 一种数据存储方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |