CN102123168A - 基于中转服务器的网页页面预读及整合方法和系统 - Google Patents

基于中转服务器的网页页面预读及整合方法和系统 Download PDF

Info

Publication number
CN102123168A
CN102123168A CN201110008500.6A CN201110008500A CN102123168A CN 102123168 A CN102123168 A CN 102123168A CN 201110008500 A CN201110008500 A CN 201110008500A CN 102123168 A CN102123168 A CN 102123168A
Authority
CN
China
Prior art keywords
page
advance
reading
url
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110008500.6A
Other languages
English (en)
Other versions
CN102123168B (zh
Inventor
梁捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Dongjing Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Dongjing Computer Technology Co Ltd filed Critical Guangzhou Dongjing Computer Technology Co Ltd
Priority to CN201110008500.6A priority Critical patent/CN102123168B/zh
Publication of CN102123168A publication Critical patent/CN102123168A/zh
Priority to PCT/CN2011/084107 priority patent/WO2012094937A1/zh
Priority to US13/580,961 priority patent/US8375107B2/en
Application granted granted Critical
Publication of CN102123168B publication Critical patent/CN102123168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种基于中转服务器的网页页面预读及整合浏览方法及系统,其方法包括:S110:根据移动终端的页面访问请求向网络资源服务器请求相应的页面数据;S120:对从网络资源服务器返回的页面数据进行预读关键字的分析;S130:根据预读关键字的优先级从网络资源服务器获取子页面的URL;S140:根据子页面的URL和预读关键字的优先级从网络资源服务器预读规定层数的子页面;S150:对所获取的所有子页面进行合并重排;S160:将合并重排后的组合页面发送给移动终端。利用本发明,能够灵活地获取有效的子页并对其进行合并重排处理,使得网页展现更加灵活、人性化并且快速,减少用户的操作流程,增强用户浏览多子页页面时的浏览体验。

Description

基于中转服务器的网页页面预读及整合方法和系统
技术领域
本发明涉及无线网络的网页浏览及用户交互技术领域,更为具体地,涉及一种基于中转服务器的网页页面预读及整合方法和系统。
背景技术
随着社会的进步和技术的发展,人们越来越多地使用移动终端来以无线的方式接入网络来获取信息。在普通的页面浏览流程中,用户在当前页面点击前进到链接页面,即时加载,但对于目前的通过移动终端尤其是手机上网方式来说,由于终端硬件以及网络接口的限制,在点击了加载前进页面后到加载完成之前,用户难免有十到二十秒的等待网页加载过程,这个过程将浪费一定用户时间,消耗用户的耐心。针对这种情况,网页的预读技术逐渐得到广泛的应用。
关于网页的预读,现有技术中存在的普遍做法如下:
服务器基于客户端终的用户历史浏览行为和网页排版预测哪些文件需要被预先装载,当用户进行网页浏览的时候根据所预先装载的文件实现网页的预读功能,这样,用户就不需要等待网页加载的过程而很快地从服务器获得需要加载的页面内容。
美国US7284035(B2)号专利申请中就披露了类似的技术方案:决定网页的某些特定子页被用户获取,如果决定了就优选预读这些被确定的子页,对子页的偏好通过分析用户之前访问的网页来产生,这种分析所参考的因素包括某个用户对某一网页的子页的访问历史、访问过去的天数、在本页中有多少个子页等等。例如,当一个用户每天早上访问同一个新闻网站并总是阅读政治、计算机、旅游和阅读栏目的文章的时候,根据该专利,则当新闻网页被访问时,这些喜好将会被决定,而那些与政治、计算机、旅游和阅读栏目的文章将被比其他栏目更加优先的被加载入浏览器的缓存。
但是,上述现有技术对特定子页的预读,用户仍需要进行子页的翻页操作才能从客户端的缓存中逐一获得这些子页,对于需要浏览含有多个子页的网页(如连载小说)的用户来说,虽然预读能够在一定程度上缩短用户的等待时间,但频繁的翻页操作也会给连续的浏览体验带来不便。
申请号为200910313007.8的中国专利提出了一种用于移动通讯设备终端的网页页面预读及整合浏览系统及其应用方法,采用预先操作读取当前网页的子页并保存的预读模块和用于把当前网页和子页组合成一个组合网页的网页组合模块,并对预读页面进行多层搜索,将对获取的子页与当前页面进行重新组合成一个统一的网页显示给用户,提高用户的浏览感受。
但申请号为200910313007.8的中国专利所提出预读整合方案只是简单地以网页上的如“下一页”/“下一章”/“下一节”关键词为激发预读的热点进行相应子页的获取和组合,对于含有复杂子页结构的网页(如连载小说中同时存在“下一页”和“下一章”链接的情形)来说无法进行精确的预读,并且该申请号为200910313007.8的中国专利预读的规则单一,缺乏对用户浏览喜好的考虑,友好性较差。
发明内容
鉴于上述问题,本发明的目的是提供一种基于中转服务器的网页页面预读及整合技术,以克服上述现有技术中预读规则单一、友好性差的缺陷。
根据本发明的一个方面,提供了一种基于中转服务器的网页页面预读及整合浏览方法,包括如下步骤:
S110:根据移动终端的页面访问请求向网络资源服务器请求相应的页面数据;
S120:对从所述网络资源服务器返回的页面数据进行预读关键字的分析;
S130:根据所述预读关键字的优先级从所述网络资源服务器获取所述页面的子页面的URL;
S140:根据所述子页面的URL和所述预读关键字的优先级从所述网络资源服务器预读规定层数的子页面;
S150:对所获取的所述页面的所有子页面进行合并重排;
S160:将合并重排后的组合页面发送给移动终端。
根据本发明的另一方面,提供了一种用于网页页面预读及整合浏览的中转服务器,包括:
数据传输单元,用于所述中转服务器与移动终端以及网络资源服务器之间的数据传输;
预读关键字分析单元,用于对基于移动终端的页面访问请求从所述网络资源服务器获得的页面数据进行预读关键字的分析;
预读页面选定单元,用于根据所述预读关键字的优先级确定从所述网络资源服务器获取所述页面的子页面的URL;
页面预读单元,用于根据所述子页面的URL和所述预读关键字的优先级从所述网络资源服务器预读规定层数的子页面;
预读页面组合单元,用于对所述页面预读单元预读的所述页面的所有子页面进行合并重排。
根据本发明的再一方面,提供了一种包括移动终端、网络资源服务器和上述的中转服务器的网页页面预读及整合浏览系统。
利用上述根据本发明的基于中转服务器的网页页面预读及整合技术方案,能够灵活地获取有效的子页并对所获得的子页进行合并重排处理,当用户浏览需要多次翻页的网页时形成一个同一的组合网页显示给用户,从而在终端将所有的内容进行一次性排版渲染,使得网页展现更加灵活、人性化并且快速,减少用户的操作流程,增强用户浏览多子页页面时的浏览体验。
并且,本发明对预读页面进行多层搜索和分析的策略,能够更准确地预知用户下一次点击行为,既可提高点击响应速度,又可以较少错误预读,节省网络流量;同时利用空闲时下载页面,用户基本不用等待,可以很好的节省用户时间,节省对网络的访问请求次数。
本发明应用在网页小说或连续多个网页组成的新闻阅读上,能大幅提高移动浏览器用户的使用感受。
为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。
附图说明
通过参考以下结合附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1示出了根据本发明的基于中转服务器的网页页面预读及整合浏览方法的流程图;
图2示出了根据本发明的每一个子页的预读流程;
图3示出了根据本发明对相同结构的子页进行组合重排的结构示意图;
图4示出了本发明的用于网页页面预读及整合浏览的中转服务器的方框示意图;
图5示出了本发明的网页页面预读及整合浏览系统的方框图。
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
以下将结合附图对本发明的具体实施例进行详细描述。
为了能够灵活地获取有效的子页并对所获得的子页进行合并重排处理,本发明采用基于关键字的优先级和用户行为的多子页合并预读方案,并且把预读的操作和重排版及合并处理放在中转服务器中处理,仅将网页渲染显示的最后步骤放到客户端,以最大化地减轻移动通讯设备终端的负担。
需要说明的是,在对本发明技术方案的表述中,网页的子页是相对于用户浏览的当前页面来说的,具体的可以是当前浏览页面中超链接所指向的其他页面,比如下一页等。
另外,本发明采用客户端-服务器的基本构架,虽然本发明主要是针对以移动终端作为网页浏览客户端来设计的,但也不排除将本发明应用到除手机等移动终端之外的接入性客户端,如PC、特定服务提供终端(如机场、车站的查询终端)等,因此,在下文的表述中,“移动终端”、“终端”、“客户端”等表述均指与用户直接交互的接入性客户端。
图1示出了根据本发明的基于中转服务器的网页页面预读及整合浏览方法的流程图。
如图1所示,当移动终端用户浏览网页页面时,移动终端即将用户的网页页面访问提交给中转服务器,而中转服务器则根据移动终端的页面访问请求向相应的网络资源服务器请求相应的页面数据(S110);在中转服务器收到从网络资源服务器返回页面数据后,即对从网络资源服务器返回的页面数据进行预读关键字的分析(S120);然后根据预读关键字的优先级从网络资源服务器获取所请求页面的子页面的URL(S130);在获取到子页面的URL之后,中转服务器进一步根据该子页面的URL和预读关键字的优先级从网络资源服务器预读规定层数的子页面(S140),即将所请求页面的子页面按规定层数所需要的量进行逐层预读,这里的规定层数可以根据终端的硬件配置确定,也可以由用户自主设定;在预读完规定层数的子页面之后,中转服务器就对所获取的所有子页面进行合并重排(S150);最后将合并重排后的组合页面发送给移动终端(S160),实现终端用户所需要的网页页面预读及整合浏览。
通过上述中转服务器对用户请求的网页的子页进行的预读及整合浏览的处理,用户在点击当前浏览页面上的上述根据预读关键字的优先级所确定的关键字或最常访问页面链接的时候,移动终端就能够直接调取缓存中多子页合并后的预读页面进行显示,从而不需要任何的翻页操作就能够浏览到适当数量的子页内容。
其中,预读关键字的优先级从左到右,依次降低:
下页、[下页]、下一页、[下一页]、下页|、>>下页、>>下页|、下一张、[下一张]、[->]、>、[>]、[->>]、>>、[>>]、下章、[下章]、下一章、[下一章]、下节、[下节]
中转服务器在判断网页上关键字的优先级的过程中,选取优先级最高的关键字,将该关键字链接指向的网页的子页及该子页的同一关键字链接指向的子页等都保存下来,例如一篇新闻的首页只有新闻的摘要内容,该页面的最高优先级关键字是“下页”,该新闻的正文一共有5页,且每一页的下方都有关键字“下页”,则中转服务器会将该新闻的第2页到第5都作为首页的子页进行预读。
具体到每一个子页的预读流程如图2所示上,在图1所示的步骤S140中,进一步包括:
S141:根据所述子页面的URL从所述网络资源服务器预读所述子页面;
S142:分析所述子页面并根据所述预读关键字的优先级从所述网络资源服务器获取下一层子页面的URL;
S143:根据所获取的下一层子页面的URL继续从所述网络资源服务器预读下一层子页面;
S144:判断所获取的子页面的层数是否达到规定层数,如果达到,则结束分析预读,否则,针对所述下一层子页面继续进行步骤142,直至预读规定层数的所有子页面。
在预读层数的控制方面,可以通过计数器或者其他本领域技术人员所悉知的数量控制方式来实现。
除了上述关键字优先级的引入,在本发明的一个优选实施方式中,还将海量用户行为纳入预读的考虑因素之中,即在步骤S130获取了子页面的URL之后,进一步判断所述子页面的URL与根据海量用户行为统计得到的在访问所述页面之后最常访问的页面URL是否相同,如果相同,则继续步骤S140的预读流程;如果不相同,则根据所述最常访问的页面URL的跳转访问率确定是否预读所述最常访问的页面。
如果所述跳转访问率超过预设阈值,则根据所述最常访问的页面URL预读所述最常访问的页面;否则,如果所述跳转访问率没有超过预设阈值,则不进行任何预读操作。
在本发明的技术方案中,中转服务器的海量用户行为统计就是记录所有用户的访问行为,并基于这些行为的记录得出与用户的访问行为相关的额各种统计参数,例如访问频率(即一天访问多少次)、某页面跳转到另外一个页面的几率等,这些都是基于用户的访问行为记录统计出来的。
具体来说,根据海量用户对上述子页的历史访问行为的统计数据得到该网页被访问之后最常被访问的网页(其中包括该网页的子页以及其他跳转的网页),如果根据关键字优先级预读到的子页的URL和该网页被访问之后最常被访问的网页的URL是一样的,则可以判定用户很希望对该新闻进行连续阅读,于是将根据关键字预读到的所有子页进行合并重排处理后发送到移动终端进行缓存。
组合的子页数量可以根据终端的硬件配置确定,也可以由用户自主设定,但考虑到用户的浏览习惯和大多数移动终端的终端配置,组合的子页数一般不超过四层,优选地对2~3层的子页进行合并重排。
如果根据关键字优先级预读到的子页和该网页被访问之后最常被访问的网页是不同的,则根据海量用户的历史访问行为的统计数据判断该网页被访问之后最常被访问的网页的跳转访问率来确定是否进行跳转访问的预读。该跳转访问率可根据经验值设定,如60%~80%之间的数值。在本发明的一个具体实施方式中,如果这个网页的跳转访问率达到70%,就对最常被访问的网页进行预读,如果这个网页的跳转访问率没有达到70%,则不进行任何后续预读。
这种海量用户行为统计信息的比较判断可以在仅第一层子页面的预读过程中引入,也可以在每一次子页面的预读过程中均将子页面的URL与海量用户行为统计得到的跳转页面URL进行比较,以使得中转服务器所预读的每一页面都更加贴近用户的浏览需求。
具体的,作为示例,在每一次子页面的预读过程中均将子页面的URL与海量用户行为统计得到的跳转页面URL进行比较的过程如下:在每次获取一个子页面的URL之后,都判断该子页面的URL与根据海量用户行为统计得到的在访问该子页面的上一页面之后最常访问的页面URL是否相同,如果相同,则继续上述步骤S143的预读操作;否则根据海量用户行为统计所确定的最常访问的页面URL的跳转访问率确定是否预读该最常访问的页面。同样,如果该跳转访问率超过预设阈值,则根据最常访问的页面URL预读所述最常访问的页面;如果所述跳转访问率没有超过预设阈值,则不进行任何预读操作,仅就已经预读的子页面进行合并重排处理。
下面以两个具体的实施方式来对本发明提供的上述基于中转服务器的网页页面预读及整合浏览方法做示例性说明。
实施例一
在网页的版面编排设计方面,对基于同一内容的各子页说来,它们的页面结构都是一样的:使用相同的标记语言,相同的网页标题等等,因此就可以根据这一特点来对子页的内容进行组合重排。具体来说,就是把网页根据网页标记语言分成标题部分和正文部分,把各子页的正文部分内容抽取,并组合成新组合网页的正文部分,新组合网页的标题部分采用各子页标题的相同部分,用户浏览时直接输出组合后的整页内容即可。
图3为对相同结构的子页进行组合重排的简单结构示意图。如图3所示,假设用户当前浏览的页面为Pagef,其各子页分别为子页1、子页2、子页3和子页4。
子页1的正文部分为text01,标题为abc1;
子页2的正文部分为text02,标题为abc2;
子页3的正文部分为text03,标题为abc3;
子页4的正文部分为text04,标题为abc4;
中转服务器通过预读将子页1到子页4获取并保存后,经过海量用户行为统计后发现,在用户访问历史行为统计中对当前浏览的页面为Pagef进行访问完之后,最常被访问的页面就是子页1,因此就可以将pagef所有子页合并重新排版成组合网页5。
如图3所示,在组合重排后,组合网页5的正文部分为子页1,子页2,子页3和子页4的正文部分的结合,因此组合网页5的正文部分为:text01,text02,text03和text04的连续组合;组合网页5的标题为子页1,子页2,子页3和子页4的标题的相同部分,即为abc。组合完成之后,中转服务器将该组合重排后的网页5发送给客户端。
当用户点击当前页面pagef上的超链接“下一页”时,客户端将组合网页5进行渲染显示。这样,客户不必进行繁琐的翻页操作即可获得与当前页面相衔接的更多的浏览内容,从而获得更好的浏览体验。
实施例二
对于涉及网络连载小说的网页来说,由于小说的章节需要,网页上能激发预读操作的链接不仅“下一页”,还可能会同时存在“下一节”、“下一章”甚至“下一卷”的情形,对于这种多个预读热点关键字同时存在的情况,就需要首先对该网页上关键字的优先级进行判断。
比如在某网络小说的网页中,“下一页”的优先级“下一章”的优先级高,而“下一章”的优先级又会高于“下一卷”的优先级。假如用户现在正在读第二章第1页(假如第二章一共有7页),那么中转服务器就会根据关键字的优先级,在获得第二章第1页之后,预读第二章第2页到第7页,然后分析所有用户当浏览完第1页后通常最常访问的那个页面(海量用户行为统计),如果该最常访问的页面是第2页,那么就将这7页的内容或者第2页到第4页的内容进行合并重排处理并发送给移动终端的缓存,当用户点击当前网页上的关键字“下一页”时,移动终端直接调取合并后的页面缓存数据进行显示。如果中转服务器根据分析,发现所有用户当浏览完第1页后最常访问的那个页面不是第2页,而是最后一章的倒数第3页,那么中转服务器将对最后一章的倒数第3页以及第3页后的若干子页进行预读,直至预读的子页数量达到规定层数,然后中转服务器将所预读的所有页面进行合并重排处理并发送给移动终端。如果中转服务器根据分析,发现所有用户当浏览完第1页后都最常访问的那个页面不是第2页,也是不该小说的任何一页,而是另外一个内容不相关的页面,且从该网络小说的页面链接到该内容不相关的页面的跳转访问率高达70%,则中转服务器将预读该内容不相关的页面及其子页,并进行页面合并重排处理后发送给移动终端。
在本发明中,进行合并处理时通常考虑到子页之间的相似程度,可以通过判断子页URL的方式进行各种合并重排,当然也可以通过判断子页排版的相似程度进行合并重排。
在本发明的预读逻辑中,有基于关键字的预读和基于统计(海量用户行为统计)的预读两种。按照一般的逻辑,针对关键字的预读的优先级大于基于统计的预读的优先级,在上述对本发明技术方案的表述中,都是针对有关键字的预读,也就是说,对于有预读关键字的页面,优先预读关键字;没有预读关键字的页面,根据中转服务器的海量用户行为统计结果进行预读。
如上参照图1和图2描述了根据本发明的基于中转服务器的网页页面预读及整合浏览方法。本发明的上述基于中转服务器的网页页面预读及整合浏览方法,可以采用软件实现,也可以采用硬件实现,或采用软件和硬件组合的方式实现。
与上述方法相对应,本发明还提供了一种用于网页页面预读及整合浏览的中转服务器,图4示出了根据本发明的用于网页页面预读及整合浏览的中转服务器400的方框示意图。如图4所示,用于网页页面预读及整合浏览的中转服务器400包括数据传输单元410、预读关键字分析单元420、预读页面选定单元430、页面预读单元440和预读页面组合单元450。
其中,数据传输单元410,用于中转服务器与移动终端以及网络资源服务器之间的数据传输;预读关键字分析单元420,用于对基于移动终端的页面访问请求从网络资源服务器获得的页面数据进行预读关键字的分析;预读页面选定单元430,用于根据预读关键字的优先级确定从网络资源服务器获取页面的子页面的URL;页面预读单元440,用于根据子页面的URL和预读关键字的优先级从网络资源服务器预读规定层数的子页面;预读页面组合单元450,用于对页面预读单元440预读的所述页面的所有子页面进行合并重排。
在预读关键字分析单元420中,所设定的预读关键字的优先级从高至低依次为:下页、[下页]、下一页、[下一页]、下页|、>>、下页、>>下页|、下一张、[下一张]、[->]、>、[>]、[->>]、>>、[>>]、下章、[下章]、下一章、[下一章]、下节、[下节]。
结合图4,中转服务器逐层预读子页面的过程如下:页面预读单元440在根据子页面的URL和预读关键字的优先级从网络资源服务器预读第一层子页面之后,页面预读单元440即根据第一层子页面的URL从网络资源服务器预读该子页面,预读关键字分析单元420进一步分析第一层子页面并根据预读关键字的优先级从网络资源服务器获取第一层子页面的下一层子页面的URL,页面预读单元440继续根据下一层子页面的URL从网络资源服务器预读下一层子页面,然后由预读关键字分析单元420继续针对下一层子页面进行分析,直至预读规定层数的所有子页面。
考虑到用户的浏览习惯和大多数移动终端的终端配置,组合的子页数一般不超过四层,优选地对2~3层的子页进行合并重排。
为了使预读页面更加符合用户的浏览意向,在本发明的一个优选实施方式中,还将海量用户行为纳入预读的考虑因素之中,即中转服务器400还包括海量用户行为统计单元460,用于根据海量用户的网页浏览行为统计用户访问每一页面的历史访问行为、访问频率以及跳转访问率。海量用户行为统计单元460记录所有用户的访问行为,并基于这些行为的记录得出各种统计参数,如访问频率(即一天访问多少次)、某页面跳转到另外一个页面的几率等,这些都是基于用户的访问行为记录统计出来的。
预读页面选定单元430在根据预读关键字的优先级从网络资源服务器获取子页面的URL之后,还需要判断该子页面的URL与根据海量用户行为统计单元460统计得到的在访问所述页面之后最常访问的页面URL是否相同,如果相同,则页面预读单元440继续根据子页面的URL和预读关键字的优先级从网络资源服务器预读规定层数的子页面;如果不相同,则预读页面选定单元430根据最常访问的页面URL的跳转访问率确定是否预读最常访问的页面。其中,如果跳转访问率超过预设阈值,则预读页面选定单元430确定最常访问的页面URL为从网络资源服务器获取的子页面的URL;否则,如果所述跳转访问率没有超过预设阈值,则预读页面选定单元430不选定任何预读页面。
跳转访问率的预设阈值可根据经验值设定,如60%~80%之间的数值在本发明的一个优选实施方式中,预设阈值为70%,即如果这个网页的跳转访问率达到70%,就对最常被访问的网页进行预读,如果这个网页的跳转访问率没有达到70%,则不进行任何后续预读。
再一方面,本发明还提供一种移动终端、网络资源服务器和前述中转服务器的网页页面预读及整合浏览系统,其方框图如图5所示。
本发明结合关键字的优先级、海量用户行为分析,对预读的页面进行契合用户浏览意向的选择,并对多个预读的页面进行合并重排版,不能使终端用户能够在不需要多次翻页的前提下一次性浏览到更多的网页内容,还从预读内容上使用户的浏览满意度得大大改善,从而更有效地提升了用户的网页浏览体验。
如上参照附图以示例的方式描述根据本发明的网页页面预读及整合浏览方法和系统。但是,本领域技术人员应当理解,对于上述本发明所提出的网页页面预读及整合浏览方法和系统,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。

Claims (22)

1.一种基于中转服务器的网页页面预读及整合浏览方法,包括如下步骤:
S110:根据移动终端的页面访问请求向网络资源服务器请求相应的页面数据;
S120:对从所述网络资源服务器返回的页面数据进行预读关键字的分析;
S130:根据所述预读关键字的优先级从所述网络资源服务器获取所述页面的子页面的URL;
S140:根据所述子页面的URL和所述预读关键字的优先级从所述网络资源服务器预读规定层数的子页面;
S150:对所获取的所述页面的所有子页面进行合并重排;
S160:将合并重排后的组合页面发送给移动终端。
2.如权利要求1所述的网页页面预读及整合浏览方法,其中,在步骤S130获取了子页面的URL之后,
进一步判断所述子页面的URL与根据海量用户行为统计得到的在访问所述页面之后最常访问的页面URL是否相同,如果相同,则继续步骤S140的预读流程;如果不相同,则根据所述最常访问的页面URL的跳转访问率确定是否预读所述最常访问的页面。
3.如权利要求2所述的网页页面预读及整合浏览方法,其中,
如果所述跳转访问率超过预设阈值,则根据所述最常访问的页面URL预读所述最常访问的页面;否则
如果所述跳转访问率没有超过预设阈值,则不进行任何预读操作。
4.如权利要求3所述的网页页面预读及整合浏览方法,其中,
所述预设阈值为70%。
5.如权利要求1所述的网页页面预读及整合浏览方法,其中,所述预读关键字的优先级从高至低依次为:
下页、[下页]、下一页、[下一页]、下页|、>>、下页、>>下页|、下一张、[下一张]、[->]、>、[>]、[->>]、>>、[>>]、下章、[下章]、下一章、[下一章]、下节、[下节]。
6.如权利要求1所述的网页页面预读及整合浏览方法,其中,在所述步骤S140中,进一步包括:
S141:根据所述子页面的URL从所述网络资源服务器预读所述子页面;
S142:分析所述子页面并根据所述预读关键字的优先级从所述网络资源服务器获取下一层子页面的URL;
S143:根据所获取的下一层子页面的URL继续从所述网络资源服务器预读下一层子页面;
S144:判断所获取的子页面的层数是否达到规定层数,如果达到,则结束分析预读,否则,针对所述下一层子页面继续进行步骤142,直至预读规定层数的所有子页面。
7.如权利要求6所述的网页页面预读及整合浏览方法,其中,在每次获取一个子页面的URL之后,都判断所述子页面的URL与根据海量用户行为统计得到的在访问该子页面的上一页面之后最常访问的页面URL是否相同,如果相同,则继续步骤S143;否则
根据所述最常访问的页面URL的跳转访问率确定是否预读所述最常访问的页面。
8.如权利要求7所述的网页页面预读及整合浏览方法,其中,
如果所述跳转访问率超过预设阈值,则根据所述最常访问的页面URL预读所述最常访问的页面;否则
如果所述跳转访问率没有超过预设阈值,则不进行任何预读操作。
9.如权利要求8所述的网页页面预读及整合浏览方法,其中,
所述预设阈值为70%。
10.如权利要求1或6所述的网页页面预读及整合浏览方法,其中,所述规定层数不超过四层。
11.如权利要求7所述的网页页面预读及整合浏览方法,其中,所述规定层数为2~3层。
12.一种用于网页页面预读及整合浏览的中转服务器,包括:
数据传输单元,用于所述中转服务器与移动终端以及网络资源服务器之间的数据传输;
预读关键字分析单元,用于对基于移动终端的页面访问请求从所述网络资源服务器获得的页面数据进行预读关键字的分析;
预读页面选定单元,用于根据所述预读关键字的优先级确定从所述网络资源服务器获取所述页面的子页面的URL;
页面预读单元,用于根据所述子页面的URL和所述预读关键字的优先级从所述网络资源服务器预读规定层数的子页面;
预读页面组合单元,用于对所述页面预读单元预读的所述页面的所有子页面进行合并重排。
13.如权利要求12所述的中转服务器,还包括:
海量用户行为统计单元,用于根据海量用户的网页浏览行为统计用户访问每一页面的历史访问行为、访问频率以及跳转访问率。
14.如权利要求13所述的中转服务器,其中,所述预读页面选定单元在根据所述预读关键字的优先级从所述网络资源服务器获取所述页面的子页面的URL之后,还需要判断所述子页面的URL与根据所述海量用户行为统计单元统计得到的在访问所述页面之后最常访问的页面URL是否相同,
如果相同,则所述页面预读单元继续根据所述子页面的URL和所述预读关键字的优先级从所述网络资源服务器预读规定层数的子页面;
如果不相同,则所述预读页面选定单元根据所述最常访问的页面URL的跳转访问率确定是否预读所述最常访问的页面。
15.如权利要求14所述的中转服务器,其中,
如果所述跳转访问率超过预设阈值,则所述预读页面选定单元确定所述最常访问的页面URL为从所述网络资源服务器获取所述页面的子页面的URL;否则
如果所述跳转访问率没有超过预设阈值,则所述预读页面选定单元不选定任何预读页面。
16.如权利要求15所述的中转服务器,其中,
所述预设阈值为70%。
17.如权利要求12所述的中转服务器,其中,所述预读关键字的优先级从高至低依次为:
下页、[下页]、下一页、[下一页]、下页|、>>、下页、>>下页|、下一张、[下一张]、[->]、>、[>]、[->>]、>>、[>>]、下章、[下章]、下一章、[下一章]、下节、[下节]。
18.如权利要求12所述的中转服务器,其中,所述页面预读单元在根据所述子页面的URL和所述预读关键字的优先级从所述网络资源服务器预读第一层子页面之后,所述页面预读单元即根据所述第一层子页面的URL从所述网络资源服务器预读所述子页面,所述预读关键字分析单元进一步分析所述第一层子页面并根据所述预读关键字的优先级从所述网络资源服务器获取所述第一层子页面的下一层子页面的URL,所述页面预读单元继续根据所述下一层子页面的URL从所述网络资源服务器预读下一层子页面,然后由所述预读关键字分析单元继续针对所述下一层子页面进行分析,直至预读规定层数的所有子页面。
19.如权利要求18所述的中转服务器,还包括:
海量用户行为统计单元,用于根据海量用户的网页浏览行为统计用户访问每一页面的历史访问行为、访问频率以及跳转访问率;并且
在所述预读关键字分析单元每次获取一个子页面的URL之后,所述预读页面选定单元都根据所述判断所述子页面的URL与所述海量用户行为统计单元统计得到的在访问该子页面的上一页面之后最常访问的页面URL是否相同,
如果相同,则所述页面预读单元继续根据所述子页面的URL和所述预读关键字的优先级从所述网络资源服务器预读规定层数的子页面;
如果不相同,则所述预读页面选定单元根据所述最常访问的页面URL的跳转访问率确定是否预读所述最常访问的页面。
20.如权利要求12或14所述的中转服务器,其中,所述规定层数不超过四层。
21.如权利要求12或14所述的中转服务器,其中,所述规定层数为2~3层。
22.一种网页页面预读及整合浏览系统,包括移动终端、网络资源服务器和如权利要求12~21中任一项所述的中转服务器。
CN201110008500.6A 2011-01-14 2011-01-14 基于中转服务器的网页页面预读及整合方法和系统 Active CN102123168B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201110008500.6A CN102123168B (zh) 2011-01-14 2011-01-14 基于中转服务器的网页页面预读及整合方法和系统
PCT/CN2011/084107 WO2012094937A1 (zh) 2011-01-14 2011-12-16 网页页面预读方法、中转服务器和网页页面预读系统
US13/580,961 US8375107B2 (en) 2011-01-14 2011-12-16 Webpage pre-reading method, transfer server and webpage pre-reading system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110008500.6A CN102123168B (zh) 2011-01-14 2011-01-14 基于中转服务器的网页页面预读及整合方法和系统

Publications (2)

Publication Number Publication Date
CN102123168A true CN102123168A (zh) 2011-07-13
CN102123168B CN102123168B (zh) 2012-07-18

Family

ID=44251620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110008500.6A Active CN102123168B (zh) 2011-01-14 2011-01-14 基于中转服务器的网页页面预读及整合方法和系统

Country Status (3)

Country Link
US (1) US8375107B2 (zh)
CN (1) CN102123168B (zh)
WO (1) WO2012094937A1 (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012094937A1 (zh) * 2011-01-14 2012-07-19 广州市动景计算机科技有限公司 网页页面预读方法、中转服务器和网页页面预读系统
WO2012155849A1 (zh) * 2011-05-16 2012-11-22 广州市动景计算机科技有限公司 网页浏览方法、代理服务器及网页浏览系统
CN102821088A (zh) * 2012-05-07 2012-12-12 北京京东世纪贸易有限公司 获取网络数据的系统和方法
CN103067341A (zh) * 2011-10-20 2013-04-24 中国移动通信集团四川有限公司 网上营业厅访问方法、系统和装置
CN103309905A (zh) * 2012-03-16 2013-09-18 百度在线网络技术(北京)有限公司 对网页进行转码后合并阅读的方法以及服务器
CN103488411A (zh) * 2012-06-13 2014-01-01 腾讯科技(深圳)有限公司 切换页面的方法和装置
CN103617229A (zh) * 2013-11-25 2014-03-05 北京奇虎科技有限公司 一种关联网页数据库的建立方法和装置
CN103617228A (zh) * 2013-11-25 2014-03-05 北京奇虎科技有限公司 一种计算关联网页URL模式pattern的方法和装置
CN103631906A (zh) * 2013-11-25 2014-03-12 北京奇虎科技有限公司 一种识别网页url中页码标识的方法和装置
CN103678393A (zh) * 2012-09-20 2014-03-26 腾讯科技(深圳)有限公司 获取信息的方法和装置
CN103678307A (zh) * 2012-08-31 2014-03-26 腾讯科技(深圳)有限公司 页面显示方法及客户端
CN103678324A (zh) * 2012-09-03 2014-03-26 百度在线网络技术(北京)有限公司 一种用于打开网页的方法、装置和设备
CN103778115A (zh) * 2012-10-17 2014-05-07 腾讯科技(深圳)有限公司 网站名称提取方法及装置
CN103870479A (zh) * 2012-12-11 2014-06-18 腾讯科技(武汉)有限公司 网页显示方法和装置
CN104268236A (zh) * 2014-09-28 2015-01-07 深圳市优网科技有限公司 一种识别网页浏览业务的方法及装置
CN104410675A (zh) * 2014-11-12 2015-03-11 北京奇虎科技有限公司 数据传输方法、数据系统及相关装置
CN104427369A (zh) * 2013-09-09 2015-03-18 联想(北京)有限公司 遥控端设备、被遥控端设备以及用于其的方法
CN104462142A (zh) * 2013-09-24 2015-03-25 联想(北京)有限公司 一种搜索网页页面中内容的方法及装置
CN104506641A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 网页应用程序的访问方法和装置
CN104731817A (zh) * 2013-12-23 2015-06-24 腾讯科技(深圳)有限公司 一种网页展现方法和装置
CN109416698A (zh) * 2016-06-20 2019-03-01 微软技术许可有限责任公司 对传播到移动应用的组织链接进行编排
CN109766082A (zh) * 2017-11-09 2019-05-17 北京京东尚科信息技术有限公司 应用程序页面跳转的方法和装置
CN112631682A (zh) * 2020-12-28 2021-04-09 北京百度网讯科技有限公司 小程序处理方法、装置、设备及存储介质

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10296558B1 (en) * 2012-02-27 2019-05-21 Amazon Technologies, Inc. Remote generation of composite content pages
US20140082484A1 (en) * 2012-09-20 2014-03-20 Tencent Technology (Shenzhen) Company Limited Method and apparatus for obtaining information
US9886422B2 (en) * 2014-08-06 2018-02-06 International Business Machines Corporation Dynamic highlighting of repetitions in electronic documents
CN108255918B (zh) * 2017-09-15 2020-11-03 阿里巴巴(中国)有限公司 预读关键词集合的获取方法、网页访问设备及电子设备
CN111552906B (zh) * 2020-04-24 2023-06-27 上海连尚网络科技有限公司 一种用于响应阅读应用中页面访问请求的方法与设备
CN111782328A (zh) * 2020-07-02 2020-10-16 支付宝(杭州)信息技术有限公司 应用处理的方法及装置
CN113779450B (zh) * 2020-08-31 2024-08-16 北京沃东天骏信息技术有限公司 页面访问方法和页面访问装置
CN113282354B (zh) * 2021-06-28 2023-04-07 中国平安人寿保险股份有限公司 应用程序的h5页面加载方法、装置、设备及存储介质
CN114139072B (zh) * 2021-10-29 2024-06-21 北京达佳互联信息技术有限公司 页面数据处理方法、装置、电子设备及存储介质
CN115037801B (zh) * 2022-03-14 2024-07-12 阿里巴巴(中国)有限公司 优先级调整方法、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001117818A (ja) * 1999-10-20 2001-04-27 Nec Corp メモリ管理装置及び管理方法並びに管理プログラムを記録した記録媒体
WO2001095695A2 (en) * 2000-06-12 2001-12-20 Princeton University System for wireless push and pull based services
CN101777068A (zh) * 2009-12-31 2010-07-14 优视科技有限公司 一种用于移动通讯设备终端的网页页面预读及整合浏览系统及其应用方法
CN101777081A (zh) * 2010-03-08 2010-07-14 中兴通讯股份有限公司 一种提高网页访问速度的方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8065620B2 (en) * 2001-01-31 2011-11-22 Computer Associates Think, Inc. System and method for defining and presenting a composite web page
CN100525188C (zh) * 2004-09-14 2009-08-05 吴怡达 以网页浏览器为介面的点对点分散式搜索下载系统及方法
US20080222283A1 (en) * 2007-03-08 2008-09-11 Phorm Uk, Inc. Behavioral Networking Systems And Methods For Facilitating Delivery Of Targeted Content
CN101325602A (zh) 2008-07-30 2008-12-17 广州市动景计算机科技有限公司 一种微浏览器智能预读网页的方法及系统
US20120066359A1 (en) * 2010-09-09 2012-03-15 Freeman Erik S Method and system for evaluating link-hosting webpages
CN102123168B (zh) * 2011-01-14 2012-07-18 广州市动景计算机科技有限公司 基于中转服务器的网页页面预读及整合方法和系统
US9646100B2 (en) * 2011-03-14 2017-05-09 Verisign, Inc. Methods and systems for providing content provider-specified URL keyword navigation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001117818A (ja) * 1999-10-20 2001-04-27 Nec Corp メモリ管理装置及び管理方法並びに管理プログラムを記録した記録媒体
WO2001095695A2 (en) * 2000-06-12 2001-12-20 Princeton University System for wireless push and pull based services
CN101777068A (zh) * 2009-12-31 2010-07-14 优视科技有限公司 一种用于移动通讯设备终端的网页页面预读及整合浏览系统及其应用方法
CN101777081A (zh) * 2010-03-08 2010-07-14 中兴通讯股份有限公司 一种提高网页访问速度的方法及装置

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012094937A1 (zh) * 2011-01-14 2012-07-19 广州市动景计算机科技有限公司 网页页面预读方法、中转服务器和网页页面预读系统
US8375107B2 (en) 2011-01-14 2013-02-12 Guangzhou Ucweb Computer Technology Co., Ltd Webpage pre-reading method, transfer server and webpage pre-reading system
WO2012155849A1 (zh) * 2011-05-16 2012-11-22 广州市动景计算机科技有限公司 网页浏览方法、代理服务器及网页浏览系统
CN103067341A (zh) * 2011-10-20 2013-04-24 中国移动通信集团四川有限公司 网上营业厅访问方法、系统和装置
CN103067341B (zh) * 2011-10-20 2017-05-03 中国移动通信集团四川有限公司 网上营业厅访问方法、系统和装置
CN103309905A (zh) * 2012-03-16 2013-09-18 百度在线网络技术(北京)有限公司 对网页进行转码后合并阅读的方法以及服务器
CN102821088A (zh) * 2012-05-07 2012-12-12 北京京东世纪贸易有限公司 获取网络数据的系统和方法
CN103488411A (zh) * 2012-06-13 2014-01-01 腾讯科技(深圳)有限公司 切换页面的方法和装置
CN103488411B (zh) * 2012-06-13 2016-06-01 腾讯科技(深圳)有限公司 切换页面的方法和装置
CN103678307B (zh) * 2012-08-31 2016-07-13 腾讯科技(深圳)有限公司 页面显示方法及客户端
CN103678307A (zh) * 2012-08-31 2014-03-26 腾讯科技(深圳)有限公司 页面显示方法及客户端
CN103678324B (zh) * 2012-09-03 2019-03-19 百度在线网络技术(北京)有限公司 一种用于打开网页的方法、装置和设备
CN103678324A (zh) * 2012-09-03 2014-03-26 百度在线网络技术(北京)有限公司 一种用于打开网页的方法、装置和设备
CN103678393A (zh) * 2012-09-20 2014-03-26 腾讯科技(深圳)有限公司 获取信息的方法和装置
WO2014044154A1 (en) * 2012-09-20 2014-03-27 Tencent Technology (Shenzhen) Company Limited Method and apparatus for obtaining information
CN103778115A (zh) * 2012-10-17 2014-05-07 腾讯科技(深圳)有限公司 网站名称提取方法及装置
CN103870479A (zh) * 2012-12-11 2014-06-18 腾讯科技(武汉)有限公司 网页显示方法和装置
CN103870479B (zh) * 2012-12-11 2018-01-05 腾讯科技(武汉)有限公司 网页显示方法和装置
CN104427369B (zh) * 2013-09-09 2018-08-10 联想(北京)有限公司 遥控端设备、被遥控端设备以及用于其的方法
CN104427369A (zh) * 2013-09-09 2015-03-18 联想(北京)有限公司 遥控端设备、被遥控端设备以及用于其的方法
CN104462142A (zh) * 2013-09-24 2015-03-25 联想(北京)有限公司 一种搜索网页页面中内容的方法及装置
CN104462142B (zh) * 2013-09-24 2019-01-15 联想(北京)有限公司 一种搜索网页页面中内容的方法及装置
CN103617228A (zh) * 2013-11-25 2014-03-05 北京奇虎科技有限公司 一种计算关联网页URL模式pattern的方法和装置
CN103631906A (zh) * 2013-11-25 2014-03-12 北京奇虎科技有限公司 一种识别网页url中页码标识的方法和装置
CN103617229A (zh) * 2013-11-25 2014-03-05 北京奇虎科技有限公司 一种关联网页数据库的建立方法和装置
CN104731817A (zh) * 2013-12-23 2015-06-24 腾讯科技(深圳)有限公司 一种网页展现方法和装置
CN104268236B (zh) * 2014-09-28 2018-03-16 深圳市优网科技有限公司 一种识别网页浏览业务的方法及装置
CN104268236A (zh) * 2014-09-28 2015-01-07 深圳市优网科技有限公司 一种识别网页浏览业务的方法及装置
CN104410675A (zh) * 2014-11-12 2015-03-11 北京奇虎科技有限公司 数据传输方法、数据系统及相关装置
CN104506641A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 网页应用程序的访问方法和装置
CN104506641B (zh) * 2014-12-30 2018-03-06 百度在线网络技术(北京)有限公司 网页应用程序的访问方法和装置
CN109416698A (zh) * 2016-06-20 2019-03-01 微软技术许可有限责任公司 对传播到移动应用的组织链接进行编排
CN109766082A (zh) * 2017-11-09 2019-05-17 北京京东尚科信息技术有限公司 应用程序页面跳转的方法和装置
CN109766082B (zh) * 2017-11-09 2022-04-12 北京京东尚科信息技术有限公司 应用程序页面跳转的方法和装置
CN112631682A (zh) * 2020-12-28 2021-04-09 北京百度网讯科技有限公司 小程序处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2012094937A1 (zh) 2012-07-19
US8375107B2 (en) 2013-02-12
CN102123168B (zh) 2012-07-18
US20120317244A1 (en) 2012-12-13

Similar Documents

Publication Publication Date Title
CN102123168B (zh) 基于中转服务器的网页页面预读及整合方法和系统
CN108363815B (zh) 一种网页页面的预读取方法、装置及智能终端设备
US10389826B2 (en) Webpage pre-reading method, apparatus and smart terminal device
CN102693271B (zh) 一种网络信息推荐方法及系统
US9524343B2 (en) Interactive web crawler
US7827191B2 (en) Discovering web-based multimedia using search toolbar data
KR101622742B1 (ko) 신디케이션에 적합한 포괄적인 온라인 랭킹 시스템 및 방법
CN101488135B (zh) 延后个性化网页的设计和获取方法
US11836167B2 (en) Search suggestions based on native application history
US20100180192A1 (en) Dynamically configuring a presentation layer associated with a webpage delivered to a client device
CN102065114A (zh) 一种移动终端访问网页的方法及装置
JP6073336B2 (ja) 履歴上のブラウジングセッション管理
CN105045864B (zh) 一种数字化资源个性化推荐方法
WO2010017434A1 (en) Dynamic portal creation based on personal usage
CN104025083A (zh) 提供网页的方法及装置
CN101777068A (zh) 一种用于移动通讯设备终端的网页页面预读及整合浏览系统及其应用方法
CN101188521B (zh) 一种挖掘用户行为数据的方法和网站服务器
RU2399090C2 (ru) Система и способ для интернет-поиска мультимедийного контента реального времени
JP2011039625A (ja) 情報検索システム及び情報検索方法
CN107436940B (zh) 基于用户信息行为分析的web前端动态展示数据的方法
Pons Object prefetching using semantic links
CN104468720A (zh) 一种确定预览链接并对其提供动态预览信息的方法
JP6691611B2 (ja) 情報処理装置、情報処理方法、プログラム、記憶媒体
CN101364220A (zh) 基于用户特性的词频库的生成方法
Pons Improving the performance of client web object retrieval

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200702

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 2, 16, 301 rooms, 510665 Yun Yun Road, Tianhe District, Guangdong, Guangzhou

Patentee before: GUANGZHOU UCWEB COMPUTER TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right