CN101488135B - 延后个性化网页的设计和获取方法 - Google Patents

延后个性化网页的设计和获取方法 Download PDF

Info

Publication number
CN101488135B
CN101488135B CN2008100430220A CN200810043022A CN101488135B CN 101488135 B CN101488135 B CN 101488135B CN 2008100430220 A CN2008100430220 A CN 2008100430220A CN 200810043022 A CN200810043022 A CN 200810043022A CN 101488135 B CN101488135 B CN 101488135B
Authority
CN
China
Prior art keywords
user
file
contents
page
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008100430220A
Other languages
English (en)
Other versions
CN101488135A (zh
Inventor
赵晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanda Computer Shanghai Co Ltd
Original Assignee
Shanda Computer Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanda Computer Shanghai Co Ltd filed Critical Shanda Computer Shanghai Co Ltd
Priority to CN2008100430220A priority Critical patent/CN101488135B/zh
Publication of CN101488135A publication Critical patent/CN101488135A/zh
Application granted granted Critical
Publication of CN101488135B publication Critical patent/CN101488135B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种延后个性化网页的设计和获取方法,其将用户访问的网页内容分为用户无关内容和用户相关内容,分别使用两种缓存:用户无关内容设计为可缓存页面;用户相关内容是将动态取得的内容输出为静态文件,在用户访问页面时,先查找本地(用户的客户端)是否有此内容,如果本地没有此内容,服务器将动态生成并传输到用户的客户端;否则询问服务器用户本地的相关内容是否已经在服务器端被修改,如果被修改则再次动态生成并传输到客户端确保最新,如没修改则仅告知用户本地该内容没有被修改,可以使用。本发明的方法通过将用户相关内容也做缓存处理,使其能从本地直接输出,而无需从服务器动态生成,故提升了个性化网站性能。

Description

延后个性化网页的设计和获取方法
技术领域
本发明涉及一种网页的设计和获取方法,特别设计一种个性化网页的设计和获取方法。 
背景技术
随着互联网的蓬勃发展及互联网用户迅速增长,网站的访问量呈几何级数增长,网站的访问速度因此逐渐变慢,网站的访问者需要长时间等待才能访问到页面,尤其对于近几年社区及论坛类型的个性化网站的日益流行,由于网站对于每个访问者都呈现不同的页面内容和展现(即个性化页面),网站需要在用户访问时实时的从数据库读取用户相关数据进行加工并传输给浏览器,这样的动态页面因为需要进行实时的数据读取、加工并通过网络传输过程,因此不但造成服务器计算资源浪费,而且造成网络带宽资源浪费,在大量用户并发访问时,会造成服务器无响应、网络拥堵、用户访问慢等问题。 
目前已有的动态页面网站基本上分为以下三种主要方式: 
1、无缓存的动态网站:在用户每次访问网页时,在服务器端都实时从数据库(或其它高速存储器,例如内存)中读取数据并加工,并将页面数据传送到用户浏览器端。 
2、页面缓存的动态网站:页面上标记过期时间或有效期时限,整个页面会被缓存在服务器和(或)用户计算机中。 
3、页面缓存和与个性化相关内容进行实时读取的网站:整个页面缓存,但页面中个性化相关内容采用无缓存动态读取。 
现有动态页面网站的缺点如下: 
1、无缓存动态网站对用户每次请求都实时数据读取、加工及传输,虽能够保证数据每次都是获取的最新数据,但事实上,网站的个性化数据都有一定的变化周期,对于没有数据变化的时间周期内,无疑造成重复数据读取、重复加工、重复传输。例如,对于“我读过的书目列表”,如果用户在一段时间没有读任何新书,那么就会造成相同的书目被重复读取、重复加工、重复传输。 
2、具有页面缓存的动态网站虽然能够避免重复数据读取、重复加工、重复传输的问题,但对于个性化相关的内容来说,用户由于访问的是被缓存的页面,则有可能访问到的是比较旧的数据,造成错误。例如,对于“我读过的书目列表”,如果用户刚刚读过一本新书,再去访问被缓存的页面,那么其中的书目列表中不包括此新书。而且对于成千上万的用户,将缓存相同数量的网页,导致空间资源浪费,并且由于这些用户的个性化内容可能随时同时更改,导致服务器在生成这些缓存页面时产生大量的IO操作,致使服务器性能下降并易出现故障。 
3、页面缓存和页面部分个性化内容实时读取的网站由于大部分内容被缓存,少量个性化内容实时读取,此方式虽减少了重复读取、重复加工、重复传输的数据量,但对于相同的用户数据仍然需要重复读取、重复加工、重复传输,同样在浪费服务器和带宽资源。例如,对于“我读过的书目列表”,如果用户长时间不读新书,那么此部分内容仍然每次需要从数据  库中读取、加工并传输到用户端。 
为了提升用户更快速的访问体验,以及让网站运营商在相同硬件及服务器软件条件下提供更大访问容量,尤其为了提升具有大量个性化内容及个性化展现的网站性能,这类网站每个用户访问到的页面内容和展现都是不同的,例如社区网站、论坛网站,其中的个性化内容都要实时获取。这样对于大型个性化网站,例如上亿用户量的网站,将耗费难以计数的服务器和带宽才能满足用户的快速访问,这无疑将大幅提高网站运营商的成本。 
发明内容
本发明要解决的技术问题是提供一种延后个性化网页的设计和获取方法,其能提升具有大量个性化内容及个性化展现的网站性能,让网站运营商在相同硬件及服务其软件条件下提供更大访问容量,及给用户更快速的访问体验。 
为解决上述技术问题,本发明的延后个性化网页的设计和获取方法,包括如下: 
(1)首先将网页的内容分为用户无关内容和用户相关内容,其中用户无关内容设计为缓存的页面,将用户相关内容为根据用户身份ID动态产生的文件,并将所述文件做本地缓存处理,同时在所述页面中包含有如何使用所述文件中数据的规则; 
(2)在用户相关内容的文件的产生过程中,在服务器端进行如下操作:判断用户对文件发出的请求头中是否含有过期标记和(或)过期时间信息,如果含有此信息则判断服务器端与用户数据中相对应的同时保存的  过期标记和(或)过期时间是否相同,相同则对此次用户请求返回没有被修改的响应,此时用户将读取本地缓存的所述文件的内容;不相同或请求头中不含有过期标记和(或)过期时间,则重新从服务器端动态获取与用户相关内容并返回给用户,并将此次获取数据所生成文件做本地缓存处理,同时在服务器端生成并保存此次获取数据所生成文件的相应过期标记和(或)过期时间; 
(3)所述页面在被用户浏览器加载完毕后,读取所述文件中的数据,并按照所述页面中的规则进行解释执行,得到个性化后的网页。 
本发明的延后个性化网页设计和获取的方法,先将网页的内容按用户无关内容和用户相关内容进行分类,并分别使用2种缓存策略进行缓存处理,同时在用户无关页面中携带有如何使用用户相关内容的规则(即如何在用户无关内容中显示用户相关内容的方法)。通过服务器端的逻辑判断,即用户发出的请求头中的过期标记和(或)过期时间信息,与用户数据相应的同时保存于服务器端的过期标记和(或)过期时间相同,则意味着与用户相关的内容没有被修改,故对用户请求返回没有被修改的响应,此时用户将直接读取本地缓存的文件,而不需要访问服务器下载该内容。同时客户端完全获取2类内容后,通过客户端程序将与用户相关内容通过与用户无关内容的缓存网页中包含的如何使用与用户相关内容的规则,将与用户相关内容展现在用户无关内容的页面上,便生成了每个用户不同的、与用户相关的个性化网页。通过上述方法,能够大规模减少服务器端数据读取及加工次数,并显著减少网络传输流量,从而在网站运营商硬件资源不变的情况下,大大提高用户的访问速度及并发访问容量。 
下面结合附图与具体实施方式对本发明作进一步详细的说明: 
图1为本发明的延后个性化网页设计和获取方法示意图。 
具体实施方式
本发明的方法,将用户访问网站时获取的内容分为两类,第一类是用户无关内容,即所有用户都将获得相同的内容;第二类是用户相关内容,即用户自身的内容,包括显示用户个人的信息,用户建立的文档等等,每个用户是不同的。在用户访问网站时,分别获取这2类内容,该2类内容分别使用以下2种缓存策略: 
1、用户无关内容:由于这部分内容为所有用户访问到的一样的内容,因此将该部分内容设计为可缓存页面,此页面可以被缓存在服务器、代理服务器、以及用户的客户端中。浏览器将依次按照本地(即用户的客户端)、代理服务器、服务器的顺序寻找缓存页面,当用户无法找到被缓存的且没有过期的页面时,则此页面将动态生成并被依次缓存在服务器、代理服务器以及自己的客户端中;否则直接使用缓存的页面。 
2、用户相关内容:对用户相关内容的处理是在用户访问页面时,先查找本地(用户的客户端)是否有此内容,如果本地没有此内容,服务器将动态生成并传输到用户的客户端;否则询问服务器用户本地的内容是否已经在服务器端被修改,如果被修改则再次动态生成并传输到客户端确保最新,如没修改则仅告知用户客户端该页面内容没有被修改,可以使用本地内容。 
本发明的方法将页面内容分为2类并分别做缓存处理,同时在用户无  关页面中携带有如何使用用户相关内容的规则(即如何在用户无关内容中显示用户相关内容的方法),在客户端完全获取2类内容后,通过客户端程序将用户相关内容通过此规则展现在用户无关内容的页面上,便生成了每个用户不同的、与用户相关的个性化网页。上述的规则可以是现有的将用户相关内容显示在用户无关内容的网页上的方法,例如,可以是对两个内容做逻辑运算并将运算结果进行标识的方法(如交集运算等)。 
用户无关内容的缓存策略及周期要求与现有技术中页面缓存的策略类似,本发明的方法主要强调用户相关内容的生成及缓存周期。下面结合图1用实例对本发明的方法进行具体说明(图中实箭头表示请求与响应命令,虚线框箭头表示响应数据): 
1)设计网站的网页时,将网页的内容区分为2类,一类是用户无关内容;另二类是用户相关内容。例如开发一个100本的书目排行榜,如果是被用户收藏的书,则书目前用星号“*”作为标记,对于这样一个开发需求,其中100本书的排行榜列表是用户无关内容,用户自己收藏的书目列表则是用户相关内容。 
2)将用户无关内容设计为一个可缓存的页面A,而将用户相关内容设计为一个根据用户身份ID动态产生的文件B,其中文件B的输出为一种静态文件(即将动态产生的文件B进行了缓存处理,在客户端输出静态文件)。例如可以将100本书的排行榜开发为一个缓存周期为30分钟的页面A,文件B为一个根据用户身份ID动态从数据库(或其他存储器,例如内存)获取用户收藏书目并输出为一个js文件(为静态文件中的一种),其中输出文件的类型包含但不限于js文件。 
3)动态文件B的产生过程中,在服务器端进行如下操作:判断用户对文件B发出的请求头中是否含有过期标记和(或)过期时间信息,如果含有此信息则判断服务器端与用户数据相应的同时保存的过期标记和(或)过期时间是否相同,相同则仅对此次用户请求返回没有被修改的响应,此时用户将读取本地缓存的文件B内容;不相同或请求头中不含有过期标记和(或)过期时间,则从重新动态从数据库(或其他存储器,例如内存)获取用户相关内容并返回给用户,同时在服务器端生成并保存此次获取数据所生成文件B的相应过期标记和(或)过期时间。例如当客户端请求用户书目的js文件时,如服务器端在输出js文件前,判断此次http请求头中的If-None-Match和If-Modified-Since与服务器端保存的是否一致,一致则将此次http响应状态码置为304,客户端获得此响应码后认为用户收藏书目没有被修改,客户端浏览器直接使用本地缓存的js文件;如果不一致则重新读取用户收藏书目并输出为一个js文件,同时保存这个文件的If-None-Match和If-Modified-Since信息。 
4)在页面A中包含如何使用文件B中数据的规则。例如:在本实施例中将文件B中用户收藏书目和页面A中排行榜书目做交集运算,最终在运算的结果书目前加上一个“*”号。页面A在被用户浏览器加载完毕后,读取文件B中的数据,并按照页面A中的规则进行解释执行,得到个性化后的页面C。例如,页面A的书目排行榜加载完成后,读取文件B中的用户收藏书目和页面A中排行榜书目做交集运算,即查找页面A中的书目是否也存在于文件B中,如果存在则在运算结果书目前加上一个“*”号。 
通过上述设计,本发明的方法对用户相关内容和用户无关内容都进行  了缓存,在访问时碰到被缓存过且没有过期的文件B时,直接从客户端读取本地缓存的文件B,故不会占用服务器的资源,由此将大大提升网站性能及用户访问速度。 

Claims (3)

1.一种延后个性化网页的设计和获取方法,其特征在于:
(1)将网页的内容分为用户无关内容和用户相关内容,其中用户无关内容设计为缓存的页面,将用户相关内容设计为根据用户身份ID动态产生的文件,并将所述文件做本地缓存处理,同时在所述页面中包含有如何使用所述文件中数据的规则;
(2)在用户相关内容的文件的产生过程中,在服务器端进行如下操作:判断用户对文件发出的请求头中是否含有过期标记和/或过期时间信息,如果含有此信息则判断服务器端与用户数据中相对应的同时保存的过期标记和/或过期时间是否相同,相同则对此次用户请求返回没有被修改的响应,此时用户将读取本地缓存的文件的内容;不相同或请求头中不含有过期标记和/或过期时间,则重新从服务器端动态获取与用户相关内容返回给用户,并将此次获取数据所生成文件做本地缓存处理,同时在服务器端生成并保存此次获取数据所生成文件的相应过期标记和/或过期时间;
(3)所述页面在被用户浏览器加载完毕后,读取所述文件中的数据,并按照所述页面中的规则进行解释执行,得到个性化后的网页。
2.按照权利要求1所述的延后个性化网页的设计和获取方法,其特征在于:所述用户无关内容设计为缓存的页面,被缓存在服务器、代理服务器或用户的客户端中。
3.按照权利要求1或2所述的延后个性化网页的设计和获取方法,其特征在于:所述用户相关内容为根据用户身份ID动态产生的文件,并将所述文件做本地缓存处理是指将所述文件输出为静态文件。
CN2008100430220A 2008-01-14 2008-01-14 延后个性化网页的设计和获取方法 Expired - Fee Related CN101488135B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100430220A CN101488135B (zh) 2008-01-14 2008-01-14 延后个性化网页的设计和获取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100430220A CN101488135B (zh) 2008-01-14 2008-01-14 延后个性化网页的设计和获取方法

Publications (2)

Publication Number Publication Date
CN101488135A CN101488135A (zh) 2009-07-22
CN101488135B true CN101488135B (zh) 2012-07-04

Family

ID=40891031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100430220A Expired - Fee Related CN101488135B (zh) 2008-01-14 2008-01-14 延后个性化网页的设计和获取方法

Country Status (1)

Country Link
CN (1) CN101488135B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102480397A (zh) * 2010-11-26 2012-05-30 金蝶软件(中国)有限公司 访问互联网页面的方法及设备
CN102567339A (zh) * 2010-12-09 2012-07-11 腾讯科技(深圳)有限公司 一种获取起始页的方法、装置和系统
CN102081650A (zh) * 2010-12-29 2011-06-01 上海网达软件有限公司 嵌入式平台用户界面加速显示的方法
CN102591963A (zh) * 2011-12-30 2012-07-18 奇智软件(北京)有限公司 网页内容加载控制方法及装置
CN103530292B (zh) * 2012-07-02 2016-05-25 阿里巴巴集团控股有限公司 网页显示方法和装置
CN102866898B (zh) * 2012-07-20 2016-03-30 厦门亿联网络技术股份有限公司 一种实现嵌入式设备上界面快速显示的方法
CN102930037B (zh) * 2012-11-09 2017-04-05 北京奇虎科技有限公司 页面加载方法和装置
CN103020241A (zh) * 2012-12-18 2013-04-03 网宿科技股份有限公司 基于会话的动态页面缓存方法和系统
CN104519081A (zh) * 2013-09-27 2015-04-15 阿里巴巴集团控股有限公司 一种页面访问的方法和装置
CN103763371A (zh) * 2014-01-21 2014-04-30 深圳市脉山龙信息技术股份有限公司 一种动态控制移动端应用缓存的方法
CN103793538A (zh) * 2014-03-06 2014-05-14 赛特斯信息科技股份有限公司 实现数据库宕机情况下网站服务恢复的系统及方法
CN104243582A (zh) * 2014-09-15 2014-12-24 厦门福旺达信息科技股份有限公司 一种网购平台并发访问优化装置和方法
CN105589919B (zh) * 2015-09-18 2018-01-09 广州市动景计算机科技有限公司 网页资源处理方法及装置
CN107102992A (zh) * 2016-02-19 2017-08-29 北大方正集团有限公司 一种新媒体静态发布方法及装置
CN107391168B (zh) * 2017-06-08 2018-07-03 腾讯科技(深圳)有限公司 动画加载方法和装置以及请求处理方法和装置
CN108334562A (zh) * 2018-01-09 2018-07-27 阿里巴巴集团控股有限公司 一种页面显示方法和装置
CN108415976B (zh) * 2018-02-09 2021-11-09 西安博达软件股份有限公司 基于cms系统的快速发布网站文件的方法
CN111767495A (zh) * 2019-04-01 2020-10-13 北京沃东天骏信息技术有限公司 一种合成网页的方法及系统
CN112347363A (zh) * 2020-11-18 2021-02-09 北京百家科技集团有限公司 一种页面生成方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7047485B1 (en) * 1999-11-10 2006-05-16 International Business Machines Corporation Intelligent pre-caching on a network
CN101030227A (zh) * 2007-03-13 2007-09-05 博思天地(北京)科技有限公司 一种利用记忆性缓存器显示门户主页的方法
CN101079041A (zh) * 2006-12-29 2007-11-28 腾讯科技(深圳)有限公司 一种更新动态网页的方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7047485B1 (en) * 1999-11-10 2006-05-16 International Business Machines Corporation Intelligent pre-caching on a network
CN101079041A (zh) * 2006-12-29 2007-11-28 腾讯科技(深圳)有限公司 一种更新动态网页的方法及系统
CN101030227A (zh) * 2007-03-13 2007-09-05 博思天地(北京)科技有限公司 一种利用记忆性缓存器显示门户主页的方法

Also Published As

Publication number Publication date
CN101488135A (zh) 2009-07-22

Similar Documents

Publication Publication Date Title
CN101488135B (zh) 延后个性化网页的设计和获取方法
CN100424694C (zh) 一种网络收藏夹的实现方法
CA2786708C (en) Scalable topical aggregation of data feeds
WO2015196907A1 (zh) 一种挖掘用户需求的搜索推送方法和装置
Chitraa et al. A novel technique for sessions identification in web usage mining preprocessing
US20090006442A1 (en) Enhanced browsing experience in social bookmarking based on self tags
CN103530292B (zh) 网页显示方法和装置
CN102123168A (zh) 基于中转服务器的网页页面预读及整合方法和系统
CN101583072A (zh) 一种用于实现Mobile Internet的中间件产品及其方法
CN111259220B (zh) 一种基于大数据的数据采集方法和系统
CN109634753B (zh) 切换浏览器内核的数据处理方法、装置、终端和存储介质
CN107291940A (zh) 页面内容管理方法、装置及相关服务器
CN101188521B (zh) 一种挖掘用户行为数据的方法和网站服务器
CN1960371A (zh) 一种访问Web应用程序文件的方法及系统
CN104468720A (zh) 一种确定预览链接并对其提供动态预览信息的方法
Jarukasemratana et al. Web caching replacement algorithm based on web usage data
Liu et al. A framework to compute page importance based on user behaviors
CN103823805B (zh) 基于社区的相关帖推荐系统及推荐方法
Langhnoja et al. Web usage mining to discover visitor group with common behavior using DBSCAN clustering algorithm
CN109002495A (zh) 数据存储方法和装置
JP2000227886A (ja) 情報源観測装置および情報源観測方法ならびに情報源観測処理を実行させるプログラムを記録した記録媒体
Maratea et al. An heuristic approach to page recommendation in web usage mining
KR101498920B1 (ko) 오프라인 실행을 위한 웹 페이지 사전 캐싱 시스템 및 방법
Babu Relevance of Search Engine Optimization in Promoting Online Business
Jyoti et al. A Novel Approach for clustering web user sessions using RST

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704

Termination date: 20200114

CF01 Termination of patent right due to non-payment of annual fee