CN101488135B

CN101488135B - 延后个性化网页的设计和获取方法

Info

Publication number: CN101488135B
Application number: CN2008100430220A
Authority: CN
Inventors: 赵晨
Original assignee: Shanda Computer Shanghai Co Ltd
Current assignee: Shanda Computer Shanghai Co Ltd
Priority date: 2008-01-14
Filing date: 2008-01-14
Publication date: 2012-07-04
Anticipated expiration: 2028-01-14
Also published as: CN101488135A

Abstract

本发明公开了一种延后个性化网页的设计和获取方法，其将用户访问的网页内容分为用户无关内容和用户相关内容，分别使用两种缓存：用户无关内容设计为可缓存页面；用户相关内容是将动态取得的内容输出为静态文件，在用户访问页面时，先查找本地(用户的客户端)是否有此内容，如果本地没有此内容，服务器将动态生成并传输到用户的客户端；否则询问服务器用户本地的相关内容是否已经在服务器端被修改，如果被修改则再次动态生成并传输到客户端确保最新，如没修改则仅告知用户本地该内容没有被修改，可以使用。本发明的方法通过将用户相关内容也做缓存处理，使其能从本地直接输出，而无需从服务器动态生成，故提升了个性化网站性能。

Description

延后个性化网页的设计和获取方法

技术领域

本发明涉及一种网页的设计和获取方法，特别设计一种个性化网页的设计和获取方法。

背景技术

随着互联网的蓬勃发展及互联网用户迅速增长，网站的访问量呈几何级数增长，网站的访问速度因此逐渐变慢，网站的访问者需要长时间等待才能访问到页面，尤其对于近几年社区及论坛类型的个性化网站的日益流行，由于网站对于每个访问者都呈现不同的页面内容和展现(即个性化页面)，网站需要在用户访问时实时的从数据库读取用户相关数据进行加工并传输给浏览器，这样的动态页面因为需要进行实时的数据读取、加工并通过网络传输过程，因此不但造成服务器计算资源浪费，而且造成网络带宽资源浪费，在大量用户并发访问时，会造成服务器无响应、网络拥堵、用户访问慢等问题。

目前已有的动态页面网站基本上分为以下三种主要方式：

1、无缓存的动态网站：在用户每次访问网页时，在服务器端都实时从数据库(或其它高速存储器，例如内存)中读取数据并加工，并将页面数据传送到用户浏览器端。

2、页面缓存的动态网站：页面上标记过期时间或有效期时限，整个页面会被缓存在服务器和(或)用户计算机中。

3、页面缓存和与个性化相关内容进行实时读取的网站：整个页面缓存，但页面中个性化相关内容采用无缓存动态读取。

现有动态页面网站的缺点如下：

1、无缓存动态网站对用户每次请求都实时数据读取、加工及传输，虽能够保证数据每次都是获取的最新数据，但事实上，网站的个性化数据都有一定的变化周期，对于没有数据变化的时间周期内，无疑造成重复数据读取、重复加工、重复传输。例如，对于“我读过的书目列表”，如果用户在一段时间没有读任何新书，那么就会造成相同的书目被重复读取、重复加工、重复传输。

2、具有页面缓存的动态网站虽然能够避免重复数据读取、重复加工、重复传输的问题，但对于个性化相关的内容来说，用户由于访问的是被缓存的页面，则有可能访问到的是比较旧的数据，造成错误。例如，对于“我读过的书目列表”，如果用户刚刚读过一本新书，再去访问被缓存的页面，那么其中的书目列表中不包括此新书。而且对于成千上万的用户，将缓存相同数量的网页，导致空间资源浪费，并且由于这些用户的个性化内容可能随时同时更改，导致服务器在生成这些缓存页面时产生大量的IO操作，致使服务器性能下降并易出现故障。

3、页面缓存和页面部分个性化内容实时读取的网站由于大部分内容被缓存，少量个性化内容实时读取，此方式虽减少了重复读取、重复加工、重复传输的数据量，但对于相同的用户数据仍然需要重复读取、重复加工、重复传输，同样在浪费服务器和带宽资源。例如，对于“我读过的书目列表”，如果用户长时间不读新书，那么此部分内容仍然每次需要从数据库中读取、加工并传输到用户端。

为了提升用户更快速的访问体验，以及让网站运营商在相同硬件及服务器软件条件下提供更大访问容量，尤其为了提升具有大量个性化内容及个性化展现的网站性能，这类网站每个用户访问到的页面内容和展现都是不同的，例如社区网站、论坛网站，其中的个性化内容都要实时获取。这样对于大型个性化网站，例如上亿用户量的网站，将耗费难以计数的服务器和带宽才能满足用户的快速访问，这无疑将大幅提高网站运营商的成本。

发明内容

本发明要解决的技术问题是提供一种延后个性化网页的设计和获取方法，其能提升具有大量个性化内容及个性化展现的网站性能，让网站运营商在相同硬件及服务其软件条件下提供更大访问容量，及给用户更快速的访问体验。

为解决上述技术问题，本发明的延后个性化网页的设计和获取方法，包括如下：

(1)首先将网页的内容分为用户无关内容和用户相关内容，其中用户无关内容设计为缓存的页面，将用户相关内容为根据用户身份ID动态产生的文件，并将所述文件做本地缓存处理，同时在所述页面中包含有如何使用所述文件中数据的规则；

(2)在用户相关内容的文件的产生过程中，在服务器端进行如下操作：判断用户对文件发出的请求头中是否含有过期标记和(或)过期时间信息，如果含有此信息则判断服务器端与用户数据中相对应的同时保存的过期标记和(或)过期时间是否相同，相同则对此次用户请求返回没有被修改的响应，此时用户将读取本地缓存的所述文件的内容；不相同或请求头中不含有过期标记和(或)过期时间，则重新从服务器端动态获取与用户相关内容并返回给用户，并将此次获取数据所生成文件做本地缓存处理，同时在服务器端生成并保存此次获取数据所生成文件的相应过期标记和(或)过期时间；

(3)所述页面在被用户浏览器加载完毕后，读取所述文件中的数据，并按照所述页面中的规则进行解释执行，得到个性化后的网页。

本发明的延后个性化网页设计和获取的方法，先将网页的内容按用户无关内容和用户相关内容进行分类，并分别使用2种缓存策略进行缓存处理，同时在用户无关页面中携带有如何使用用户相关内容的规则(即如何在用户无关内容中显示用户相关内容的方法)。通过服务器端的逻辑判断，即用户发出的请求头中的过期标记和(或)过期时间信息，与用户数据相应的同时保存于服务器端的过期标记和(或)过期时间相同，则意味着与用户相关的内容没有被修改，故对用户请求返回没有被修改的响应，此时用户将直接读取本地缓存的文件，而不需要访问服务器下载该内容。同时客户端完全获取2类内容后，通过客户端程序将与用户相关内容通过与用户无关内容的缓存网页中包含的如何使用与用户相关内容的规则，将与用户相关内容展现在用户无关内容的页面上，便生成了每个用户不同的、与用户相关的个性化网页。通过上述方法，能够大规模减少服务器端数据读取及加工次数，并显著减少网络传输流量，从而在网站运营商硬件资源不变的情况下，大大提高用户的访问速度及并发访问容量。

下面结合附图与具体实施方式对本发明作进一步详细的说明：

图1为本发明的延后个性化网页设计和获取方法示意图。

具体实施方式

本发明的方法，将用户访问网站时获取的内容分为两类，第一类是用户无关内容，即所有用户都将获得相同的内容；第二类是用户相关内容，即用户自身的内容，包括显示用户个人的信息，用户建立的文档等等，每个用户是不同的。在用户访问网站时，分别获取这2类内容，该2类内容分别使用以下2种缓存策略：

1、用户无关内容：由于这部分内容为所有用户访问到的一样的内容，因此将该部分内容设计为可缓存页面，此页面可以被缓存在服务器、代理服务器、以及用户的客户端中。浏览器将依次按照本地(即用户的客户端)、代理服务器、服务器的顺序寻找缓存页面，当用户无法找到被缓存的且没有过期的页面时，则此页面将动态生成并被依次缓存在服务器、代理服务器以及自己的客户端中；否则直接使用缓存的页面。

2、用户相关内容：对用户相关内容的处理是在用户访问页面时，先查找本地(用户的客户端)是否有此内容，如果本地没有此内容，服务器将动态生成并传输到用户的客户端；否则询问服务器用户本地的内容是否已经在服务器端被修改，如果被修改则再次动态生成并传输到客户端确保最新，如没修改则仅告知用户客户端该页面内容没有被修改，可以使用本地内容。

本发明的方法将页面内容分为2类并分别做缓存处理，同时在用户无关页面中携带有如何使用用户相关内容的规则(即如何在用户无关内容中显示用户相关内容的方法)，在客户端完全获取2类内容后，通过客户端程序将用户相关内容通过此规则展现在用户无关内容的页面上，便生成了每个用户不同的、与用户相关的个性化网页。上述的规则可以是现有的将用户相关内容显示在用户无关内容的网页上的方法，例如，可以是对两个内容做逻辑运算并将运算结果进行标识的方法(如交集运算等)。

用户无关内容的缓存策略及周期要求与现有技术中页面缓存的策略类似，本发明的方法主要强调用户相关内容的生成及缓存周期。下面结合图1用实例对本发明的方法进行具体说明(图中实箭头表示请求与响应命令，虚线框箭头表示响应数据)：

1)设计网站的网页时，将网页的内容区分为2类，一类是用户无关内容；另二类是用户相关内容。例如开发一个100本的书目排行榜，如果是被用户收藏的书，则书目前用星号“*”作为标记，对于这样一个开发需求，其中100本书的排行榜列表是用户无关内容，用户自己收藏的书目列表则是用户相关内容。

2)将用户无关内容设计为一个可缓存的页面A，而将用户相关内容设计为一个根据用户身份ID动态产生的文件B，其中文件B的输出为一种静态文件(即将动态产生的文件B进行了缓存处理，在客户端输出静态文件)。例如可以将100本书的排行榜开发为一个缓存周期为30分钟的页面A，文件B为一个根据用户身份ID动态从数据库(或其他存储器，例如内存)获取用户收藏书目并输出为一个js文件(为静态文件中的一种)，其中输出文件的类型包含但不限于js文件。

3)动态文件B的产生过程中，在服务器端进行如下操作：判断用户对文件B发出的请求头中是否含有过期标记和(或)过期时间信息，如果含有此信息则判断服务器端与用户数据相应的同时保存的过期标记和(或)过期时间是否相同，相同则仅对此次用户请求返回没有被修改的响应，此时用户将读取本地缓存的文件B内容；不相同或请求头中不含有过期标记和(或)过期时间，则从重新动态从数据库(或其他存储器，例如内存)获取用户相关内容并返回给用户，同时在服务器端生成并保存此次获取数据所生成文件B的相应过期标记和(或)过期时间。例如当客户端请求用户书目的js文件时，如服务器端在输出js文件前，判断此次http请求头中的If-None-Match和If-Modified-Since与服务器端保存的是否一致，一致则将此次http响应状态码置为304，客户端获得此响应码后认为用户收藏书目没有被修改，客户端浏览器直接使用本地缓存的js文件；如果不一致则重新读取用户收藏书目并输出为一个js文件，同时保存这个文件的If-None-Match和If-Modified-Since信息。

4)在页面A中包含如何使用文件B中数据的规则。例如：在本实施例中将文件B中用户收藏书目和页面A中排行榜书目做交集运算，最终在运算的结果书目前加上一个“*”号。页面A在被用户浏览器加载完毕后，读取文件B中的数据，并按照页面A中的规则进行解释执行，得到个性化后的页面C。例如，页面A的书目排行榜加载完成后，读取文件B中的用户收藏书目和页面A中排行榜书目做交集运算，即查找页面A中的书目是否也存在于文件B中，如果存在则在运算结果书目前加上一个“*”号。

通过上述设计，本发明的方法对用户相关内容和用户无关内容都进行了缓存，在访问时碰到被缓存过且没有过期的文件B时，直接从客户端读取本地缓存的文件B，故不会占用服务器的资源，由此将大大提升网站性能及用户访问速度。

Claims

1.一种延后个性化网页的设计和获取方法，其特征在于：

(1)将网页的内容分为用户无关内容和用户相关内容，其中用户无关内容设计为缓存的页面，将用户相关内容设计为根据用户身份ID动态产生的文件，并将所述文件做本地缓存处理，同时在所述页面中包含有如何使用所述文件中数据的规则；

(2)在用户相关内容的文件的产生过程中，在服务器端进行如下操作：判断用户对文件发出的请求头中是否含有过期标记和/或过期时间信息，如果含有此信息则判断服务器端与用户数据中相对应的同时保存的过期标记和/或过期时间是否相同，相同则对此次用户请求返回没有被修改的响应，此时用户将读取本地缓存的文件的内容；不相同或请求头中不含有过期标记和/或过期时间，则重新从服务器端动态获取与用户相关内容返回给用户，并将此次获取数据所生成文件做本地缓存处理，同时在服务器端生成并保存此次获取数据所生成文件的相应过期标记和/或过期时间；

2.按照权利要求1所述的延后个性化网页的设计和获取方法，其特征在于：所述用户无关内容设计为缓存的页面，被缓存在服务器、代理服务器或用户的客户端中。

3.按照权利要求1或2所述的延后个性化网页的设计和获取方法，其特征在于：所述用户相关内容为根据用户身份ID动态产生的文件，并将所述文件做本地缓存处理是指将所述文件输出为静态文件。