CN103793428B - 网页摘要信息的生成方法和装置 - Google Patents
网页摘要信息的生成方法和装置 Download PDFInfo
- Publication number
- CN103793428B CN103793428B CN201210430025.6A CN201210430025A CN103793428B CN 103793428 B CN103793428 B CN 103793428B CN 201210430025 A CN201210430025 A CN 201210430025A CN 103793428 B CN103793428 B CN 103793428B
- Authority
- CN
- China
- Prior art keywords
- information
- webpage
- web page
- abstract information
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000000694 effects Effects 0.000 claims abstract description 8
- 238000012986 modification Methods 0.000 abstract description 6
- 230000004048 modification Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 7
- 238000012423 maintenance Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/986—Document structures and storage, e.g. HTML extensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开了一种网页摘要信息的生成方法和装置,其中,该方法包括:网页摘要信息服务器接收来自网站应用服务器的请求信息,其中,请求信息包括用于唯一标识网页的标识信息和用于生成网页摘要信息的参数;网页摘要信息服务器将网页摘要信息样式发送给网站应用服务器,以使网站应用服务器根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成最终网页对应的网页摘要信息。本申请解决了现有技术中网页摘要信息被硬编码在网站应用服务器的代码中,从而造成的网页摘要信息容易被篡改,对摘要信息的修改较为复杂的技术问题,达到了提高维护摘要信息的灵活性和保证摘要信息的准确性的技术效果。
Description
技术领域
本申请涉及互联网领域,具体而言,涉及一种网页摘要信息的生成方法和装置。
背景技术
Meta标签是一个网站的html代码中很重要的组成部分,Meta标签虽然不作为网页设计的一部分展示出来,然而它们会被搜索引擎所读取,通常它们包含对网页内容的简洁描述,一般包含一些关键词或者是关键信息,就相当于这个网页的一个摘要信息。Meta信息是否能真实地反映网页内容的主要信息从一定程度上会影响网站的用户体验。
目前,Meta标签一般都包含在网页html代码的<head>和</head>之间,主要包括以下几个标签内容:title、description、keywords以及robot tag等。举例而言对于如下的一段代码:
在<head>和</head>之间的就是Meta标签,即该网页对应的网页摘要信息。
相关技术中,最常见的技术就是将Meta标签以硬编码或者半硬编码的方式嵌入到html代码中。下面对硬编码和半硬编码进行详细的描述。
硬编码的方式,就是直接将Meta标签内容固定地写死在html代码中,所有网站用户访问该页面看到的结果都是一样的。很多网站的首页的Meta标签信息都是采用硬编码的方式进行编辑的。
半硬编码的方式,就是提取出Meta信息相同的内容,然后按照用户的查询条件的不同展示不同的Meta标签信息。例如,当用户在某个网站上搜索mp3时,看到的结果html代码中Meta标签部分的内容为:
当用户在该网站上搜索apple时,看到的html代码中的Meta标签部分的内容为:
即,半硬编码的方式也被写在了html代码中,在展示的时候,仅是里面对应着搜索词的部分的信息改变了,其它部分的内容是完全相同的。
然而,对于上述两种方式,主要存在以下两个问题:
1)Meta标签的文本信息都是直接分散在各个代码模块中的,即,每个代码模块中都存储有自身所对应的Meta信息,以及其它的代码信息,并没有将Meta信息和其他的网页代码有效地区分开。这样在对其它代码进行更改时,就有可能导致相应的Meta信息被篡改。同样的,在对Meta信息进行修改时,也可能会产生误操作,修改了其它的网页代码,因此,在对Meta信息进行维护时维护的难度比较大,降低了对Meta信息进行修改时的修改效率和准确性。
2)对于上述的两种方式,Meta信息与应用是耦合在一起的,对于Meta信息的修改必须要等到应用发布到生产环境之后才能使得修改的Meta信息生效,即,只有该修改后的Meta信息对应的代码在应用中被执行,该Meta信息对应的修改内容才能生效,修改的实时性较低。
针对上述问题,尚未提出有效的解决方法。
发明内容
本申请提供了一种网页摘要信息的生成方法和装置,以至少解决现有技术中网页摘要信息被硬编码在网站应用服务器的代码中而造成的网页摘要信息容易被篡改、对网页摘要信息的修改较为复杂的技术问题。
根据本申请的一个方面,提供了一种网页摘要信息的生成方法,包括:网页摘要信息服务器接收来自网站应用服务器的请求信息,其中,上述请求信息包括用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,上述请求信息包括:用于唯一标识网页的标识信息;上述网页摘要信息服务器查找与上述标识信息对应的网页摘要信息样式,其中,上述网页摘要信息样式中包括一个或多个用于表示与上述网页对应的网页摘要信息的变量;上述网页摘要信息服务器根据上述参数对上述网页摘要信息样式中对应的上述变量进行赋值替换以生成上述网页对应的网页摘要信息,并将上述生成的上述网页摘要信息发送给上述网站应用服务器,或者,上述网页摘要信息服务器将上述网页摘要信息样式发送给上述网站应用服务器,以使上述网站应用服务器根据上述参数对上述网页摘要信息样式中对应的上述变量进行赋值替换以生成上述网页对应的网页摘要信息。
优选地,在上述网页摘要信息服务器接收来自网站应用服务器的请求信息之前,上述方法还包括:上述网页摘要信息服务器根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。
优选地,上述网页摘要信息服务器查找与上述标识信息对应的网页摘要信息样式的步骤包括:上述网页摘要信息服务器查找在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式。
优选地,上述网页摘要信息服务器查找在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式的步骤包括:上述网页摘要信息服务器判断查找到的与上述标识信息对应的网页摘要信息样式是否包括生效时间段;若包括上述生效时间段,则判断上述请求信息的接收时间是否位于上述生效时间段内,若位于上述生效时间段内,则将查找到的上述网页摘要信息样式作为在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式;若不包括上述生效时间段,则将查找到的上述网页摘要信息样式作为在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式。
优选地,在上述网页摘要信息服务器将上述网页摘要信息样式发送给上述网站应用服务器之后,上述方法还包括:上述网站应用服务器从缓存中读取上述用于生成网页摘要信息的参数,并根据上述参数对上述网页摘要信息样式中对应的上述变量进行赋值替换以生成上述网页对应的网页摘要信息。
优选地,上述网页摘要信息样式包括:用于唯一标识网页的第一变量,用于表示网页标题的第二变量,用于表示网页关键词的第三变量,用于表示网页内容的第四变量,用于表示生效时间段的第五变量;上述网页摘要信息包括:Meta信息,其中,上述Meta信息包括:与上述第二变量对应的用于表示网页标题的参数,与上述第三变量对应的用于表示网页关键词的参数,与上述第四变量对应的用于表示网页内容的参数。
根据本申请的另一方面,提供了一种网页摘要信息的生成装置,包括:接收单元,用于接收来自网站应用服务器的请求信息,其中,上述请求信息包括用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,上述请求信息包括:用于唯一标识网页的标识信息;查找单元,用于查找与上述标识信息对应的网页摘要信息样式,其中,上述网页摘要信息样式中包括一个或多个用于表示与上述网页对应的网页摘要信息的变量;生成单元,用于根据上述参数对上述网页摘要信息样式中对应的上述变量进行赋值替换以生成上述网页对应的网页摘要信息,并将上述生成的上述网页摘要信息发送给上述网站应用服务器;或者,发送单元,用于将上述网页摘要信息样式发送给上述网站应用服务器,以使上述网站应用服务器根据上述参数对上述网页摘要信息样式中对应的上述变量进行赋值替换以生成上述网页对应的网页摘要信息。
优选地,上述装置还包括:设置单元,用于在上述网页摘要信息服务器接收来自网站应用服务器的请求信息之前,根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。
优选地,上述查找单元包括:查找模块,用于查找在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式。
优选地,上述查找模块包括:第一判断子模块,用于判断查找到的与上述标识信息对应的网页摘要信息样式是否包括生效时间段;第二判断子模块,用于在判断出包括上述生效时间段的情况下,判断上述请求信息的接收时间是否位于上述生效时间段内,若位于上述生效时间段内,则将查找到的上述网页摘要信息样式作为在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式;生成子模块,用于在判断出不包括上述生效时间段的情况下,将查找到的上述网页摘要信息样式作为在与上述请求信息的接收时间对应的时间段内生效的、且与上述标识信息对应的网页摘要信息样式。
在本申请中,将网页摘要信息样式存储在了网页摘要信息服务器中,网站应用服务器只需要向网页摘要信息服务器发送一个携带有样式标识的请求消息,就可以获取到相应的摘要信息样式或者是一个完整的摘要信息,从而解决了现有技术中网页摘要信息被硬编码在网站应用服务器的代码中,在对其它代码进行更改时容易造成网页摘要信息被篡改,以及对摘要信息的修改较为复杂的技术问题,达到了提高摘要信息的维护效率和保证摘要信息的准确性的技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的摘要信息的生成系统的一种优选结构框图;
图2是根据本申请实施例的摘要信息的生成装置的一种优选结构框图;
图3是根据本申请实施例的摘要信息的生成装置的另一种优选结构框图;
图4是根据本申请实施例的摘要信息的生成装置的又一种优选结构框图;
图5是根据本申请实施例的摘要信息的生成装置的又一种优选结构框图;
图6是根据本申请实施例的摘要信息的生成方法的一种优选流程图;
图7是根据本申请实施例的摘要信息的生成方法的另一种优选流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在描述本申请的各实施例的进一步细节之前,将参考图1来描述可用于实现本申请的原理的一个合适的计算体系结构。在以下描述中,除非另外指明,否则将参考由一个或多个计算机执行的动作和操作的符号表示来描述本申请的各实施例。由此,可以理解,有时被称为计算机执行的这类动作和操作包括计算机的处理单元对以结构化形式表示数据的电信号的操纵。这一操纵转换了数据或在计算机的存储器系统中的位置上维护它,这以本领域的技术人员都理解的方式重配置或改变了计算机的操作。维护数据的数据结构是具有数据的格式所定义的特定属性的存储器的物理位置。然而,尽管在上述上下文中描述本申请,但它并不意味着限制性的,如本领域的技术人员所理解的,后文所描述的动作和操作的各方面也可用硬件来实现。
转向附图,其中相同的参考标号指代相同的元素,本申请的原理被示为在一个合适的计算环境中实现。以下描述基于所述的本申请的实施例,并且不应认为是关于此处未明确描述的替换实施例而限制本申请。
图1示出了可用于这些设备的一个示例计算机体系结构的示意图。出于描述的目的,所绘的体系结构仅为合适环境的一个示例,并非对本申请的使用范围或功能提出任何局限。也不应将该计算系统解释为对图1所示的任一组件或其组合具有任何依赖或需求。
本申请的原理可以使用其它通用或专用计算或通信环境或配置来操作。适用于本申请的众所周知的计算系统、环境和配置的示例包括但不限于,个人计算机、服务器,多处理器系统、基于微处理的系统、小型机、大型计算机、以及包括任一上述系统或设备的分布式计算环境。
在其最基本的配置中,图1中的网页摘要信息的生成系统100至少包括:一个网页摘要信息服务器102以及一个或多个网站应用服务器104。网页摘要信息服务器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置、用于存储数据的存储装置以及与客户端通信的传输装置;网站应用服务器104可以包括:微处理器MCU、与服务器通信的传输装置、与用户交互的显示装置。在本说明书和权利要求书中,“系统”也可以被定义为能够执行软件、固件或微码来实现功能的任何硬件组件或硬件组件的组合网页摘要信息的生成系统100甚至可以是分布式的,以实现分布式功能。
如本申请所使用的,术语“模块”、“组件”或“单元”可以指在网页摘要信息的生成系统100上执行的软件对象或例程。此处所描述的不同组件、模块、单元、引擎和服务可被实现为在网页摘要信息的生成系统100上执行(例如,作为单独的线程)的对象或进程。尽管此处所描述的系统和方法较佳地以软件来实现,但是硬件或软件和硬件的组合的实现也是可能并被构想的。
实施例1
图2是根据本申请实施例网页摘要信息的生成装置的一种优选的结构示意图,优选的,本实施例中的装置位于网页摘要信息服务器102上。
优选的,如图2所示的网页摘要信息的生成装置200可以包括:接收单元202、查找单元204、生成单元206、以及发送单元208,下面对这几个结构进行具体的描述。
1)接收单元202,用于接收来自网站应用服务器的请求信息,其中,请求信息包括但不仅限于用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,请求信息中也可以仅携带有用于唯一标识网页的标识信息,而不携带用于生成网页摘要信息的参数;
即,在本实施例中新增了一个专门用于对网页摘要信息(即上文的Mate标签)进行集中管理的服务器:网页摘要信息服务器。当网站应用服务器需要获取摘要信息时,仅需要向网页摘要服务器发送相应的请求消息,在里面携带一定的标识信息即可,这样网页摘要信息服务器就会进行相应的处理,返回对应的网页摘要信息样式或者是返回完整的网页摘要信息。其中,所述网页摘要信息服务器和网站应用服务器可以是物理上相互独立的两台或多台服务器,也可以是一台服务器中的具有各自功能的应用程序或模块。本申请对此并不做限定。
2)查找单元204,与接收单元202耦合,用于查找与标识信息对应的网页摘要信息样式,其中,网页摘要信息样式中包括一个或多个用于表示与网页对应的网页摘要信息的变量;
在网页摘要服务器中存储了很多网页摘要信息的样式,所谓的样式就是一些框架,其中包含很多未被赋值的变量。只需要为这些样式中的变量赋予不同的值也就可以得到不同的摘要信息。同时,将摘要信息的样式都放在了网页摘要信息服务器侧,实现了网页摘要信息的统一管理,同时也就将网页摘要信息和其它的网页代码分离开了,对摘要信息的样式的改变或者是对其中变量的参数的改变也都不会影响网页代码中的非摘要信息代码。
例如,在网页摘要信息样式中可以但不限于包括以下至少之一:用于唯一标识网页的第一变量(pageid),用于表示网页标题的第二变量(title pattern),用于表示网页关键词的第三变量(keyword pattern),用于表示网页内容的第四变量(descriptionpattern),用于表示生效时间段的第五变量(Effective Time);相应的网页摘要信息就包括:Meta信息(即,最终生成的网页摘要信息中的参数信息),其中,Meta信息包括:与第二变量对应的用于表示网页标题的参数,与第三变量对应的用于表示网页关键词的参数,与第四变量对应的用于表示网页内容的参数。
举例而言,对于每一个网页摘要信息样式(Meta pattern)可以是网页摘要信息服务器(也可以称之为Meta仓库)中最小可用单位,可以采用以下的结构来标识一个网页摘要信息的样式的相关内容:(pageid,title pattern,keyword pattern,descriptionpattern)
其中,pageid用于标识该网页摘要信息样式,一个样式唯一对应一个pageid,该字段的类型可以为一串字符。优选的,可以为每种网页页面类型定义一个或多个样式。例如以某个购物网站为例,其对应的网页页面类型可以有:网站首页、网站的搜索列表页面、产品的详细描述页面。这样就可以分别为网站首页、网站的搜索列表页面、产品的详细描述页面定义一些样式以供选择。
对于上述的Title pattern、keyword pattern以及description pattern所对应的字段中就有预先设定好的变量,这些变量所对应的具体的值在网站应用服务器请求网页摘要信息时通过网站应用服务器传递的参数进行替换。
例如,对于下面的网页摘要信息:
{Keyword}Manufacturers &{keyword}Suppliers Directory-Find a{keyword}Manufacturer and Supplier in{category}.Choose Quality{country}Manufacturers,Suppliers,Exporters at Alibaba.com.
其中,keyword为用户参数中的关键词,category为用户参数中的类目,country为用户参数中的国家。对于这些内容都是可以替换的变量,网页摘要信息服务器或者是网站应用服务器就可以利用参数对其进行替换以生成所希望的网页最终摘要信息。
3)生成单元206,与查找单元204耦合,用于根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息,并将生成的网页摘要信息发送给网站应用服务器;或者,
4)发送单元208,与查找单元204耦合,用于将网页摘要信息样式发送给网站应用服务器,以使网站应用服务器根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
即,在上述实施例中提供了两种生成网页摘要信息的方式:
1)网页摘要信息在网页摘要信息服务器侧生成:网站应用服务器需要在请求消息中携带相应的摘要信息的变量所对应的参数,摘要信息服务器根据这些参数生成网页摘要信息之后,就可以将完整的网页摘要信息返回给网站应用服务器;
2)网页摘要信息在网站应用服务器侧生成:网站应用服务器仅需要在请求消息中携带用于指示网页摘要信息样式的指示信息即可,而无需携带相应的参数,网页摘要信息服务器在获取到请求消息时向网站应用服务器返回相应的网页摘要信息样式即可,网站应用服务器在根据返回的网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
优选地,上述生成的网页摘要信息,可以是该网页最终的摘要信息,即,最终用于展示的网页摘要信息。
在上述优选实施方式中,将网页摘要信息样式存储在了网页摘要信息服务器中,网站应用服务器只需要向网页摘要信息服务器发送一个携带有样式标识的请求消息,就可以获取到相应的摘要信息样式或者是一个完整的摘要信息,从而解决了现有技术中网页摘要信息被硬编码在网站应用服务器的代码中,在对其它代码进行更改时容易造成网页摘要信息被篡改,以及对摘要信息的修改较为复杂的技术问题,达到了提高摘要信息的维护效率和保证摘要信息的准确性的技术效果。
对于网页摘要信息服务器中的存储的网页摘要信息样式需要是预先录入的或者是根据获取的配置信息配置生成的。在一个优选实施方式,如图3所示,上述网页摘要信息的生成装置还包括:设置单元302,与网站应用服务器104耦合,用于在网页摘要信息服务器接收来自网站应用服务器的请求信息之前,根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。优选地,可以以SEO友好的方式设置不同网页对应的网页摘要信息样式。例如,先确定一个网页摘要信息样式标识,用于标识该网页摘要信息样式所对应的页面ID(pageid),然后在定义该样式中title、keyword以及description元素所对应的字段内容,从而生成一个网页摘要信息样式。
优选地,可以为每个网页摘要信息样式定义一个生效时间,即,在该网页摘要信息样式对应的生效时间内进行的请求才会显示该网页摘要信息样式。例如,快到圣诞节了,可以定义一个在圣诞节前后使用的网页摘要信息样式,即,只有在设定的圣诞节的那几天进行请求时才会返回该圣诞节样式。在一个优选实施方式中,如图4所示,查找单元包括:查找模块402,用于查找在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式。
考虑到有时候仅需要对一些特定的网页摘要信息样式定义生效时间,对于生效时间这个信息也就不需要对每个网页摘要信息样式都设定,因此,对于一些没有生效时间的样式可以不考虑生效时间直接进行返回。在一个优选实施方式中,如图5所示,上述查找模块包括:第一判断子模块502,用于判断查找到的与标识信息对应的网页摘要信息样式是否包括生效时间段;第二判断子模块504,用于在判断出包括生效时间段的情况下,判断请求信息的接收时间是否位于生效时间段内,若位于生效时间段内,则将查找到的网页摘要信息样式作为在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式;生成子模块506,用于在判断出不包括生效时间段的情况下,将查找到的网页摘要信息样式作为在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式。即,先判断被请求的摘要信息样式中是否有用于标识生效时间的字段,如果有,就按照生效时间进行返回,如果没有,直接返回即可。
在上述各个优选实施方式中,网站应用服务器可以将网页摘要信息与网页一起进行展示。优选地,为了可以快速展示,网站应用服务器可以先将生成的或者是获取的网页摘要信息样式或者是网页摘要信息保存在本地的缓存中,在需要展示的时候可以快速获取并进行展示,从而提高了展示的效率。因在上述介绍时已经提及,可以由网站应用服务器自己生成最终的网页摘要信息,网页摘要信息服务器只需要向网站应用服务器返回请求的网页摘要信息样式即可。在一个优选实施方式中,网站应用服务器从缓存中读取用于生成网页摘要信息的参数,并根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
实施例2
在图1-图5所示的网页摘要信息的生成系统和装置的基础上,本申请提供了一种优选的网页摘要信息的生成方法。如图6所示,该方法可以包括如下步骤:
步骤S602:网页摘要信息服务器接收来自网站应用服务器的请求信息,其中,请求信息包括但不仅限于用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,请求信息中也可以仅携带有用于唯一标识网页的标识信息,而不携带用于生成网页摘要信息的参数;
即,在本实施例中新增了一个专门用于对网页摘要信息(即上文的Mate标签)进行集中管理的服务器:网页摘要信息服务器。当网站应用服务器需要获取摘要信息时,仅需要向网页摘要服务器发送相应的请求消息,在里面携带一定的标识信息即可,这样网页摘要信息服务器就会进行相应的处理,返回对应的网页摘要信息样式或者是返回完整的网页摘要信息。
步骤S604:网页摘要信息服务器查找与标识信息对应的网页摘要信息样式,其中,网页摘要信息样式中包括一个或多个用于表示与网页对应的网页摘要信息的变量;
在网页摘要服务器中存储了很多网页摘要信息的样式,所谓的样式就是一些框架,其中包含很多未被赋值的变量。只需要为这些样式中的变量赋予不同的值也就可以得到不同的摘要信息。同时,将摘要信息的样式都放在了网页摘要信息服务器侧,实现了网页摘要信息的统一管理,同时也就将网页摘要信息和其它的网页代码分离开了,对摘要信息的样式的改变或者是对其中变量的参数的改变也都不会影响网页代码中的非摘要信息代码。
例如,在网页摘要信息样式中可以但不限于包括以下至少之一:用于唯一标识网页的第一变量(pageid),用于表示网页标题的第二变量(title pattern),用于表示网页关键词的第三变量(keyword pattern),用于表示网页内容的第四变量(descriptionpattern),用于表示生效时间段的第五变量(Effective Time);相应的网页摘要信息就包括:Meta信息(即,最终生成的网页摘要信息中的参数信息),其中,Meta信息包括:与第二变量对应的用于表示网页标题的参数,与第三变量对应的用于表示网页关键词的参数,与第四变量对应的用于表示网页内容的参数。
举例而言,对于每一个网页摘要信息样式(Meta pattern)可以是网页摘要信息服务器(也可以称之为Meta仓库)中最小可用单位,可以采用以下的结构来标识一个网页摘要信息的样式的相关内容:(pageid,title pattern,keyword pattern,descriptionpattern)
其中,pageid用于标识该网页摘要信息样式,一个样式唯一对应一个pageid,该字段的类型可以为一串字符。优选的,可以为每种网页页面类型定义一个或多个样式。例如以某个购物网站为例,其对应的网页页面类型可以有:网站首页、网站的搜索列表页面、产品的详细描述页面。这样就可以分别为网站首页、网站的搜索列表页面、产品的详细描述页面定义一些样式以供选择。
对于上述的Title pattern、keyword pattern以及description pattern所对应的字段中就有预先设定好的变量,这些变量所对应的具体的值在网站应用服务器请求网页摘要信息时通过网站应用服务器传递的参数进行替换。
例如,对于下面的网页摘要信息:
{Keyword}Manufacturers &{keyword}Suppliers Directory-Find a{keyword}Manufacturer and Supplier in{category}.Choose Quality{country}Manufacturers,Suppliers,Exporters at Alibaba.com.
其中,keyword为用户参数中的关键词,category为用户参数中的类目,country为用户参数中的国家。对于这些内容都是可以替换的变量,网页摘要信息服务器或者是网站应用服务器就可以利用参数对其进行替换以生成所希望的网页摘要信息。
步骤S606:网页摘要信息服务器根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息,并将生成的网页摘要信息发送给网站应用服务器,或者,网页摘要信息服务器将网页摘要信息样式发送给网站应用服务器,以使网站应用服务器根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
即,在上述实施例中提供了两种生成网页摘要信息的方式:
1)网页摘要信息在网页摘要信息服务器侧生成:网站应用服务器需要在请求消息中携带相应的摘要信息的变量所对应的参数,摘要信息服务器根据这些参数生成网页摘要信息之后,就可以将完整的网页摘要信息返回给网站应用服务器;
2)网页摘要信息在网站应用服务器侧生成:网站应用服务器仅需要在请求消息中携带用于指示网页摘要信息样式的指示信息即可,而无需携带相应的参数,网页摘要信息服务器在获取到请求消息时向网站应用服务器返回相应的网页摘要信息样式即可,网站应用服务器在根据返回的网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
优选地,上述生成的网页摘要信息,可以是该网页最终的摘要信息,即,最终用于展示的网页摘要信息。
在上述优选实施方式中,将网页摘要信息样式存储在了网页摘要信息服务器中,网站应用服务器只需要向网页摘要信息服务器发送一个携带有样式标识的请求消息,就可以获取到相应的摘要信息样式或者是一个完整的摘要信息,从而解决了现有技术中网页摘要信息被硬编码在网站应用服务器的代码中,在对其它代码进行更改时容易造成网页摘要信息被篡改,以及对摘要信息的修改较为复杂的技术问题,达到了提高摘要信息的维护效率和保证摘要信息的准确性的技术效果。
对于网页摘要信息服务器中的存储的网页摘要信息样式需要是预先录入的或者是根据获取的配置信息配置生成的,可以按照以下方式生成:网页摘要信息服务器根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。优选地,可以以SEO友好的方式设置不同网页对应的网页摘要信息样式。例如,先确定一个网页摘要信息样式标识,用于标识该网页摘要信息样式所对应的页面ID(pageid),然后在定义该样式中title、keyword以及description元素所对应的字段内容,从而生成一个网页摘要信息样式。
优选地,可以为每个网页摘要信息样式定义一个生效时间,即,在该网页摘要信息样式对应的生效时间内进行的请求才会显示该网页摘要信息样式。例如,快到圣诞节了,可以定义一个在圣诞节前后使用的网页摘要信息样式,即,只有在设定的圣诞节的那几天进行请求时才会返回该圣诞节样式。在一个优选实施方式中,网页摘要信息服务器查找与标识信息对应的网页摘要信息样式的步骤包括:网页摘要信息服务器查找在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式。
考虑到有时候仅需要对一些特定的网页摘要信息样式定义生效时间,对于生效时间这个信息也就不需要对每个网页摘要信息样式都设定,因此,对于一些没有生效时间的样式可以不考虑生效时间直接进行返回。在一个优选实施方式中,网页摘要信息服务器查找在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式的步骤包括:网页摘要信息服务器判断查找到的与标识信息对应的网页摘要信息样式是否包括生效时间段;若包括生效时间段,则判断请求信息的接收时间是否位于生效时间段内,若位于生效时间段内,则将查找到的网页摘要信息样式作为在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式;若不包括生效时间段,则将查找到的网页摘要信息样式作为在与请求信息的接收时间对应的时间段内生效的、且与标识信息对应的网页摘要信息样式。即,先判断被请求的摘要信息样式中是否有用于标识生效时间的字段,如果有,就按照生效时间进行返回,如果没有,直接返回即可。
在上述各个优选实施方式中,网站应用服务器可以将网页摘要信息与网页一起进行展示。优选地,为了可以快速展示,网站应用服务器可以先将生成的或者是获取的网页摘要信息样式或者是网页摘要信息保存在本地的缓存中,在需要展示的时候可以快速获取并进行展示,从而提高了展示的效率。因在上述介绍时已经提及,可以由网站应用服务器自己生成最终的网页摘要信息,网页摘要信息服务器只需要向网站应用服务器返回请求的网页摘要信息样式即可。在一个优选实施方式中,网站应用服务器从缓存中读取用于生成网页摘要信息的参数,并根据参数对网页摘要信息样式中对应的变量进行赋值替换以生成网页对应的网页摘要信息。
实施例3
本申请提供了一种优选的实施例来进一步对本申请进行解释,但是值得注意的是,该优选实施例只是为了更好的描述本申请,并不构成对本申请不当的限定。
如图7所示,本申请实施例给出了客户端请求Meta仓库获取Meta信息的一种优选流程图,如图7所示,包括以下步骤:
步骤S702:网站应用服务器收集完整的摘要请求,其中,摘要请求中携带有请求参数对象和页面的唯一标识。优选地,该摘要请求可以是用户输入的,也可以是网站应用服务器根据需要自己生成的。其中,上述的页面唯一标识是预先确定的,用于标识所请求的网页摘要信息所对应的页面区域。一个页面唯一标识可以对应于多个网页摘要信息样式,然而在同时时间内仅会对应一个可用的网页摘要信息样式。上述的请求参数对象中应包含一些常用的参数,例如:当前请求的关键词,类目名称,国家,省份,城市,地区,会员类型,价格区间以及每页展示的条数等等。
步骤S704:根据页面的唯一标识从本地缓存中读取网页摘要信息的样式,如果网站应用服务器在本地已经存储了相应的网页摘要信息的样式,则执行步骤S706,否则,转而执行步骤S708。
步骤S706:如果网站应用服务器在本地已经存储了相应的网页摘要信息的样式,则网站应用服务器根据请求参数对该网页摘要信息的样式进行渲染,即根据请求参数对该网页摘要信息的样式中的变量进行替换以生成最终可以展示的网页摘要信息,执行步骤S712。
步骤S708:网站应用服务器根据摘要请求中携带的页面唯一标识向网页摘要信息服务器(Meta仓库)获取所请求的网页摘要信息的样式,并将其存储在自身的本地缓存中。
步骤S710:网站应用服务器根据请求参数对该网页摘要信息的样式中的变量进行替换以生成最终可以展示的网页摘要信息。
步骤S712:网站应用服务器对最终生成的网页摘要信息随网页一起进行显示。
通过以上的描述可知,本申请具有以下优势:将网页摘要信息样式存储在了网页摘要信息服务器中,网站应用服务器只需要向网页摘要信息服务器发送一个携带有样式标识的请求消息,就可以获取到相应的摘要信息样式或者是一个完整的摘要信息,从而解决了现有技术中网页摘要信息被硬编码在网站应用服务器的代码中,在对其它代码进行更改时容易造成网页摘要信息被篡改,以及对摘要信息的修改较为复杂的技术问题,达到了提高摘要信息的维护效率和保证摘要信息的准确性的技术效果。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种网页摘要信息的生成方法,其特征在于,包括:
网页摘要信息服务器接收来自网站应用服务器的请求信息,其中,所述请求信息包括用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,所述请求信息包括:用于唯一标识网页的标识信息;
所述网页摘要信息服务器查找与所述标识信息对应的网页摘要信息样式,其中,所述网页摘要信息样式中包括一个或多个用于表示与所述网页对应的网页摘要信息的变量;
所述网页摘要信息服务器根据所述参数对所述网页摘要信息样式中对应的所述变量进行赋值替换以生成所述网页对应的网页摘要信息,并将所述生成的所述网页摘要信息发送给所述网站应用服务器,或者,所述网页摘要信息服务器将所述网页摘要信息样式发送给所述网站应用服务器,以使所述网站应用服务器根据所述参数对所述网页摘要信息样式中对应的所述变量进行赋值替换以生成所述网页对应的网页摘要信息。
2.根据权利要求1所述的方法,其特征在于,在所述网页摘要信息服务器接收来自网站应用服务器的请求信息之前,还包括:
所述网页摘要信息服务器根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。
3.根据权利要求1所述的方法,其特征在于,所述网页摘要信息服务器查找与所述标识信息对应的网页摘要信息样式的步骤包括:
所述网页摘要信息服务器查找在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式。
4.根据权利要求3所述的方法,其特征在于,所述网页摘要信息服务器查找在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式的步骤包括:
所述网页摘要信息服务器判断查找到的与所述标识信息对应的网页摘要信息样式是否包括生效时间段;
若包括所述生效时间段,则判断所述请求信息的接收时间是否位于所述生效时间段内,若位于所述生效时间段内,则将查找到的所述网页摘要信息样式作为在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式;
若不包括所述生效时间段,则将查找到的所述网页摘要信息样式作为在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式。
5.根据权利要求1所述的方法,其特征在于,在所述网页摘要信息服务器将所述网页摘要信息样式发送给所述网站应用服务器之后,还包括:
所述网站应用服务器从缓存中读取所述用于生成网页摘要信息的参数,并根据所述参数对所述网页摘要信息样式中对应的所述变量进行赋值替换以生成所述网页对应的网页摘要信息。
6.根据权利要求1所述的方法,其特征在于,所述网页摘要信息样式包括:用于唯一标识网页的第一变量,用于表示网页标题的第二变量,用于表示网页关键词的第三变量,用于表示网页内容的第四变量,用于表示生效时间段的第五变量;所述网页摘要信息包括:Meta信息,其中,所述Meta信息包括:与所述第二变量对应的用于表示网页标题的参数,与所述第三变量对应的用于表示网页关键词的参数,与所述第四变量对应的用于表示网页内容的参数。
7.一种网页摘要信息的生成装置,其特征在于,包括:
接收单元,用于接收来自网站应用服务器的请求信息,其中,所述请求信息包括用于唯一标识网页的标识信息和用于生成网页摘要信息的参数,或者,所述请求信息包括:用于唯一标识网页的标识信息;
查找单元,用于查找与所述标识信息对应的网页摘要信息样式,其中,所述网页摘要信息样式中包括一个或多个用于表示与所述网页对应的网页摘要信息的变量;
生成单元,用于根据所述参数对所述网页摘要信息样式中对应的所述变量进行赋值替换以生成所述网页对应的网页摘要信息,并将所述生成的所述网页摘要信息发送给所述网站应用服务器;或者,
发送单元,用于将所述网页摘要信息样式发送给所述网站应用服务器,以使所述网站应用服务器根据所述参数对所述网页摘要信息样式中对应的所述变量进行赋值替换以生成所述网页对应的网页摘要信息。
8.根据权利要求7所述的装置,其特征在于,还包括:
设置单元,用于在所述网页摘要信息服务器接收来自网站应用服务器的请求信息之前,根据接收到的配置信息为不同的网页设置对应的网页摘要信息样式。
9.根据权利要求7所述的装置,其特征在于,所述查找单元包括:
查找模块,用于查找在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式。
10.根据权利要求9所述的装置,其特征在于,所述查找模块包括:
第一判断子模块,用于判断查找到的与所述标识信息对应的网页摘要信息样式是否包括生效时间段;
第二判断子模块,用于在判断出包括所述生效时间段的情况下,判断所述请求信息的接收时间是否位于所述生效时间段内,若位于所述生效时间段内,则将查找到的所述网页摘要信息样式作为在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式;
生成子模块,用于在判断出不包括所述生效时间段的情况下,将查找到的所述网页摘要信息样式作为在与所述请求信息的接收时间对应的时间段内生效的、且与所述标识信息对应的网页摘要信息样式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210430025.6A CN103793428B (zh) | 2012-10-31 | 2012-10-31 | 网页摘要信息的生成方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210430025.6A CN103793428B (zh) | 2012-10-31 | 2012-10-31 | 网页摘要信息的生成方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103793428A CN103793428A (zh) | 2014-05-14 |
CN103793428B true CN103793428B (zh) | 2017-05-31 |
Family
ID=50669107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210430025.6A Active CN103793428B (zh) | 2012-10-31 | 2012-10-31 | 网页摘要信息的生成方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103793428B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224571A (zh) * | 2014-06-30 | 2016-01-06 | 北京金山安全软件有限公司 | 终端上传数据的处理及数据上传处理方法、装置 |
CN105786849A (zh) * | 2014-12-22 | 2016-07-20 | 北京奇虎科技有限公司 | 一种文档类网页自定义摘要的生成方法和系统 |
CN105786837A (zh) * | 2014-12-22 | 2016-07-20 | 北京奇虎科技有限公司 | 一种小说网页智能摘要的生成方法与系统 |
CN105786853A (zh) * | 2014-12-22 | 2016-07-20 | 北京奇虎科技有限公司 | 一种论坛帖子智能摘要的显示方法和系统 |
CN105786854A (zh) * | 2014-12-22 | 2016-07-20 | 北京奇虎科技有限公司 | 一种搜索结果中视频播放网页摘要的生成方法与系统 |
CN105786836A (zh) * | 2014-12-22 | 2016-07-20 | 北京奇虎科技有限公司 | 一种对影视网页的结构化摘要生成方法与系统 |
CN105653606A (zh) * | 2015-12-23 | 2016-06-08 | 北京奇虎科技有限公司 | 基于结构统一化处理的官网摘要展示方法及装置 |
CN108520014A (zh) * | 2018-03-21 | 2018-09-11 | 广东欧珀移动通信有限公司 | 信息分享方法、装置、移动终端和计算机可读介质 |
CN109543128B (zh) * | 2018-10-19 | 2021-01-12 | 深圳点猫科技有限公司 | 一种基于编程语言的前端框架项目实现方法及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446191A (zh) * | 2010-10-13 | 2012-05-09 | 北京创新方舟科技有限公司 | 一种用于生成网页内容摘要的方法、设备及系统 |
CN102737016A (zh) * | 2011-03-30 | 2012-10-17 | 中国银联股份有限公司 | 基于并行处理的信息文件生成系统及方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8930376B2 (en) * | 2008-02-15 | 2015-01-06 | Yahoo! Inc. | Search result abstract quality using community metadata |
US8977599B2 (en) * | 2010-11-11 | 2015-03-10 | Verizon Patent And Licensing Inc. | Method and system for testing client-server applications |
-
2012
- 2012-10-31 CN CN201210430025.6A patent/CN103793428B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446191A (zh) * | 2010-10-13 | 2012-05-09 | 北京创新方舟科技有限公司 | 一种用于生成网页内容摘要的方法、设备及系统 |
CN102737016A (zh) * | 2011-03-30 | 2012-10-17 | 中国银联股份有限公司 | 基于并行处理的信息文件生成系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103793428A (zh) | 2014-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103793428B (zh) | 网页摘要信息的生成方法和装置 | |
US8762360B2 (en) | Integrating applications within search results | |
US8458227B1 (en) | URL rescue by identifying information related to an item referenced in an invalid URL | |
US8898137B1 (en) | URL rescue by execution of search using information extracted from invalid URL | |
US8307073B1 (en) | URL rescue by correction of encoding errors | |
CN105027121A (zh) | 对本机应用的应用页面建索引 | |
CN110851757A (zh) | 页面资源加载方法及终端 | |
CN107391528B (zh) | 前端组件依赖信息搜索方法及设备 | |
CN103177096B (zh) | 基于文本属性的页面元素定位方法及设备 | |
EP2638484B1 (en) | Dynamic image result stitching | |
CN106600082A (zh) | 业务系统中任务的处理方法、装置及业务体系构建系统 | |
CN109684093A (zh) | 数据处理方法及系统 | |
CN108763524B (zh) | 电子装置、聊天数据处理方法和计算机可读存储介质 | |
EP3238105A1 (en) | Application partial deep link to a corresponding resource | |
US20100191616A1 (en) | Software method and system to enable automatic, real-time extraction of item price and availability from a supplier catalog during a buyer's electronic procurement shopping process | |
CN111046316B (zh) | 一种应用上架状态监控方法、智能终端及存储介质 | |
CN112559914A (zh) | 指标数据显示方法及装置 | |
CN111158998A (zh) | 一种埋点数据的显示方法及装置 | |
CN105808628A (zh) | 网页转码方法、装置及系统 | |
CN114546220A (zh) | 页面配置方法及装置、存储介质、计算机设备 | |
CN109766480B (zh) | 一种数据查询方法和设备 | |
EP1370985A2 (en) | Systeme and method for dynamic web page generation | |
US11714954B1 (en) | System for determining reliability of extracted data using localized graph analysis | |
JP5968967B2 (ja) | 情報処理装置 | |
JP2014164309A (ja) | 画面プログラム生成装置及びその画面プログラム生成方法、情報処理装置、並びにコンピュータ・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240219 Address after: # 01-21, Lai Zan Da Building 1, 51 Belarusian Road, Singapore Patentee after: Alibaba Singapore Holdings Ltd. Country or region after: Singapore Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands Patentee before: ALIBABA GROUP HOLDING Ltd. Country or region before: Cayman Islands |
|
TR01 | Transfer of patent right |